Nghiên cứu các phương pháp nhúng dấu ẩn vào dữ liệu đa phương tiện và ứng dụng Tổng quan về nhúng dấu ẩn vào dữ liệu đa phương tiện, các ứng dụng nhúng dấu số, kỹ thuật nhúng dấu tổng quát, các mô hình nhúng dấu ẩn, các vấn đê đối với nhung dấu ẩn. Nhúng dấu ảnh tĩnh. Nhúng dấu các loại dữ liệu đa phương tiện khác. Đánh gia chất lượng dữ liệu. Kết quả thực nghiệm và đánh giá thuật toán. Description: Tổng quan về nhúng dấu ẩn vào dữ liệu đa phương tiện, các ứng dụng nhúng dấu số, kỹ thuật nhúng dấu tổng quát, các mô hình nhúng dấu ẩn, các vấn đê đối với nhung dấu ẩn. Nhúng dấu ảnh tĩnh. Nhúng dấu các loại dữ liệu đa phương tiện khác. Đánh gia chất lượng dữ liệu. Kết quả thực nghiệm và đánh giá thuật toán.
Trang 1NGÀNH: CÔNG NGHỆ THÔNG TIN
Trang 2-
Trang 3kỹ thuật cryptography là kỹ thuật bảo mật dữ liệu gặt hái nhiều thành công và được ứng dụng rất rộng rãi Đặc điểm nổi bật của kỹ thuật này là dữ liệu trên đường truyền được mã hoá để chống ăn cắp dữ liệu Thế nhưng xa hơn nữa, có một vấn đề đặt ra đó là dữ liệu sau khi được giải mã để thu được dữ liệu gốc, dữ liệu không được bảo vệ nữa Người dùng có thể sao chép, phát tán tuỳ ý, hoặc họ giả mạo tác
Luận văn đã nghiên cứu và trình bày các phương nhúng dấu ẩn vào ba kiểu dữ
liệu đa phương tiện gồm ảnh tĩnh, video và audio Phần lý thuyết đi sâu vào các nguyên lý nhúng dấu ẩn và các thuật toán cụ thể Trọng tâm nghiên cứu các phương pháp nhúng dấu ảnh tĩnh, so sánh các phương pháp nhúng dấu theo không gian, miền tần số và miền đa phân giải
Phần thực nghiệm đã cài đặt 11 thuật toán nhúng dấu ảnh tĩnh, chạy chương trình và so sánh kết quả Từ đó đánh giá được ưu nhược điểm của từng thuật toán cũng như thấy được mức độ tin cậy của nhúng dấu ẩn Cuối cùng đề xuất một số ngữ cảnh ứng dụng trong thực tế
Em xin chân thành cảm ơn sự hỗ trợ và hướng dẫn tận tình của thầy giáo, tiến sĩ Nguyễn Linh Giang trong quá trình thực hiện đề tài
Hà N ội, ngày 31 tháng 10 năm 2007
Đặng Thị Tuyết Thanh
Trang 4MỤC LỤC
CHƯƠNG I TỔNG QUAN I
1.1 Nhúng d ấu ẩn vào dữ liệu đa phương tiện 1
1.2 Các ứng dụng nhúng dấu số 3
1.3 K ỹ thuật nhúng dấu tổng quát 5
1.3.1 Nguyên lý cơ bản của kỹ thuật nhúng dấu 6
1.3.2 Phân loại dấu nhúng 7
1.3.3 Phân loại hệ thống nhúng dấu 8
1.4 Các mô hình nhúng d ấu ẩn 10
1.4.1 Mã hoá LSB 12
1.4.2 Kỹ thuật trải phổ 13
1.4.3 Kỹ thuật Patchwork 15
1.4.4 Kỹ thuật điều chế chỉ số lượng tử 16
1.5 Các v ấn đề đối với nhúng dấu ẩn 17
1.5.1 Yêu cầu đặt ra đối với nhúng dấu ẩn 17
1.5.2 Các vấn đề khi nhúng dấu 17
CHƯƠNG II NHÚNG DẤU ẢNH TĨNH 23
2.1 T ổng quan nhúng dấu ảnh tĩnh 23
2.1.1 Cơ bản nhúng dấu ảnh tĩnh 23
2.1.2 Công việc nhúng dấu 25
2.2 Phương pháp nhúng dấu theo miền không gian 28
2.2.1 Kỹ thuật nhúng dấu theo miền không gian 28
2.2.2 Các thuật toán nhúng dấu theo miền không gian 29
2.3 Phương pháp nhúng dấu theo miền tần số 33
2.3.1 Kỹ thuật biến đổi cô sin rời rạc 33
2.3.2 Các thuật toán nhúng dấu dựa trên biến đổi cô sin rời rạc 43
2.4 Phương pháp nhúng dấu theo miền đa phân giải 53
2.4.1 Kỹ thuật biến đổi sóng con rời rạc 53
Trang 52.4.2 Các thuật toán nhúng dấu dựa trên biến đổi sóng con rời rạc 58
2.5 So sánh các phương pháp nhúng dấu 61
CHƯƠNG III NHÚNG DẤU CÁC LOẠI DỮ LIỆU ĐA PHƯƠNG TIỆN KHÁC 64
3.1 Nhúng d ấu video 64
3.1.1 Nhúng dấu trong miền không gian 66
3.1.2 Nhúng dấu trong miền biến đổi 67
3.1.3 Nhúng dấu vào dữ liệu đã nén 68
3.1.4 Một số thuật toán nhúng dấu video 68
3.2 Nhúng d ấu audio 71
3.2.1 Kỹ thuật nhúng dấu audio cảm quan 71
3.2.2 Các phương pháp nhúng dấu audio 73
CHƯƠNG IV ĐÁNH GIÁ CHẤT LƯỢNG DỮ LIỆU 79
4.1 Đánh giá chất lượng dữ liệu được nhúng dấu 79
4.1.1 Dữ liệu ảnh 79
4.1.2 Dữ liệu video và audio 81
4.2 Các t ấn công ảnh hưởng đến dấu nhúng 82
4.2.1 Phân loại tấn công 83
4.2.2 Các thao tác và tấn công xoá bỏ 84
4.2.3 Các tấn công phá vỡ sự đồng bộ 85
4.2.4 Các tấn công nhúng và tấn công phát hiện 86
CHƯƠNG V KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ THUẬT TOÁN 88 5.1 K ết quả thực nghiệm 90
5.1.1 Các thuật toán nhúng dấu trong miền không gian 90
5.1.2 Các thuật toán dựa trên DCT 91
5.1.3 Các thuật toán dựa trên DWT 98
5.2 So sánh và đánh giá 105
5.3 Đề xuất kịch bản sử dụng: 107
TÀI LI ỆU THAM KHẢO 112
Trang 6DANH M ỤC CÁC HÌNH VỄ ĐỒ THỊ
Hình 1.2: Bộ giải mã dấu nhúng đầy đủ Error! Bookmark not defined Hình 1.3 : Phân loại nhúng dấu ẩn Error! Bookmark not defined Hình 1.4 Mô hình truyền thông bảo mật cơ bản Error! Bookmark not defined
Hình 1.5 Mô hình truyền thông dấu nhúng cơ bản Error! Bookmark not defined
Hình 1.6 Bộ phát hiện dấu nhúng cơ bản Error! Bookmark not defined Hình 1.7 Mô hình nhúng của thuật toán nhúng dấu ẩn Cox Error! Bookmark not defined
Hình 1.8 Ví dụ sử dụng hai bộ lượng tử để nhúng dấu Error! Bookmark not defined
Hình 1.9: Mô hình kênh truyền của phương pháp nhúng loại 1 Error! Bookmark not defined
Hình 1.10: Mô hình kênh truyền phương pháp nhúng dấu ẩn loại 2 Error! Bookmark not defined
Hình 1.11: Kênh đối xứng nhị phân với xác suất lật p Error! Bookmark not defined
Hình 1.12: Minh họa bản chất cấp phát lại bit của nhúng dấu ẩn Error! Bookmark not defined
Hình 2.1: Quá trình nhúng dấu ẩn [8] Error! Bookmark not defined
Hình 2.2 (a) tính tương quan tự động của ảnh không tương quan trước và sau DCT
Error! Bookmark not defined Hình 2.3 (a) Ảnh thứ nhất, (b) ảnh thứ 2 Error! Bookmark not defined
Hình 2.4 (a) ảnh không tương quan và DCT của (b) ảnh tương quan và DCT của
nó Error! Bookmark not defined
Hình 2.5 Các khối xử lý của quá trình nhúng và phát hiện dấu nhúng dựa trên DCT
Error! Bookmark not defined Hình 2.6 Chọn block site sử dụng mạng Gaussian trong đó các Error! Bookmark not defined
block site được chọn có màu đen Error! Bookmark not defined
Trang 7Hình 2.7: Hàm chỉ số ind(c) Error! Bookmark not defined Hình 2.8: sơ đồ khối của kỹ thuật nhúng dấu DWT Error! Bookmark not defined Hình 3.1: Quá trình nhúng dấu video Error! Bookmark not defined Hình 3.2: quá trình phát hiện dấu nhúng video Error! Bookmark not defined
Hình 3.3: Mô hình nhúng dấu JAWS Error! Bookmark not defined
Hình 3.4 Sơ đồ khối của mô hình nhúng dấu video đã nén Error! Bookmark not defined
Hình 3.5 Bộ mã hoá dấu nhúng và các thành phần của nó Error! Bookmark not defined
Hình 5.1 Ảnh lena.jpg bensong.jpg: ảnh đơn giản, ít chi tiết, ít biên Error! Bookmark not defined
Hình 5.2 Ảnh bensong.jpg vantay.jpg: là ảnh phức tạp, có nhiều biên và kết cấu
Error! Bookmark not defined Hình 5.3 Ảnh vantay.jpg - đầu ra: các ảnh đã được nhúng dấu Error! Bookmark not defined
Hình 5.4 Ảnh kết quả và ảnh sai khác, thuật toán Bruyn, ảnh lena.jpg Error! Bookmark not defined
Hình 5.5 Ảnh kết quả và ảnh sai khác, thuật toán Fotopoulos, ảnh lena.jpg Error! Bookmark not defined
Hình 5.5 Ảnh kết quả và ảnh sai khác, thuật toán Hsu Stil, ảnh bensong.jpg Error! Bookmark not defined
Hình 5.6 Ảnh kết quả và ảnh sai khác, thuật toán Cox, ảnh lena.jpg Error! Bookmark not defined
Hình 5.7 Ảnh kết quả và ảnh sai khác, thuật toán Yulin Wang, ảnh vantay.jpg
Error! Bookmark not defined Hình 5.8 Ảnh kết quả và ảnh sai khác, thuật toán Zhu, ảnh lena.jpg Error! Bookmark not defined
Hình 5.9 Ảnh kết quả và ảnh sai khác, thuật toán Kim, ảnh lena.jpg Error! Bookmark not defined
Trang 8Hình 5.10 Ảnh kết quả và ảnh sai khác, thuật toán Wang, ảnh lena.jpg Error! Bookmark not defined
Hình 5.11 Ảnh kết quả và ảnh sai khác, thuật toán Corvi, ảnh lena.jpg Error! Bookmark not defined
Hình 5.12 Ảnh kết quả và ảnh sai khác, thuật toán Xia, ảnh lena.jpg Error! Bookmark not defined
Hình 5.13 Mô hình hệ thống phân phối dữ liệu đa phương tiện an toàn Error! Bookmark not defined
Hình 5.14 Quá trình tạo dấu ẩn Error! Bookmark not defined
Trang 9DANH M ỤC CÁC BẢNG
Bảng 1.1: Sự tương đồng giữa hệ thống truyền thông và hệ thống nhúng dấu ẩn
Error! Bookmark not defined
Bảng 2.1: Các hệ số DCT được sử dụng Error! Bookmark not defined Bảng 2.2: Đánh số thứ tự 3 x 3 khối 8 x 8 các hệ số DCT của thuật toán Yulin
Wang và Alan Pearmain Error! Bookmark not defined
Bảng 2.3: Bảng so sánh tổng hợp các phương pháp nhúng dấu ảnh tĩnh Error!
Bookmark not defined
Bảng 5.1 Kết quả nhúng dấu thuật toán Bruyn, ảnh lena.jpg Error! Bookmark not
defined
Bảng 5.3 Kết quả nhúng dấu thuật toán Bruyn, ảnh bensong.jpg Error! Bookmark
not defined
Bảng 5.4 Kết quả sau tấn công thuật toán Bruyn, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.5 Kết quả nhúng dấu thuật toán Bruyn, ảnh vantay.jpg Error! Bookmark
Bảng 5.8 Kết quả sau tấn công thuật toán Fotopoulos, ảnh lena.jpg Error!
Bookmark not defined
Bảng 5.9 Kết quả nhúng và sau tấn công thuật toán Fotopoulos, ảnh vantay.jpg
Error! Bookmark not defined
Bảng 5.10 Kết quả nhúng và sau tấn công thuật toán Fotopoulos, ảnh bensong.jpg
Error! Bookmark not defined
Bảng 5.11 Kết quả nhúng và sau tấn công thuật toán Hsu Stil, ảnh lena.jpg Error!
Bookmark not defined
Bảng 5.12 Kết quả nhúng và sau tấn công thuật toán Hsu Stil, ảnh vantay.jpg Error!
Bookmark not defined
Bảng 5.13 Kết quả nhúng và sau tấn công thuật toán Hsu Stil, ảnh bensong.jpg
Error! Bookmark not defined
Bảng 5.14 Kết quả nhúng và sau tấn công thuật toán Cox, ảnh lena.jpg Error!
Bookmark not defined
Trang 10Bảng 5.15 Kết quả nhúng và sau tấn công thuật toán Cox, ảnh vantay.jpg Error!
Bookmark not defined
Bảng 5.16 Kết quả nhúng và sau tấn công thuật toán Cox, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.17 Kết quả nhúng dấu thuật toán Yulin Wang, ảnh lena.jpg Error!
Bookmark not defined
Bảng 5.18 Kết sau tấn công thuật toán Yulin Wang, ảnh lena.jpg Error! Bookmark
not defined
Bảng 5.19 Kết quả nhúng và sau tấn công thuật toán Yulin Wang, ảnh bensong.jpg
Error! Bookmark not defined
Bảng 5.20 Kết quả nhúng và sau tấn công thuật toán Yulin Wang, ảnh vantay.jpg
Error! Bookmark not defined
Bảng 5.21 Kết quả nhúng và sau tấn công thuật toán Barni, ảnh lena.jpg Error!
Bookmark not defined
Bảng 5.22 Kết quả nhúng và sau tấn công thuật toán Barni, ảnh vantay.jpg Error! Bookmark not defined
Bảng 5.23 Kết quả nhúng và sau tấn công thuật toán Barni, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.24 Kết nhúng dấu thuật toán Zhu, ảnh lena.jpg Error! Bookmark not
defined
Bảng 5.25 Kết sau tấn công thuật toán Zhu, ảnh lena.jpg Error! Bookmark not
defined
Bảng 5.26 Kết quả nhúng và sau tấn công thuật toán Zhu, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.27 Kết quả nhúng và sau tấn công thuật toán Zhu, ảnh vantay.jpg Error!
Bookmark not defined
Bảng 5.28 Kết quả nhúng dấu thuật toán Kim, ảnh lena.jpg Error! Bookmark not
defined
Bảng 5.29 Kết quả sau tấn công thuật toán Kim, ảnh lena.jpg Error! Bookmark
not defined
Bảng 5.30 Kết quả nhúng và sau tấn công thuật toán Kim, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.31 Kết quả nhúng và sau tấn công thuật toán Kim, ảnh vantay.jpg Error!
Bookmark not defined
Bảng 5.32 Kết quả nhúng dấu thuật toán Wang, ảnh lena.jpg Error! Bookmark not
defined
Trang 11Bảng 5.33 Kết quả sau tấn công thuật toán Wang, ảnh lena.jpg Error! Bookmark
not defined
Bảng 5.34 Kết quả nhúng và sau tấn công thuật toán Wang, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.35 Kết quả nhúng và sau tấn công thuật toán Wang, ảnh vantay.jpg Error!
Bookmark not defined
Bảng 5.36 Kết quả nhúng dấu thuật toán Corvi, ảnh lena.jpg Error! Bookmark not
defined
Bảng 5.37 Kết quả sau tấn công thuật toán Corvi, ảnh lena.jpg Error! Bookmark
not defined
Bảng 5.38 Kết quả nhúng và sau tấn công thuật toán Corvi, ảnh bensong.jpg Error!
Bookmark not defined
Bảng 5.39 Kết quả nhúng và sau tấn công thuật toán Corvi, ảnh vantay.jpg Error!
Bookmark not defined
Bảng 5.40 Kết quả nhúng dấu thuật toán Xia, ảnh lena.jpg Error! Bookmark not defined
Bảng 5.41 Kết quả sau tấn công thuật toán Xia, ảnh lena.jpg Error! Bookmark not
Bảng 5.44 Bảng tổng hợp giá trị tương quan sau nhúng dấu, các thuật toán miền
DCT Error! Bookmark not defined
Bảng 5.45 Bảng tổng hợp giá trị tương quan sau nhúng dấu, các thuật toán miền
DWT Error! Bookmark not defined
Bảng 5.46 Bảng tổng hợp giá trị MSE, PSNR sau nhúng dấu, các thuật toán miền DCT
Error! Bookmark not defined
Bảng 5.47 Bảng tổng hợp giá trị MSE, PSNR sau nhúng dấu, các thuật toán miền DWT
Error! Bookmark not defined
Trang 12DANH MỤC CÁC TỪ VIẾT TẮT
AWGN Additive white Gaussian noise Nhiễu cộng, trắng phân phối chuẩn AWUN Additive white uniform noise Nhiễu cộng, trắng phân phối đều DICO Discrete input and continuous
output
Đầu vào rời rạc, đầu ra liên tục
DIDO Discrete input and continuous
output
Đầu vào rời rạc, đầu ra rời rạc
CICO Continuous input and
continuous output
Đầu vào liên tục, đầu ra liên tục
MSE Mean square error Lỗi bình phương trung bình
VER Variable embedding rate Tốc độ nhúng biến đổi
CER Constant embedding rate Tốc độ nhúng hằng
PSNR Peak signal to noise ratio Tỉ lệ tín hiệu nhiễu cao nhất
DCT Discrete cosine transform Biến đổi cô sin rời rạc
DWT Discrete wavelets transform Biến đổi sóng con rời rạc
LSB Least significant bit Bít ít quan trọng nhất
Trang 13Gần đây sự lớn mạnh của phương tiện số ví dụ như Internet cho phép chúng
ta dễ dàng truy cập, sao lưu, sửa đổi nội dung của các tài liệu số như ảnh, âm thanh, video số Vấn đề đặt ra là rất cần phát triển các kỹ thuật bảo vệ bản quyền của các
dữ liệu số của người gửi và ngăn ngừa việc sao chép hoặc giả mạo bản quyền tác giả
Nhúng dấu ẩn là một kỹ thuật mô phỏng theo việc sử dụng công nghệ đánh dấu trên giấy tờ rất thông dụng vào thế giới số Nhúng dấu ẩn mô tả các phương pháp và công nghệ cho phép che dấu thông tin, ví dụ một con số nào đó, một văn bản trong dữ liệu số như ảnh, video và audio Trong kỹ thuật nhúng, thông tin không được nhúng trong khuôn khổ khu vực dữ liệu Quá trình nhúng dấu ẩn giống như việc sửa đổi dữ liệu mà ta không nhận thấy bằng mắt Với các ảnh thì điều này nghĩa là việc sửa đổi các giá trị điểm ảnh phải bị ẩn Xa hơn nữa, dấu nhúng phải đơn giản, gọn nhẹ phụ thuộc vào ứng dụng Với những dấu nhúng phức tạp, chúng
ta phải xem xét dấu nhúng có khả năng chống lại sự vận động của dữ liệu số, như là việc nén làm mất thông tin, co giãn, cắt xén
Nhúng d ấu ẩn được sử dụng để làm gì?
Điều đầu tiên là vấn đề bảo vệ bản quyền của dữ lịêu số trong các ứng dụng Trước đây, việc sao lưu dữ liệu số khá phức tạp và phải yêu cầu kinh nghiệm để có thể giả mạo Tuy nhiên, trong thế giới số ngày nay điều đó không còn khó nữa Mọi người có thể sao chép dễ dàng dữ liệu số và thậm chí còn đảm bảo chất lượng tốt
Để bảo vệ bản quyền, các tác giả có thể nhúng dấu hoặc che dấu thông tin trên ảnh, thông tin nhúng dấu có thể là tên tác giả Vì vậy, dấu được nhúng sẽ cho phép xác nhận bản quyền Không chỉ thực hiện nhúng dấu trên ảnh, việc này còn có thể thực hiện đối với audio và video số Đặc biệt là việc phân tán audio số thông qua internet trong định dạng mp3 hiện nay là một vấn đề lớn Trong trường hợp này, nhúng dấu
ẩn có thể hữu ích để thiết lập điều khiển phân tán audio và giúp bảo vệ bản quyền
Ngu ồn gốc của nhúng dấu ẩn
Phương pháp nhúng dấu ẩn đầu tiên là dấu ẩn giấy Đó là một dấu ẩn nhìn thấy được, nhỏ, chìm trong giấy để đảm bảo đây là bản gốc hoặc chính thức Ví dụ, dấu ẩn trong các tờ séc của chính phủ, các văn bản chính thức và tiền giấy Dấu ẩn giấy được sử dụng ở châu Âu từ ít nhất là thế kỷ thứ 13 với mục đích xác thực Và ngày nay, chúng vẫn được sử dụng như là một đặc trưng bảo mật
Trang 14Năm 1954, Emil Hembrooke, công ty Muzac đã lấy bằng sáng chế “Nhận dạng âm thanh và các tín hiệu tương tự” Bằng sáng chế mô tả phương pháp nhúng một đoạn mã nhận dạng vào âm nhạc sao cho người nghe không thể cảm thấy thay đổi để bảo vệ bản quyền Bằng sáng chế có đoạn “Phát minh này cho phép nhận dạng bản gốc của các sản phẩm âm nhạc, do đó, là một phương pháp bảo vệ bản quyền hiệu quả, nghĩa là, có thể xem nó như là dấu ẩn trên giấy” Dấu ẩn điện tử đã
ra đời như thế
Từ lúc này, các phương pháp nhúng dấu ẩn được phát triển và sử dụng trong nhiều ứng dụng Nhúng dấu ẩn tiếp tục được nền công nghiệp quan tâm nhiều Tuy nhiên, mãi đến tận những năm 1990, dấu ẩn điện tử (đặc biệt là dấu ẩn số) mới nhận được các mối quan tâm đáng kể từ giới học viện Từ đây, các nghiên cứu về đề tài này mở rộng nhanh chóng và ngày nay có rất nhiều cuộc hội nghị diễn ra đánh giá
về nhúng dấu ẩn
So sánh watermarking và cryptography
Đối với vấn đề bảo mật nhúng dấu, không thể tránh được việc so sánh với cryptography Việc bảo mật dữ liêu số nằm trong lĩnh vực của cryptography nhiều thập kỷ nay và nó rất hiệu quả Watermarking là lĩnh vực mới sử dụng để bảo mật
dữ liệu Có một số khác nhau giữa hai phương pháp này
Giống nhau: cả hai phương pháp có chung mục đích bảo vệ dữ liệu số, chống
ăn cắp dữ liệu Cơ chế đều chèn thêm thông tin bí mật vào nội dung và mã hoá khiến cho kẻ ăn cắp dữ liệu không giải mã được để thu nhận dữ liệu gốc
Khác nhau:
- Cryptography dùng để đối phó với dữ liệu nhị phân và nó được dựa trên các nguyên lý toán học, trong khi đó nhúng dấu dùng để đối phó với dữ liệu liên tục, được dựa trên xử lý ảnh và tín hiệu
- Đối với dữ liệu được mã hoá bởi hệ thống cryptography, nội dung của dữ liệu được bảo vệ suốt trong quá trình truyền từ nơi gửi đến nơi nhận, sau khi nhận
và giải mã, dữ liệu rõ ràng giống như dữ liệu gốc và nó không còn được bảo vệ nữa Còn dữ liệu watermarking, không phải bí mật trên đường truyền, việc bảo mật của
kỹ thuật nhúng dấu được dựa trên nội dung của chính nó Vì thế, việc bảo vệ dữ liệu
số vẫn được tiếp tục thậm chí sau khi kẻ tấn công thu được dữ liệu nhúng dấu Watermarking áp dụng cho các ứng dụng bảo vệ bản quyền mà cryptography không thể đáp ứng được
- Dữ liệu mã hoá bởi hệ thống cryptography có dung lượng tăng, vì thế phải gửi lượng dữ liệu lớn trên đường truyền, trong khi với hệ thống nhúng dấu, dung lượng của dữ liệu gần như không thay đổi
Trang 151.2 Các ứng dụng nhúng dấu số
i, K ỹ thuật nhúng dấu số đối với quản lý bản quyền
Một trong những ứng dụng truyền thống của nhúng dấu đó là bảo vệ bản quyền Lý do chính sử dụng các dấu nhúng đó là để xác nhận bản quyền nội dung bằng một dấu ẩn được in chèn vào trong ảnh Trong nhiều trường hợp, dấu nhúng được sử dụng thêm vào để mã hoá nội dung, khi mà việc mã hoá cung cấp phương pháp bảo mật khi phân phát dữ liệu Quyền sở hữu đối với người nhận và dấu nhúng giúp cho người sở hữu nội dung xác nhận nội dung và bảo vệ sự sao chép hoặc sử dụng bất hợp pháp Nếu không có nhúng dấu, không có cách nào để mở rộng việc điều khiển bản quyền nội dung mỗi khi nội dung vượt khỏi phạm vi số cần bảo vệ
và tới người sử dụng bất kỳ
Nhúng dấu số được sử dụng để mở rộng việc bảo vệ và cung cấp nhiều cơ hội để những người sở hữu nội dung bảo vệ bản quyền và tính năng của nội dung số Chữ ký của người sở hữu, nội dung và giới hạn sử dụng có thể nhúng vào nội dung
Cơ chế này làm tăng khả năng bảo vệ nội dung sau khi phát tán nội dung ra môi trường quảng bá
Những yêu cầu chính về kỹ thuật đối với ứng dụng này như sau:
Dấu nhúng không gây hại cho dữ liệu
Dấu nhúng độc lập với định dạng dữ liệu
Thông tin được mang bởi dấu nhúng phải bền vững trước các tác động lên nội dung dữ liệu, nén dữ liệu
Dấu nhúng có thể phát hiện mà không cần dùng đến nội dung gốc ban đầu
Dấu nhúng có thể xác nhận bởi một số kiểu khoá được sử dụng để xác nhận một lượng lớn nội dung đối với một cá nhân là duy nhất
Nội dung có thể bị thay đổi với các định dạng khác, tác động soạn thảo hoặc cắt xén của người dùng, việc nén để lưu trữ hoặc truyền đi, và yêu cầu đặt ra là có thể bảo vệ dấu nhúng trước những nội dung đã bị xử lý này Thông thường, tín hiệu dấu nhúng được nhúng vào nội dung không biến mất sau khi soạn thảo nội dung, nhưng trở nên khó bị phát hiện hơn trong khi nội dung bị thay đổi Thông thường tính bền vững cao có thể thu được bởi tăng chiều dài của tín hiệu dấu nhúng, vì thế
mà cải tiến được khả năng bảo vệ
Hiện nay, nhiều sản phẩm và dịch vụ thương mại sử dụng kỹ thuật nhúng dấu Chúng bao gồm các ứng dụng nhúng/phát hiện dấu nhúng và các dịch vụ để tìm kiếm nội dung trên internet với các dấu nhúng được thiết kế tin cậy Các ứng
dụng này thay thế vai trò giữa những người sở hữu nội dung và khách hàng của họ
Trang 16ii, K ỹ thuật nhúng dấu số đối với việc chứng minh bản quyền tác giả và sự giả mạo
Ứng dụng khác của nhúng dấu số là chứng minh bản quyền tác giả và chứng minh sự giả mạo Nó không bảo vệ nội dung trước sự sao chép hoặc đánh cắp, nhưng cung cấp phương pháp để chứng thực dữ liệu và đảm bảo tính toàn vẹn của
dữ liệu
Các máy ảnh số nhanh chóng mở rộng và được sử dụng trong nhiều ứng dụng công nghiệp, bởi vì sử dụng ảnh số đem lại hiệu quả lớn hơn nhiều, có thể tiết kiệm thời gian, tiền bạc khi phát triển, in ấn hoặc trưng bày so với các ảnh cơ truyền
thống Có một số vấn đề hạn chế đối với một số ứng dụng, đó là với các ảnh mà được sử dụng để chứng thực hoặc tài liệu dùng cho việc phán đoán Ví dụ như, các công ty bảo hiểm xe ô tô đôi khi sử dụng các bức ảnh xe bị tai nạn do cửa hàng sửa chữa xe cung cấp để ước lượng giá cả sửa chữa Việc làm thay đổi các ảnh số này sẽ phải tốn một lượng đáng kể tiền bạc và thời gian để sửa chữa
Tuy nhiên, các ảnh số có thể bị thay đổi để phóng đại phá huỷ Kết quả là phát sinh một lượng lớn thanh toán gây ra cho các công ty bảo hiểm, hoặc đáng lo hơn làm huỷ hoại uy tín của họ Có một kiểu dấu nhúng số, gọi là dấu nhúng tamper-detect, có thể giải quyết vấn đề này, và cung cấp môi trường bảo vệ cho ảnh
Cách để thực hiện tính năng này là nhúng một lớp tín hiệu bản quyền vào ảnh số sử dụng một dấu nhúng số Lớp bổ sung này được sử dụng như là một
“sensor” để phát hiện sự thay đổi Những thực thi gần đây có thể phát hiện thậm chí
cả vị trí thay đổi trên ảnh
Các yêu cầu kỹ thuật đối với ứng dụng này như sau:
Che dấu người sử dụng,
Có thể thực hiện với định dạng ảnh nén (hầu hết là JPEG)
Nhạy cảm đối với các tác động lên nội dung, nén,…
iii, Nhúng d ấu nổi
Không giống các kỹ thuật nhúng dấu số được mô tả ở trên, dấu nhúng trong trường hợp này phải hiện Nó áp dụng trong các sản phẩm thương mại Dạng thức duy nhất của kỹ thuật nhúng dấu do IBM cung cấp cho phép nội dung của người sở hữu nhúng một nhãn hiệu là lô gô hoặc hình ảnh nào đó lên trên bề mặt của ảnh Nhãn hiệu chỉ bị loại bỏ khi sử dụng phần mềm loại bỏ dấu nhúng và dùng đến khoá để giải mã
Nhãn hiệu này được cung cấp nhờ hiệu chỉnh các hệ số DCT của ảnh nén JPEG theo các qui tắc cho trước và kết quả phân tích tác động trực quan để tạo ra tính trong suốt cho nó, mà không bị phá huỷ Bằng chương trình loại bỏ dấu nhúng,
Trang 17khoá được sử dụng để xoá bỏ nhãn hiệu từ ảnh Loại bỏ nhãn hiệu hiện cũng có thể không thực hiện được khi nhúng một nhãn hiệu ẩn nữa lên ảnh vì mục đích theo dõi
Với dấu nhúng hiện ở trên ảnh, khiến cho nội dung của nó được bảo vệ, nội dung của người sở hữu có thể phân tán trên toàn bộ ảnh lên mạng internet hoặc khi
mở bằng nhiều ứng dụng đa dạng Khi người sử dụng muốn sử dụng bản sao chất lượng tốt của ảnh, anh ta phải yêu cầu một khoá giải mã và phải trả tiền để có nó Điều này giúp giảm yếu tố rủi ro và lượng truyền dữ liệu trên mạng
iv, Nhúng d ấu sinh trắc vào thẻ thông minh
hoặc các dữ liệu sinh trắc đặc trưng
Nhúng các dấu sinh trắc đó vào các thẻ thông minh, hộ chiếu, thẻ mua
hàng,…
Sử dụng các thẻ đó để chứng thực người dùng trong các hệ thống phần mềm ứng dụng Trong các phần mềm đó đã có kho lưu trữ dữ liệu sinh trắc của người Căn cứ vào thẻ đó, phần mềm xác thực được người dùng
1.3 K ỹ thuật nhúng dấu tổng quát
Nhúng dấu là quá trình nhúng dữ liệu dấu mờ hoặc tín hiệu số hoặc nhãn bản quyền vào đối tượng đa phương tiện, dấu nhúng có thể được phát hiện để tạo ra sự xác nhận về đối tượng Đối tượng có thể là ảnh, audio hoặc video Một ví dụ đơn giản của dấu nhúng số có thể là một dấu hiệu nổi thay thế một ảnh để xác nhận bản quyền Tuy nhiên dấu nhúng có thể chứa các thông tin thêm vào bao gồm việc nhận dạng người mua một bản tài liệu cụ thể nào đó
Thông thường, bất kỳ mô hình (thuật toán) nhúng dấu nào cũng bao gồm 3 phần sau:
_ Dấu nhúng _ Khoá _ Bộ phận mã hoá (thuật toán chèn)
_ Bộ giải mã và so sánh (thuật toán phát hiện)
Mỗi chủ sở hữu có một dấu nhúng duy nhất hoặc họ cũng có thể đưa nhiều dấu nhúng khác nhau vào trong các đối tượng khác nhau Thuật toán nhúng dấu hợp
nhất các dấu nhúng vào trong một đối tượng Thuật toán thẩm tra sẽ xác nhận đối tượng để xác định chủ sở hữu và tình trạng của đối tượng
Trang 181.3.1 N guyên lý cơ bản của kỹ thuật nhúng dấu
Nguyên lý chính của các hệ thống nhúng dấu hiện tại có thể so sánh với mã hoá đối xứng khi sử dụng cùng một khoá để mã hoá và giải mã dấu nhúng Mỗi hệ thống nhúng dấu bao gồm hai hệ thống con: một bộ mã hoá nhúng dấu và một bộ giải mã tương ứng Chính thức, hệ thống nhúng dấu có thể được mô tả bằng một tập
(O, W, K, Ek, Dk, Cτ ), trong đó O là tập gồm tất cả dữ liệu ban đầu, W là tập tất cả
dấu nhúng, K là tập các khoá Hai hàm sau:
Ek: O x W x K O (1.1)
mô tả quá trình nhúng dấu và phát hiện Hàm so sánh như sau:
{ }0,1:W2 →
Cτ (1.3)
so sánh cái đã phân tách với dấu đã nhúng sử dụng ngưỡng τ để so sánh Các tham
số đầu vào của quá trình nhúng là đối tượng mang (hoặc gốc co), dấu nhúng w dùng
để nhúng, khoá bí mật hoặc công khai K:
w o
E (c , )= (1.4)
Đầu ra của bộ mã hoá tạo thành tập dữ liệu đã nhúng dấu
Hình 1.1: bộ mã hoá dấu nhúng đầy đủ
Trong quá trình phát hiện, tập dữ liệu đã được thao tác và nhúng dấu ˆcw, dữ
liệu gốc co, dấu nhúng cw, khoá K được sử dụng suốt trong qúa trình nhúng tạo
thành tập hợp tối đa các tham số đầu vào (hình 1.1)
Các kiểu hệ thống nhúng dấu khác nhau phân biệt bởi số lượng tham số đầu
vào trong quá trình đọc Dấu nhúng đã phân tách ^w thường khác với dấu đã nhúng
w là do các thao tác vận động Để mà xét đoán sự tương ứng của hai dấu nhúng, hàm so sánh Cτ sẽ so sánh dấu nhúng khả nghi với dấu nhúng thu nhận được dựa
w C
, 0
, 1 ) , ( (1.5)
ngưỡng τ phụ thuộc vào thuật toán đã chọn và một hệ thống hoàn hảo để có
thể xác định rõ ràng dấu nhúng Việc phân tích khuôn dạng chính thức của các hệ
Trang 19thống nhúng dấu cũng có thể được sử dụng để phát triển sự phiên dịch hình học của các thuật toán nhúng dấu đã trình bày
Hình 1.2: Bộ giải mã dấu nhúng đầy đủ
1.3.2 Phân lo ại dấu nhúng
- Dấu nhúng bền vững được thiết để chống lại các vận động hỗn tạp, tất cả
các ứng dụng cung cấp sẵn tính năng bảo mật cho hệ thống nhúng dấu yêu cầu loại dấu nhúng này
- Dấu nhúng dễ hỏng được nhúng với tính chất bền vững rất thấp Vì thế, loại
dấu nhúng này có thể bị phá huỷ thậm chí bởi các vận động nhẹ nhất Trong trường hợp này chúng được so sánh với các thông báo ẩn trong các phương pháp steganographic Chúng có thể được sử dụng để kiểm tra tính nguyên vẹn của các đối tượng
- Dấu nhúng công khai và dấu nhúng bí mật được phân biệt với nhau theo
các yêu cầu về tính bí mật đối với khoá được dùng để nhúng và thu nhận dấu nhúng
Theo nguyên lý cơ bản của kỹ thuật nhúng dấu, khoá giống nhau được sử dụng trong quá trình mã hoá và giải mã Nếu khoá được biết, loại dấu nhúng này sẽ
là public, trái lại khoá bị ẩn thì dấu nhúng là private Các dấu nhúng public có thể
sử dụng trong các ứng dụng mà không có yêu cầu liên quan đến bảo mật (ví dụ nhúng siêu dữ liệu)
- Dấu nhúng nổi hoặc dấu nhúng khoanh vùng có thể là lô gô hoặc các ảnh
chèn lên bề mặt trong lĩnh vực nhúng dấu ảnh hoặc video Để đối phó với việc xác định vị trí thông tin ẩn dấu, các dấu nhúng này không bền vững
Bên cạnh các loại dấu nhúng đa dạng, có bốn hệ thống nhúng dấu được phân lớp theo đầu vào và đầu ra suốt trong quá trình phát hiện Việc sử dụng nhiều thông tin hơn ở phía phát hiện sẽ làm tăng tính linh hoạt của toàn bộ hệ thống nhúng dấu nhưng lại giới hạn tính khả thi của tiếp cận nhúng dấu ở phía nhúng
Trang 201.3.3 Phân lo ại hệ thống nhúng dấu
- Nhúng dấu rõ ràng yêu cầu ít nhất phải có dữ liệu gốc trong quá trình đọc Chúng ta có thể phân chia nhỏ hơn kiểu hệ thống này thành hai loại phụ thuộc vào việc dấu nhúng có cần thiết có mặt trong quá trình giải mã hay không
Kiểu 1 phát hiện dấu nhúng của tập dữ liệu được thao tác có tiềm nằng nhờ
w C
,0
,1),( (1.7)
Các hệ thống này trả lời câu hỏi: dấu nhúng w có được nhúng trong tập dữ
liệu ^cw hay không? Theo cách này nội dung thông tin của dấu nhúng là 1 bít Bằng
cách sử dụng thêm thông tin, tính bền vững của các phương pháp nhúng này thông thường sẽ tăng lên
- Nhúng dấu bán đui mù khác với phương pháp trên, hệ thống này không sử dụng dữ liệu gốc để phát hiện
∧
∧
= w
w c
w C
,0
,1),( (1.8)
điều này cần thiết trong các ứng dụng mà việc truy cập đến dữ liệu gốc không có ích hoặc không thể Các phương pháp nhúng dấu bán đui mù có thể được sử dụng để sao chép điều khiển và bảo vệ bản quyền
- Nhúng dấu đui mù là thách thức lớn nhất đối với việc phát triển của một hệ thống nhúng dấu Cả dữ liệu gốc mà và dấu nhúng đều không được sử dụng trong quá trình giải mã
điều này là cần thiết trong các ứng dụng mà n bít thông tin phải được đọc ngoài tập
dữ liệu đã nhúng dấu ^cw, ví dụ, trong việc theo dõi các bản sao được phân tán bất hợp pháp
Trang 21T ổng quát ta có phân loại như sau
Hình 1.3 : Phân loại nhúng dấu ẩn
Cách phân loại đơn giản nhất là theo nguồn đa phương tiện: nguồn cảm nhận (âm thanh, ảnh, video, đồ họa 3D) và nguồn không cảm nhận (văn bản, các đoạn mã nguồn có khả năng thực thi) Sự khác nhau chủ yếu là nguồn không cảm nhận thường yêu cầu xử lý, truyền tải, lưu trữ không mất mát thông tin Tuy nhiên, dữ liệu cảm nhận có giới hạn chịu đựng biến đổi, cho phép không phát hiện những thay đổi nhỏ
Mặc dầu nhiều kỹ thuật nhúng dấu ẩn có thể áp dụng chung cho các loại nguồn cảm nhận, đa số các phương pháp chỉ áp dụng với một loại duy nhất Nguyên nhân chính là chúng liên quan đến những giác quan khác nhau và về mặt sinh học thì quá trình nhìn thì phức tạp hơn quá trình nghe nhiều Phải dựa trên mô hình giác quan để chắc chắn rằng dữ liệu gốc đã được thay đổi theo cách thức khó cảm nhận được
Các phương pháp nhúng dấu ẩn
Theo nguồn đa phương tiện
Nguồn cảm nhận
Nguồn không cảm nhận
Theo cảm nhận của con người Thấy được
Không thấy được
Theo miền hệ số Miền không gian
Chịu được tấn công loại bỏ
Trang 22Theo cảm nhận của con người, kỹ thuật nhúng dấu ẩn có thể chia làm hai nhóm: thấy được và không thấy được Dấu ẩn thấy được chủ yếu được sử dụng trong ảnh và video, thường mang thông tin về bản quyền, về chủ sở hữu hoặc chính sách kiểm soát truy nhập để can ngăn những sử dụng trái phép ảnh đã nhúng dấu ẩn Phần lớn các nghiên cứu về nhúng dấu ẩn hiện nay đang tập trung vào nhúng dấu ẩn không thấy được
Ngoài ra, còn nhiều cách phân loại khác như phân loại theo miền nhúng dấu ẩn: miền tần số và miền không gian, theo khả năng chịu tấn công: bền vững hay dễ hỏng, …
1.4 Các mô hình nhúng d ấu ẩn
Mô hình nhúng dấu ẩn-mô hình truyền thông
Nhúng dấu ẩn có thể xem như là một bài toán truyền thông, trong đó dữ liệu
ẩn có thể được phân phối và dữ liệu gốc sẽ hoạt động như là vật mang hay là một phần của kênh truyền Các kỹ thuật như lọc, truyền thông trải phổ, dồn và phân kênh và mã sửa lỗi được sử dụng nhiều trong đánh dấu ẩn Ngoài ra, cấu trúc phân lớp giúp cho việc ưu tiên và phân tách nhiều vấn đề khi thiết kế
Hình 1.4 Mô hình truyền thông bảo mật cơ bản
Trang 23Hình 1.5 Mô hình truyền thông dấu nhúng cơ bản
Hệ thống truyền thông Hệ thống nhúng dấu ẩn
Kênh truyền thông Tín hiệu gốc
Các ràng buộc trên tín hiệu
được truyền vì giới hạn vật lý
Các ràng buộc trên dấu ẩn vì giới hạn chất lượng cảm nhận
Nhiễu Các tấn công vào tín hiệu gốc và dấu ẩn
Thông tin phụ tại bộ phát
hay/và bộ thu
Các hiểu biết về tín hiệu gốc, các tham số của quá trình nhúng dấu ẩn như khóa, …, tại bộ nhúng dấu
ẩn và bộ phát hiện dấu ẩn Dung lượng kênh truyền Dung lượng của nhúng dấu ẩn
Bảng 1.1: Sự tương đồng giữa hệ thống truyền thông và hệ thống nhúng dấu ẩn Các thành phần chính của hệ thống nhúng dấu ẩn bao gồm:
- Mô hình cảm nhận
- Cách thức nhúng 1 bit
- Cách thức nhúng nhiều bit thông qua kỹ thuật điều chế và giải điều chế
- Cách giải quyết vấn đề dung lượng nhúng không đều
- Cách cải thiện tính bền vững và tính bảo mật
- Dữ liệu nào cần nhúng
Trang 24Các thành phần này có thể thấy được trong các lớp, tương tự với cấu trúc lớp của truyền thông mạng máy tính Tầng vật lý của nhúng dấu ẩn giải quyết vấn đề làm thế nào 1 hoặc nhiều bit có thể nhúng không thấy được vào trong dữ liệu gốc Tầng này có 3 thành phần chính, (1) kỹ thuật nhúng 1 bit, (2) mô hình cảm nhận để đảm bảo tính không thấy được, và (3) các kỹ thuật dồn kênh/phân kênh để nhúng nhiều bit Các giao thức để thu được tính năng bổ sung được xây dựng trên đỉnh của tầng vật lý, như phương pháp kiểm soát dung lượng nhúng không đều, cải thiện tính bền vững, nâng cao dung lượng thông qua mã sửa sai
Sự khác nhau chính giữa hai mô hình này là việc mã hóa trong hệ thống truyền thông là nhằm bảo vệ các bit thông tin khỏi các biến đổi do kênh truyền trong khi trong hệ thống đánh dấu ẩn, việc nhúng dấu ẩn nhằm mục đích giảm thiểu các biến đổi về cảm nhận gây ra đối với nội dung được đánh dấu ẩn
Hình 1.6 Bộ phát hiện dấu nhúng cơ bản
Bộ mã hoá dấu nhúng sử dụng một tập con co j [1], , co j [l(co j )] gồm
tất cả các thành phần mang co được chọn từ khoá bí mật Thao tác thay thế co j [i] - m[i] trong các LSB đuợc thực hiện trong tập con này Quá trình đọc thu nhận giá trị của các bít Vì thế, bộ giải mã cần tất cả các thành phần mang được sử dụng suốt trong quá trình nhúng Tổng quát l(co) l(m); vì thế, tính bền vững có thể đuợc cải tiến bằng cách nhúng lặp lại dấu nhúng Việc chọn lọc ngẫu nhiên các thành phần
để nhúng và thay đổi LSB làm sinh ra lượng nhiễu nhỏ hơn và mật độ cố định Việc nhận ra các nhiễu này phụ thuộc vào ngưỡng chấp nhận của đối tượng mang gốc và
vì thế phụ thuộc vào nội dung của nó Ưu điểm chính của phương pháp này là trọng
Trang 25tải cao, trong khi đó nhược điểm đó là tính bền vững kém, việc thay đổi ngẫu nhiên LSB làm phá huỷ dấu nhúng Các đặc tính này của LSB giới hạn khả năng của nó
và đòi hỏi một môi trường số nghèo nàn
1.4.2 K ỹ thuật trải phổ
Truyền thông trải phổ bao gồm một số các kỹ thuật đánh dấu tín hiệu trong
đó băng thông được truyền có tầm quan trọng hơn được yêu cầu bởi tốc độ dữ liệu
và băng thông truyền được xác định một hàm độc lập với thông báo liên quan với người gửi và nguời nhận
Trước tiên dự kiến tăng sức chịu đựng đối với việc giảm nhiễu, các đặc điểm này cũng rất cần thiết với nhiều ứng dụng khác và trước tiên được áp dụng với lĩnh vực nhúng dấu số Sáng kiến về truyền thông trải phổ được Kiesler và Antheil để xuất
Mô hình:
Với việc sử dụng rộng rãi thuật ngữ trong ngữ cảnh trải phổ, tín hiệu mang
có thể được xem như một bộ nhiễu âm gây nhiễu cho tín hiệu trọng tải mang thông tin dấu nhúng
Giả sử tín hiệu mang được biểu diễn bởi N mẫu tần, và một tín hiệu trọng tải được biểu diễn bằng D ≤ N hàm cơ sở trực giao và đưa ra cơ sở
trực giao mở rộng không gian tín hiệu trong đó tín hiệu mang c(t) được biểu diễn
bằng công thức (1.10) trong không gian N chiều và trong đó tín hiệu biến đổi phụ thuộc thời gian t
= N
k k
c t
c
1
0);
()
2 2
)
tín hiệu trọng tải có thể không bị mất tính tổng quát được biểu diễn bằng D có xác
xuất tương đương và các tín hiệu trực giao năng lượng tương đượng được tính theo (1.12):
= N
k k ik
s
1
0 , 1
);
( )
i ik
m l
m l dt
t t dt
t t s s
0
, 1 )
( ) ( ,
) ( )
(1.12)
Trang 26Năng lượng trung bình của mỗi tín hiệu trọng tải được đưa ra bởi (1.13) Với x biểu diễn giá trị mong đợi thông qua thống kê toàn bộ
k
s ik
s
_ 2 _
2
1
;)
Kết hợp tín hiệu trọng tải và tín hiệu mang c(t) + s(t) được tương quan bởi
người nhận với tín hiệu đã được biết Như giả sử ở trên, năng lượng của tín hiệu mang bị giới hạn, lượng tăng thêm trung bình tương đương với tỉ lệ số chiều của không gian tín hiệu, độc lập với sự phân bố năng lượng tín hiệu của tín hiệu mang
Sự thu nhận:
Việc thu nhận tín hiệu trải phổ có thể sử dụng ba kỹ thuật sau:
1 Mô hình tham chiếu truyền (TR): việc phát hiện được thực hiện bởi gửi tín hiệu mang thành hai phiên bản, một phiên bản được điều chế và một phiên bản không được điều chế rồi xử lý cả hai tín hiệu thông qua bộ phát hiện tương quan
2 Mô hình tham chiếu lưu trữ (SR): yêu cầu người gửi và người nhận có thể phát sinh tín hiệu giả ngẫu nhiên giống nhau Hơn nữa, người nhận phải
có khả năng điều chỉnh bộ phát sinh tín hiệu mang để đồng bộ với đầu ra của tín hiệu mang đầu vào, việc phát hiện trên thực tế là giống với mô hình TR
3 Mô hình lọc phù hợp (MF): cung cấp một phản hồi xung băng rộng giả
ngẫu nhiên được sử dụng ở phía nhận để khôi phục tín hiệu trải phổ Trong số đó thì nhúng dấu số sử dụng mô hình TR, được xem như là nhúng dấu rõ ràng, một số sử dụng mô hình SR với cả hai loại nhúng dấu nửa đui mù và đui mù
Để dễ hiểu, ta xem xét trường hợp cụ thể nhúng dấu ảnh tĩnh áp dụng mô hình trải phổ như sau:
Toàn bộ mô hình của thuật toán được biểu diễn trong hình 1.7, sử dụng phép biến đổi theo miền tần số để chuyển đổi ảnh đầu vào sang miền khác
Trong miền tần số, một chuỗi các giá trị co = co[1], , co[n] được phân
tách từ ảnh Chuỗi này mang thông tin của tín hiệu và bị sửa đổi Dấu nhúng là chuỗi số thực w = w[1], ,w[n] Mỗi giá trị w[i] được chọn là độc lập với N(0,1) (phân bố Gaussian với µ = 0 và σ2 = 1)
Trang 27Hình 1.7 Mô hình nhúng của thuật toán nhúng dấu ẩn Cox
Rất nhiều kỹ thuật nhúng áp dụng mô hình giống thế này
Ba công thức khác nhau được đề xuất để nhúng dấu, chúng khác nhau về đặc trưng nhúng và về tính chuyển đổi ngược:
cw[i] = c[i] + αw[i] (1.14a) cw[i] = c[i](1 + αw[i]) (1.14b) cw[i] = c[i] exp( αw[i]) (1.14c)
Tham số cường độ dấu nhúng hoặc tỉ lệ α ảnh hưởng tốt đến robustness cũng như chất lượng hiển thị của dấu đã nhúng Trong các công thức trước đó, α là giá trị
tỉ lệ toàn bộ Các kết quả tốt hơn có thể thu được nhờ sử dụng phép nhân các tham
số tỉ lệ Lý thuyết Cox đưa ra đề xuất sử dụng biến đổi cô sin rời rạc DCT, mặc dù các loại biến đổi khác cũng đáp ứng được Kết quả của việc chèn các giá trị kết hợp
cw vào ảnh gốc để thu được ảnh nhúng dấu Thu nhận dấu nhúng cũng được dựa trên sự tương quan
Việc nhúng dấu bằng phương pháp này không bị giới hạn trong miền DCT
Có thể áp dụng với miền DFT và miền sóng
1.4.3 K ỹ thuật Patchwork
Dữ liệu dùng nhúng dấu được phân thành hai tập con phân biệt Chọn một thuộc tính của dữ liệu và thay đổi nó theo hướng đối lập trong hai tập đó Ví dụ, các
giá trị của mẫu được gán nhãn thuộc vào tập con A hoặc B Trong tập A, các giá trị
dữ liệu được tăng lên, trong khi đó trong tập B các giá trị của nó giảm đi một lượng
xác định g Việc chia tách hai mẫu này là bí mật được sử dụng trong bước nhúng và phát hiện Dấu nhúng có thể được phát hiện dễ dàng nếu dữ liệu phù hợp với các thuộc tính thống kê Kỹ thuật này được Bender đề xuất
Đặt N = NA = NB tương ứng là kích thước của các tập con và g là tổng số
lượng thay đổi trong các mẫu Đặt a[i] tương ứng là dữ liệu mẫu tại vị trí i của tập con A, và b[i] là dữ liệu mẫu trong tập B Sự khác nhau giữa các giá trị mẫu được
tính là:
Trang 28i b i a N i b N i a N S
B A
])[][(
1][
1][
1
(1.15) Giá trị mong đợi của sai khác này có thể tính bởi:
Một kiểm thử thống kê được xác định để so sánh với giá trị ngưỡng Mặc dù
kỹ thuật Patchwork khác với tiếp cận dựa trên tương quan của kỹ thuật trải phổ, nó giống với tương quan tuyến tính
1.4.4 K ỹ thuật điều chế chỉ số lượng tử
Mô hình nhúng dấu bằng cách điều chế chỉ số lượng tử (QIM) được đưa ra bởi Chen và Wornell Mô hình này được dựa trên một tập các bộ lượng tử hoá N chiều Thông báo m được truyền là chỉ số của bộ lượng tử hoá được sử dụng để
lượng tử véc tơ tín hiệu gốc co Trong khi thu nhận thông tin ẩn, một bộ lượng tử
hoá ước lượng ma trận khoảng cách cho tất cả các bộ luợng tử Chỉ số của bộ lượng
tử với khoảng cách nhỏ nhất sẽ cấu tạo nên thông báo m Để làm giảm tấn công bóp
méo, ràng buộc về bóp méo phải được thoả mãn: EK (co,m) = cm co, m Để làm
tăng tính bền vững, các giá trị được cấu trúc lại của các bộ lượng tử phải có khoảng cách lớn nhất Ví dụ của trường hợp 2 chiều (m=2) được biểu diễn trên hình 1.8
Hình 1.8 Ví dụ sử dụng hai bộ lượng tử để nhúng dấu x và o liên quan đến hai bộ lượng tử khác nhau Dấu + biểu thị giá trị hiện tại sẽ được lượng tử hoá Kết quả
phụ thuộc vào bộ lượng tử nào được chọn
Trang 291.5 Các v ấn đề đối với nhúng dấu ẩn
1.5.1 Yêu c ầu đặt ra đối với nhúng dấu ẩn
- Tính không thấy được
Trong nhúng dấu, thông thường yêu cầu tính chính xác cao, dữ liệu sau khi nhúng dấu trông phải giống như dữ liệu gốc, dù muốn hay không đây cũng là mục đích quan trọng Dấu nhúng phải bị ẩn đi và khiến cho người dùng không chú ý đến hoặc không nhận thấy được
- Dung lượng nhúng dấu
Khối lượng của dấu nhúng phải đủ lớn để lưu giữ thông tin cần thiết cho ứng dụng
có thể điều khiển được tùy thuộc vào phương pháp nhúng dấu
1.5.2 Các v ấn đề khi nhúng dấu
A, Dung lượng
Dung lượng nhúng dấu là một ước lượng bao nhiêu thông tin có thể ẩn vào trong dữ liệu Dung lượng nhúng dấu được xác định bởi mô hình thống kê Mục đích của dung lượng nhúng dấu đó là để phân tích giới hạn thông tin nhúng vào dữ liệu trong chừng mực vẫn đáp ứng các đặc tính ẩn và bền vững của dấu nhúng Dung lượng nhúng dấu có ý nghĩa quan trọng làm cho thuật toán nhúng dấu hiệu quả hơn
Trang 30Có thể sử dụng mô hình kênh cộng để xác định sự khác nhau giữa hai phương pháp khi xem xét sự cân bằng tính bền vững và dung lượng Để đơn giản hóa, ta thừa nhận rằng tồn tại nhiễu cộng, trắng, phân phối chuẩn (AWGN) trong cả hai mô hình Các điều kiện nhiễu cộng khác như nhiễu cộng, trắng phân phối đều (AWUN) và nhiễu màu có thể được nghiên cứu tương tự bằng cách áp dụng việc trắng hóa và/hoặc tính toán lại dung lượng dựa trên lý thuyết thông tin Cần chú ý là với một mô hình với phân phối nhiễu xác định và một ràng buộc tín hiệu dấu ẩn xác định thì sẽ có một dung lượng xác định Dung lượng sẽ khác đi nếu kênh được mô hình hóa khác đi Dung lượng là một hàm của phân phối nhiễu và ràng buộc dấu ẩn,
ví dụ năng lượng của nhiễu và dấu ẩn
Phương pháp nhúng loại 1
Trong phương pháp nhúng loại 1, dấu ẩn (có thể đã mã hóa, điều chế, và/hoặc co giãn) được nhúng vào dữ liệu gốc trên một số miền cụ thể hoặc trên các đặc trưng cụ thể, như hình 1.9 Ta giả thiết là chỉ nhúng một bit, do đó, sự khác nhau giữa tín hiệu đã nhúng dấu ẩn I1 và tín hiệu gốc I0 là một hàm của b (b là bit cần nhúng) ví dụ: I1 – I0 = f(b) Mặc dầu có thể phát hiện b trực tiếp từ I1, I0 vẫn được xem là nguồn nhiễu chính trong quá trình phát hiện Do đó, hiểu biết về I0 sẽ cải thiện hiệu năng phát hiện bằng cách ước lượng nhiễu
Hình 1.9: Mô hình kênh truyền của phương pháp nhúng loại 1
Dung lượng của loại 1
Mô hình kênh truyền của phương pháp loại 1 có đầu vào liên tục và đầu ra liên tục (CICO) Nhiễu thêm vào bao gồm nhiễu từ tín hiệu nguồn và nhiễu do xử lý/biến đổi Ta thừa nhận 2 điều: (1) tín hiệu gốc độc lập với nhiễu xử lý, và (2) cả hai đều là phân phối chuẩn Dung lượng nhúng dưới AWGN thu được với đầu vào phân phối chuẩn và bằng
2
log2
1
σ
σI CICO
I2
Kênh truyền Tín hiệu đã đánh dấu ẩn I1
I0
Tín hiệu gốc Nhiễu
Trang 31Hình 1.10: Mô hình kênh truyền phương pháp nhúng dấu ẩn loại 2
Dung lượng của loại 2
Hình 1.11: Kênh đối xứng nhị phân với xác suất lật p
Kênh truyền của loại 2 có đầu vào rời rạc với biên quyết định hoặc ở 1 vị trí (biên đơn) hoặc ở 2 vị trí (biên đôi) Trường hợp biên đơn ứng với thuật toán nhúng dấu ẩn ràng buộc về dấu, và biên đôi thông thường trong trường hợp ràng buộc phức tạp hơn như phương pháp nhúng dấu ẩn chẵn lẻ và bảng tra Đầu tiên, ta sẽ nghiên cứu trường hợp biên đơn, và sau đó, mở rộng kết quả cho trường hợp biên đôi Nếu sử dụng quyết định chặt, kênh sẽ là kênh đối xứng nhị phân đầu vào rời rạc,
I2
Kênh truyền Tín hiệu đã đánh
1
Trang 32đầu ra rời rạc (DIDO) Dung lượng của loại kênh này đã được nghiên cứu kỹ càng
và với đầu vào có xác suất ngang nhau, dung lượng được tính toán như sau:
p DIDO h
p
h p
1
1log)1(
2
:21
M A
M A M
−+
=1 log log 2 1
2 2 2
2 2
σ
AY DICO
Trong đó, E[.] là kỳ vọng đối với Y, hàm mật độ xác suất của Y là
2 2 2
2
2 ) ( 2 2
) ( 2
22
12
2
1)
πσπσ
A y A
y
e e
y f
−
− +
1
3:
32
:1
2:2
, ,
M A
M A M
A
Quyết định lỏng cho phép tỉ số tín hiệu dấu ẩn trên nhiểu A/ 2
σ là 2 ∼ 5dB thấp hơn dung lượng của quyết định chặt trong điều kiện có nhiễu AWGN và AWUN
Dung lượng của phương pháp nhúng dấu ẩn loại 2 trình bày ở trên là trong trường hợp biên đơn Tiếp theo, ta xét trong trường hợp biên đôi: đặc trưng của ảnh
Trang 33gốc bằng –A nếu nhúng 0 và bằng +A nếu nhúng 1 Trong thực tế, tín hiệu thường được ràng buộc lớn hơn +A hoặc nhỏ hơn –A để mã hóa bit 1 hơn là chính xác bằng
±A, do đó, sẽ có dung lượng lớn hơn Đặt bước lượng tử hóa là Q và xem xét đầu vào kênh X=kQ (nghĩa là, giá trị có mang dấu ẩn), lỗi sẽ xuất hiện khi đầu ra Y trong vùng Y>(k+1/2)Q hoặc Y<(k-1/2)Q Do đó, đối với mô hình kênh DIDO với nhiễu AWGN, xác suất lỗi bit p là
2 ) 3 4 (
2 ) 1 4 (
2 0
2
2
12
,2
1min2
)34(2
)14(2
,2
1min
k
Q k
Q k
dt t
(1.24)
Với tỉ số dấu ẩn trên nhiễu
σ
Q cao, ta có thể bỏ qua các vùng xa kQ nhưng cùng ánh
xạ tới cùng một giá trị như là kQ và xấp xỉ xác suất với biên trên:
1min2
2,2
1min
Q
dt t
Thay kết quả pAWGN vào công thức (1.17) sẽ thu được dung lượng kênh Như vậy, mô hình kênh truyền DIDO và DICO đã chứng minh tính khả thi trong thực tế của phương pháp nhúng dấu ẩn loại 2 Các mô hình kênh truyền này còn có thể được cải thiện thêm, ví dụ phương pháp kết hợp phép co giãn có hệ số co giãn lớn vào phương pháp nhúng dấu ẩn ràng buộc dựa trên lượng tử hóa của Chen
So sánh
Cố định MSE do nhúng là E2, để so sánh dung lượng của hai phương pháp nhúng dưới nhiễu AWGN ta đơn giản hóa như sau: với loại 1, chọn mô hình kênh CICO và thừa nhận rằng nhiễu AWGN bao gồm nhiễu xử lý phân phối chuẩn (với phương sai 2
σ ) và nhiễu từ tín hiệu gốc (với phương sai chuẩn gấp 10 lần phương sai chuẩn của tín hiệu dấu ẩn, nghĩa là σI =10E); với loại 2, chọn mô hình kênh nhị phân đối xứng DIDO với p cho phương pháp nhúng chẵn lẻ với bước lượng tử hóa
Q trong đó biến đổi MSE do nhúng bằng E2, nghĩa là Q= 3E Dung lượng thu được là
+ +
2 2
1
10 1 log 2
) 1 4 ( 2 , 2
1 min
k
Q k G Q k G
h C
σ σ
( 1.27)
Trang 34Sơ đồ (1.17) chỉ ra rằng dung lượng của loại 2 cao hơn rất nhiều so với loại 1 khi tỉ
số dấu ẩn trên nhiễu dương, phù hợp với các phân tích trên Từ đó, có thể thấy là loại 2 rất hữu ích trong điều kiện nhiễu thấp trong khi loại 1 phù hợp với nhiễu nghiêm trọng Dung lượng của cả hai loại 1 và 2 có thể tiếp cận thông qua mã hóa kênh như mã RS / BCH
B, Băng thông
Nhược điểm của nhúng dấu ẩn là nó phải cung cấp năng lượng bổ sung để truyền thông tin thứ hai Trên thực tế, băng thông truyền thông tin thứ hai có được bằng cách giảm băng thông truyền phương tiện gốc hoặc tăng băng thông tổng cộng
để truyền phương tiện đã nhúng dấu ẩn, điều này phụ thuộc vào việc chất lượng của phương tiện gốc có giảm hay không Trong trường hợp đơn giản nhất: nhúng một bit vào ảnh (hình 1.12), không gian của toàn bộ ảnh S thường được chia thành hai tập con không giao nhau S1 và S2 với S=S1 S2 bất chấp thuật toán cụ thể nào được sử dụng Khi bộ phát hiện thấy ảnh thuộc S1, nó sẽ cho đầu ra là bit đã nhúng
có giá trị bằng 0, và ngược lại, khi bộ phát hiện thấy ảnh thuộc S2, nó sẽ cho đầu ra
là bit đã nhúng có giá trị bằng 1 Bit đã nhúng có giá trị 0 hoặc 1 với xác suất ngang nhau, xác suất của ảnh thuộc vào tập con thứ nhất và tập con thứ hai là 0,5 Để mã hóa ảnh vào không gian, phải có ít nhất 1 bit dùng để xác định ảnh thuộc vào tập con nào Nói cách khác, một trong các bit dùng để mã hóa ảnh thực sự mang bit đã nhúng
Hình 1.12: Minh họa bản chất cấp phát lại bit của nhúng dấu ẩn
Nếu số lượng bit tổng cộng dùng để mô tả ảnh không thay đổi trong suốt quá trình nhúng dấu ẩn, một bit được cấp phát lại một cách lô gíc để chuyển từ mô tả ảnh sang mô tả dữ liệu được ẩn (một cách vật lý có thể có nhiều bit liên quan đến
dữ liệu được nhúng) Trong trường hợp này, chất lượng tuyệt đối của ảnh giảm vì ít bít sử dụng để mô tả hiệu quả ảnh hơn (trừ phi có dư thừa trong mô tả ảnh) Trong khi điều này chỉ ra rằng nhúng dấu ẩn không có ưu điểm tiết kiệm tốc độ bit so với các tấn công vào dữ liệu thứ hai mà không nhằm vào phương tiện gốc, nhúng dấu
ẩn có quá ít ưu điểm, bao gồm khả năng kết hợp dữ liệu thứ hai với phương tiện gốc thành một khối, sự chuẩn hóa dễ dàng và độ phức tạp tính toán thấp trong ứng dụng thực tế
Trang 35CHƯƠNG II NHÚNG DẤU ẢNH TĨNH
Nhúng dấu ảnh tĩnh là kỹ thuật tiêu biểu nhất cho ta quan sát và thực nghiệm Với kỹ thuật nhúng dấu nổi Dấu nhúng là các lô gô hình mờ, dòng ký tự được chèn lên bề mặt ảnh Với kỹ thuật nhúng dấu ẩn, lô gô hoặc chuỗi bít được chèn vào nội dung ảnh, nhưng lại cho kết quả ảnh đã nhúng dấu không quan sát được dấu nhúng
đó Ảnh đã nhúng dấu nhìn bằng mắt thường giống như ảnh gốc
Việc nhúng dấu vào ảnh tĩnh phải sử dụng đến các ứng dụng phần mềm được viết ra để nhúng dấu Và các phần mềm này phải sử dụng các thuật toán nhúng dấu (trong phần 2.2)
Dấu nhúng trong ảnh tĩnh vì thế mà khó phát hiện, khó giả mạo hoặc thay đổi
2.1 T ổng quan nhúng dấu ảnh tĩnh
2.1.1 Cơ bản nhúng dấu ảnh tĩnh
- D ấu nhúng được nhúng vào các thành phần độ chói
Với ảnh tĩnh, màu sắc dễ bị thay đổi hoặc chuyển đổi sang mức xám Trong việc nhúng dấu ảnh, dấu nhúng sẽ được nhúng vào các vùng bền vững của ảnh Các vùng có độ chói cao không được đánh giá chính xác, bởi vì các vùng đó có cấu trúc đơn giản nên khó che dấu thông tin Các vùng có cường độ gradient cao là thích hợp nhất để nhúng dấu Hay hiểu theo cách khác, đó là các đường biên có liên quan với cấu trúc ảnh và sự biến thiên độ chói
Rất nhiều mô hình nhúng dấu ẩn giấu dữ liệu vào thành phần độ chói để đối phó với hệ thống trực quan (HVS) - hệ thống này sử dụng hầu hết băng thông của
nó để nhận biết sự thay đổi độ chói Khi biến đổi ảnh, ví dụ bằng nén JPEG, thông tin độ chói cũng được quan tâm hơn thông tin màu sắc khi mà những thay đổi nhỏ
về độ chói dễ bị phát hiện hơn là thay đổi lớn về màu sắc Nếu việc nén ảnh thay đổi
độ chói của ảnh, sẽ sinh ra chất lượng nghèo nàn đối với HVS Để cho dấu nhúng bền vững trước nén, dấu nhúng phải ở trong vùng ảnh mà không bị thay đổi bởi nén
Đó là lý do tại sao phải nhúng dữ liệu vào thành phần độ chói
Năm 1997, có một đề xuất sử dụng kênh màu blue để nhúng dấu ảnh dựa trêm trải phổ Kênh màu blue được sử dụng bởi HVS ít nhạy cảm và phân bố thưa hơn so với màu green và red Qua thực nghiệm, khả năng của dấu nhúng kênh blue lớn hơn gấp 50 lần so với khả năng của dấu nhúng độ chói Điều này có nghĩa là dấu nhúng kênh blue bền vững hơn trước các tấn công lọc và thêm nhiễu Đối với nén JPEG cũng rất khả quan Tuy nhiên, có một vấn đề là dấu nhúng kênh blue rất khó điều khiển và dự báo Việc thiết kế các dấu nhúng kênh blue rất tinh vi và đòi hỏi mô hình của HVS phải thích ứng với dấu nhúng
Trang 36Có ba cách cơ bản để nhúng dấu vào ảnh nhị phân/ hội hoạ:
Mức điểm ảnh: thay đổi giá trị của các điểm ảnh riêng lẻ (sử dụng chọn lọc giả ngẫu nhiên) Cách này thích hợp với ảnh hội hoạ phân tán từng chấm Tuy nhiên nhiễu đen và trắng sẽ xuất hiện khi thực hiện với các kiểu ảnh nhị phân khác Có thể được thực hiện với ảnh nhị phân hoặc trực tiếp trên màn hình đồ hoạ ở bước thiết kế
Mức thành phần: thay đổi đặc tính của các nhóm điểm ảnh (ví dụ, vị trí hoặc khu vực của các thành phần đã kết nối) Đáng tiếc là sự thành công của cách này phụ thuộc vào kiểu loại ảnh gốc
Mức block: phân chia ảnh gốc thành các khối và thay đổi đặc tính của mỗi khối
Ba loại dấu ẩn này dẫn đến các thuật toán nhúng và phát hiện khác nhau
- Nhúng d ấu theo miền không gian và miền biến đổi
Thông thường có hai mô hình nhúng dấu phổ biến được phân loại gồm nhúng dấu theo miền không gian và nhúng dấu theo miền phổ Trong mô hình nhúng dấu miền không gian, dấu nhúng được nhúng trực tiếp vào ảnh bằng cách sửa đổi giá trị điểm ảnh của ảnh Mô hình này khá là đơn giản và thường không cần sử dụng đến ảnh gốc để phân tách dấu nhúng Nó có hiệu năng cao trong tính toán, nhưng có hạn chế về mặt chất lượng: đó là không đủ mạnh để chống lại các thao tác
xử lý tín hiệu thông thường vì thế dấu nhúng không trải đều ra toàn bộ ảnh và một
số thao tác xử lý tín hiệu thông thường có thể dễ dàng xoá bỏ dấu nhúng mà không ảnh hưởng đến chất lượng của ảnh đã nhúng dấu
Ngược lại, các mô hình nhúng dấu miền quang phổ thực hiện công việc nhúng dấu bằng cách thay đổi các hệ số phổ, sau khi ảnh được biến đổi sang miền quang phổ Ví dụ như miền biến đổi cô sin rời rạc, miền biến đổi Fourier rời rạc, miền biến đổi sóng rời rạc Các biến đổi này làm mất tính tương quan về giá trị không gian của ảnh, hầu hết năng lượng của ảnh tập trung vào các thành phần tần số thấp trong miền phổ Dấu nhúng thường được chèn vào các hệ số tần số thấp và trung bình và các thay đổi sẽ trải đều trên ảnh Hơn nữa, bởi vì các hệ số tần số thấp
Trang 37và trung bình hầu như ít bị ảnh hưởng suốt trong các thao tác xử lý tín hiệu so với các hệ số tần số cao Mô hình nhúng dấu miền phổ mạnh hơn mô hình nhúng dấu miền không gian
Miền DCT đã được mở rộng nghiên cứu bởi vì đây là phép biến đổi được sử dụng trong chuẩn nén JPEG, tại đó các nghiên cứu mở rộng về khả năng cảm nhận được thực hiện Các ưu điểm xa xôi của việc sử dụng DCT bao gồm cả yếu tố kết hợp nhiều tần số trong giải tần rất hiệu quả, biến đổi DCT được sử dụng rộng rãi trong các mô hình nén ảnh tĩnh và video, và các hệ số DCT bị ảnh hưởng bởi nén được biết là khá tốt Số lượng đáng kể các kỹ thuật nhúng dấu ảnh tĩnh dùng chung
mô hình này Chúng khác nhau chủ yếu là ở kiểu dạng tín hiệu, cách thức nhúng và thu nhận nội dung dấu nhúng
Vấn đề với các phương pháp nhúng dấu hiện hành đó là hầu hết trong chúng không phát hiện được dấu nhúng Mặc dù một số mô hình nhúng dấu DWT có thể phát hiện dấu nhúng theo tiến trình, nó rất ý nghĩa trong miền DCT, bởi vì các chuẩn nén JPEG dựa trên DCT ngày nay được sử dụng rất nhiều Trong một vài trường hợp, để đối phó với sự giới hạn băng thông mạng, cần phải truyền ảnh theo tiến trình và vì thế cần phát hiện dấu nhúng theo tiến trình
2.1.2 Công vi ệc nhúng dấu
A, Quá trình nhúng d ấu
Ta có khung công việc chi tiết như sau:
Hình 2.1: Quá trình nhúng dấu ẩn [8]
Các thuật toán chọn các đặc trưng quan trọng của tín hiệu gốc sao cho chúng
có thể thao tác được Phụ thuộc vào loại thuật toán và loại phương tiện, các đặc trưng là khác nhau, ví dụ với ảnh các đặc trưng có thể là các hệ số trong miền DCT,
Chọn giả ngẫu nhiên
Trang 38độ sáng trong khối 8 x 8 của miền không gian, Các đặc trưng được chọn là các đặc trưng chính phân biệt các thuật toán với nhau
Các đặc trưng có thể thao tác được này, ta gọi là site Bắt đầu bằng một tập các site- tập này nên có số lượng phần tử lớn- ta sẽ bắt đầu xử lý chọn
Ch ọn site:
có hai phương pháp chọn site: hoặc ngẫu nhiên hoặc định tính Trong chọn site ngẫu nhiên, khóa được sử dụng như là đầu vào của bộ tạo số giả ngẫu nhiên (PRNG) Với các số giả ngẫu nhiên này, ta chọn một tập con từ tập các site có thể của chúng ta Đây là ý tưởng của kỹ thuật trải phổ
Lo ại bỏ site xấu:
có thể muốn loại bỏ các site nào đó vì thay đổi chúng sẽ dẫn đến thay đổi lớn chất lượng ảnh
Ti ền xử lý dấu ẩn:
dấu ẩn bản thân nó là đã được tiền xử lý để dễ dàng khôi phục từ lỗi Phương
thức đơn giản để thực hiện điều này là lặp mọi bit trong dấu ẩn cr lần, thừa số cr được gọi là tốc độ chip Các phương pháp phức tạp hơn bao gồm mã hóa Hamming hoặc mã hóa Reed Solomon
Đồng bộ:
đồng bộ được sử dụng để phát hiện dịch chuyển, biến đổi hay loại biến đổi hình học nào khác có thể áp dụng được trên ảnh
Nhúng:
dấu ẩn được nhúng tại site đã chọn vào trong ảnh gốc
K ết hợp tín hiệu đã nhúng dấu ẩn và tín hiệu không đánh dấu:
để cải thiện đặc tính cảm nhận của tín hiệu đã đánh dấu ẩn Thông thường, tín hiệu đã nhúng dấu ẩn I* và tín hiệu gốc I được cộng theo từng phần tử (thường
là miền không gian) với trọng số cục bộ I’ = β I* + (1- β) I
Kết quả là tín hiệu đã đánh dấu I’
Không phải mọi thuật toán đều sử dụng tất cả các bước, nhưng ta thấy rằng hầu hết các thuật toán có thể trình bày và thực thi bằng cách sử dụng khung công việc này
Trang 39Một số bộ phát hiện chỉ tính toán xác suất có mặt dấu ẩn trong ảnh kiểm tra I’’, trong khi bộ phát hiện khác đọc dấu ẩn, thu được dấu ẩn tái tạo S’’ Bây giờ ta sẽ đánh giá cả hai khả năng có thể này
:1
i i
i i i
s s
s s
Sau đó, tỉ số lỗi bit được tính toán như sau:
N
p S
S BER( , ")= ∑ i ( 2.2)
Hệ số tương quan chuẩn
Một số bài báo sử dụng các hệ số tương quan chuẩn với các dấu ẩn là chuỗi có kỳ vọng 0
i i
i i
s s
s s S
)'',(
i
i i
s
s s S
S
Trang 40Từ công thức này, tỉ số tín hiệu thành nhiễu (SNR) có thể được tính toán như sau: SNR(S,S’’) = -10 log10(E(S,S’’))
Với các phép đo này, ngưỡng t có thể được sử dụng để quyết định xem nếu dấu ẩn tồn tại Ví dụ:
Dấu ẩn tồn tại nếu NC(S,S’’) > tC
Dấu ẩn không tồn tại nếu NC(S,S’’) ≤ tC
2.2 Phương pháp nhúng dấu theo miền không gian
2.2.1 K ỹ thuật nhúng dấu theo miền không gian
Rất nhiều phương pháp nhúng dấu sử dụng nhúng theo miền không gian Cách đơn giản nhất là thay đổi giá trị bít có bậc nhỏ nhất của các điểm ảnh được chọn Cách làm này chỉ tốt đối với ảnh không phải là đối tượng của mọi thay đổi nào Một dấu nhúng có thể được nhúng bằng cách chèn thêm một ký hiệu lên một vị trí trên bề mặt ảnh Dấu nhúng kết quả có thể hiện hoặc ẩn, phụ thuộc vào giá trị cường độ Các thao tác cắt, chỉnh sửa ảnh có thể sử dụng để loại bỏ dấu nhúng
Nhúng dấu miền không gian cũng có thể được thực hiện nhờ việc phân tách màu sắc Theo cách này, dấu nhúng chỉ xuất hiện trong một dải màu Điều này khiến cho dấu nhúng khó nhìn thấy vì thế khó phát hiện bằng mắt thường Tuy nhiên, dấu nhúng xuất hiện trực tiếp ngay sau khi màu được phân tách để in Khiến cho tài liệu vô dụng đối với máy in trừ khi dấu nhúng bị loại bỏ khỏi dải màu Tiếp cận này được sử dụng mang tính thương mại dùng cho báo chí để kiểm tra các ảnh
số từ kho lưu trữ ảnh trước khi mua các phiên bản không nhúng dấu
Thu ật toán nhúng dấu
Trong mô hình này, chỉ có 7 bít quan trọng nhất được sử dụng, những bít còn lại không bị ảnh hưởng suốt trong quá trình nhúng, tỉ lệ mức xám của các điểm ảnh lân cận để phát sinh thông tin phụ thuộc không có tính quyết định Đây là vấn đề quan trọng bởi vì việc nhúng dấu không tốn thời gian
Phần quan trọng nhất trong quá trình nhúng dấu đó là phương pháp phát sinh thông tin phụ thuộc bí mật S Trước hết, S phải phụ thuộc vào phần không được chọn của lân cận nhưng không phải là điểm ảnh được nó nhúng dấu Thứ hai, các lân cận bí mật được chọn theo cách ngẫu nhiên và kẻ tấn công không thể thu nhận được gì từ tín hiệu kết quả Do đó, chúng ta giới thiệu thông tin không quyết định trong việc tạo ra thông tin bí mật Thuật toán nhúng dấu được mô tả như sau:
1 Phát sinh dấu nhúng nhị phân w với khoá bí mật k được chia xẻ với bộ phát hiện
2 Thực hiện vòng lặp với mỗi điểm ảnh i trong ảnh f