Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, khi có bất kì sự can thiệp hay thay đổi nào tới ảnh gốc thì dấu thủy vân sẽ không còn nguyên vẹn, với kỹ thuật thủy vân này được
Trang 1Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
- -
Học viên thực hiện: Lê Minh Hoài
TÊN ĐỀ TÀI LUẬN VĂN:
TÌM HIỂU CÁC PHÉP BIẾN ĐỔI MA TRẬN SVD, QR
VÀ ỨNG DỤNG ĐỂ XÂY DỰNG LƯỢC ĐỒ THỦY VÂN
LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH
Thái Nguyên, tháng 07 năm 2014
Trang 2Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
- -
Học viên thực hiện: Lê Minh Hoài
TÊN ĐỀ TÀI LUẬN VĂN:
TÌM HIỂU CÁC PHÉP BIẾN ĐỔI MA TRẬN SVD, QR
VÀ ỨNG DỤNG ĐỂ XÂY DỰNG LƯỢC ĐỒ THỦY VÂN
Chuyên ngành: Khoa học máy tính
Trang 3Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công
bố trong bất kỳ công trình nào khác
Học viên
Lê Minh Hoài
Trang 4Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
Trước hết tôi chân thành cảm ơn Ban giám hiệu, phòng Đào tạo, các thầy cô giáo trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên đã quan tâm, tạo điều kiện thuận lợi, nhiệt tình giảng dạy và hướng dẫn tôi trong suốt quá trình học tập ở trường Đặc biệt tôi xin gửi lời cảm ơn chân thành nhất tới PGS.TS Nguyễn Bá Tường đã hướng dẫn, chỉ bảo và động viên trong suốt quá trình thực hiện luận văn
Cuối cùng tôi xin cảm ơn mọi sự giúp đỡ từ người thân, đồng nghiệp những người đã luôn ủng hộ, hỗ trợ tôi trong suốt quá trình thực hiện luận văn của mình Mặc dù đã có nhiều cố gắng, tuy nhiên luận văn của tôi không thể tránh khỏi những thiếu sót, do đó tôi rất mong nhận được những ý kiến đánh giá, bổ sung để tôi
có thể hoàn thiện luận văn của mình./
Thái Nguyên, ngày 07 tháng 10 năm 2014
Học viên
Lê Minh Hoài
Trang 5Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
LỜI CAM ĐOAN i
LỜI CẢM ƠN iv
DANH MỤC CÁC HÌNH MINH HỌA ix
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN 3
1.1 Ảnh số 3
1.1.1 Khái niệm 3
1.1.2 Phân loại ảnh 3
1.1.3 Histogram của ảnh 4
1.1.4 Cấu trúc tệp ảnh Bitmap 5
1.2 Chất lượng ảnh 6
1.2.1 Hệ số PSNR 6
1.2.2 Hệ số Diff 6
1.3 Một số phép biến đổi 7
1.3.1 Phép biến đổi Cosin rời rạc 7
Phép biến đổi DCT 1-D 8
Phép biến đổi DCT 2-D 9
1.3.2 Phép biến đổi SVD 10
1.3.3 Phép biến đổi QR 10
1.4 Giấu tin 11
1.4.1 Khái niệm giấu tin 11
1.4.2 Giấu tin trên miền không gian 14
1.4.3 Giấu tin trên miền biến đổi 14
1.5 Thủy vân số 15
1.5.1 Khái niệm thủy vân 15
1.5.2 Phân loại thủy vân 16
1.5.3 Một số tính chất của thủy vân số 19
1.5.4 Ứng dụng của thủy vân 21
CHƯƠNG 2: THỦY VÂN TRÊN MIỀN SVD 23
2.1 Phép biến đổi SVD 23
2.1.1 Khái niệm về SVD 23
2.1.2 Phép biến đổi SVD 24
Trang 6Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
2.1.4 Ví dụ minh họa khải triển SVD 25
2.2 Lược đồ thủy vân SVD-1 27
2.2.1 Ý tưởng của thuật toán 27
2.2.2 Thuật toán nhúng thủy vân 27
2.2.3 Thuật toán trích thủy vân 29
2.2.4 Nhận xét về lược đồ SVD-1 30
2.3 Lược đồ thủy vân SVD-N 30
2.3.1 Ý tưởng của thuật toán 30
2.3.2 Thuật toán nhúng thủy vân 30
2.3.3 Thuật toán trích thủy vân 32
2.3.4 Nhận xét về lược đồ SVD-N 32
2.4 Mã nguồn Chương trình thử nghiệm 33
CHƯƠNG 3 : THỦY VÂN TRÊN MIỀN QR 34
3.1 Phép biến đổi QR 34
3.1.1 Khái niệm về QR 34
3.1.2 Phép biến đổi QR 35
3.1.3 Xét ví dụ khai triển SVD 35
3.2 Lược đồ thủy vân QR-1 37
3.2.1 Ý tưởng của thuật toán 37
3.2.2 Thuật toán nhúng thủy vân 37
3.2.3 Thuật toán trích thủy vân 38
3.2.4 Nhận xét về lược đồ QR-1 38
3.3 Lược đồ thủy vân QR-N 39
3.3.1 Ý tưởng của thuật toán 39
3.3.2 Thuật toán nhúng thủy vân 39
3.3.3 Thuật toán trích thủy vân 40
3.3.4 Nhận xét về lược đồ QR-N 40
3.4 Kết quả thực nghiệm của các lược đồ SVD và QR 41
3.4.1 Bộ ảnh thử nghiệm 41
3.4.2 So sánh tính bền vững của các lược đồ thủy vân 41
3.4.3 So sánh SVD-1 và QR-1 tại các vị trí nhúng thủy vân khác nhau 42
3.4.5 Khả năng lựa chọn phần tử nhúng thủy vân 46
3.4.5.1 Chất lượng ảnh sau khi nhúng thủy vân 47
3.4.5.2 So sánh các lược đồ SVD-1 và QR-1 47
Trang 7Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
3.5 Chương trình thử nghiệm 49 TÀI LIỆU THAM KHẢO 61
Trang 8Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
DCT Discrete Cosine Transform Biến đổi Cosin rời rạc IDCT Invert Discrete Cosine Transform Biến đổi ngược DCT DFT Discrete Fourier Transform Biến đổi Forier rời rạc IDFT Invert Discrete Fourier Transform Biến đổi ngược DFT DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc IDWT Invert Discrete Wavelet Transform Biến đổi ngược DWT
FFT Fast fourier transfer Biến đổi Fourier nhanh GIS Geographic Information System Hệ thống thông tin địa lý PRNS Pseudo random number sequence Dãy số giả ngẫu nhiên
Trang 9Số hóa bởi Trung tâm Học liệu http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC HÌNH MINH HỌA
Hình 1.1 Biểu đồ histogram của ảnh màu Pepper
1999)
Hình 1.2 Thứ tự cấu trúc các thành phần của ảnh Bitmap
Hình 1.3 Sơ đồ quá trình giấu tin
Hình 1.4 Sơ đồ quá trình giải mã tin giấu
Hình 1.5 Phân loại các kỹ thuật thủy vân
Hình 1.6 Mô hình quá trình nhúng thủy vân
Hình 1.7 Mô hình quá trình tách và kiểm định thủy vân
Trang 10MỞ ĐẦU
Ngày nay, mạng Internet đã trở thành một trong các phương tiện truyền tải, chia sẻ thông tin, tài liệu một cách thuận tiện, hiệu quả Thông tin luôn sẵn sàng trực tuyến, mọi người đều có thể kết nối vào Internet để tìm kiếm một cách dễ dàng các thông tin cần thiết Bên cạnh đó, các công ty, các nhà cung cấp sản phẩm có thể bán sản phẩm của mình thông qua mạng Internet cũng như cung cấp dữ liệu, thông tin về các sản phẩm, dịch vụ của mình cho người dùng thông qua hệ thống mạng Internet một cách hiệu quả
Với lượng thông tin được truyền qua mạng ngày càng nhiều thì vấn nạn sao chép và sử dụng không hợp pháp dữ liệu số ngày một tăng Tuy nhiên việc quản lý và khai thác các thông tin này lại đôi khi nằm ngoài tầm kiểm soát của các cá nhân, tổ chức do nạn sao chép bất hợp pháp, vi phạm bản quyền ngày một gia tăng Từ đó cần thiết phải có các giải pháp chống sao chép để hạn chế việc vi phạm bản quyền các sản phẩm dữ liệu số
Một trong những giải pháp hữu hiệu để bảo vệ bản quyền các sản phẩm
dữ liệu số là kỹ thuật thủy vân số được xem là một trong những giải pháp quan trọng Thủy vân số dựa trên kết quả nghiên cứu của nhiều lĩnh vực khác nhau như: Mật mã học, kỹ thuật giấu tin, lý thuyết thống kê và xử lý tín hiệu
số Mục đích của phương pháp này là nhúng một lượng thông tin có ích vào các sản phẩm số (lượng thông tin này được gọi là thủy vân) Dựa trên mục đích sử dụng các lược đồ thủy vân được chia thành hai nhóm chính gồm thủy vân bền vững và thủy vân dễ vỡ Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, khi có bất kì sự can thiệp hay thay đổi nào tới ảnh gốc thì dấu thủy vân sẽ không còn nguyên vẹn, với kỹ thuật thủy vân này được ứng dụng trong bài toán xác thực tính toàn vẹn dữ liệu số Trong khi đó thủy vân bền vững được ứng dụng trong bài toán bảo vệ bản quyền đối với các sản phẩm
số
Trang 11Nội dung luận văn tập trung vào tìm hiểu một số kỹ thuật giấu tin trong ảnh số đã được công bố trên một số lược đồ thủy vân bền vững ứng dụng các phép biến đổi SVD, QR trong việc xác thực bảo vệ tác quyền trên dữ liệu ảnh
số Đây là hướng nghiên cứu có ý nghĩa khoa học và có nhiều ứng dụng trong
thực tế, vì thế em đã chọn đề tài nghiên cứu như sau: “Tìm hiểu các phép
biến đổi ma trận SVD, QR và ứng dụng để xây dựng lược đồ thủy vân”
Cấu trúc của Luận văn bao gồm các thành phần với nội dung như sau:
Mở đầu
Chương 1: Tổng quan
Trình bày tổng quan về các kiến thức cơ bản về ảnh số, các phép biến
đổi, thông tin về giấu tin và thủy vân trên ảnh số
Chương 2: Thủy vân trên miền SVD
Tập trung tìm hiểu, phân tích, đánh giá phép biến đổi SVD và chương trình SVD thử nghiệm
Chương 3: Thủy vân trên miền QR
Tập trung tìm hiểu, phân tích, đánh giá phép biến đổi QR và chương trình QR thử nghiệm
Trang 12CHƯƠNG 1: TỔNG QUAN
Thủy vân trên ảnh số là hướng nghiên cứu nhận được nhiều sự quan tâm của các nhà nghiên cứu trong và ngoài nước Để tăng cường tính bền vững cho các thuật toán thủy vân, hầu hết các lược đồ đều sử dụng miền biến đổi để nhúng dấu thủy vân thay cho việc sử dụng trực tiếp trên miền không gian ảnh
Nội dung chương này tập trung trình bày một số khái niệm liên quan đến ảnh
số, thủy vân số và một số phép biến đổi thường được sử dụng trong các lược đồ thủy vân như phép biến đổi DCT, phép biến đổi SVD và phép biến đổi QR
1.1 Ảnh số
1.1.1 Khái niệm
Như đã biết, ảnh số tự nhiên được lượng tử từ ảnh liên tục (ảnh tự nhiên)
Do vậy, dữ liệu của ảnh thường có sự tương quan cao Nói cách khác, các
điểm ảnh lân cận (liền kề) có giá trị xấp xỉ nhau
1.1.2 Phân loại ảnh
Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên dương gồm m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm ảnh Dựa theo màu sắc ta có thể chia ảnh số thành 3 dạng cơ bản như: Ảnh
nhị phân, ảnh đa cấp xám và ảnh màu (true color)
- Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và màu còn lại cho đối tượng của ảnh Nếu hai màu là đen và trắng thì gọi là ảnh đen trắng Như vậy, ảnh nhị phân được xem như một ma trận nhị phân
- Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau trong khoảng màu đen - màu trắng Như vậy, ảnh đa mức xám xem như là ma trận không âm có giá trị tối đa 255
Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn
bởi một số byte (thường 3 byte) đại diện cho 3 thành phần màu và như vậy,
Trang 13ảnh màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần màu của các điểm ảnh
Trong lĩnh vực giấu tin, mỗi dạng ảnh có những thuận lợi, khó khăn và cách tiếp cận riêng Tuy nhiên, một lược đồ giấu tin trên ảnh nhị phân ta có thể dễ dàng áp dụng cho ảnh đa cấp xám, hoặc ảnh màu thông qua tính chẵn
lẻ của giá trị điểm ảnh Nhưng từ lược đồ giấu tin trên ảnh màu hoặc ảnh đa cấp xám khó có thể áp dụng đối với ảnh nhị phân
1.1.3 Histogram của ảnh
Histogram là khái niệm cơ bản trong xử lý ảnh Histogram là bảng thống kê tần xuất giá trị cường độ sáng của các điểm ảnh Đối với ảnh màu, cường độ sáng của một điểm ảnh được xác định theo công thức:
trong đó R,G,B là giá trị các thành phần màu và là cường độ sáng của
điểm ảnh Ví dụ: Từ ảnh màu pepper.bmp ta có thể dễ dàng xác định được
biểu đồ histogram tương ứng như hình 1.3
Hình 1.1 Biểu đồ histogram của ảnh màu Pepper
Trang 141.1.4 Cấu trúc tệp ảnh Bitmap
Ảnh Bitmap được lưu trữ dưới dạng nhị phân, là một tệp định dạng được chia thành các thành phần như sau: Tiêu đề file (Bitmap Header), thông tin ảnh (Bitmap Infor), bảng màu (Pallete Table) và vùng dữ liệu (Data) Thứ
tự các thành phần trên được lưu trữ tuần tự trong bộ nhớ như hình minh họa
Header Info header
Optional palette
Image data
Hình 1.2 Thứ tự cấu trúc các thành phần của ảnh Bitmap
Ý nghĩa của các thành phần như sau :
- Tiêu đề file (Header): Mô tả thông tin chung về file định dạng Bitmap, độ dài của nó được cố định với mọi ảnh Bitmap
- Thông tin ảnh (Infor header): Mô tả thông tin về ảnh được lưu trữ, độ dài của nó cũng cố định
- Bảng màu (Optional Palette): Là bảng màu của ảnh Bitmap, độ dài của nó có thể bằng không ( không có bảng màu) đối với ảnh đen trắng và ảnh màu có số lượng màu lớn hơn 256 màu
- Vùng dữ liệu (Image Data): Chứa thông tin của từng điểm ảnh, độ dài của phần này phụ thuộc vào kích thước của ảnh Nó được lưu trữ theo hướng
từ dưới lên trên và từ trái qua phải
Trang 151.2 Chất lƣợng ảnh
Như đã đề cập ở trên, chất lượng ảnh chứa tin là một trong những yếu tố quan trọng trong giấu tin mật, đặc biệt là thủy vân số Chất lượng ảnh chứa tin
có thể được đánh giá bằng hệ số PSNR (Peak Signal-to-Noise Ratio) Lược đồ
có hệ số càng lớn thì chất lượng ảnh chứa tin càng cao
1.2.1 Hệ số PSNR
Như ta đã đề cập ở trên, chất lượng ảnh giấu tin là một trong các yếu tố quan trọng trong giấu tin mật, đặc biệt là thủy vân số Chất lượng ảnh chứa tin
có thể đánh giá bằng hệ số PSNR (Peak Signal to Noise Ratio) Lược đồ có hệ
số PSNR càng lớn thì chất lượng ảnh chứa tin càng cao Hệ số PSNR của ảnh chứa tin I’ so với ảnh gốc I kích thước m x n được tính theo công thức :
MSE
MAX PSNR 20 log10 (1.2)
Trong đó MAX, là giá trị cực đại của điểm ảnh và MSE (Mean Square Error) được xác định theo công thức :
x m
I I Diff
'
(1.4)
nó chính là độ sai khác trung bình giữa ảnh gốc và ảnh thuỷ vân
Trang 16Sử dụng Diff để đánh giá chất lượng ảnh của các lược đồ thuỷ vân Lược
đồ nào có Diff nhỏ hơn thì có chất lượng ảnh thuỷ vân tốt hơn
Trong các lược đồ thủy vân dưới đây chỉ xét ảnh đa cấp xám I có kích thước M×N (nếu I là ảnh màu thì sử dụng công thức I=0.299R+0.587G+0.114B để chuyển sang đa cấp xám) Như vậy ảnh thực chất là một ma trận nguyên không âm Giả sử I là ảnh gốc và I' là ảnh sau khi
nhúng dấu thuỷ vân (ảnh thuỷ vân) Để đánh giá chất lượng của ảnh thuỷ vân
I' có thể sử dụng chuẩn của ma trận hiệu I' - I:
M
i N
j
j i I j i I I
I
' '
) , ( ) ,
1.3.1 Phép biến đổi Cosin rời rạc
Biến đổi Cosine rời rạc (DCT - Descrete Cosine Transform) là một trong những phép biến đổi quan trọng trong lĩnh vực xử lý tín hiện nói chung
và nén ảnh nói riêng DCT đã trở thành một công cụ hữu ích trong các chuẩn nén dữ liệu hình ảnh, âm thanh
Cũng giống như các phép biến đổi khác, biến đổi Cosine rời rạc gồm: biến đổi thuận (DCT) và biến đổi ngược (IDCT - Inverse Descrete Cosine Transform) Phép biến DCT sẽ chuyển dữ liệu ở miền thời gian sang miền tần
số, và được thực hiện ngược lại đổi với phép biến đổi IDCT Nội dung chi tiết
về biến đổi Cosine rời rạc được trình bày trong các mục tiếp theo
Trang 17C n Gf
n
t t f
2
) 1 2 ( cos
2 1 0
(1.6) trong đó
1 , , 1 , 0 0
1
0 '
2
1
n f
f nêu
f nêu
Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần
số về miền thời gian được xác định theo công thức:
1 , , 1 , 0 ,
2
) 1 2 ( cos
0
n t
n
j t CjGj
n p
Ví dụ với 8 mẫu dữ liệu p = (12,10,8,10,12,10,8,11), áp dụng phép biến
đổi thuận ta nhận được 8 hệ số DCT tương ứng:
G=(28.6375; 0.571202; 0.46194; 1.757; 3.18198; -11.72956; 0.191342; 0.308709)
và áp dụng IDCT đối với G ta sẽ nhận được dãy dữ liệu p như ở trên
Trang 18Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh Nhưng không phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều
(hàng, cột) Tuy nhiên, đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên
các hàng và trên các cột Do vậy ta gọi phép biến đổi này là DCT 2-D
Theo [7], phép biến đổi thuận DCT 2-D đối với m x n giá trị của p trên
không gian 2 chiều được xác định theo công thức:
' 2
) 1 2 ( cos 2
) 1 2 ( cos
0
, 1
0 ,
n
i x m
j y p
C C mn G
n
x
y x m
y j i
với 0 ≤ i ≤ n - 1, 0 ≤ j ≤ m - 1 và Ci,Cj được xác định:
1 , , 1 , 0 0
1
0 '
2
1
n f
f nêu
f nêu
Khi đó, hệ số đầu tiên G0,o gọi là phần tử DC và các hệ số còn lại là AC
Phép biến đổi IDCT 2-D tương ứng đối với m x n hệ số G về miền không gian được tính theo công thức:
' 2
) 1 2 ( cos 2
) 1 2 ( cos
0
, 1
0 ,
n
j x m
i y G
C C mn
p
n
x
j j i m
y y
với 0 ≤ i ≤ n-1, 0 ≤ j ≤ m-1 và Ci,Cj được xác định:
1 , , 1 , 0 0
1
0 '
2
1
n f
f nêu
f nêu
Trang 190 '
8
) 5 0 ( cos 8 1
0 '
8 1
i nêu i
j
i nêu
(T là ma trận trực chuẩn nên T ↑’ = T ↑ (-1))
Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnh P
để nhận được khối hệ số DCT G theo công thức:
cũng giống như DCT, DWT đều là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần tử
cố định của miền biến đổi Năng lượng ảnh tập trung vào phần tử D(1,1) trong
phép biến đổi SVD phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công
1.3.3 Phép biến đổi QR
Phép biến đổi QR (QR Decomposition: A=Q×R) cũng giống như DCT,
DWT là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần tử cố định của miền biến
đổi Năng lượng ảnh tập trung vào hàng đầu của ma trận R trong phép biến
đổi QR Các phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công
Trang 201.4 Giấu tin
1.4.1 Khái niệm giấu tin
* Một là bảo vệ cho chính đối tượng được giấu tin bên trong Đây chính
là thủy vân số, là lĩnh vực rất đa dạng, có nhiều mục đích và đang được quan tâm, nghiên cứu rất nhiều; tính ứng dụng của nó trong hiện tại rất lớn và đã có nhiều kỹ thuật được đề xuất
* Hai là bảo mật cho dữ liệu được đem giấu Chính là giấu tin mật, tập trung vào các kỹ thuật giấu tin sao cho người khác rất vất vả, khó khăn mới phát hiện được đối tượng có chứa thông tin mật bên trong
, h
con (DWT)
Trang 21
* Mô hình kỹ thuật giấu tin:
Hình 1.3 Sơ đồ quá trình giấu tin
Trong các mô hình kỹ thuật giấu tin được mô tả như trong các hình minh họa 1.3 và 1.4 dưới đây Theo mô hình 1.3 biểu diễn sơ đồ quá trình giấu tin ta thấy ở đây phương tiện chứa thông tin bao gồm các đối tượng được dùng làm môi trường để giấu tin như các tệp đa phương tiện Thông tin cần giấu là một lượng thông tin mang ý nghĩa và mục đích nào đó tùy thuộc vào mục đích và yêu cầu của người sử dụng Thông tin sẽ được giấu vào trong môi trường chứa thông tin nhờ một bộ nhúng thông tin Bộ nhúng thông tin là những chương trình có chứa các thuật toán để giấu thông tin và được thực hiện với một khóa bí mật giống như các hệ mật mã
Sau khi giấu thông tin ta thu được một môi trường đã giấu tin và sẽ được truyền tải, phân phối trên các phương tiện truyền thông khác nhau
Thông tin cần giấu
Dữ liệu môi trường đã được giấu tin
Khóa
Trang 22Hình 1.4 Sơ đồ quá trình giải mã tin giấu
Trong hình 1.4 đã chỉ ra các nhiệm vụ của quá trình giải mã thông tin
đã được giấu Quá trình giải mã này phải được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin và kết hợp với khóa để giải mã tin Khóa để giải mã tin này có thể giống hay khác với khóa đã nhúng tin Kết quả thu được bao gồm môi trường gốc và thông tin đã được che giấu Tùy theo các trường hợp cụ thể, thông tin tách được ra có thể phải cần xử lý, kiểm định
và so sánh với thông tin đem giấu ban đầu Thông qua dữ liệu được tách ra từ môi trường chứa thông tin giấu, người ta có thể biết được trong quá trình truyền tải, phân phát dữ liệu có bị xâm phạm, tấn công hay không
Đối với các hệ thống giấu thông tin mật thì rất quan tâm đến tính an toàn
và bảo mật thông tin của dữ liệu cần giấu Hệ thống giấu tin mật có độ bảo mật cao nếu có độ phức tạp của các thuật toán thám mã khó có thể thực hiện được trên máy tính Tuy nhiên, cũng có các hệ thống chỉ quan tâm đến số lượng thông tin có thể được che giấu, hay quan tâm đến sự ảnh hưởng của thông tin mật đến các môi trường chứa dữ liệu
Dữ liệu môi trường thông
tin(Hình ảnh,
âm thanh, phim, )
Bộ giải
mã thông tin
Thông tin cần giấu
Dữ liệu môi trường
đã được giấu tin
Khóa
Kiểm định
Trang 231.4.2 Giấu tin trên miền không gian
Miền không gian của ảnh là miền dữ liệu của ảnh gốc, tác động đến miền không gian ảnh chính là tác động trực tiếp đến các điểm ảnh, làm thay đổi giá trị của điểm ảnh Đây là xu hướng trực quan được tập trung khai thác trong quá trình thủy vân trong ảnh, khi nói đến việc giấu tin trong ảnh chính
là nhằm thay đổi giá trị các điểm ảnh gốc, những bít ít quan trọng của mỗi điểm ảnh đảm bảo cho ảnh được chỉnh sửa giá trị điểm ảnh gần nguyên gốc nhất
Tuy nhiên, phương pháp này có nhiều nhược điểm, chẳng hạn như tính bền vững không được đảm bảo với dấu thủy vân qua các thao tác biến đổi ảnh như quay chụp ảnh, nén ảnh các tác tác động đó đôi khi cũng làm sai lệch điểm ảnh dẫn đến các bít ít quan trọng nhất cũng bị thay đổi
Phương pháp biến đổi dựa trên miền không gian như trình bày ở trên là cách biến đổi tín hiệu và miền giá trị rời rạc của các điểm ảnh được gọi là miền biến số độc lập Trong thực thế phép biến đổi trực tiếp này gặp phải những khó khăn và hiệu quả không cao
Ngoài phương pháp biến đổi trực tiếp, có dùng phương pháp biến đổi gián tiếp thông qua các phép biến đổi trực giao làm nhiệm vụ chuyển miền không gian sang miền biến đổi
1.4.3 Giấu tin trên miền biến đổi
Miền biến đổi hay còn gọi là miền tần số là miền nhận được khi biến đổi miền ảnh Đây là kỹ thuật sử dụng phương pháp biến đổi như tính tích phân hay phương pháp đổi hệ tọa độ trong tích đề các Phương pháp này nhằm chuyển miền không gian sang miền tần số, cụ thể là biến đổi tín hiệu và miền giá trị rời rạc của các điểm ảnh sang miền mới và có biến số mới
Mỗi phép biến đổi có những thuận lợi và khó khăn riêng, tùy vào trường hợp cụ thể để lựa chọn phép biến đổi nào cho phù hợp Sau khi biến
Trang 24đổi các tín hiệu và miền giá trị rời rạc trong miền biến số mới này, nếu cần thiết có thể dùng phép biến đổi ngược lại để đưa ảnh về miền biến số độc lập
Phương pháp biến đổi gián tiếp làm đơn giản rất nhiều các công việc gặp phải khi dùng phương pháp biến đổi trực tiếp trong miền biến số độc lập
Có một số phương pháp biến đổi phổ biến hiện nay như: Fourier, Cosin rời rạc (DCT), Wavelet là những phép biến đổi được sử dụng phố biến trong các kỹ thuật xử lý multimedia, đặc biệt trong xử lý ảnh số Ngoài ra các phép biến đổi này còn dùng nhiều trong lĩnh vực giấu tin, thủy vân số
1.5 Thủy vân số
1.5.1 Khái niệm thủy vân
Thủy vân trên ảnh số là kỹ thuật nhúng một lượng thông tin vào một bức ảnh số, các thông tin được nhúng có thể được ẩn hoặc hiện thị phụ thuộc vào kỹ thuật thủy vân cụ thể Trong kỹ thuật thủy vân số thì thông tin nhúng được gọi là thủy vân Thủy vân có thể là một chuỗi các ký tự, một hình ảnh, hay một logo nào đó Có thể chia thủy vân số thành hai nhóm là thủy vân dễ
vỡ và thủy vân bền vững
* Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, sao cho nếu có một phép biến đổi nào làm thay đổi ảnh gốc thì thủy vân được giấu trong đó sẽ không còn nguyên vẹn như thủy vân gốc
* Ngược lại, với kỹ thuật thủy vân dễ vỡ là thủy vân bền vững Các kỹ thuật thủy vân bền vững thường được sủ dụng trong các ứng dụng bảo vệ tác quyền Trong những ứng dụng đó, thủy vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp Thủy vân được nhúng trong các sản phẩm như một hình thức dán tem bản quyền Trong thường hợp như thế, thủy vân phải tồn tại bền vững cùng sản phẩm nhằm chống việc tẩy xóa, làm giả hay biến đổi nhằm phá hủy thủy vân Một yêu cầu lý tưởng đối với thủy vân bền vững là nếu muốn phá hủy thủy vân thì chỉ có cách duy nhất là phá hủy sản phẩm
Trang 251.5.2 Phân loại thủy vân
Nói đến thủy vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng nhằm đảm bảo an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: Bảo vệ bản quyền, xác thực thông tin, chống xuyên tạc, điều khiển sao chép, ta có thể nhận thấy tính ứng dụng của thủy vân rất là lớn, với mỗi ứng dụng lại có các yêu cầu đặc trưng riêng, do đó các kỹ thuật thủy vân này cũng
có những tính năng khác biệt tương ứng
Trong kỹ thuật thủy vân số thì thông tin nhúng được gọi là thủy vân Thủy vân có thể là một chuỗi ký tự hay là một tệp hình ảnh, biểu tượng
Thủy vân trên ảnh số là kỹ thuật nhúng một lượng thông tin số vào một bức ảnh số và thông tin nhúng được gắn liền với bức ảnh chứa và dữ liệu thủy vân có thể được hiển thị hay ẩn là tùy thuộc vào mỗi kỹ thuật thủy vân cụ thể
Có thể chia các kỹ thuật thủy vân theo các nhóm như hình minh họa như hình 1.5 như sau
Hình 1.5 Phân loại các kỹ thuật thủy vân
Các kỹ thuật thủy vân trên hình 1.5 được phân biệt khác nhau bởi những đặc trưng, tính chất của từng kỹ thuật và khía cạnh ứng dụng của những kỹ thuật đó Trong thực tế, tùy theo mục đích, yêu cầu của bài toán mà
ta sẽ chọn kỹ thuật thủy vân phù hợp Tuy nhiên, các kỹ thuật này cũng có một số đặc điểm giống nhau
Thủy vân số
Trang 26Với kỹ thuật thủy vân bền vững thường được sử dụng trong bài toán bảo vệ bản quyền Trong những ứng dụng đó, thủy vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp Thủy vân được nhúng vào trong các sản phẩm như là hình thức dán tem bản quyền Trong các trường hợp này thì thủy vân phải tồn tại bền vững cùng với sản phẩm, nhằm chống lại việc tẩy xóa, làm giả hay biến đổi phá hủy thủy vân Một yêu cầu lý tưởng đối với thủy vân bền vững là nếu muốn loại bỏ thủy vân này thì chỉ còn có cách duy nhất là phá hủy sản phẩm Thủy vân bền vững lại được chia thành hai loại là thủy vân
ẩn và thủy vân hiện Thủy vân hiện là loại thủy vân được hiện lên ngay trên sản phẩm và người sử dụng có thể nhìn thấy được, ví dụ như các biểu tượng của các đài truyền hình trên các kênh vô tuyến VTV1, VTC1, Bibi, Các thủy vân hiện trên ảnh thường hiển thị dưới dạng chìm, mờ hoặc trong suốt nhằm không gây ảnh hưởng đến chất lượng các sản phẩm ảnh gốc Đối với thủy vân hiện này thì thông tin bản quyền hiển thị ngay trên sản phẩm; còn đối với thủy vân ẩn thì cũng giống như giấu tin, yêu cầu tính ẩn rất cao, bằng mắt thường không thể nhìn thấy thủy vân Trong vấn đề bảo vệ bản quyền, thủy vân ẩn mang nhiều tính bất ngờ hơn trong việc phát hiện sản phẩm bị lấy cắp Trong trường hợp này thì người chủ sở hữu hợp pháp sẽ đưa ra bằng chứng là thủy vân đã được nhúng vào trong sản phẩm đó
Còn đối với thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh sao cho sản phẩm khi phân phối, truyền tải trong các môi trường nếu có bất
kỳ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thủy vân
đã được giấu trong đối tượng đó sẽ không còn nguyên vẹn như thủy vân gốc Các tính chất của kỹ thuật thủy vân này thường được sử dụng trong các ứng dụng xác thực thông tin và phát hiện thông tin bị xuyên tạc Đó chính là nguyên nhân vì sao các ứng dụng loại này rất cần đến kỹ thuật thủy vân dễ
vỡ Ví dụ như để bảo vệ chống bị xuyên tạc một ảnh nào đó, người ta nhúng một thủy vân vào đó và sau đó quảng bá, phân phối đối tượng này Khi cần
Trang 27kiểm tra lại người ta sử dụng hệ thống đọc thủy vân, nếu không đọc được thủy vân hoặc thủy vân đã bị sai lệch nhiều so với thủy vân ban đầu đã được nhúng vào đối tượng thì có nghĩa là bức ảnh đó đã bị thay đổi, chỉnh sửa,
Mô hình hệ thống thủy vân thường liên quan đến các quá trình sau:
* Quá trình nhúng thủy vân
*Mô hình quá trình nhúng thủy vân được minh họa như hình 1.4
Hình 1.6 Mô hình quá trình nhúng thủy vân
* Quá trình tách thủy vân
Ảnh chứa thủy vân SW trong quá trình phân phối, truyền tải có thể bị
sử dụng trái phép, người sử dụng có thể đã dùng một số phép biến đổi nhằm
toán thủy vân Ảnh gốc S
Thủy vân W
ảnh chứa thủy vân
Trang 28tác động, tấn công vào SW nhằm phá hủy thủy vân nếu có trong đó, các tấn công vào trong SW sẽ tạo ra SW*
Quá trình tách thủy vân từ ảnh chứa SW* ( SW* có thể trùng với SW) tiến hành quá trình:
- Sử dụng ảnh chứa thủy vân SW*, hệ thống khóa K đã sử dụng trong quá trình nhúng thủy vân
- Tùy theo kỹ thuật, ảnh gốc S có thể sử dụng
- Tách thủy vân được thực hiện theo một thuật toán đã xác định Kết quả là thông tin thủy vân W* được tách ra từ SW*
- Thủy vân tách được cần so sánh với thủy vân gốc W để đưa ra những kết luận
Mô hình quá trình tách thủy vân trong hệ thống thủy vân được minh họa như hình 1.7 như sau:
Hình 1.7 Mô hình quá trình tách và kiểm định thủy vân
1.5.3 Một số tính chất của thủy vân số
Hệ thủy vân trên ảnh cũng là một hệ giấu tin cho nên cũng có một số đặc điểm và tính chất giống như che giấu thông tin trong ảnh như sau:
- Phương tiện chứa là hình ảnh hai chiều tĩnh
toán tách thủy vân
Ảnh gốc S
Thủy vân W
Thủy vân được tách
ra W*
Thủy vân gốc
W
Kiểm định
Kết luận
Trang 29- Thông tin được giấu vào trong ảnh nhưng không ảnh hưởng nhiều đến chất lượng hình ảnh đó
- Kỹ thuật che giấu phụ thuộc vào bản chất của hệ thống thị giác của con người
- Ngoài các đặc điểm chung đã nêu ở trên thì kỹ thuật thủy vân trên ảnh
số được phân biệt với ký thuật giấu tin mật ở những đặc trưng sau:
* Thông tin thủy vân có hoặc không bị biến đổi khi ảnh chứa bị thay đổi:
Với hệ thống thủy vân bền vững, các yêu cầu thông tin thủy vân không thay đổi trước các tác động làm biến dạng thông tin trên ảnh chứa thủy vân;
và ngược lại hệ thống thủy vân dễ vỡ yêu cầu thông tin thủy vân sẽ bị thay đổi (vỡ) khi có bất kỳ sự thay đổi, tác động nào vào ảnh chứa thủy vân
* Thủy vân hiện, thủy vân ẩn
Không giống như giấu thông tin mật với yêu cầu bắt buộc là thông tin che giấu phải ẩn bên trong ảnh sao cho mắt thường không nhận biết được sự tồn tại của thông tin giấu Nhưng kỹ thuật thủy vân số lại có hai loại là thủy vân hiện và thủy vân ẩn Có nghĩa là có loại thủy vân cho phép nhìn thấy được thông tin được nhúng vào và có loại không thể nhìn thấy được Thủy vân hiện thường được ứng dụng cho mục đích tuyên bố, công khai về quyền
sở hữu và ngược lại thủy vân ẩn thường được sử dụng với mục đích như giấu
bí mật các thông tin xác nhận quyền sở hữu sản phẩm
* Tính chất bền vững
Đó chính là đặc tính quan trọng nhất của một hệ thống thủy vân bền vững Đối với hệ thống thủy vân này thì yêu cầu đầu tiên là hệ thủy vân phải chống lại được các phép biến đổi hay tấn công có chủ đích hoặc không có chủ đích lên ảnh chứa thủy vân Tiêu chuẩn của nó là thủy vân phải tồn tại cùng
Trang 30với sự tồn tại của ảnh chứa, thủy vân chỉ bị phá hủy khi ảnh chứa chấp nhận mất đi phần lớn chất lượng của mình
1.5.4 Ứng dụng của thủy vân
Yêu cầu cơ bản nhất của hệ thống thủy vân là phải đảm bảo tính chất bền vững và người ta đã ứng dụng kỹ thuật giấu tin vào vào một số bài toán sau:
* Bài toán bảo vệ quyền tác giả: Đây là ứng dụng cơ bản nhất của kỹ
thuật thủy vân số Một thông tin nào đó mang ý nghĩa đặc trưng riêng, bản quyền được sở hữu bởi tác giả thì gọi nó là thủy vân, thông tin này sẽ được nhúng vào trong các sản phẩm đa phương tiện, và nó là minh chứng cho bản quyền của tác giả nhằm bảo vệ các sản phẩm chống lại các hành vi, vi phạm lấy cắp hoặc làm nhái Các yêu cầu kỹ thuật đối với ứng dụng này là thủy vân phải tồn tại bền vững cùng với sản phẩm, chỉ khi muốn bỏ thủy vân này mà không được phép của người chủ sở hữu hay tác giả thì chỉ còn có cách là phá hủy sản phẩm đó
* Bài toán giấu tin mật: Với bài toán này, thông tin cần được che giấu
trong trường hợp này là cần được bảo vệ trước các đối tượng không được phép Việc giải mã nó để nhận được thông tin cũng không cần dữ liệu môi trường gốc Đối với các thuật toán giấu thông tin mật này không quan tâm đến việc bảo vệ thông tin mật trước sự tấn công, phá hoại của các đối thủ mà thay vào đó là các thuật toán rất chú trọng đến tính ẩn và tính an toàn đối với dữ liệu thông tin cần che giấu Do đó, các thuật toán giấu tin này có độ bảo mật
cao sẽ được dùng trong các ứng dụng giấu tin mật
* Bài toán xác thực thông tin: Với bài toán này, một số thông tin sẽ
được che giấu trong dữ liệu nguồn và thông tin này sẽ được sử dụng để nhận biết xem dữ liệu nguồn có bị thay đổi, biến dạng hay không Với loại ứng dụng này thì thủy vân cần được ẩn để tránh được sự tò mò, nhận thấy của đối
Trang 31thủ, hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên tạc thông tin nguồn cũng rất cần được quan tâm chú ý Các ứng dung trong thực tế, người ta mong muốn tìm được vị trí bị xuyên phá cũng như nhận biết được các thay đổi Các yêu cầu chung đối với loại ứng dụng này là khả năng giấu thông tin rất cao và
thủy vân không cần bền vững
* Bài toán kiểm soát sao chép: Với bài toán này, thủy vân được sử
dụng để kiểm soát việc sao chép thông tin Các thiết bị phát hiện ra thủy vân thường được cài đặt sẵn trong các hệ thống đọc và ghi Các ứng dụng thuộc bài toán này yêu cầu thủy vân phải được đảm bảo an toàn và cũng sử dụng
phương pháp phát hiện thủy vân đã giấu mà không cần thông tin gốc
* Bài toán dán nhãn hay giấu vân tay: Với bài toán này, thủy vân số
được sử dụng để nhận diện người gửi hay người nhận của một thông tin nào
đó Các thủy vân khác nhau sẽ được nhúng vào các bản sao khác nhau của thông tin gốc trước khi gửi đi cho nhiều người khác nhau Yêu cầu của các ứng dụng này là đảm bảo độ an toàn cao cho các thủy vân nhằm tránh sự xóa dấu vết trong khi phân phối, truyền tải
Trang 32CHƯƠNG 2: THỦY VÂN TRÊN MIỀN SVD
Như đã đề cập trong Chương 1, các lược đồ thủy vân nhúng tin trên miền không gian có khả năng phát hiện mọi sự thay đổi trên ảnh thủy vân dù chỉ một vài bít Tuy nhiên, đối với dữ liệu ảnh, thông thường người dùng chấp nhận sự thay đổi ảnh do thay đổi định dạng hoặc lỗi một vài bít trên đường truyền nhưng không làm thay đổi nội dung và ý nghĩa của ảnh thủy vân Để giải quyết vấn đề này, một số lược đồ thủy vân bán dễ vỡ thường sử dụng miền biến đổi để nhúng dấu thủy vân Nội dụng chương này sẽ tập trung trình bày hai thuật toán thủy vân dựa trên phép biến đổi SVD [8- 12] Phương pháp SVD1 nhúng một bít của dấu thủy vân trên phần tử D(1,1) hoặc U(1,1) hoặc V(1,1) như trong các tài liệu [8,9,10], lược
đồ SVDN nhúng một số bít vào bít thấp của ma trận đường chéo D như trong 12] Ngoài những ưu điểm bền vững so với miền không gian, hai lược đồ này thực hiện thủy vân trên từng khối ảnh nên có khả năng định vị vùng ảnh giả mạo (vùng ảnh có dấu thủy vân thay đổi), điều này sẽ giúp người dùng an tâm sử dụng những vùng ảnh chưa bị tấn công mà còn dự đoán được mục đích của sự tấn công trên ảnh thủy vân
[11-2.1 Phép biến đổi SVD
2.1.1 Khái niệm về SVD
Phép biến đổi SVD (Singular Value Decomposition: T
V D U
giống như DCT, DWT đều là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần tử cố
định của miền biến đổi Năng lượng ảnh tập trung vào phần tử D(1,1) trong
phép biến đổi SVD, thì phần tử này có tính ổn định cao; vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công
Có hai hướng nghiên cứu xây dựng các lược đồ thủy vân dựa trên cách
tiếp cận này Hướng thứ nhất: Nhúng dấu thủy vân vào ma trận D bằng cách nhúng vào phần tử D(1,1) hoặc U(1,1) hoặc V(1,1) như [8-10] Hướng thứ hai: Nhúng dấu thủy vân vào một số phần tử trên ma trận đường chéo D như
[11-12] Ngoài ra, có nhiều nghiên cứu sử dụng đồng thời phân tích SVD với
Trang 33các phép biến đổi ma trận khác như DCT, DWT, để xây dựng các lược đồ thủy vân kết hợp như trong [8, 11,12].
2.1.2 Phép biến đổi SVD
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành
tích của 3 ma trận thực theo công thức như sau:
T
V D U
Để tiện lợi cho việc tính toán, dưới đây sẽ sử dụng chuẩn 1 (1-norm)
được định nghĩa là tổng giá trị tuyệt đối các phần tử của véc tơ hoặc ma trận:
m
i n
j
j i Y Y
) ,
Ảnh gốc và ảnh thuỷ vân
Trong các lược đồ thủy vân dưới đây chỉ xét ảnh đa cấp xám I có kích thước M×N (nếu I là ảnh màu thì sử dụng công thức I=0.299R+0.587G+0.114B để chuyển sang đa cấp xám) Như vậy ảnh thực chất là một ma trận nguyên không âm Giả sử I là ảnh gốc và I' là ảnh sau khi
nhúng dấu thuỷ vân (ảnh thuỷ vân) Để đánh giá chất lượng của ảnh thuỷ vân
I' có thể sử dụng chuẩn của ma trận hiệu I' - I:
M
i N
j
j i I j i I I
I
' '
) , ( ) ,
Trang 34Nếu giá trị này càng nhỏ thì I' càng giống I và chất lượng ảnh thuỷ vân càng tốt Rõ ràng ||I' - I|| phụ thuộc vào kích thước của ảnh Để có một đánh
giá độc lập với kích thước ảnh, có thể dùng đại lượng sau:
N M
I I Diff
'
(2.4)
nó chính là độ sai khác trung bình giữa ảnh gốc và ảnh thuỷ vân
Dưới đây sẽ dùng Diff để đánh giá chất lượng ảnh của các lược đồ thuỷ vân Lược đồ nào có Diff nhỏ hơn thì có chất lượng ảnh thuỷ vân tốt hơn
2.1.3 Một số tính chất của khai triển SVD
Trong khai triển SVD năng lượng của ảnh tập trung vào ma trận đường chéo D, đặc biệt là phần D(1,1) Do đó, nếu sử dụng ma trận D để nhúng thủy vân thì tính bền vững của thuật toán được cải thiện nhưng chất lượng ảnh sẽ
bị giảm
Theo [7], nếu áp dụng khai triển SVD trên dữ liệu ảnh thì, ma trận D đại diện cho cường độ sáng của ảnh, hai ma trận U, V đại diện cho hình ảnh của ảnh
2.1.4 Ví dụ minh họa khải triển SVD
Để dễ theo dõi phép khai triển SVD ta xét ví dụ minh họa trên khối ảnh A như hình minh họa sau :
Hình 2.1 Kết quả phân tích SVD đối với ma trận A
Trang 35Khi đó, các ma trận U, D và V tương ứng của A như sau :