Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép biến đổi DCT kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di truyền, giải thuật tối ưu bầy đàn, mạng neura
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan toàn bộ nội dung luận văn này là do tôi tự sưu tầm, biên soạn và nghiên cứu
Nội dung của luận văn này chưa từng được ai khác công bố hay xuất bản dưới bất kỳ hình thức nào và cũng không được sao chép từ bất kỳ một công trình nghiên cứu nào
Toàn bộ mã nguồn chương trình hoàn toàn do tôi tự tay viết và chỉnh sửa dưới sự hướng dẫn của thầy giáo hướng dẫn, kết quả thử nghiệm hoàn toàn do tôi tìm hiểu và thực hiện
Nếu sai tôi xin hoàn toàn chịu trách nhiệm
Thái Nguyên, ngày 10 tháng 4 năm 2016
Học viên
Nguyễn Nam Phương
Trang 2LỜI CẢM ƠN
Tôi xin bày tỏ lòng biết ơn sâu sắc đến thầy giáo PGS.TS.Nguyễn Bá Tường- Trường Học viện Kĩ thuật Quân sự là người đã trực tiếp hướng dẫn, chỉ bảo tận tình và hết lòng giúp đỡ tôi trong suốt thời gian làm luận văn này Xin được cảm ơn các anh, chị và các bạn đồng nghiệp trong nhóm nghiên cứu an toàn bảo mật thông tin do thầy Nguyễn Bá Tườnghướng dẫn đã
có những góp ý quý báu trong quá trình nghiên cứu và trình bày luận văn Tôi cũng chân thành cảm ơn những người thân trong gia đình, bạn bè đã động viên và tạo mọi điều kiện giúp tôi trong quá trình học tập, công tác cũng như trong cuộc sống
Cuối cùng tôi xin gửi lời chúc sức khỏe và thành công tới tất cả quý thầy
cô và gia đình cùng toàn thể các bạn
Thái Nguyên, ngày 10 tháng 4 năm 2016
Học viên
Nguyễn Nam Phương
Trang 3MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT v
DANH MỤC BẢNG vi
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ vii
LỜI MỞ ĐẦU 1
Chương 1 CÁC KHÁI NIỆM CƠ SỞ 3
1.1 Ảnh số 3
1.1.1.Khái niệm và phân loại ảnh số 3
1.1.2.Điểm ảnh 4
1.1.3.Màu và mô hình màu 5
1.1.4.Histogram 9
1.1.5.Định dạng ảnh 10
1.2 Các phép biến đổi ma trận 12
1.2.1.Biến đổi Cosine rời rạc DCT 12
1.2.2.Biến đổi Wavelet rời rạc DWT 15
1.2.3.Biến đổi SVD 16
1.3 Giấu tin 18
1.3.1.Khái niệm giấu tin 18
1.3.2.Giấu tin trên miền không gian 20
1.3.3.Giấu tin trên miền biến đổi 21
1.4 Thủy vân số 22
1.4.1.Khái niệm 22
1.4.2.Phân loại 22
1.4.3.Các yêu cầu đối với hệ thống thủy vân 25
1.4.4.Mô hình thủy vân cơ bản 25
1.4.5.Tấn công thủy vân 27
Trang 41.4.6.Đánh giá chất lượng thủy vân 27
1.4.7.Ứng dụng của thủy vân 29
Chương 2 THỦY VÂN BỀN VỮNG DỰA TRÊN CÁC PHÉPBIẾN ĐỔI DWT VÀ SVD 31
2.1 Giới thiệu chung 31
2.2 Khai triển SVD 31
2.2.1 Khái niệm về khai triển SVD 31
2.2.2 Một số tính chất của khai triển SVD 32
2.3 Thủy vân trên miền SVD 34
2.4 Phương pháp DMA [5]: Thủy vân kết hợp SVD và DWT ba mức 37
2.4.1 Thuật toán chuyểnđổi sang dãy nhị phân 37
2.4.2 Thuật toán nhúng thủy vân 37
2.4.3 Thuật toán trích thủy vân 39
2.4.4 Nhận xét và đánh giá 40
2.5 Phương pháp TDD [6]: Thủy vân sử dụng SVD và DWT hai mức 41
2.5.1 Giới thiệu 41
2.5.2 Thuật toánnhúng thủy vân 41
2.5.3 Thuật toán trích 42
2.5.4 Nhận xét và đánh giá 43
Chương 3 THỰC NGHIỆM, PHÂN TÍCH VÀ SO SÁNHCÁC LƯỢC ĐỒ THỦY VÂN 44
3.1 Các Độ đo xác định chất lượng và tính bền vững 44
3.2 Giới thiệu chương trình 44
3.3 Kết quả thử nghiệm 49
3.3.1 Kết quả lược đồ DMA 49
3.3.2 Kết quả lược đồ TDD so sánh lược đồ với DMA 51
KẾT LUẬN 53
TÀI LIỆU THAM KHẢO 54
Trang 5DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
SVD Singular Value Decomposition Biến đổi SVD
NMF Non-negative Matrix Factorization Thừa số hóa ma trận không
âm DCT Discrete Cosine Transform Biến đổi Cosine rời rạc IDCT Invert Discrete Cosine Transform Biến đổi ngược DCT
DFT Discrete Fourier Transform Biến đổi Forier rời rạc IDFT Invert Discrete Fourier Transform Biến đổi ngược DFT
DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc IDWT Invert Discrete Wavelet Transform Biến đổi ngược DWT
FT Fourier Transfer Biến đổi Fourier
Trang 6DANH MỤC BẢNG
Bảng 3.1: Kết quả thử nghiệm về chất lượng ảnh sau khi 49
nhúng thủy vân: 49
Bảng 3.2: Kết quả thử nghiệm tính bền vững của lược đồ thủy vân: 49
Bảng 3.3: Kết quả thử nghiệm tính bền vững của lược đồ thủy vân 50
sau khi ảnh thủy vân bị tấn công: 50
Bảng 3.4: So sánh chất lượng ảnh của lược đồ DMA và TDD 51
Bảng 3.5: Bảng So sánh tính bền vững của lược đồ DMA và TDD 52
dựa trên độ đo hệ số tương quan r 52
Trang 7DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1: Biểu diễn các điểm ảnh trong ảnh số 4
Hình 1.2: Tổ hợp màu Red-Green-Blue trong hệ màu RGB 6
Hình 1.3: Tổ hợp các màu trong mô hình màu CMYK 7
Hình 1.4: Mặt phẳng màu U-V tại giá trị Y = 0.5 8
Hình 1.5: Biểu đồ histogram của ảnh đa cấp xám Lena 9
Hình 1.6: Cấu trúc tệp ảnh bitmap 10
Hình 1.7: Sơ đồ quá trình giấu tin 19
Hình 1.8: Sơ đồ quá trình giải mã tin giấu 20
Hình 1.9: Phân loại các kỹ thuật thủy vân 23
Hình 1.10: Mô hình hệ thống thủy vân cơ bản 26
Hình 2.1: Một khối ảnh 88 của ảnh Baboon 32
Hình 2.2: Kết quả phân tích SVD đối với ma trận A của 33
Hình 2.3: Sơ đồ nhúng thủy vân DMA 39
Hình 2.4: Sơ đồ nhúng thủy vân TDD 42
Hình 2.5: Sơ đồ Trích thủy vân 43
Trang 8LỜI MỞ ĐẦU
Ngày nay, cùng với sự phát triển mạnh mẽ của công nghệ thông tin và truyền thông, mạng Internet đã trở thành một trong các phương tiện truyền tải, chia sẻ thông tin, tài liệu một cách thuận tiện, hiệu quả Thông tin luôn sẵn sàng trực tuyến, mọi người đều có thể kết nối vào Internet để tìm kiếm một cách dễ dàng các thông tin cần thiết Bên cạnh đó, các công ty, các nhà cung cấp sản phẩm có thể bán sản phẩm của mình thông qua mạng Internet cũng như sẵn sàng cung cấp dữ liệu, thông tin về các sản phẩm, dịch vụ của mình cho người dùng thông qua hệ thống mạng Internet một cách hiệu quả
Với lượng thông tin được truyền qua mạng ngày càng nhiều thì vấn nạn sao chép và sử dụng không hợp pháp dữ liệu số ngày một tăng.Tuy nhiên việc quản lý và khai thác các thông tin này lại đôi khi nằm ngoài tầm kiểm soát của các cá nhân, tổ chức do vấn nạn sao chép bất hợp pháp, vi phạm bản quyền ngày một gia tăng Từ đó cần thiết phải có các giải pháp chống sao chép để hạn chế việc vi phạm bản quyền các sản phẩm dữ liệu số
Một trong những giải pháp hữu hiệu để bảo vệ bản quyền là kỹ thuật thủy vân số.Thủy vân số dựa trên kết quả nghiên cứu của nhiều lĩnh vực khác nhau như: Mật mã học, kỹ thuật giấu tin, lý thuyết thống kê và xử lý tín hiệu
số Mục đích của phương pháp này là nhúng một lượng thông tin có ích vào các sản phẩm số (lượng thông tin này được gọi là thủy vân) Dựa trên mục đích
sử dụng các lược đồ thủy vân được chia thành hai nhóm chính gồm thủy vân bền vững và thủy vân dễ vỡ Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, khi có bất kì sự can thiệp hay thay đổi nào tới ảnh gốc thì dấu thủy vân sẽ không còn nguyên vẹn; kỹ thuật thủy vân này được ứng dụng trong bài toán xác thực tính toàn vẹn dữ liệu số Trong khi đó thủy vân bền vững được ứng dụng trong bài toán bảo vệ bản quyền đối với các sản phẩm số
Trang 9Luận văn trình bày một số lược đồ thủy vân bền vững dựa trêncác phép biến đổi SVD,DWTứng dụng trong việc bảo vệbản quyền trên dữ liệu ảnh số Đây là hướng nghiên cứu mới trên thế giới, có ý nghĩa khoa học và ứng dụng
thực tiễn Nội dung luận văn được tổ chức thành ba chương như sau:
Chương 1:Trìnhbàytổngquanvềcác kiến thức cơ bản về ảnh số, một số
phép biến đổi ma trận, khái niệm về giấu tin và thủy vân số
Chương 2: Trình bày các kết quả nghiên cứu về thủy vân số dựa trên sự
kết phép biến đổi SVD và DWT đã được công bố và đề xuất hai lược đồ thủy vân mới sử dụng kết hợp phếp biến đổi SVD và DWT
Chương 3: Trình bày các phântích,đánhgiá và so sánh giữa các lược đồ
thủy vân đã trình bày trong chương 2.Đồng thời tác giả cũng đưa ra kết quả chương trình thử nghiệm cho các lược đồ trên
Trang 10Chương 1 CÁC KHÁI NIỆM CƠ SỞ
Chương này trình bày các khái niệm cơbản về ảnh số, ảnh nhị phân, ảnh đa mức xám, ảnh mầu, điểm ảnh, mầu và mô hình mầu, các định dạng ảnh, các phép biến đổi ma trận thường dùng trong xử lý ảnh, các khái niệm về giấu tin, thủy vân số
1.1 Ảnh số
1.1.1 Khái niệm và phân loại ảnh số
Ảnh số là tập hợp bao gồm hữu hạn các phần tử được gọi là điểm ảnh (pixel), mỗi điểm ảnh được biểu diễn bởi một số hữu hạn các bit
Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên dương gồm m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm ảnh Dựa theo màu sắc ta có thể chia ảnh số thành 3 loại cơ bản: Ảnh nhị phân, ảnh đa cấp xám và ảnh màu (true color)
Ảnh nhị phân
Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và màu còn lại cho đối tượng của ảnh.Nếu hai màu là đen và trắng thì gọi là ảnh đen trắng.Như vậy, ảnh nhị phân được xem như một ma trận nhị phân
Ảnh đa mức xám
Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau trong khoảng màu đen - màu trắng Như vậy, ảnh đa mức xám xem như là ma trận không âm có giá trị tối đa là 255 Mỗi điểm ảnh trong ảnh đa cấp xám biểu diễn cường độ sáng của ảnh tại điểm đó
Ảnh màu
Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn bởi một số byte (thường là 3 byte)đại diện cho 3 thành phần màu và như vậy, ảnh màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần màu của các
Trang 11điểm ảnh.Hệ màu RGB sẽ bao gồm 3 ma trận màu tương ứng với các giá trị Red, Green và Blue.Đây là hệ màu được sử dụng phổ biến nhất
Ngoài ra, ảnh cũng cũng có thể được phân thành hai loại: Ảnh có tần số cao và ảnh có tần số thấp
1.1.2 Điểm ảnh
Điểm ảnh (pixel, picture element) là một phần tử ảnh, đơn vị thông tin nhỏ nhất trong một ảnh dạng raster.Ảnh số (digital image) là tập hợp hữu hạn các điểm ảnh.Ảnh số có thể được biểu diễn dưới dạng một ma trận 2 chiều, mỗi phần tử của ma trận tương ứng với một điểm ảnh
Hình 1.1: Biểu diễn các điểm ảnh trong ảnh số
Hàng xóm của một điểm ảnh (Neighbors of a Pixel)
Một điểm ảnh p trong hệ tọa độ (x,y) có 4 hàng xóm bên cạnh theo chiều dọc và chiều ngang với tọa độ như sau:
(x + 1, y + 1) ; (x + 1, y - 1) ; (x - 1, y + 1) ; (x - 1, y - 1)
Trang 12ND(p) cùng với N4(p) được gọi là N8(p), tức là 8 hàng xóm của p Tương tự như trên thì N8(p) cũng sẽ có các điểm ở bên ngoài ảnh nếu p là một điểm trên biên của ảnh
Điểm ảnh liền kề (Adjacency)
Định nghĩaV là tập các giá trị cường độ sáng của ảnh Tập V được dùng
để xác định các điểm ảnh liền kề Ví dụ với ảnh nhị phân V = {0, 1}; ảnh đa cấp xám thì V = {0, 1, 2 , …, 255} Có ba kiểu liền kề:
a) adjacency: Hai điểm ảnh p và q trong tập V được gọi là adjacency nếu q thuộc tập N4(p)
4-b) adjacency: Hai điểm ảnh p và q trong tập V được gọi là adjacency nếu q thuộc tập N8(p)
c) m-adjacency: Hai điểm ảnh p và q trong tập V được gọi là adjacency nếu thỏa mãn một trong hai điều kiện sau:
8 q thuộc tập N4(p)
- q thuộc tập ND(p) và tập N4(p) ∩ N4(q) = Ø
1.1.3 Màu và mô hình màu
Một mô hình màu là một mô hình toán học trừu tượng mô tả cách các màu sắc có thể được biểu diễn như là bộ dữ liệu số, thường là ba hoặc bốn giá trị hoặc các thành phần màu sắc.Người ta chia ra thành nhiều mô hình màu khác nhau tùy thuộc vào ứng dụng của từng lĩnh vực.Dưới đây là các mô hình màu được dùng phổ biến nhất
Mô hình RGB
Mô hình màu RGB sử dụng mô hình bổ sung trong đó ánh sáng đỏ, xanh lá cây và xanh lam được tổ hợp với nhau theo nhiều phương thức khác nhau để tạo thành các màu khác Từ viết tắt RGB trong tiếng Anh có nghĩa là
đỏ (red), xanh lá cây (green) và xanh lam (blue), là ba màu gốc trong các mô hình ánh sáng bổ sung
Trang 13Hình 1.2: Tổ hợp màu Red-Green-Blue trong hệ màu RGB
Cũng lưu ý rằng mô hình màu RGB tự bản thân nó không định nghĩa thế nào là "đỏ", "xanh lá cây" và "xanh lam" một cách chính xác, vì thế với cùng các giá trị như nhau của RGB có thể mô tả các màu tương đối khác nhau trên các thiết bị khác nhau có cùng một mô hình màu
Mô hình RGB sẽ làm việc tốt với các thiết bị phát quang sử dụng ánh sáng trắng làm cơ sở Vì vậymô hìnhRGB được sử dụng cho các màu thể hiện trên màn hình máy tính cũng như các màu trong thiết kế Web được chiếu qua các màn hình hay máy chiếu dùng ánh sáng
Trong biểu diễn số trên máy tính, ảnh màu RGB có thể sử dụng số bit màu là 16, 24, 32 hoặc 48 Ảnh có số bitcàng cao thì càng biểu diễn chính xác màu sắc của điểm ảnh
Mô hình CMYK
Từ CMYK (hay YMCK) là một mô hình màu được sử dụng nhiều trong
in ấn Mô hình màu này dựa trên cơ sở trộn các chất màu của các màu sau:
C=Cyan - màu xanh lơ
M=Magenta - màu cánh sen hay hồng sẫm
Y=Yellow - màu vàng
K=Key - màu đen (Ký hiệu là K vì màu Black đã dùng ký hiệu B trong
mô hình RGB)
Trang 14Hình 1.3: T
Nguyên lý làm vi
chúng ta nhìn thấy là từ
hồng sẫm cộng với vàng s
xanh lam, xanh lơ cộng v
màu xanh lơ, cánh sen và vàng t
Vì màu “đen” sinh ra b
sự giống như mực đen th
thụ toàn bộ ánh sáng), vi
mặc dù điều này không chính
vào với các màu gốc lo
Việc sử dụng công ngh
rất cao cấp với độ tương ph
ta nhìn thấy trên màn hình máy tính thông th
màu của nó khi in ra vì các mô hình màu CMYK và RGB (s
hình máy tính) có các gam màu khác nhau Mô hình màu RGB là mô hình dựa trên cơ sở phát xạ
chế hấp thụ ánh sáng
Mô hình HSB
Mô hình màu HSB
màudựa trên ba giá trị:
Tổ hợp các màu trong mô hình màu CMYK
Nguyên lý làm việc của CMYK là trên cơ sở hấp thụ ánh sáng Màu mà
ừ phần của ánh sáng không bị hấp thụ Trong CMYK
i vàng sẽ cho màu đỏ, cánh sen cộng với xanh lơ cho màu
ng với vàng sinh ra màu xanh lá cây và tmàu xanh lơ, cánh sen và vàng tạo ra màu đen
sinh ra bởi việc trộn các màu gốc loại trừ
c đen thật sự hay màu đen của vật đen tuyệt đánh sáng), việc in ấn trên cơ sở bốn màu (đôi khi gọi là
u này không chính xác) phải sử dụng mực đen để
c loại trừ là các màu vàng, cánh sen và xanh lơ
ng công nghệ in ấn bốn màu sinh ra kết quả in tương phản cao hơn Tuy nhiên màu của vật th
y trên màn hình máy tính thông thường có sự sai khác chút ít v
a nó khi in ra vì các mô hình màu CMYK và RGB (sử dụ
hình máy tính) có các gam màu khác nhau Mô hình màu RGB là mô hình
ánh sáng trong khi mô hình CMYK làm vi
Mô hình màu HSB, còn gọi là mô hình màu HSV, là m
p các màu trong mô hình màu CMYK
ánh sáng Màu mà Trong CMYK,
i xanh lơ cho màu
i vàng sinh ra màu xanh lá cây và tổ hợp của các
hình CMYK làm việc theo cơ
, là một mô hình
Trang 15H: (Hue) Vùng màu
S: (Saturation) Độ bão hòa màu
B (hay V): (Bright hay Value) Độ sáng
Mô hình YUV
Mô hình YUVquy định một không gian màu được tạo bởi một độ sáng
và hai thành phần màu (chrominance) YUV được sử dụng trong hệ thống
phát sóng truyền hình theo chuẩn PAL, đây là chuẩn ở phần lớn các nước trên thế giới
Mô hình YUV giúp tạo ra màu đúng với nhận thức của con người hơn chuẩn RGB(được dùng trong các thiết bị đồ hoạ máy tính) nhưng không chuẩn bằng không gian màu HSV
Hình 1.4: Mặt phẳng màu U-V tại giá trị Y = 0.5
Trong mô hình YUV, Y đại diện cho thành phần độ sáng, U và V là đại diện cho các thành phần màu Không gian màu YCbCr hay YPbPr, được sử dụng trong các thiết bị phát hình, đều xuất phát từ mô hình màu YUV(Cb/Pb
và Cr/Pr là những phiên bản biến thể của U và V), và đôi khi bị gọi một cách không chính xác là “YUV” Không gian màu YIQ được dùng trong các hệ thống truyền hình NTSC cũng liên quan đến YUV, tuy nhiên lại đơn giản hơn YUV nhiều
Trang 16Các tín hiệu YUV đ
R, G và B được cộng lạ
sáng chung tại một điểm
tín hiệu xanh lam (B c
thống kê tần suất giá tr
cường độ sáng của một đi
trong đó , ,
của ảnh
Hình 1.5: Bi
u YUV đều xuất phát từ các nguồn RGB Các giá tr
ại với nhau để tạo ra một tín hiệu Y đơn đ
m Tín hiệu U sau đó được tạo ra bằng các
u xanh lam (B của RGB) và được nhân với một tỉ lệ nhấ
ừ Y khỏi màu đỏ (R của RGB) và nhân tỉ
c sau có thể dùng để tính toán Y, U và V từ R
Histogram là khái niệm cơ bản trong xử lý ảnh Histogram là b
t giá trị cường độ sáng của các điểm ảnh Đối v
t điểm ảnh được xác định theo công thức:
= 0.299 + 0.587 + 0.114
à giá trị các thành phần màu và là cư
Biểu đồ histogram của ảnh đa cấp xám Lena
là cường độ sáng
p xám Lena
Trang 171.1.5 Định dạng ảnh
Ảnh bitmap
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh dạng raster khá
phổ biến Các tập tin đồ họa lưu dưới dạng BMP thường có đuôi là BMP
hoặc DIB (Device Independent Bitmap)
Hình 1.6: Cấu trúc tệp ảnh bitmap
Các thuộc tính tiêu biểu của một tập tin ảnh BMPlà:
- Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n
Một ảnh BMP n-bit có 2nmàu Giá trị n càng lớn thì ảnh càng có nhiều màu,
và càng rõ nét hơn Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lượng hình ảnh trung thực nhất
- Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel)
- Chiều rộng của ảnh (width), cho bởi điểm ảnh
Cấu trúc tập tin ảnh BMP bao gồm 4 phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap
Trang 18Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển
thị ảnh
Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh
Bitmap Data: lưu dữ liệu ảnh
Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không được nén bằng bất kỳ thuật toán nào.Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG)
Ảnh JPEG
Ảnh JPEG là một định dạng ảnh đã qua xử lý nén ảnh, thuật toán nén là
thuật toán JPEG(Joint Photographic Experts Group) - một trong những
phương pháp nénảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh sẽ bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người
Một số đặc điểm của ảnh JPEG là:
- Ảnh có dung lượng nhỏ, dùng phổ biến trên các thiết bị di động, các trang web
- Ảnh JPEG có thể hiển thị các hình ảnh với các màu chính xác colour), có thể lên đến 16 triệu màu
Trang 19(true Ảnh sử dụng thuật toán nén JPEG sẽ bị mất thông tin so với ảnh gốc
Do đó một số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, và các vùng sẽ mất đi sự rõ nét
Các định dạng khác
Ngoài hai định dạng ảnh kể trên còn có rất nhiều định dạng ảnh khácphổ biến được kể đến như:
- Ảnh raster: PNG, ICO, GIFF, TIFF,…
- Ảnh vector: AI, CorelDRAW, CGM, DXF, EVA, EMF, Gerber, HVIF, IGES, PGML,…
- Ảnh RAW: CIFF, DNG, ORF
1.2 Các phép biến đổi ma trận
Như chúng ta đã biết, ảnh số được lưu dưới dạng các ma trận điểm ảnh
Do đó, các phép biến đổi ảnh số thực chất là các phép biến đổi trên các ma trận Trong mục này, ta xét các phép biến đổi ma trận được sử dụng nhiều trong xử lý ảnh.Các phép biến đổi này thường trả về những nét đặc trưng nhất của ảnh, qua đó có thể sử dụng các đặc trưng này để tiến hành xử lý ảnh
1.2.1 Biến đổi Cosine rời rạc DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay video Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần
số và biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không gây tổn hao đến chất lượng Lý do chọn biến đổi cosine cho xử lý ảnh số là biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn
Trang 20Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần
số về miền thời gian được xác định theo công thức:
= 2 cos (2 + 1)
2 ớ = 0,1, … , 1 Một tính chất quan trọng của DCT là rất hữu ích trong bài toán nén dữ liệu, với dữ liệu đầu vào có sự tương quan cao thì năng lượng của dữ liệu đầu vào sẽ tập trung vào một số phần tử đầu tiên, đặc biệt là hệ số DC Các phần
tử còn lại có giá trị nhỏ, thường xấp xỉ bằng 0
Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh.Nhưng không phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều
(hàng, cột) Tuy nhiên, đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên
các hàng và trên các cột Do vậy ta gọi phép biến đổi này là DCT 2-D
Phép biến đổi thuận DCT 2-D đối với m × n giá trị của p trên không gian 2 chiều được xác định theo công thức:
Trang 21để nhận được khối hệ số DCT (G) theo công thức:
và phép biến đổi ngược tương ứng:
= ′× ×
Trang 22Kỹ thuật thuỷ vân sửdụng phép biến đổi DCT thường chia ảnh gốc thành các khối,thực hiện phép biến đổi DCTvới từng khối ảnh gốc để được miền tần số thấp, miền tần số giữa và miền tần số cao Đa số kỹ thuật thuỷ vân
ẩn bền vững sẽ chọn miền tần số giữa của mỗi khối để nhúng bit thuỷ vân theo một hệ số k nào đó gọi là hệ số tương quan giữa chất lượng ảnh sau khi nhúng thuỷvân (tính ẩn của thuỷ vân) và độ bền vững của thuỷ vân
Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép biến đổi DCT kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di truyền, giải thuật tối ưu bầy đàn, mạng neural,… đã được nhiều nhà khoa học quan tâm nghiên cứu
1.2.2 Biến đổi Wavelet rời rạc DWT
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việchết
sức phức tạp.Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệukhổng lồ.Để giảm thiểu công việc tính toán người ta chỉ chọn ra một tậpnhỏ các giá trị tỉ lệ
và các vị trí để tiến hành tính toán Hơn nữa nếu việctính toán được tiến hành
tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số2 thì kết quả thu được sẽ hiệu
quả và chính xác hơn rất nhiều Quá trìnhchọn các tỷ lệ và các vị trí để tính
toán như trên tạo thành lưới nhị tố(dyadic).Một phân tích như trên hoàn toàn có thể thực hiện được nhờbiến đổi Wavelet rời rạc (DWT) Do đó, việc tính toán biến đổi DWT thựcchất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoáđược thực hiện với sự lựa chọn các hệ số a và b như sau:
= 2 , = 2 , ớ , ∈ Biến đổi Wavelet được sử dụng rộng rãi trong các lĩnh vực xử lý tín hiệu số, xử lý ảnh, nén ảnh, mã hóa tín hiệu,…
Trang 231.2.3 Biến đổi SVD
Định nghĩa
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành
tích của 3 ma trận thực như sau:
Phép biến đổi SVD (Singular Value Decomposition) cũng giống như
DCT, DWT đều là các phép biến đổi ma trận trực giao và có cùng một tính chất quan trọng là tập trung năng lượng ảnh vào một số phần tử cố định của miền biến đổi Năng lượng ảnh tập trung vào phần tử (1,1) trong phép biến đổi SVD, phần tử này có tính ổn định cao, vì vậy có thể sử dụng chúng để xây dựng các lược đồ thủy vân bền vững trước các phép tấn công
Các ứng dụng
Một số ứng dụng sử dụng biến đổi SVD có thể chỉ ra như:
- Nén ảnh (Image Compression)
- Lập chỉ mục ngữ nghĩa tiềm ẩn (Latent semantic indexing - LSI)
Lập chỉ mục ngữ nghĩa tiềm ẩn (LSI) là một phương pháp lập chỉ mục
và tìm kiếm sử dụng một kỹ thuật phân tích ma trận SVD để xác định các mẫu trong các mối quan hệ giữa các điều kiện và khái niệm có trong một bộ sưu tập không có cấu trúc văn bản LSI là dựa trên nguyên tắc rằng các từ được sử dụng trong các bối cảnh tương tự có xu hướng có ý nghĩa tương tự Một tính năng quan trọng của LSI là khả năng trích xuất nội dung khái niệm
Trang 24của một nội dung văn bản bằng cách thiết lập mối liên hệ giữa những điều kiện xảy ra trong những hoàn cảnh tương tự LSI cũng là một ứng dụng thống
kê đa biến được phát triển bởi Jean-Paul Benzécri trong đầu những năm 1970, vào một bảng dự phòng được xây dựng từ tính từ trong các tài liệu
Ưu điểm của phương pháp LSI sử dụng biến đổi SVD là có thể đối phó với vấn đề đồng nghĩa, điều mà các phương pháp truyền thống không thực hiện được
- Kỹ thuật (Engineering)
Trong kỹ thuật nói chung, biến đổi SVD có khả năng áp dụng cho các lĩnh vực sau:
Hệ thống động lực tuyến tính (Linear Dynamical System)
Phân tích EOF analysis(of ocean topography and climate system)
Xử lý tín hiệu và nhận dạng mẫu (Signal processing and pattern recognition)
Dự báo thời tiết số (Numerical weather prediction, Lanczos methods)
- Truyền thông (Comunications)
Ứng dụng phương pháp SVD trong truyền thông như:
Mạng không dây (Wireless communications)
Nén ảnh và video (Compression of videos and images)
- Toán học và thống kê (Mathematics and Staticstics)
Đại số tuyến tính (Numerical linear algebra)
Xấp xỉ hạng ma trận (Low-rank matrix approximation)
Giải phương trình tuyến tính thuần nhất (Solving Homogeneous linear equations)
Principal Component Analysis
Trang 251.3 Giấu tin
1.3.1 Khái niệm giấu tin
Giấu tin là kỹ thuật nhúng thông tin vào dữ liệu môi trường, dữ liệu môi trường thường là: văn bản, ảnh, âm thanh, video Thông tin được nhúng
có thể là những thông điệp bí mật cần trao đổi, thông tin về tác giả, hoặc thông tin về sản phẩm đa phương tiện
Nếu là bảo vệ cho chính đối tượng được giấu tin bên trong Đây chính
là thủy vân số, là lĩnh vực rất đa dạng, có nhiều mục đích và đang được quan tâm, nghiên cứu rất nhiều; tính ứng dụng của nó trong hiện tại rất lớn và đã có nhiều kỹ thuật được đề xuất
Trong trường hợp là bảo mật cho dữ liệu được đem giấu Chính là giấu tin mật, tập trung vào các kỹ thuật giấu tin sao cho người khác rất vất vả, khó khăn mới phát hiện được đối tượng có chứa thông tin mật bên trong
Các lược đồ giấu tin trong ảnh có thể được chia thành 2 chủ đề chính Thứ nhất, gồm những lược đồ giấu tin trên miền không gian ảnh, những lược
đồ này thường biến đổi các bit thấp trong giá trị màu của các điểm ảnh Thứ hai, gồm những lược đồ giấu tin trên miền biến đổi của ảnh, hai phép biến đổi hay được sử dụng là: Phép biến đổi cosine rời rạc (DCT), phép biến đổi sóng con (DWT)
Số lượng lược đồ giấu tin trên ảnh màu, ảnh đa cấp xám nhiều hơn so với ảnh nhị phân Lý do chủ yếu là việc thay đổi trên ảnh nhị phân dễ bị phát hiện hơn so với ảnh màu và ảnh đa cấp xám Tuy nhiên, giấu tin trên ảnh nhị phân luôn nhận được sự quan tâm của các nhà nghiên cứu Bởi ngoài việc ứng dụng trực tiếp trên ảnh nhị phân, những lược đồ này còn là cơ sở để phát triển cho những loại dữ liệu đa phương tiện khác
Trang 26Mô hình kỹ thuật giấu tin:
Trong các mô hình kỹ thuật giấu tin được mô tả như trong các hình minh họa 1.7 và 1.8dưới đây Theo mô hình 1.8 biểu diễn sơ đồ quá trình giấu tin ta thấy ở đây phương tiện chứa thông tin bao gồm các đối tượng được dùng làm môi trường để giấu tin như các tệp đa phương tiện Thông tin cần giấu là một lượng thông tin mang ý nghĩa và mục đích nào đó tùy thuộc vào mục đích và yêu cầu của người sử dụng Thông tin sẽ được giấu vào trong môi trường chứa thông tin nhờ một bộ nhúng thông tin Bộ nhúng thông tin là những chương trình có chứa các thuật toán để giấu thông tin và được thực hiện với một khóa bí mật giống như các hệ mật mã
Hình 1.7: Sơ đồ quá trình giấu tin
Sau khi giấu thông tin ta thu được một môi trường đã giấu tin và sẽ được truyền tải, phân phối trên các phương tiện truyền thông khác nhau Quá trình giải mã tin là một quá trình ngược lại với giấu tin Sơ đồ giải mã tin chỉ ra trong Hình 1.8
Trang 27Hình 1.8: Sơ đồ quá trình giải mã tin giấu
Trong Hình 1.8đã chỉ ra các nhiệm vụ của quá trình giải mã thông tin
đã được giấu Quá trình giải mã này phải được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin và kết hợp với khóa để giải mã tin Khóa để giải mã tin này có thể giống hay khác với khóa đã nhúng tin Kết quả thu được bao gồm môi trường gốc và thông tin đã được che giấu Tùy theo các trường hợp cụ thể, thông tin tách được ra có thể phải cần xử lý, kiểm định
và so sánh với thông tin đem giấu ban đầu Thông qua dữ liệu được tách ra từ môi trường chứa thông tin giấu, người ta có thể biết được trong quá trình truyền tải, phân phát dữ liệu có bị xâm phạm, tấn công hay không
Đối với các hệ thống giấu thông tin mật này rất quan tâm đến tính an toàn và bảo mật thông tin của dữ liệu cần giấu Hệ thống giấu tin mật có độ bảo mật cao nếu có độ phức tạp của các thuật toán thám mã khó có thể thực hiện được trên máy tính Tuy nhiên, cũng có các hệ thống chỉ quan tâm đến số lượng thông tin có thể được che giấu, hay quan tâm đến sự ảnh hưởng của thông tin mật đến các môi trường chứa dữ liệu
1.3.2 Giấu tin trên miền không gian
Miền không gian của ảnh là miền dữ liệu của ảnh gốc, tác động đến miền không gian ảnh chính là tác động trực tiếp đến các điểm ảnh, làm thay đổi giá trị của điểm ảnh Đây là xu hướng trực quan được tập trung khai thác trong quá trình thủy vân trong ảnh, khi nói đến việc giấu tin trong ảnh chính là nhằm thay
Trang 28đổi giá trị các điểm ảnh gốc, những bit ít quan trọng của mỗi điểm ảnh đảm bảo cho ảnh được chỉnh sửa giá trị điểm ảnh gần nguyên gốc nhất
Tuy nhiên, phương pháp này có nhiều nhược điểm, chẳng hạn như tính bền vững không được đảm bảo với dấu thủy vân qua các thao tác biến đổi ảnh như quay chụp ảnh, nén ảnh các tác tác động đó đôi khi cũng làm sai lệch điểm ảnh dẫn đến các bit ít quan trọng nhất cũng bị thay đổi
Phương pháp biến đổi dựa trên miền không gian như trình bày ở trên là cách biến đổi tín hiệu và miền giá trị rời rạc của các điểm ảnh được gọi là miền biến số độc lập Trong thực thế phép biến đổi trực tiếp này gặp phải những khó khăn và hiệu quả không cao
Ngoài phương pháp biến đổi trực tiếp, có dùng phương pháp biến đổi gián tiếp thông qua các phép biến đổi trực giao làm nhiệm vụ chuyển miền không gian sang miền biến đổi
1.3.3 Giấu tin trên miền biến đổi
Miền biến đổi hay còn gọi là miền tấn số là miền nhận được khi biển đổi miền ảnh Đây là kỹ thuật sử dụng phương pháp biến đổi như tính tích phân hay phương pháp đổi hệ tọa độ trong tích đề các Phương pháp này nhằm chuyển miền không gian sang miền tần số, cụ thể là biến đổi tín hiệu và miền giá trị rời rạc của các điểm ảnh sang miền mới và có biến số mới
Mỗi phép biến đổi có những thuận lợi và khó khăn riêng, tùy vào trường hợp cụ thể để lựa chọn phép biến đổi nào cho phù hợp Sau khi biến đổi các tín hiệu và miền giá trị rời rạc trong miền biến số mới này, nếu cần thiết có thể dùng phép biến đổi ngược lại để đưa ảnh về miền biến số độc lập
Phương pháp biến đổi gián tiếp làm đơn giản rất nhiều các công việc gặp phải khi dùng phương pháp biến đổi trực tiếp trong miền biến số độc lập.Có một số phương pháp biến đổi phổ biến hiện nay như: Fourier, Cosine rời rạc (DCT), Wavelet là những phép biến đổi được sử dụng phố biến
Trang 29trong các kỹ thuật xử lý multimedia, đặc biệt trong xử lý ảnh số Ngoài ra các phép biến đổi này còn dùng nhiều trong lĩnh vực giấu tin, thủy vân số
1.4 Thủy vân số
1.4.1 Khái niệm
Thủy vân trên ảnh số là kỹ thuật nhúng một lượng thông tin vào một bức ảnh số, các thông tin được nhúng có thể được ẩn hoặc hiện thị phụ thuộc vào kỹ thuật thủy vân cụ thể.Trong kỹ thuật thủy vân số thì thông tin nhúng được gọi là thủy vân Thủy vân có thể là một chuỗi các ký tự, một hình ảnh, hay một logo nào đó Có thể chia thủy vân số thành hai nhóm là thủy vân dễ
vỡ và thủy vân bền vững
Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh, sao cho nếu
có một phép biến đổi nào làm thay đổi ảnh gốc thì thủy vân được giấu trong
đó sẽ không còn nguyên vẹn như thủy vân gốc
Ngược lại, với kỹ thuật thủy vân dễ vỡ là thủy vân bền vững.Các kỹ thuật thủy vân bền vững thường được sử dụng trong các ứng dụng bảo vệ tác quyền.Trong những ứng dụng đó, thủy vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp.Thủy vân được nhúng trong các sản phẩm như một hình thức dán tem bản quyền.Trong thường hợp như thế, thủy vân phải tồn tại bền vững cùng sản phẩm nhằm chống việc tẩy xóa, làm giả hay biến đổi pháp hủy thủy vân.Một yêu cầu lý tưởng đối với thủy vân bền vững làm nếu muốn phá hủy thủy vân thì chỉ có cách duy nhất là phá hủy sản phẩm
1.4.2 Phân loại
Nói đến thủy vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng nhằm đảm bảo an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, xác thực thông tin, chống xuyên tạc, điều khiển sao chép, ta có thể nhận thấy tính ứng dụng của thủy vân rất là lớn, với mỗi ứng
Trang 30dụng lại có các yêu cầu đặc trưng riêng, do đó các kỹ thuật thủy vân này cũng
có những tính năng khác biệt tương ứng
Trong kỹ thuật thủy vân số thì thông tin nhúng được gọi là thủy vân Thủy vân có thể là một chuỗi ký tự hay là một tệp hình ảnh, biểu tượng
Thủy vân trên ảnh số là kỹ thuật nhúng một lượng thông tin số vào một bức ảnh số và thông tin nhúng được gắn liền với bức ảnh chứa và dữ liệu thủy vân có thể được hiển thị hay ẩn là tùy thuộc vào mỗi kỹ thuật thủy vân cụ thể
Có thể chia các kỹ thuật thủy vân theo các nhóm như hình minh họa như Hình 1.9 như sau:
Hình 1.9: Phân loại các kỹ thuật thủy vân
Các kỹ thuật thủy vân trên hình 1.9 được phân biệt khác nhau bởi những đặc trưng, tính chất của từng kỹ thuật và khía cạnh ứng dụng của những kỹ thuật đó Trong thực tế, tùy theo mục đích, yêu cầu của bài toán mà
ta sẽ chọn kỹ thuật thủy vân phù hợp, tuy nhiên các kỹ thuật này cũng có một
số đặc điểm giống nhau
Với kỹ thuật thủy vân bền vững thường được sử dụng trong bài toán bảo vệ bản quyền.Trong những ứng dụng đó, thủy vân đóng vai trò là thông
Trang 31tin sở hữu của người chủ hợp pháp.Thủy vân được nhúng vào trong các sản phẩm như là hình thức dán tem bản quyền.Trong các trường hợp này thì thủy vân phải tồn tại bền vững cùng với sản phẩm, nhằm chống lại việc tẩy xóa, làm giả hay biến đổi phá hủy thủy vân.Một yêu cầu lý tưởng đối với thủy vân bền vững là nếu muốn loại bỏ thủy vân này thì chỉ còn có cách duy nhất là phá hủy sản phẩm.Thủy vân bền vững lại được chia thành hai loại là thủy vân
ẩn và thủy vân hiện Thủy vân hiện là loại thủy vân được hiện lên ngay trên sản phẩm và người sử dụng có thể nhìn thấy được, ví dụ như các biểu tượng của các đài truyền hình trên các kênh vô tuyến VTV, VTC, HN,…Các thủy vân hiện trên ảnh thường hiển thị dưới dạng chìm, mờ hoặc trong suốt nhằm không gây ảnh hưởng đến chất lượng các sản phẩm ảnh gốc Đối với thủy vân hiện này thì thông tin bản quyền hiển thị ngay trên sản phẩm; còn đối với thủy vân ẩn thì cũng giống như giấu tin, yêu cầu tính ẩn rất cao, bằng mắt thường không thể nhìn thấy thủy vân Trong vấn đề bảo vệ bản quyền, thủy vân ẩn mang nhiều tính bất ngờ hơn trong việc phát hiện sản phẩm bị lấy cắp.Trong trường hợp này thì người chủ sở hữu hộ pháp sẽ chỉ ra bằng chứng là thủy vân
đã được nhúng vào trong sản phẩm đó
Thủy vân dễ vỡ là kỹ thuật nhúng thủy vân vào trong ảnh sao cho sản phẩm khi phân phối, truyền tải trong các môi trường nếu có bất kỳ một phép biến đổi nào làm thay đổi sản phẩm gốc thì thủy vân đã được giấu trong đó sẽ không còn nguyên vẹn như thủy vân gốc Các tính chất của kỹ thuật thủy vân này thường được sử dụng trong các ứng dụng xác thực thông tin và phát hiện thông tin bị xuyên tạc.Đó chính là nguyên nhân vì sao các ứng dụng loại này rất cần đến kỹ thuật thủy vân dễ vỡ.Ví dụ như để bảo vệ chống bị xuyên tạc một ảnh nào đó, người ta nhúng một thủy vân vào đó và sau đó quảng bá,
Trang 32phân phối đối tượng này.Khi cần kiểm tra lại người ta sử dụng hệ thống đọc thủy vân, nếu không đọc được thủy vân hoặc thủy vân đã bị sai lệch nhiều so với thủy vân ban đầu đã được nhúng vào đối tượng thì có nghĩa là bức ảnh đó
đã bị thay đổi, chỉnh sửa
1.4.3 Các yêu cầu đối với hệ thống thủy vân
Mỗi phương pháp thủy vân đều có những ưu nhược điểm khác nhau Vì vậy, để đánh giá chất lượng của mỗi phương pháp ta cần xét các tiêu chí sau: tính ẩn, tính bền vững Dưới đây ta xét các yêu cầu của một hệ thủy vân ẩn:
Tính ẩn (invisible)
Yêu cầu quan trọng nhất đối với thủy vân ẩn là tính ẩn của dấu thủy vân Điều đó có nghĩa là ảnh thủy vân không thay đổi nhiều so với ảnh gốc và con người không nhận biết được ảnh có chứa thủy vân Khi nhúng thủy vân chất lượng ảnh thủy vân phải được đảm bảo và không bị phát hiện bởi thị giác của con người
Tính bền vững (robustness)
Yêu cầu thứ hai là thủy vân phải thực sự bền vững trước các phép tấn công ảnh có chủ đích và không có chủ đích Các tấn công không có chủ đích với ảnh số như: nén ảnh, lọc nhiễu, lấy mẫu,… còn tấn công có chủ đích là việc tẩy, xóa, làm nhiễu ảnh thủy vân Yêu cầu này chính là việc đảm bảo sẽ lấy được dấu thủy vân ngay khi ảnh thủy vân bị tấn công bởi các phép nêu trên
1.4.4 Mô hình thủy vân cơ bản
Hệ thống thủy vân đầy đủ gồm có hai quá trình: nhúng thủy vân và trích thủy vân Quá trình nhúng thủy vân sẽ thực hiện nhúng dấu thủy vân vào ảnh gốc.Trong quá trình trao đổi thông tin, ảnh thủy vân bị tấn công làm biến đổi.Quá trình trích thủy vân sẽ lấy lại dấu thủy vân từ các ảnh bị tấn công
Trang 33Sơ đồ hoạt động của 2 quá trình này như sau:
Hình 1.10: Mô hình hệ thống thủy vân cơ bản
Quá trình nhúng thủy vân:
Input:
- ảnh I dùng làm môi trường nhúng
- Dấu thủy vân W
- Khóa K(có thể có hoặc không)
Output:
- Ảnh I’ là ảnh I đã biến đổi sau khi nhúng W
Quá trình trích thủy vân:
Trích thủy vân là quá trình ngược của nhúng thủy vân với mục đích lấy
ra được thông tin đã giấu.Dấu thủy vân sau khi được lấy ra sẽ được so sánh với dấu thủy vân gốc để xác định bản quyền tác giả
Trang 341.4.5 Tấn công thủy vân
Tấn công thủy vân là các phương pháp tác động nhằm thay đổi ảnh thủy vân nhằm xóa bỏ các vết tích dấu thủy vân trong ảnh.Các tấn công này bao gồm cả tấn công có chủ đích và không có chủ đích Bằng cách sử dụng các phần mềm chỉnh sửa ảnh tiên tiến hiện nay như: Adobe Photoshop, Picasa,….kẻ tấn công có thể dễ dàng thực hiện các phép biến đổi ảnh Các tấn công có thể sử dụng nhưng phép biến đổi sau: nén, quay, cắt, làm mờ, biến đổi histogram,…
1.4.6 Đánh giá chất lượng thủy vân
Để đánh giá một hệ thống thủy vân có tốt hay không thông qua một số giá trị độ đo sau:
Hệ số PSNR
Chất lượng ảnh chứa dấu thủy vân có thể đánh giá bằng hệ số PSNR
(Peak Signal to Noise Ratio) Lược đồ có hệ số PSNR càng lớn thì chất lượng
ảnh càng cao Hệ số PSNR của ảnh chứa tin I’ so với ảnh gốc I kích thước
× được tính theo công thức :
Trang 35Hệ số Diff
Giả sửI là ảnh gốc và I' là ảnh sau khi nhúng dấu thuỷ vân (ảnh thuỷ vân) Để đánh giá chất lượng của ảnh thuỷ vân I' có thể sử dụng chuẩn của ma trận hiệu I' - I:
∥ ′ ∥= | ( , ) ′( , )|
Nếu giá trị này càng nhỏ thì I' càng giống I và chất lượng ảnh thuỷ vân càng tốt Rõ ràng ||I' - I|| phụ thuộc vào kích thước của ảnh Để có một đánh giá độc lập với kích thước ảnh, có thể dùng đại lượng sau:
= ∥
Đó chính là độ sai khác trung bình giữa ảnh gốc và ảnh thuỷ vân
Trong các nhận xét đánh giá của luận văn sẽ dùng Diff để đánh giá chất lượng ảnh của các lược đồ thuỷ vân.Lược đồ nào có Diffnhỏ hơn thì có chất
lượng ảnh thuỷ vân tốt hơn
Hệ số Err
Để so sánh dấu thủy vân W = (w , w , … , w ) trích ra từ I (ảnh thủy vân đã bị tấn công) với dấu thủy vân gốc W = (w , w , … , w ) bằng cách dùng hệ số Err:
Trang 36Trong các lược đồ dưới đây sẽ dùng Err để đánh giá độ bền vững của các lược đồ thuỷ vân.Lược đồ nào có Err nhỏ hơn thì bền vững hơn trước các phép tấn công ảnh
1.4.7 Ứng dụng của thủy vân
Yêu cầu cơ bản nhất của hệ thống thủy vân là phải đảm bảo tính chấtbền vững và người ta đã ứng dụng kỹ thuật giấu tin vào vào một số bài toán sau:
Bài toán bảo vệ quyền tác giả
Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân số Một thông tin nào đó mang ý nghĩa đặc trưng riêng bản quyền được sở hữu bởi tác giả thì gọi nó là thủy vân, thông tin này sẽ được nhúng vào trong các sản phẩm đa phương tiện, và nó là minh chứng cho bản quyền của tác giả nhằm bảo vệ các sản phẩm chống lại các hành vi vi phạm lấy cắp hoặc làm nhái Các yêu cầu
kỹ thuật đối với ứng dụng này là thủy vân phải tồn tại bền vững cùng với sản phẩm, chỉ khi muốn bỏ thủy vân này mà không được phép của người chủ sở hữu hay tác giả thì chỉ còn có cách là phá hủy sản phẩm đó
Bài toán giấu tin mật
Với bài toán này, thông tin cần được che giấu trong trường hợp này là cần được bảo vệ trước các đối tượng không được phép Việc giải mã nó để nhận được thông tin cũng không cần dữ liệu môi trường gốc Đối với các thuật toán giấu thông tin mật này không quan tâm đến việc bảo vệ thông tin mật trước sự tấn công, phá hoại của các đối thủ mà thay vào đó là các thuật toán rất chú trọng đến tính ẩn và tính an toàn đối với dữ liệu thông tin cần che giấu Do đó, các thuật toán giấu tin này có độ bảo mật cao sẽ được dùng trong
các ứng dụng giấu tin mật
Bài toán xác thực thông tin
Với bài toán này, một số thông tin sẽ được che giấu trong dữ liệu nguồn
và thông tin này sẽ được sử dụng để nhận biết xem dữ liệu nguồn có bị thay
Trang 37đổi, biến dạng hay không Với loại ứng dụng này thì thủy vân cần được ẩn để tránh được sự tò mò, nhận thấy của đối thủ, hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên tạc thông tin nguồn cũng rất cần được quan tâm chú ý Các ứng dụng trong thực tế, người ta mong muốn tìm được vị trí bị xuyên phá cũng như nhận biết được các thay đổi Các yêu cầu chung đối với loại ứng
dụng này là khả năng giấu thông tin rất cao và thủy vân không cần bền vững
Bài toán kiểm soát sao chép
Với bài toán này, thủy vân được sử dụng để kiểm soát việc sao chép thông tin Các thiết bị phát hiện ra thủy vân thường được cài đặt sẵn trong các
hệ thống đọc và ghi Các ứng dụng thuộc bài toán này yêu cầu thủy vân phải được đảm bảo an toàn và cũng sử dụng phương pháp phát hiện thủy vân đã
giấu mà không cần thông tin gốc
Bài toán dán nhãn hay giấu vân tay
Với bài toán này, thủy vân số được sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Như các thủy vân khác nhau sẽ được nhúng vào các bản sao khác nhau của thông tin gốc trước khi gửi đi cho nhiều người khác nhau Yêu cầu của các ứng dụng này là đảm bảo độ an toàn cao cho các thủy vân nhằm tránh sự xóa dấu vết trong khi phân phối, truyền tải
Trang 38Chương 2 THỦY VÂN BỀN VỮNG DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI DWT VÀ SVD
Đây là một trong những hướng nghiên cứu nhận được nhiều sự quan tâm Trong chương 2 này trình bày lược đồ thủy vân dựa trên hai miền kết hợp: SVD–DWT
2.1 Giới thiệu chung
Như đã trình bày trong Chương 1, các lược đồ thủy vân bền vững là kỹ thuật nhúng tin trên miền biến đổi Một số miền biến đổi thường được sử dụng trong kỹ thuật thủy vân bền vững là: SVD, QR, DCT, DWT Đểtăng cường tính bền vững, phù hợp với các định dạng dữ liệu các lược đồ có thể
kết hợp các miền biến đổi với nhau
2.2 Khai triển SVD
2.2.1 Khái niệm về khai triển SVD
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành
tích của 3 ma trận thực như sau
2 ,
1
i j u m