TỔNG QUAN VỀ ẢNH SỐ GIẢ MẠO, PHÒNG CHỐNG GIẢ MẠO ẢNH SỐ, CÁC PHÉP BIẾN ĐỔI MA TRẬN
CÁC DẠNG ẢNH GIẢ MẠO
Làm giả hình ảnh đã tồn tại từ lâu, với nhiều ví dụ nổi bật trong lịch sử và hiện tại Các bức ảnh giả mạo thường được sử dụng cho nhiều mục đích khác nhau, bao gồm chính trị, thương mại và pháp lý Dưới đây là một số ví dụ điển hình về hình ảnh giả mạo.
Hình 1.1 Đối chiếu ảnh gốc (trái) với ảnh giả mạo trong đó đã chỉnh sửa thêm vào một nhân vật (tướng Francis P Blair) [39]
Một nhân vật đã bị loại bỏ đi trong một bức ảnh chụp cùng Mao Trạch Đông:
Hình 1.2 Đối chiếu ảnh gốc (trái) với ảnh giả mạo trong đó đã chỉnh sửa bỏ đi một nhân vật [39]
Mới đây Iran và Triều Tiên công bố một số bức ảnh thử nghiệm tên lửa trên internet, được giới chuyên môn cho là giả mạo:
Hình 1.3 Hình ảnh trên internet được cho là giả mạo thử tên lửa của Iran và
Hiện nay, các chương trình xử lý ảnh số như PhotoShop và Corel Draw đã mang lại sức mạnh to lớn trong việc tạo ra ảnh giả mạo Những phần mềm này cho phép người dùng, ngay cả những người không có kiến thức chuyên môn, thực hiện các thao tác như cắt, dán, thêm, bớt, che các đối tượng trong ảnh, cũng như thay đổi màu sắc và ánh sáng Kết quả là, ảnh giả có thể trông giống như ảnh thật, phục vụ cho nhiều mục đích khác nhau.
1.1.2 Ảnh giả mạo và phân loại
Ảnh giả mạo là những hình ảnh được tạo ra với mục đích đánh lừa người xem, phản ánh nội dung không đúng sự thật Những bức ảnh này thường được sản xuất thông qua các chương trình xử lý và chỉnh sửa ảnh từ hình ảnh thật.
Quá trình chuyển đổi từ ảnh thật thành ảnh giả mạo có thể được mô tả qua ba loại chính: ghép ảnh (image splicing), cắt/dán (copy/move) trong cùng một ảnh và chỉnh sửa ảnh (image retouching).
Ghép ảnh là một hình thức giả mạo ảnh số phổ biến, trong đó nhiều bức ảnh được kết hợp để tạo ra một bức ảnh hoàn chỉnh.
Sự thuyết phục của việc giả mạo ảnh phụ thuộc vào sự phù hợp giữa các yếu tố như kích thước, tư thế, màu sắc, chất lượng và ánh sáng Khi có một cặp ảnh tương thích tốt và được thực hiện bởi chuyên gia có kinh nghiệm, việc giả mạo có thể trở nên hoàn toàn thuyết phục.
Hình 1.5 Ảnh giả mạo bên phải đã được cắt ghép từ hai ảnh gốc ban đầu
1.1.2.2 Cắt/dán trên cùng một ảnh
(a) Ảnh gốc (b) Ảnh đã che phủ đối tượng
Hình 1.6 Ảnh che phủ và bỏ đi đối tượng [40]
Một dạng phổ biến của ảnh giả mạo loại hai là sao chép hoặc di chuyển các phần của ảnh gốc Những ảnh giả mạo này thường được tạo ra bằng cách cắt và dán trên cùng một ảnh, khiến cho các vùng được thu nhận từ cùng một camera và góc độ, do đó ánh sáng và bóng đổ tương đồng, khó phân biệt bằng mắt thường Các hình thức thường gặp bao gồm việc thêm hoặc bớt đối tượng trong ảnh; việc xóa bỏ các đối tượng có thể được coi là che phủ hoặc loại bỏ Ví dụ, trong hình 1.6(a) có hai chiếc ô tô, một xe con và một xe tải, trong khi hình 1.6(b) là phiên bản giả mạo của hình 1.6(a) với chiếc xe tải bị che phủ bởi một cành cây cũng từ ảnh gốc.
Hình 1.7 Minh họa cho loại ảnh giả mạo chỉnh sửa ảnh: (a) ảnh gốc, (b) ảnh được thay đổi màu sắc, (c) ảnh tăng độ tương phản, (d) ảnh được làm mờ nền [40]
Hình 1.7 trình bày một ảnh gốc và ba ví dụ về giả mạo tăng cường ảnh Cụ thể, ví dụ (1) cho thấy xe mô tô màu xanh chuyển thành màu lục lam và xe tải màu đỏ trong nền chuyển thành màu vàng Ví dụ (2) thể hiện việc tăng độ tương phản của toàn cảnh, tạo cảm giác như bức ảnh được chụp vào một ngày nắng Cuối cùng, ví dụ (3) cho thấy các xe ô tô đỗ bị làm mờ, làm cho chiều sâu khung cảnh trở nên hẹp hơn.
Mặc dù loại giả mạo này không thay đổi cơ bản hình dạng hay ý nghĩa của ảnh gốc như ghép ảnh, nhưng nó vẫn ảnh hưởng đến cách hiểu của người xem về bức ảnh.
Có thể điều chỉnh thời tiết và thời gian trong ngày, cũng như làm mờ một số chi tiết để làm nổi bật các yếu tố khác trong bức ảnh.
KỸ THUẬT PHÒNG CHỐNG VÀ PHÁT HIỆN ẢNH GIẢ MẠO
Các kỹ thuật xác thực và phát hiện ảnh giả mạo được chia thành hai hướng chính: kỹ thuật chủ động nhằm xác thực và phòng chống giả mạo ảnh, và kỹ thuật thụ động dùng để phát hiện ảnh giả mạo Hai hướng này được mô tả rõ ràng qua sơ đồ tổng hợp từ các tài liệu nghiên cứu.
Hình 1.8 Hai hướng trong phòng chống và phát hiện ảnh số giả mạo
Kỹ thuật điều tra ảnh số chủ động bao gồm hai phương pháp chính: băm tính toán trước và ẩn thông tin Cụ thể, chữ ký số và thủy vân số được sử dụng để phòng chống giả mạo ảnh, giúp đảm bảo tính xác thực và bảo mật của hình ảnh.
[35,39,40] Luận án này sử dụng kỹ thuật thủy vân nên các các nội dung tiếp theo chỉ đề cập đến kỹ thuật này
1.2.1.1 Giới thiệu và phân loại thủy vân
Thủy vân số là phương pháp ẩn thông tin trong dữ liệu đa phương tiện, bao gồm hai quá trình chính: nhúng thủy vân và trích thủy vân Các quá trình này sử dụng khóa bí mật hoặc khóa công khai để nâng cao tính an ninh của các lược đồ thủy vân.
Hình 1.9 Quá trình nhúng thủy vân [11]
Hình 1.10 Quá trình trích thủy vân [11]
Thủy vân số có nhiều ứng dụng quan trọng, dẫn đến việc nghiên cứu và phát triển nhiều phương pháp thủy vân khác nhau Các phương pháp này được phân chia thành ba loại chính: thủy vân bền vững (robust watermarking), thủy vân dễ vỡ (fragile watermarking), và thủy vân bán dễ vỡ (semi-fragile watermarking).
Thủy vân bền vững là loại thủy vân yêu cầu dấu vân ít bị biến đổi khi bị tấn công, đảm bảo rằng sản phẩm vẫn giữ được giá trị sử dụng Nếu dấu thủy vân bị loại bỏ, sản phẩm sẽ không còn giá trị Chính vì vậy, các lược đồ thủy vân bền vững thường được ứng dụng rộng rãi.
Trong bài toán bảo vệ bản quyền, có 16 phương pháp quan trọng Các cuộc tấn công phổ biến nhằm loại bỏ dấu thủy vân trên ảnh số bao gồm nén JPEG, thêm nhiễu, lọc, xoay, cắt xén, làm mờ, thay đổi kích thước, cũng như điều chỉnh cường độ sáng và độ tương phản.
Thủy vân dễ vỡ khác với thủy vân bền vững ở chỗ yêu cầu dấu thủy vân có khả năng bị biến đổi khi gặp tấn công trên dữ liệu Chính vì vậy, thủy vân dễ vỡ thường được sử dụng để xác thực tính toàn vẹn của ảnh trong các môi trường trao đổi không an toàn.
Thủy vân bán dễ vỡ là loại thủy vân kết hợp giữa tính bền vững và tính dễ vỡ, có khả năng chống lại các biến đổi khách quan như nén và làm mờ mà không làm thay đổi nội dung Tuy nhiên, nó lại dễ bị tổn thương trước các tấn công có chủ đích như xoay, tịnh tiến và cắt ghép, dẫn đến sự thay đổi nội dung ảnh Trong quá trình trao đổi và sử dụng ảnh số, các yếu tố môi trường và chương trình xử lý ảnh có thể ảnh hưởng đến chúng, vì vậy việc sử dụng thủy vân bán dễ vỡ là cần thiết để phòng chống giả mạo.
Bên cạnh việc phân loại theo các tiêu chí khác, thủy vân được chia thành hai loại chính: thủy vân hiện (visible watermarking) và thủy vân ẩn (invisible watermarking) dựa vào khả năng hiển thị của chúng trên sản phẩm đa phương tiện Luận án này sẽ tập trung nghiên cứu các lược đồ thủy vân ẩn.
Cũng có thể phân loại theo môi trường nhúng thủy vân như thủy vân trên miền không gian, thủy vân trên miền tần số
1.2.1.2 Các yêu cầu với lược đồ thủy vân
Tính ẩn của thuỷ vân là yếu tố quan trọng, yêu cầu rằng nó phải không thể nhận biết được bởi con người trong ảnh Điều này đồng nghĩa với việc dấu thuỷ vân chỉ tạo ra những thay đổi rất nhỏ, không làm ảnh hưởng đến chất lượng của bức ảnh.
Tính bền vững của thủy vân là yếu tố quan trọng thứ hai, yêu cầu thủy vân cần có khả năng tồn tại cao trước các tấn công có chủ đích cũng như không có chủ đích.
Các công không có chủ đích đối với ảnh số bao gồm nén ảnh, lấy mẫu, lọc và chuyển đổi A/D và D/A Ngược lại, các tấn công có chủ đích có thể là việc xoá, thay đổi hoặc làm nhiễu thuỷ vân trong ảnh Để thực hiện điều này, thuỷ vân cần được dấu trong các vùng quan trọng về trực giác Phương pháp thuỷ vân số phải đảm bảo rằng việc không thể khôi phục thuỷ vân tương đương với việc ảnh đã bị biến đổi quá nhiều, dẫn đến mất giá trị thương mại.
Khả năng mang tin cao là yêu cầu quan trọng, đòi hỏi lượng thông tin thêm vào ảnh phải đủ để phục vụ cho ứng dụng mà không làm giảm chất lượng ảnh một cách đáng kể.
Việc thực hiện đồng thời ba yêu cầu trong việc dấu thuỷ vân trong ảnh là rất khó khăn Để đảm bảo tính bền vững của thuỷ vân, cần phải điều chỉnh dữ liệu ảnh, nhưng nếu thay đổi quá nhiều sẽ làm giảm tính ẩn Ngược lại, nếu thay đổi quá ít, các yếu tố cần thiết để xác định thuỷ vân có thể không đủ Thông tin được dấu quá nhiều cũng có thể ảnh hưởng đến chất lượng ảnh và giảm tính bền vững Do đó, lượng thay đổi ảnh tối đa có thể chấp nhận và tính bền vững là hai yếu tố quyết định lượng thông tin được dấu trong ảnh.
An ninh là khả năng chống lại các cuộc tấn công, và việc loại bỏ hoặc phá hủy dấu thủy vân sẽ rất khó khăn nếu không có kiến thức về khóa bí mật, ngay cả khi các lược đồ thủy vân đã được công bố Đối với lược đồ thủy vân bền vững, mọi nỗ lực để loại bỏ hoặc phá hủy dấu thủy vân sẽ làm giảm chất lượng hình ảnh một cách nghiêm trọng Trong khi đó, với các lược đồ dễ vỡ và bán dễ vỡ, những nỗ lực này sẽ dẫn đến việc phá hủy thông tin xác thực.
1.2.1.3 Ứng dụng của thủy vân
Theo I Cox và cộng sự [35] thủy vân có rất nhiều ứng dụng trong nhiều lĩnh vực Tuy nhiên có một số ứng dụng chính sau đây:
MỘT SỐ PHÉP BIẾN ĐỔI MA TRẬN
Các phương pháp phòng chống và phát hiện giả mạo ảnh hiện nay chủ yếu dựa vào các phép biến đổi ma trận, và vẫn đang được nghiên cứu và phát triển Mục tiêu của luận án là cải tiến và đề xuất các phương pháp mới từ các phép biến đổi ma trận Trong phần này, chúng tôi sẽ trình bày một số phép biến đổi ma trận như SVD, QR, DCT, DWT và NMF, được sử dụng để xây dựng các phương pháp trong luận án.
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành tích của 3 ma trận thực như sau [47]:
U là ma trận trực chuẩn cấp m×m
V là ma trận trực chuẩn cấp n×n
D là ma trận đường chéo cấp m×n có tính chất:
Sau khi thực hiện biến đổi SVD với ma trận Y, ma trận D thu được là ma trận đường chéo, trong đó phần tử D(1,1) có giá trị lớn nhất và tính ổn định cao hơn các phần tử khác Do đó, phần tử D(1,1) thường được sử dụng làm đặc trưng đại diện hoặc vị trí nhúng thủy vân.
Mọi ma trận thực Y cấp m×n cho trước luôn luôn có thể phân tích thành tích của 2 ma trận thực như sau [47]:
Q là ma trận trực chuẩn cấp m×m
R là ma trận tam giác trên cấp m×n
Giống như phép biến đổi SVD, biến đổi QR với ma trận Y tạo ra ma trận R, trong đó các phần tử ở hàng đầu tiên có giá trị lớn nhất và tính ổn định cao hơn so với các hàng khác Do đó, các phần tử ở hàng 1 thường được sử dụng làm đặc trưng đại diện hoặc vị trí nhúng thủy vân.
1.3.3 Phép biến đổi cosine rời rạc
Trong ứng dụng, phép biến đổi DCT hai chiều được áp dụng cho các khối dữ liệu điểm ảnh nhằm tạo ra các khối DCT gồm 64 phần tử Để cải thiện tốc độ thực hiện, phương pháp ma trận thường được sử dụng cho biến đổi DCT hai chiều Bài viết này sẽ trình bày chi tiết các phép biến đổi DCT 1 chiều và 2 chiều theo cách tiếp cận này.
1.3.3.1 Phép biến đổi cosine rời rạc một chiều
Theo [108], biến đổi DCT một chiều ứng với dãy ở miền quan sát để nhận được dãy trong miền tần số tính theo công thức: trong đó:
The values referred to as the discrete cosine transform (DCT) consist of a first coefficient known as the DC (Direct Current) element, while the remaining coefficients are identified as AC (Alternating Current) elements.
Khi đó, biến đổi IDCT một chiều tương ứng thực hiện theo công thức:
Theo [108], một trong những đặc điểm quan trọng của phép biến đổi DCT là sự tập trung năng lượng, tức là năng lượng của ảnh được dồn vào một số phần tử của ma trận sau khi biến đổi Năng lượng này được định nghĩa là tổng bình phương các phần tử ma trận điểm ảnh, đặc biệt đối với dữ liệu có sự tương quan cao như ảnh, âm thanh và video Trong miền DCT, năng lượng chủ yếu tập trung vào một số phần tử đầu tiên, đặc biệt là phần tử DC, trong khi các phần tử còn lại thường có giá trị nhỏ, gần bằng 0.
Ví dụ, với dãy sau khi biến đổi cosine rời rạc một chiều ta nhận được miền DCT tương ứng:
1.3.3.2 Phép biến đổi cosine rời rạc hai chiều
Biến đổi DCT một chiều chỉ thích hợp cho dữ liệu âm thanh Đối với dữ liệu hai chiều như hình ảnh, chúng ta có thể thực hiện hai lần biến đổi DCT một chiều: một lần theo hàng và một lần theo cột, từ đó tạo ra biến đổi DCT hai chiều.
Theo [108], phép biến đổi DCT hai chiều cho phép chuyển đổi ma trận cấp từ miền quan sát sang miền tần số thông qua một công thức cụ thể Ma trận ở miền tần số được xác định dựa trên các công thức đã được thiết lập.
Khi đó, hệ số đầu tiên được gọi là phần tử DC và các hệ số còn lại là AC
Phép biến đổi IDCT hai chiều ứng với hệ số DCT của ma trận về miền quan sát tính theo công thức: với
Theo [108], ma trận cosine rời rạc cấp là ma trận trực chuẩn và được tính theo công thức:
Khi đó, phép biến đổi DCT hai chiều theo cách tiếp cận ma trận được tính theo công thức: và biến đổi IDCT hai chiều:
Ma trận trực chuẩn có tính chất rằng ma trận chuyển vị của nó chính là ma trận nghịch đảo Vì vậy, phép biến đổi DCT và IDCT luôn duy trì được phổ dữ liệu.
1.3.4 Phép biến đổi wavelet rời rạc
Phép biến đổi wavelet rời rạc (DWT) giữ vai trò quan trọng trong xử lý dữ liệu đa phương tiện và là chuẩn nén ảnh JPEG 2000 Khác với biến đổi DCT, năng lượng của ảnh trên miền DWT tập trung đồng đều vào một số phần tử góc trên bên trái Điều này cho phép áp dụng phép biến đổi DWT nhiều lần cho một ảnh, thực hiện liên tiếp trên các phần tử góc để đạt được độ tập trung năng lượng theo yêu cầu của ứng dụng.
1.3.4.1 Một số ký hiệu và khái niệm
Dưới đây sẽ ký hiệu R n là tập các véc tơ thực cấp n biểu diễn dưới dạng cột,
R mxn là tập các ma trận thực cấp m×n (m hàng n cột) Với X R n và A R m n , kí hiệu: X(i) là phần tử thứ i của X, A(i) là cột thứ i của A, A[i] là hàng i của A (khi đó
A ( ) , A [ i ] T R n ), A(i,j) là phần tử ở hàng i cột j của A Với véc tơ X (hàng hoặc cột), ký hiệu Sum(X) là tổng các phần tử của X Như vậy đối với ma trận A thì:
Sum(A[i]) là tổng các phần tử trên hàng i của A
Sum(A(i)) là tổng các phần tử trên cột i của A
Chuẩn ma trận được sử dụng dưới đây là chuẩn Euclid: m i n j j i A
( Năng lượng của ma trận A được hiểu là A 2
Trong mục này chỉ xét các ảnh đa cấp xám A có kích thước N×N với N=2 s
Nếu A là ảnh màu, ta sử dụng công thức A=0.299R+0.587G+0.114B để chuyển đổi sang ảnh xám với giá trị từ 0 đến 255 Trong một số trường hợp, ảnh và ma trận có thể được coi là đồng nhất, tức là ảnh A được xem như ma trận cấp N×N, trong đó A(i,j) là giá trị điểm ảnh tại vị trí hàng i, cột j Năng lượng của ảnh được tính bằng A^2.
1.3.4.2 Ý tưởng chung của phép biến đổi DWT trực chuẩn
Phép biến đổi DWT trực chuẩn là các phép biến đổi H bảo toàn năng lượng của ma trận, áp dụng cho ảnh A có kích thước N×N, với N = 2^s Quá trình thực hiện được tiến hành theo hàng.
B HA sẽ tạo ra các đống nhỏ (sóng nhỏ) bằng cách gom k hàng liên tiếp của A (với k thường là 2, 4, 6, 8) để hình thành N/2 hàng đầu của B Qua đó, N/2 hàng đầu của B sẽ có giá trị dương và lớn, giúp tập trung năng lượng của A vào N/2 hàng đầu của B Ví dụ, với k=2, B HA sẽ tối ưu hóa giá trị của B từ A.
Khi đó ma trận trực chuẩn H được xác định như sau (giả sử N=8):
H các hệ số α, β thòa mãn điêu kiện 0, 0, 2 2 1
Khi thực hiện theo hàng cột:
D thì năng lượng của A sẽ được tập trung vào góc phần tư thứ nhất của D
1.3.4.3 Phép biến đổi DWT dạng Haar
Trong phép biến đổi này
, 1 2 k , khi đó H như sau [108, trang 559]:
H Áp dụng phép biến đổi H cho ảnh A có sơ đồ sau:
Hình 1.11 Áp dụng phép biến đổi DWT theo hàng và cột
Có nhiều mức phép biến đổi có thể áp dụng cho ảnh, ví dụ như trong trường hợp hai mức, sau khi áp dụng mức 1, ta tiếp tục áp dụng mức 2 cho góc phần tư thứ nhất.
Hình 1.12 Áp dụng phép biến đổi DWT theo hai mức 1.3.4.4 Phép biến đổi DWT dạng Daubechies D4
Phép biến đổi Daubechies D4 hay còn gọi D4 [108, trang 560,561] là một trong các phép biến đổi DWT rất thông dụng, trong phép biến đổi này:
Mỗi phép biến đổi DWT được xác định bởi hai bộ lọc: lọc thông thấp và lọc thông cao Chẳng hạn, trong phép biến đổi DWT Haar, bộ lọc thông thấp và bộ lọc thông cao đều có hai hệ số Trong khi đó, phép biến đổi DWT D4 sử dụng bộ lọc thông thấp và bộ lọc thông cao với bốn hệ số.
KẾT LUẬN CHƯƠNG 1
Chương này kết hợp với phần mở đầu nhằm giới thiệu tổng quan về tình hình nghiên cứu và các khái niệm, kỹ thuật, phương pháp trong luận án Nội dung chương trình bày các khái niệm về ảnh giả mạo, phân loại ảnh giả mạo và các phương pháp phòng chống, phát hiện Ngoài ra, chương cũng đề cập đến một số phép biến đổi ma trận quan trọng như DCT, DWT, SVD, QR và NMF, được ứng dụng trong việc phát triển các kỹ thuật phòng chống và phát hiện ảnh giả mạo Những phép biến đổi này sẽ được áp dụng trong các chương 2, 3 và 4 của luận án.
PHÒNG CHỐNG GIẢ MẠO ẢNH BẰNG KỸ THUẬT THỦY VÂN
KỸ THUẬT THỦY VÂN VÀ PHÒNG CHỐNG GIẢ MẠO ẢNH
Kỹ thuật thủy vân bền vững đã trở nên phổ biến trong việc bảo vệ bản quyền, khác với kỹ thuật thủy vân dễ vỡ, chủ yếu được áp dụng để xác thực và phòng chống giả mạo ảnh Quy trình này được mô tả chi tiết qua sơ đồ do H Liu cung cấp.
Hình 2.1 Quy trình sử dụng kỹ thuật thủy vân cho xác thực/phòng chống giả mạo ảnh
Quy trình này được mô tả chi tiết hơn bởi các bước sau:
Bước 1 Chia ảnh thành các khối không chờm nhau
Bước 2 Sử dụng lược đồ thủy vân bán dễ vỡ nhúng thủy vân vào từng khối Bước 3 Thu được ảnh có các khối chứa dấu thủy vân
Xác thực và định vị vùng giả mạo:
Bước 1 Chia ảnh thành các khối tương tự như quá trình nhúng
Bước 2 Trích dấu thủy vân từ các khối
Bước 3 Kiểm tra các dấu thủy vân được trích từ từng khối
Bước 4 Kết luận và khoanh vùng giả mạo
+ Tồn tại dấu thủy vân nào không nguyên vẹn, kết luận ảnh bị chỉnh sửa + Các vùng có dấu thủy vân bị phá hủy là vùng giả mạo
Thuỷ vân được sử dụng để xác định tính nguyên bản của ảnh số, giúp phát hiện sự can thiệp của con người thông qua các ứng dụng xử lý ảnh Nó được nhúng vào ảnh với tính chất dễ vỡ, đảm bảo rằng bất kỳ thay đổi nhỏ nào cũng có thể làm hỏng hoặc phát hiện thuỷ vân Tuy nhiên, thuỷ vân cần tồn tại ổn định trước các phép biến đổi ảnh như chuyển đổi định dạng, lấy mẫu và nén mà không làm sai lệch nội dung.
Hình ảnh dưới đây mô tả kết quả của quá trình này:
Hình 2.2 Ảnh được chia khối và dấu thủy vân được trích ra
Lược đồ thủy vân là yếu tố cốt lõi trong nghiên cứu và phát triển các lược đồ thủy vân bán dễ vỡ, nhằm tìm kiếm các phương pháp hiệu quả để phòng chống giả mạo.
Bài viết này trình bày các lược đồ thủy vân bán dễ vỡ được xây dựng từ phân tích ma trận NMF, SVD và QR Những lược đồ này có ứng dụng quan trọng trong việc nhúng và trích dấu thủy vân, nhằm ngăn chặn tình trạng giả mạo ảnh.
ĐỀ XUẤT THUẬT TOÁN ĐIỀU CHỈNH CỘNG GIẢI BÀI TOÁN NMF VÀ XÂY DỰNG LƯỢC ĐỒ THỦY VÂN
2.2.1 Giới thiệu bài toán thừa số hóa ma trận không âm và một số thuật toán giải
Thừa số hóa ma trận không âm (NMF) là một kỹ thuật phát triển từ năm 1994, được Paatero và Tapper đề xuất, với nhiều ứng dụng tiềm năng trong phân tích và thu gọn dữ liệu cũng như trích chọn đặc trưng Kỹ thuật này có vai trò quan trọng trong việc xây dựng các phương pháp chủ động và thụ động để phòng chống và phát hiện giả mạo ảnh Về mặt toán học, NMF được diễn đạt như một bài toán tối ưu hóa với ràng buộc không âm, thu hút sự quan tâm lớn từ các nhà nghiên cứu trong cả lý thuyết và ứng dụng.
Thừa số hóa ma trận không âm là quá trình biểu diễn gần đúng một ma trận không âm V ∈ R^(n×m) dưới dạng tích của hai ma trận không âm W ∈ R^(n×r) và H ∈ R^(r×m).
Do r thường được chọn là một số rất bé, nên kích thước của các ma trận W và
H nhỏ hơn V, cho thấy W và H là biểu diễn gần đúng của ma trận dữ liệu V Kỹ thuật thừa số hóa ma trận không âm là một phương pháp hiệu quả để biểu diễn và thu nhỏ dữ liệu Mặc dù kỹ thuật này mới xuất hiện gần đây, nhưng đã thu hút được nhiều sự quan tâm.
32 ứng dụng rộng rãi, chẳng hạn như: phân cụm tài liệu [95, 122], khai phá dữ liệu
[96], nhận dạng đối tượng [71], phát hiện ảnh giả mạo[118, 126] Để đo độ xấp xỉ trong (2.1) thường sử dụng chuẩn Frobenius của ma trận hiệu: n i m j ij
Như vậy bài toán thừa số hóa ma trận không âm có thể phát biểu dưới dạng bài toán tối ưu hóa với ràng buộc không âm:
Do hàm mục tiêu không lồi, hầu hết các phương pháp không thể tìm ra lời giải tối ưu cho bài toán, mà chỉ đạt được một điểm dừng với cặp ma trận (W,H) thỏa mãn các điều kiện Krush-Kuhn-Tucker (KKT).
W ia (( ) T ) ia 0, bj ( T ( )) bj 0, , , , Trong đó:
Để điều chỉnh H hoặc W (khi cố định đối còn lại), thường áp dụng phương pháp gradient ngược với bước đi thích hợp, nhằm giảm hàm mục tiêu và đảm bảo tính không âm của H và W Trong số các thuật toán giải bài toán (2.3), thuật toán của D.D Lee và H S Seung được coi là thuật toán đầu tiên, có ưu điểm là đơn giản và dễ sử dụng, tuy nhiên tốc độ hội tụ của nó tương đối chậm Thuật toán này sử dụng công thức đặc trưng để thực hiện điều chỉnh.
33 ij ij T T ij ij ij ij ij H W A W WH
T ij ij ij ij ij ij W A H W H H
(2.6) Bằng cách khéo léo chọn ij và ij theo công thức: ij T ij ij W WH
~ ) ( ~ nhận được công thức điều chỉnh sau: ij T ij
Thuật toán điều chỉnh nhân, như tên gọi, chỉ sử dụng phép nhân trong công thức điều chỉnh Phương pháp này đảm bảo tính không âm cho các ma trận W~ và H~.
Trong [72] cũng chứng minh tính đơn điệu giảm của hàm mục tiêu sau khi điều chỉnh:
Thuật toán này có ưu điểm là đơn giản và dễ thực hiện trên máy tính, nhưng do các hệ số ij và ij được chọn khá đặc biệt, nó không đạt được cực tiểu trong mỗi lần điều chỉnh, dẫn đến hạn chế tốc độ hội tụ Để cải thiện tốc độ hội tụ, E.F Gonzalez và Y Zhang đã nâng cấp thuật toán của D.D Lee và H.S Seung bằng cách thêm một hệ số cho mỗi cột của H và một hệ số cho mỗi hàng của W, thay thế công thức (2.5) và (2.6) bằng một công thức mới.
T ij i ij ij W AH WHH
34 Để xác định các hệ số j và i trong [48] định nghĩa hàm:
Để tính toán biểu thức q A T (b Ax) và p x /(A T Ax) q, trong đó A là ma trận và b, x là các vectơ, chúng ta sử dụng các phép toán chia và nhân theo từng phần tử của vectơ Cuối cùng, xác định g(A, b, x) theo công thức min, max: x p 0.
Các hệ số j và i được xác định theo hàm g(A,b,x) như sau: j g ( W , V j , H j ), j 1 n i g H~ T ,V i T ,W i T ),i 1 m
Trong nghiên cứu của C.J Lin [74], một thuật toán mới được giới thiệu dựa trên phương pháp chiều gradient [21,22] Kết quả thử nghiệm cho thấy các thuật toán của E F Gonzalez, Y Zhang và C.J Lin nhanh hơn so với thuật toán của Lee và Seung [48][74] Tuy nhiên, thuật toán của Lee và Seung nổi bật với lược đồ tính toán đơn giản và dễ cài đặt, khiến nó vẫn được sử dụng phổ biến Thêm vào đó, theo nhận xét trong [74], các thuật toán của E.F Gonzalez
Y Zhang và D D Lee, H.S Seung không phải lúc nào cũng hội tụ tới điểm dừng, nhất là đối với các bài toán thực tế với kích thước lớn
2.2.2 Đề xuất thuật toán điều chỉnh cộng giải bải toán NMF
Bài viết này đề xuất một thuật toán mới, trong đó từng phần tử của các ma trận W và H được điều chỉnh theo phương pháp Gauss-Seidel phi tuyến.
[49] Qua thực nghiệm chứng tỏ thuật toán đề xuất có tốc độ hội tụ vượt trội so với
Thuật toán mới được giới thiệu có lược đồ tính toán đơn giản và dễ dàng triển khai ứng dụng Ý tưởng chính của thuật toán là điều chỉnh từng phần tử W ij của ma trận W và H ij của ma trận H, trong khi giữ cố định tất cả các phần tử còn lại.
2.2.2.1 Điều chỉnh một phần tử của W
Trong phần này, chúng ta sẽ xem xét thuật toán điều chỉnh một phần tử của ma trận W, trong khi giữ nguyên các phần tử còn lại của W và H Cụ thể, giả sử phần tử W ij được điều chỉnh bằng cách cộng thêm tham số ij vào nó.
Gọi W~ là ma trận nhận được, khi đó bằng một số phép biến đổi ma trận, ta có: m b i a H WH m b i a
Nên từ công thức (2.2) suy ra:
( W H f cần xác định sao cho g( ) đạt giá trị cực tiểu với điều kiện ~ 0 ij ij W
W Do g( ) là hàm bậc hai, nên có thể được tính như sau:
Công thức (2.12) luôn có nghĩa vì nếu q 0 thì theo (2.10) sẽ có p > 0
Từ công thức (2.9) và (2.12) , ta có: g ( ) 0, nếu (q = 0) hoặc (q>0 và W ij =0) (2.13.a) g ( ) 0, nếu trái lại (2.13.b)
Bằng cách sử dụng công thức cập nhật (2.7) và (2.12), tính đơn điệu giảm của hàm mục tiêu f(W,H) được khẳng định trong bổ đề sau
Bổ đề 1: Nếu điều kiện KKT không thỏa mãn tại W ij thì:
Chứng minh Từ (2.10), (2.11) suy ra: q ((WH V)H T ) ij
Do đó, nếu điều kiện KKT (2.4) không thỏa mãn tại W ij thì các tính chất:
W ij 0, q 0 và W ij q 0 không thể xảy ra đồng thời, dẫn đến việc trường hợp (2.13.a) không thể xảy ra Do đó, trường hợp (2.13.b) phải xảy ra và ta có g ( ) 0 Từ đó, suy ra từ (2.8).
Ngược lại nếu (2.14) thỏa mãn thì có nghĩa là: q=0 hoặc q>0 và W ij = 0 Do đó từ (2.12), suy ra 0 Nên theo (2.7) ta có:
Bổ đề được chứng minh!
2.2.2.2 Điều chỉnh một phần tử của H
Gọi H ~ là ma trận nhận được qua phép điều chỉnh: ij ij H
(2.15) Trong đó được xác định theo các công thức : n a
Bằng cách lập luận tương tự như trong mục 2.2.2.1, ta có bổ đề:
Bổ đề 2: Nếu điều kiện KKT không thỏa mãn tại H ij thì :
2.2.2.3 Điều chỉnh ma trận W và H
Trong mục này ta xét phép biến đổi T từ (W, H) sang (W~
Biến đổi các phần tử của W theo mục 2.2.2.1 Biến đổi các phần tử của H theo muc 2.2.2.2
Nói cách khác phép biến đổi: ~ ) ( , )
~ , ( W H T W H được thực hiện như sau:
Bước 2 Điều chỉnh các phần tử của W~
Bước 3 Điều chỉnh các phần tử của H ~
Từ các Bổ đề 1 và 2 , ta dễ dàng suy ra các tính chất quan trọng sau đây của phép biến đổi T
Bổ đề 3: Nếu phương án (W, H) không thỏa mãn điều kiện KKT (2.4) thì:
39 trong trường hợp trái lại thì: ~ ) ( , )
Tính chất sau đây được trực tiếp suy ra từ Bổ đề 3
Hệ quả 1: Với mọi ( W , H ) 0, Nếu đặt ~ ) ( , )
2.2.2.4 Đề xuất thuật toán aNMF
Thuật toán được mô tả qua phép biến đổi T như sau:
Từ Hệ quả 1, chúng ta có thể rút ra một tính chất quan trọng của thuật toán aNMF, đó là Định lý 1: Giả sử (W k, H k) là chuỗi các phương án được sinh ra bởi thuật toán.
2.2.2.4, khi đó dãy giá trị hàm mục tiêu f ( W k , H k ) là dãy đơn điệu giảm thực sự:
Chứng minh: Nếu ( W 1 , H 1 ) thoả mãn điều kiện KKT thì thuật toán kết thúc tại k=1, trong trường hợp trái lại, thuật toán cho phương án ( W 2 , H 2 )= T(W 1 ,H 1 ), và theo Bổ đề 3: f ( W 2 , H 2 ) f ( W 1 , H 1 )
Bằng cách lặp lại lập luận trên sẽ nhận được f ( W k 1 , H k 1 ) f ( W k , H k ), k 1 Định lý 1 được chứng minh!
Theo Định lý 1 dãy f ( W k , H k ) là đơn điệu giảm thực sự Ngoài ra dãy này bị chặn dưới bởi 0, nên ta có hệ quả sau:
Hệ quả 2: Dãy f ( W k , H k ) là một dãy hội tụ Hay nói cách khác tồn tại giá trị f không âm sao cho: f W k H k f k
Bây giờ ta xét tính chất hội tụ của thuật toán aNMF mục 2.2.2.4 Định lý 2: Giả sử ( W , H ) là một điểm giới hạn của dãy ( W k , H k ) và m b jb j r
2 (2.20) thì ( W , H )là điểm dừng của bài toán (2.3)
Chứng minh Giả sử ( W , H ) là giới hạn của dãy con ( W t k , H t k ) của dãy
Theo điều kiện (2.19), (2.20), phép biến đổi T là liên tục tại ( W , H ) Do đó từ
Hơn nữa, từ T ( W t k , H t k ) ( W t k 1 , H t k 1 ) , suy ra:
Sử dụng tính liên tục của hàm mục tiêu f(W,H), từ (2.21), (2.22) ta có: lim f(W t k ,H t k ) f(W,H) k lim f(W t k 1 ,H t k 1 ) f(T(W,H)) k
Mặt khác theo Hệ quả 2 dãy f ( W k , H k ) là hội tụ, suy ra:
Do đó theo Bổ đề 3 ( W , H ) là điểm dừng của bài toán (2.3) Định lý 2 được chứng minh!
2.2.2.5 Điều kiện dừng của thuật toán a Dừng theo điều kiện KKT Đầu tiên sử dụng điều kiện dừng theo phần dư KKT (2.4), có thể nhận thấy các điều kiện KKT tương đương với điều kiện sau:
Vì vậy nếu ( W , H ) càng nhỏ, thì (W,H) càng gần điểm dừng của bài toán
(2.3) Để có được một đại lượng độc lập với kích thước của W và H, sử dụng công thức sau:
) , ( trong đó W là số phần tử của tập hợp: min( W ia , (( WH V ) H T ) ia ) | i 1 n , a 1 r và H là số phần tử của tập hợp: min(H bj ,(W T (WH V) bj )| j 1 m,b 1 r
( W H được gọi là phần dư KKT tương đối
Khi đó điều kiện kết thúc của thuật toán là:
Với epsilon là một số tương đối nhỏ nào đó được chọn bởi người sử dụng b Dừng theo thời gian và số vòng lặp
ĐỀ XUẤT LƯỢC ĐỒ THỦY VÂN SỬ DỤNG PHÂN TÍCH QR
Các phép biến đổi SVD và QR, tương tự như DCT và DWT, đều là các phép biến đổi ma trận trực giao với đặc tính quan trọng là tập trung năng lượng ảnh vào một số phần tử nhất định trong miền biến đổi Trong phép biến đổi SVD, năng lượng ảnh tập trung vào phần tử D(1,1), trong khi ở phép biến đổi QR, nó tập trung vào hàng đầu của ma trận R Những phần tử này có tính ổn định cao, cho phép chúng được sử dụng để xây dựng các lược đồ thủy vân bền vững trước các cuộc tấn công, như đã được H Chen và cộng sự chỉ ra.
Phép biến đổi SVD được dùng khá nhiều để xây dựng các lược đồ thủy vân
Có hai hướng nghiên cứu xây dựng các lược đồ thủy vân dựa trên cách tiếp cận này
Có hai hướng chính để nhúng dấu thủy vân vào ma trận D Hướng thứ nhất là nhúng vào phần tử D(1,1), một số phần tử đầu trên đường chéo, tất cả các phần tử trên đường chéo, hoặc toàn bộ ma trận D Hướng thứ hai là nhúng dấu thủy vân vào các phần tử trên cột thứ nhất của ma trận U và/hoặc V.
Nhiều nghiên cứu đã áp dụng phân tích SVD kết hợp với các phép biến đổi ma trận khác như DCT và DWT để phát triển các lược đồ thủy vân đa dạng.
Phân tích QR có nhiều ưu điểm so với phân tích SVD, nhưng chưa được chú ý nhiều trong việc phát triển các lược đồ thủy vân Gần đây, Song Wei đã áp dụng phân tích QR để xây dựng lược đồ thủy vân, ký hiệu là SW, bằng cách nhúng dấu thủy vân vào các phần tử Q(2,1) và Q(3,1) của ma trận Q Ngoài ra, cũng có một số nghiên cứu khác kết hợp phân tích QR với các phép biến đổi ma trận khác nhằm phát triển lược đồ thủy vân.
Trong bài viết này, chúng tôi đề xuất hai lược đồ thủy vân dựa trên phân tích QR cho miền không gian ảnh Khác với lược đồ SW, các lược đồ này sử dụng hàng đầu của ma trận R để nhúng thủy vân Lược đồ thứ nhất nhúng thủy vân vào một phần tử trên hàng đầu của R, trong khi lược đồ thứ hai nhúng thủy vân trên toàn bộ hàng đầu của R Bên cạnh đó, phương pháp nhúng bít thủy vân của các lược đồ đề xuất cũng có những điểm khác biệt so với các lược đồ trước đây.
Trong lược đồ SW, việc nhúng bít thủy vân được thực hiện bằng cách điều chỉnh giá trị của hai phần tử Q(2,1) và Q(3,1), sao cho Q(2,1) lớn hơn hoặc nhỏ hơn Q(3,1) tùy thuộc vào giá trị bít cần nhúng (0 hoặc 1) Lược đồ này áp dụng ý tưởng từ phương pháp QIM (Quantization Index Modulation) để nhúng bít thủy vân vào một phần tử trên hàng đầu của R.
So với các lược đồ thủy vân dựa trên phân tích SVD và QR, lược đồ đề xuất cho thấy tính bền vững cao hơn trước các phép biến đổi ảnh, đặc biệt là nén JPEG Bên cạnh đó, lược đồ này còn có ưu điểm về số lượng phép tính ít hơn, tính bảo mật cao hơn và chất lượng ảnh thủy vân tốt hơn.
Trước khi trình bày đề xuất hai lược đồ thủy vân bán dễ vỡ sử dụng phân tích
QR, phần này trình bày hai lược đồ thủy vân bán dễ vỡ sử dụng phân tích SVD
2.3.1 Lược đồ thủy vân sử dụng phân tích SVD Để tiện theo dõi và so sánh, mục này trình bày hai lược đồ thủy vân, lược đồ thứ nhất nhúng một bít thủy vân vào phần tử đầu trên đường chéo ma trận D (của mỗi khối ảnh), gọi là lược đồ SVD-1 [116] và lược đồ thứ hai nhúng một bít vào tất cả các phần tử trên đường chéo ma trận D (của mỗi khối ảnh), gọi là lược đồ SVD-
Hai lược đồ phổ biến này thường được áp dụng trong nhiều nghiên cứu sau này và có thể kết hợp với các phép biến đổi ma trận khác như DCT, DWT để tạo ra các lược đồ mới.
2.3.1.1 Lược đồ thủy vân SVD -1 a Thuật toán nhúng thủy vân
Trong thuật toán này, đầu vào bao gồm ảnh I và dấu thủy vân W với độ dài t bit, cùng với một số nguyên dương q là hệ số lượng tử Kết quả đầu ra sẽ là ảnh I’ chứa dấu thủy vân W Các bước thực hiện thuật toán được mô tả chi tiết như sau:
Bước 1: Chia ảnh I thành t khối không giao nhau từng đôi một và có cùng kích thước m×n, ký hiệu là I i ,i=1,2, ,t
Bước 2: Áp dụng phân tích SVD trên mỗi khối I i :
Bước 3: Nhúng bít w i vào phần tử D i (1,1) của ma trận đường chéo D i :
Hệ số lượng tử q trong lược đồ thủy vân ảnh hưởng đến tính bền vững và chất lượng của ảnh Cụ thể, khi q nhỏ, tính bền vững giảm nhưng chất lượng ảnh thủy vân tăng Ngược lại, q lớn giúp tăng tính bền vững nhưng giảm chất lượng ảnh Do đó, việc lựa chọn hệ số q cần cân nhắc giữa tính bền vững và chất lượng ảnh để đáp ứng yêu cầu sử dụng thực tế.
Sau khi thực hiện nhúng w i vào D i ta nhận được D i ’ chỉ khác D i tại vị trí (1,1)
Bước 4: Tính I i ' U i D i ' V i T , ảnh I’ tạo từ các khối I i ’ là ảnh chứa dấu thủy vân W
Nhận xét: Công thức tính D i ’(1,1) trong trường hợp w i =1 và Z i < q/4 trình bày trong bước 3 chứa số hạng -Z i , nhưng trong [82] là + Z i , nghĩa là:
Theo tài liệu [116], có sự nhầm lẫn giữa dấu cộng và dấu trừ Các tác giả đã sử dụng phương pháp QIM để nhúng bít thủy vân w i vào D i (1,1) Theo lý thuyết của phương pháp QIM [30], điều này có thể được giải thích một cách rõ ràng.
[88], D i (1,1) cần được biến đổi một cách ít nhất để rơi vào tập:
1 q q x x tùy thuộc bít thủy vân w i =0 hoặc w i =1 Nói cách khác nếu w i =0 thì D i ’(1,1) thuộc
Ω 0 và nếu w i =1 thì D i ’(1,1) thuộc Ω 1 Trên hình dưới đây Ω 0 gồm các điểm ○, Ω 1 gồm các điểm ×:
Công thức (2.23) không phải lúc nào cũng đúng, vì D i ’(1,1) tính theo công thức này không luôn thuộc Ω1 Điều này cho thấy sự sai sót trong công thức (2.23), và có thể minh chứng điều này bằng một ví dụ đơn giản.
Với w i =1 thì D i (1,1)= 20q +q/6, khi đó theo công thức (2.23) thì
Theo thuật toán trích bit, nếu D i ’(1,1) mod q = q/12 < q/2, thì w’ i = 0, dẫn đến việc bít trích ra khác với bít đã nhúng, từ đó cho thấy (2.23) là sai Để kiểm tra dấu thủy vân và xác định bản quyền, ảnh I’ đã nhúng thủy vân có thể bị tấn công qua các phép biến đổi như thêm nhiễu, lọc, làm mờ, hoặc nén JPEG, dẫn đến ảnh I* (phiên bản tấn công của I’) Thuật toán dưới đây sẽ kiểm tra sự tồn tại của dấu thủy vân trong ảnh I* để đưa ra kết luận về bản quyền của tác giả đối với ảnh I’.
Bước 1 Chia ảnh I* thành t khối như trong thuật toán nhúng thủy vân, ký hiệu là:
Bước 2 Áp dụng phân tích SVD trên mỗi khối I i *:
Bước 3 Xác định bít w i * từ D i *(1,1) như sau:
Bước 4 So sánh dấu thủy vân W * w 1 * , , w t * trích ra từ I* với dấu thủy vân gốc W w 1 , , w t bằng cách dùng hệ số Err: t i i i XOR w t w
Ta nhận thấy Err là độ sai khác trung bình giữa W và W*, nó có giá trị trong đoạn [0, 1] và Err = 0 nếu w i = w i * (với i ), Err = 1 nếu w i w i * (với i )
Hệ số Err được so sánh với ngưỡng τ trong khoảng [0,1]; nếu Err nhỏ hơn τ, điều này cho thấy W* gần với W, từ đó có thể kết luận rằng ảnh I* đã được nhúng dấu thủy vân W và vẫn thuộc về tác giả của ảnh I’.
KẾT LUẬN CHƯƠNG 2
Bài viết trình bày một thuật toán điều chỉnh cộng cho bài toán thừa số hóa ma trận không âm NMF, với ưu điểm nổi bật về tính đơn giản, tốc độ tính toán nhanh và khả năng hội tụ tốt hơn so với các thuật toán trước đó Thuật toán này được ứng dụng để xây dựng lược đồ thủy vân bán dễ vỡ nhằm phòng chống giả mạo ảnh Ngoài ra, chương cũng giới thiệu hai lược đồ thủy vân SVD-1 và SVD-N dựa trên phân tích SVD, đồng thời phát triển thêm hai lược đồ mới QR-1 và QR-N Các lược đồ này cho thấy sự cải thiện về tốc độ và độ bền khi đối mặt với các tấn công ảnh như nén JPEG, làm mờ và nhiễu mà không làm thay đổi nội dung gốc.