Phương pháp cổ điển để tạo thủy vân cho luồng video nén là giải nén video và sử dụng kỹ thuật tạo thủy vân miền không gian hoặc miền biến đổi, sau đó nén lại video đã được thêm thủy vân.
Trang 1HỌC VIỆN KỸ THUẬT MẬT MÃ
KHOA AN TOÀN THÔNG TIN
BÀI TẬP LỚN MÔN HỌC
KỸ THUẬT GIẤU TIN
Đề tài 23 :
KỸ THUẬT THỦY VÂN CỦA VIDEO MPEG4
Sinh viên thực hiện : NGUYỄN MINH HOÀNG AT150121
VŨ TRẦN HOÀNG ANH AT150102 HOÀNG NHẬT HỒNG AT150122
LÊ CÔNG SẢN AT150150 NGUYỄN VĂN NGHĨA AT150141 Nhóm :
Giảng viên hướng dẫn :
9
Th.S HOÀNG THU PHƯƠNG
Hà Nội, 02/2022
Trang 2TÓM LƯỢC
Phương pháp tạo thủy vân video miền nén MPEG-4 được đề xuất và thể hiện của nó được nghiên cứu ở tốc độ bit video từ 64 Kb / s đến 900
Kb / s Thủy vân được chèn bằng cách sửa đổi hệ số Discrete Cosine Transformation (DCT) Cường độ của thủy vân được thay đổi theo đặc tính khung cục bộ để giảm tác động đến chất lượng hình ảnh Thể hiện của thuật toán cũng được nghiên cứu để tạo thủy vân các bit trong khung hình khác nhau, từ 1 Kb / khung hình đến 3 Kb / khung hình Thủy vân không bị tấn công trước các cuộc tấn công như chia tỷ lệ, xoay và cắt xén ngay cả khi sử dụng kỹ thuật mù
Mục lục
1 Giới thiệu 2
2 Tổng quan về MPEG-4 3
3 Phương án đề xuất 3
3.1 Tín hiệu thủy vân trải phổ 4
3.2 Nhúng thủy vân 4
3.3 Phương pháp tăng thích ứng cục bộ 6
4 Kết quả 10
5 Đánh giá chủ quan 12
6 Kết luận 15
1 Giới thiệu
Kỹ thuật thủy vân số là việc chèn thông tin một cách trong suốt vào dữ liệu đa phương tiện, nó đóng vai trò như một chữ ký trong video
Trang 3Phương pháp cổ điển để tạo thủy vân cho luồng video nén là giải nén video và sử dụng kỹ thuật tạo thủy vân miền không gian hoặc miền biến đổi, sau đó nén lại video đã được thêm thủy vân Một số nhược điểm của phương pháp này là: Tăng tính nhiễu do quá trình nén lại, chất lượng không tốt do không hiểu biết về kết quả các tham số nén và độ phức tạp trong tính toán Một cách khác là chỉ chèn thủy vân trong miền nén Theo cách tiếp cận này, thủy vân được chèn vào một số thành phần cú pháp như hệ số DCT của video được giải mã một phần
Hartung mô tả các kỹ thuật để nhúng thủy vân trải phổ vào video nén MPEG-2 cũng tương tự vào video không nén Đối với kỹ thuật thủy vân miền nén, họ giải mã video để thu được hệ số DCT của mỗi khung hình
và chèn thủy vân bằng cách sửa đổi các hệ số DCT đó Langelaar mô tả
kỹ thuật thủy vân miền nén được gọi là Differential Energy Watermark (DEW), trong đó video được chia thành nhóm các khối, mỗi nhóm được chia thành hai bộ có kích thước bằng nhau được xác định bởi khóa nhúng thủy vân Bằng cách so sánh năng lượng của các hệ số DCT đã chọn trong hai bộ, một bit trọng tải duy nhất được biểu thị Jordan và cộng sự đề xuất một phương pháp tạo thủy vân cho video nén để nhúng thông tin vào các vectơ chuyển động Hsu và Wu trình bày một phương pháp cho kỹ thuật thủy vân điều chỉnh hệ số DCT tần số trung bình liên quan đến các khối lân cận về mặt không gian và thời gian Nicholson đã đánh giá độ bền của thủy vân và chất lượng video sau khi video được tạo thủy vân và nén bằng MPEG-4 Tuy nhiên, không có kỹ thuật nào trong
số này giải quyết được thủy vân trực tiếp của các video MPEG-4 này Trong bài báo này, một kỹ thuật thủy vân miền nén mới cho các luồng video MPEG- 4 được trình bày Cách tiếp cận tương tự như thủy vân được chèn vào hệ số DCT Tuy nhiên, việc sử dụng các mẫu đồng bộ hóa làm cho nó trở nên mạnh mẽ và đạt được cải thiện cục bộ về chất lượng
Phần 2 giới thiệu tổng quan về kỹ thuật MPEG-4 Tiếp theo là phương pháp được đề xuất và kết quả trong Phần 3 và Phần 4 tương ứng Phần 5
Trang 4đề xuất một giao thức để đánh giá chủ quan của hệ thống và kết luận trong Phần 6
2 Tổng quan về MPEG-4
MPEG-4 mã hóa thông tin hình ảnh dưới dạng các đối tượng (video tự nhiên, tổng hợp và kết cấu tĩnh) MPEG-4 mã hóa mô tả cảnh để kết xuất thích hợp tất cả các đối tượng Khung ảnh của MPEG-4 có thể bao gồm một hoặc nhiều đối tượng video Mỗi đối tượng video được đặc trưng bởi thông tin không gian và thời gian dưới dạng hình khuôn, chuyển động và kết cấu và tương ứng với một đối tượng 2D trong cảnh
Bề mặt đối tượng video (Video Object Plane - VOP) là một mẫu thời gian của đối tượng video VOP có thể được mã hóa độc lập với nhau hoặc phụ thuộc nhau bằng cách bù trừ chuyển động Một VOP chứa dữ liệu video được mã hóa ở dạng khối không chồng lấn Một khối không chồng lấn chứa một phần của độ chó sáng và các thành phần sắc độ được lấy mẫu theo không gian Trong tiêu chuẩn hình ảnh MPEG-4, chỉ hỗ trợ một định dạng sắc độ cho khối không chồng lấn là định dạng 4:2:0 Ở định dạng này, mỗi macroblock chứa 4 khối độ chói sáng và 2 khối sắc
độ Mỗi khối gồm 8x8 pixel được mã hóa bằng cách sử dụng phép biến đổi DCT Các hệ số DCT sau đó được lượng tử hóa một cách thích ứng
để đạt được tốc độ bit thấp
3 Phương án đề xuất
Trong phương pháp được đề xuất, một tín hiệu thủy vân được chèn trực tiếp vào chuỗi nhị phân nén MPEG-4 trong khi quá trình phát hiện được thực hiện bằng cách sử dụng chuỗi nhị phân nén mà không có bất kỳ tín hiệu thủy vân nào Phần 3.1 thảo luận về sự hình thành tín hiệu thủy vân
từ các mẫu đồng bộ và tín hiệu thông điệp gốc Phần 3.2 đề cập đến quá trình mà tín hiệu thủy vân được nhúng vào các video MPEG-4 Phần 3.3 thảo luận về phương pháp tăng thích ứng cục bộ để tăng chất lượng video
Trang 53.1 Tín hiệu thủy vân trải phổ
Tín hiệu thủy vân thường được giới hạn ở một giá trị nhỏ để đảm bảo tính trong suốt và có thể bị nhiễu từ tín hiệu chủ và nhiễu bổ sung phát sinh từ quá trình xử lý sau đó Tín hiệu trải phổ dễ bị xảy ra lỗi đồng bộ hóa sau quá trình chia tỷ lệ, cắt xén và phép quay Một cặp mẫu được áp dụng trên tín hiệu trải phổ để chống lại sự mất tính đồng bộ Mẫu đầu tiên hạn chế tín hiệu thủy vân để có cấu trúc tuần hoàn định kỳ Đặc biệt, tín hiệu thủy vân w (x , y ) được xây dựng bằng cách lặp lại một ô thủy vân
sơ cấp w ( x , y )^ theo một cách không chồng chéo Nếu việc lát được thực hiện đúng cách, đỉnh luôn xảy ra ở tâm của mỗi ô Nếu một phép biến đổi tuyến tính A được áp dụng cho VOP đã được thủy vân một hệ số tự tương quan h(x , y), do đó các đỉnh mới di chuyển đến x 'và y ' theo
[x ' y '
]T=A [x y ] T (1) Mẫu đồng bộ hóa thứ hai buộc w (x , y ) phải chứa một tập các đỉnh trong miền yêu cầu Yêu cầu này được đáp ứng bằng cách khiến w ( x , y )^ là sự kết hợp của thông điệp mang ký hiệu m(x , y ) và tín hiệu đồng bộ g ( x , y ) Trong miền tần số này g ( x , y ) chứa các đỉnh ở băng tần trung bình, mỗi đỉnh chiếm một hệ số tần và có độ lớn thống nhất Sau quá trình chuyển đổi hình học A được áp dụng cho hình ảnh, hệ số FFT F (u , v ) di chuyển đến một vị trí mới (u , v ) theo phương trình
[u ' v '
]T=(A T
)−1[u v ] T (2)
Do sử dụng hai phương trình trên, chúng ta có thể thu được phép biến đổi tuyến tính A áp dụng cho hình ảnh và thực hiện hoàn nguyên phép biến đổi để thực hiện phương pháp phát hiện Hình 1 (a) Phác thảo quá trình tạo ra tín hiệu thủy vân
3.2 Nhúng thủy vân
Phần này mô tả kỹ thuật nhúng thủy vân trực tiếp vào chuỗi nhị phân được tạo ra để phù hợp với Advanced Simple Profile (ASP) của tiêu chuẩn MPEG-4 Tín hiệu thủy vân w (x , y ) sẽ được thêm vào mặt phẳng
Trang 6độ chói sáng của VOPs Vì DCT là một phép biến đổi tuyến tính để
thêm tín hiệu thủy vân được biến đổi trực tiếp vào hệ số DCT của các
khối chói sáng, nó tương đương phép cộng trong miền không gian Một
luồng nhị phân sơ cấp được phân tích cú pháp thành mức khối, vectơ
chuyển động được mã hóa có độ dài biến đổi và hệ số DCT Các vectơ
chuyển động được tái cấu trúc sử dụng giải mã VLC và đảo ngược các
bước đoán trước nếu có thể Sau khi tín hiệu thủy vân được nhúng, các
mã VLC được tái tạo lại và chuỗi nhị phân được tái cấu trúc Hình 1 (b):
Mô tả toàn bộ đại cương
Vì tín hiệu 96x96 được nhúng trong hình ảnh 192x192, nên một khối
8x8 sẽ được nhúng trong một khối 16x16 Do đó, tổng số hoán vị có thể
là P64256 Thuộc tính này giúp giới thiệu Giấy phép kỹ thuật số (Digital
License Number) Mỗi người dùng được ủy quyền có một khóa được
ánh xạ tới một trong các cấu hình của tất cả các hoán vị có thể xảy ra
Chuỗi bậc hai là một phương pháp mà lặp lại các (i+i2)K mod 256, trong đó
K là số giấy phép tạo ra 64 vị trí để chèn thủy vân Bảng băm là một
cách tiếp cận khác để làm điều tương tự
(a)
Sửa lỗi Chia tỉ lệ và bổ sung Sự gắn kết
Chia tỉ lệ và nhúng Tín hiệu đã thủy
vân
Tín hiệu thủy vân
Đồng bộ hóa
theo mẫu
Tín hiệu không được đánh dấu
Trang 7Hình 1 a) Sơ đồ chuẩn bị tín hiệu thủy vân b) Phác thảo cho một trình
nhúng thủy vân Trình nhúng bắt chước giải mã MPEG-4
3.3 Phương pháp tăng thích ứng cục bộ
Phương pháp tăng thích ứng cục bộ để cải thiện việc thể hiện của thủy vân Đối với các vùng tương đối mịn của video, nơi thậm chí chỉ một lượng nhỏ sai lệch cũng có thể thấy, kiểm soát tăng cục bộ sẽ giảm sức
Các hệ số DCT đã thủy vân
Các
hệ số DCT
Nhúng thủy vân
Vecto chuyển động
Thôn tin tiêu đề và hình dạng
Dòng Bit đã thủy vân Dòng Bit không được
đánh dấu
Trang 8mạnh của nhúng thủy vân để giảm thiểu khả năng cảm nhận thủy vân Đối với các vùng hình ảnh hay biến đổi và vùng kết cấu của hình ảnh, kiểm soát tăng cục bộ làm tăng sức mạnh nhúng để cải thiện độ mạnh
mẽ Phương pháp tăng cục bộ sử dụng thước đo hoạt động cục bộ để điều chỉnh công suất thủy vân trên cơ sở từng khối, được thu trực tiếp từ
hệ số DCT cho các khối trong và được dự đoán bằng cách sử dụng thông tin vectơ chuyển động cho các khối được dự đoán Mô hình tăng cho ra tăng cục bộ L(x , y ) Các hệ số thủy vân sau đó được tính trọng số bằng
L(x , y ) để tạo ra tín hiệu thủy vân sẽ được nhúng vào video:
W¿ (x , y )=αLL( x , y )W (x , y ) (3) trong đó W¿ là thủy vân sẽ được nhúng, αLlà mức tăng toàn cầu do người dùng lựa chọn và W là tín hiệu thủy vân trước khi điều chỉnh mức tăng Đối với mỗi VOP, trọng số tăng cục bộ được quyết định dựa trên hoạt động ước tính trong VOP Đối với mã hóa nội khung VOP,L ( x , y ) là
L(x , y )=DCT (f (x ) , g ( y ))2∑DCT (i, j)2 (4) trong đó f ( x ) và g ( y ) là ánh xạ pixel thứ (x , y ) thành hệ số DCT (f (x), g( y )) Đối với VOP được dự đoán, sẽ sử dụng cùng một công thức nhưng thay
vì tổng năng lượng là ∑DCT (i , j)2, nó là
A i=N 1
N A A+N 2
N A B+N 3
N A C+N 4
N A D (5)
trong đó N 1, N 2, N 3 và N 4 là số pixel đã di chuyển từ Khu vực A, B, C,
D đến khối hiện đang được xem xét Bản phác thảo cho tăng thích ứng cục bộ được thể hiện trong Hình 2 (a)
Trang 9(b)
(c) Hình 2 a) Bản phác thảo cho phương pháp tăng thích ứng cục bộ b) Tín hiệu thủy vân gốc sẽ được chèn c) Tín hiệu thủy vân cuối sau khi lát
Trang 10(a)Video I (900 Kb/sec)
Trang 11(b) Video II (64 Kb/sec) Hình 3 a) Video đã được thủy vân có tốc độ bit 900 Kb / giây và tốc độ bit trọng tải là 1 Kb / khung hình b) Video đã được thủy vân có tốc độ
bit 64 Kb / giây và tốc độ bit trọng tải là 1 Kb / khung hình
4 Kết quả
Thuật toán đã được thử với hai video (một video có nhiều kết cấu so với video khác) được thực hiện trong IIT Kanpur vì không có tập dữ liệu video tiêu chuẩn cho các phương pháp tạo thủy vân Các video được nén
ở các tốc độ bit khác nhau (64-900 Kb / giây) và tốc độ bit của tín hiệu thủy vân thay đổi từ 1 kb / khung hình đến 3 Kb / khung hình Các khung có kích thước 192 x 192 và thủy vân 32 x 32 đã được chèn vào Việc chuẩn bị tín hiệu thủy vân đã được thể hiện trong các hình 2 (b), 2 (c) Kết quả nhúng thủy vân ở 1 Kb / khung hình và video 900 kb / s và
Trang 1264 kb / s được thể hiện trong Hình 3 Hình 4 cho thấy hiệu suất của mô-đun tăng thích ứng cục bộ
(a)Không có tăng thích ứng cục bộ
Trang 13(b)Có tăng thích ứng cục bộ Hình 4 a) Video đã được thủy vân có tốc độ bit 900 Kb / giây và tốc độ trọng tải thủy vân là 3Kb / giây và không có mô-đun tăng thích ứng cục
bộ b) Video thủy vân có tốc độ bit 900 Kb / giây và tốc độ trọng tải thủy vân là 3Kb / giây với áp dụng tăng thích ứng cục bộ Sự khác biệt là chất lượng khá rõ ràng ở các vùng có kết cấu thấp như bầu trời và bức tường
5 Đánh giá chủ quan
Một giao thức để đánh giá chất lượng của các khung video có thủy vân
đã được xác định dựa trên khuyến nghị P.910 của ITU-T và ITU-R Rec BT.500 Các khuyến nghị này đề xuất các giao thức khác nhau dựa trên mục tiêu của các đánh giá và sự sẵn có của hiểu biết nền tảng Trong giao thức Absolute Category Rating (ACR), các hình ảnh được hiển thị
và sau đó các câu hỏi liên quan đến chất lượng của nó được đưa ra
Trang 14Thang đo là rời rạc với các giá trị 1-5 Trong giao thức Degradation Category Rating (DCR), đầu tiên nguồn được trình bày theo đó là hệ thống thử nghiệm Thang đo sử dụng là thang điểm suy giảm rời rạc Các thang đo ACR, DCR không được tuân thủ vì chúng sử dụng các thang đo rời rạc và do đó làm mất đi sự tự do để phân biệt với việc sử dụng Một giao thức được thiết kế trong đó đối tượng được hiển thị hiểu biết nền tảng và hệ thống thử nghiệm nhưng thang đo là liên tục Trong mỗi phiên kiểm tra, người dùng lần đầu tiên được làm quen với các giao diện Tiếp theo là phần thử để kiểm tra độ quen thuộc Sau đó, chúng tôi
đã có một phiên kiểm tra bắt đầu với một dãy ổn định Điểm số cao hơn mức thông thường và điểm số trung bình đã được tính toán
Bài kiểm tra nhận thức chủ quan được thực hiện trên 5 đối tượng là người dùng cuối và không phải chuyên gia về xử lý hình ảnh Thang điểm mà các đối tượng bình chọn là liên tục Trong phiên đầu tiên của bài kiểm tra, video bên dưới có tốc độ bit là 900 Kb / s Trong phiên thứ hai, tốc độ bit đã được thay đổi và các khung riêng lẻ được hiển thị Tỷ
lệ thủy vân vẫn là 1 Kb / khung hình Các biểu đồ sau (hình 5 (a) và hình
5 (b)) cho thấy hiệu suất của hai video
Trang 15(a)Tốc độ bit tải trọng đã thay đổi
(b)Tốc độ bit của video đã thay đổi
Trang 16Hình 5 a) Đánh giá chủ quan về các video có tốc độ bit tải trọng đã thay đổi b) Đánh giá chủ quan về video có tốc độ bit của video đã
thay đổi
6 Kết luận
Một kỹ thuật mới để thủy vân số các chuỗi nhị phâm MPEG-4 trong miền nén được đề xuất Kỹ thuật này không chỉ mạnh mẽ đối với các lỗi đồng bộ hóa mà còn cải thiện chất lượng video bằng cách sử dụng kỹ thuật thích ứng cục bộ
7 Tài liệu tham khảo
[1] Hartung, F., Girod, B.: Watermarking of uncompressed and
compressed video Signal Processing 66 (1998) 283–301
[2] Hartung, F.: Watermarking and fingerprinting of uncompressed and compressed video Signal Processing 66 (1998) 283–301
[3] ISO: Information technology - generic coding of moving pictures and associated audio information ISO/IEC 13818-2 (1994)
[4] Langelaar, G., R.Lagendijk: Optimal di erential energy fferential energy
watermarking of dct encoded images and video IEEE Transactions on image Processing 10 (2001) 148– 158
[5] F Jordan, M.K., Ebrahimi, T.: Proposal of a watermarking technique for hiding/retrieving data in compressed and decompressed video
ISO/IEC document JTC1/SC29/WG11 MPEG97/M2281 (1997)
[6] Hsu, C., Wu, J.: Hidden digital watermarks in images IEEE
Transactions on Image Processing 8 (1999) 58–68
[7] D Nicholson, P.K., Delaigle, J.: Watermarking in mpeg4 context European Conference on Multimedia Application Services and
Techniques (1999) 472–492
Trang 17[8] ISO: Information technology - coding of audio/video objects:video ISO/IEC 14486-2 (October 1998)
[9] ITU-T: Methodology for subjective assesment of the quality of
television pictures Recommendation P.910 (1996)
[10] ITU-R: Subjective video quality assesment methods for multimedia applications Recommendation BT 500-11 (1995)