BÀI TẬP LỚN MÔN HỌC KỸ THUẬT GIẤU TIN Đề tài 23 : KỸ THUẬT THỦY VÂN CỦA VIDEO MPEG4

Phương pháp cổ điển để tạo thủy vân cho luồng video nén là giải nén video và sử dụng kỹ thuật tạo thủy vân miền không gian hoặc miền biến đổi, sau đó nén lại video đã được thêm thủy vân.

Trang 1

HỌC VIỆN KỸ THUẬT MẬT MÃ

KHOA AN TOÀN THÔNG TIN

BÀI TẬP LỚN MÔN HỌC

KỸ THUẬT GIẤU TIN

Đề tài 23 :

KỸ THUẬT THỦY VÂN CỦA VIDEO MPEG4

Sinh viên thực hiện : NGUYỄN MINH HOÀNG AT150121

VŨ TRẦN HOÀNG ANH AT150102 HOÀNG NHẬT HỒNG AT150122

LÊ CÔNG SẢN AT150150 NGUYỄN VĂN NGHĨA AT150141 Nhóm :

Giảng viên hướng dẫn :

9

Th.S HOÀNG THU PHƯƠNG

Hà Nội, 02/2022

Trang 2

TÓM LƯỢC

Phương pháp tạo thủy vân video miền nén MPEG-4 được đề xuất và thể hiện của nó được nghiên cứu ở tốc độ bit video từ 64 Kb / s đến 900

Kb / s Thủy vân được chèn bằng cách sửa đổi hệ số Discrete Cosine Transformation (DCT) Cường độ của thủy vân được thay đổi theo đặc tính khung cục bộ để giảm tác động đến chất lượng hình ảnh Thể hiện của thuật toán cũng được nghiên cứu để tạo thủy vân các bit trong khung hình khác nhau, từ 1 Kb / khung hình đến 3 Kb / khung hình Thủy vân không bị tấn công trước các cuộc tấn công như chia tỷ lệ, xoay và cắt xén ngay cả khi sử dụng kỹ thuật mù

Mục lục

1 Giới thiệu 2

2 Tổng quan về MPEG-4 3

3 Phương án đề xuất 3

3.1 Tín hiệu thủy vân trải phổ 4

3.2 Nhúng thủy vân 4

3.3 Phương pháp tăng thích ứng cục bộ 6

4 Kết quả 10

5 Đánh giá chủ quan 12

6 Kết luận 15

1 Giới thiệu

Kỹ thuật thủy vân số là việc chèn thông tin một cách trong suốt vào dữ liệu đa phương tiện, nó đóng vai trò như một chữ ký trong video

Trang 3

Phương pháp cổ điển để tạo thủy vân cho luồng video nén là giải nén video và sử dụng kỹ thuật tạo thủy vân miền không gian hoặc miền biến đổi, sau đó nén lại video đã được thêm thủy vân Một số nhược điểm của phương pháp này là: Tăng tính nhiễu do quá trình nén lại, chất lượng không tốt do không hiểu biết về kết quả các tham số nén và độ phức tạp trong tính toán Một cách khác là chỉ chèn thủy vân trong miền nén Theo cách tiếp cận này, thủy vân được chèn vào một số thành phần cú pháp như hệ số DCT của video được giải mã một phần

Hartung mô tả các kỹ thuật để nhúng thủy vân trải phổ vào video nén MPEG-2 cũng tương tự vào video không nén Đối với kỹ thuật thủy vân miền nén, họ giải mã video để thu được hệ số DCT của mỗi khung hình

và chèn thủy vân bằng cách sửa đổi các hệ số DCT đó Langelaar mô tả

kỹ thuật thủy vân miền nén được gọi là Differential Energy Watermark (DEW), trong đó video được chia thành nhóm các khối, mỗi nhóm được chia thành hai bộ có kích thước bằng nhau được xác định bởi khóa nhúng thủy vân Bằng cách so sánh năng lượng của các hệ số DCT đã chọn trong hai bộ, một bit trọng tải duy nhất được biểu thị Jordan và cộng sự đề xuất một phương pháp tạo thủy vân cho video nén để nhúng thông tin vào các vectơ chuyển động Hsu và Wu trình bày một phương pháp cho kỹ thuật thủy vân điều chỉnh hệ số DCT tần số trung bình liên quan đến các khối lân cận về mặt không gian và thời gian Nicholson đã đánh giá độ bền của thủy vân và chất lượng video sau khi video được tạo thủy vân và nén bằng MPEG-4 Tuy nhiên, không có kỹ thuật nào trong

số này giải quyết được thủy vân trực tiếp của các video MPEG-4 này Trong bài báo này, một kỹ thuật thủy vân miền nén mới cho các luồng video MPEG- 4 được trình bày Cách tiếp cận tương tự như thủy vân được chèn vào hệ số DCT Tuy nhiên, việc sử dụng các mẫu đồng bộ hóa làm cho nó trở nên mạnh mẽ và đạt được cải thiện cục bộ về chất lượng

Phần 2 giới thiệu tổng quan về kỹ thuật MPEG-4 Tiếp theo là phương pháp được đề xuất và kết quả trong Phần 3 và Phần 4 tương ứng Phần 5

Trang 4

đề xuất một giao thức để đánh giá chủ quan của hệ thống và kết luận trong Phần 6

2 Tổng quan về MPEG-4

MPEG-4 mã hóa thông tin hình ảnh dưới dạng các đối tượng (video tự nhiên, tổng hợp và kết cấu tĩnh) MPEG-4 mã hóa mô tả cảnh để kết xuất thích hợp tất cả các đối tượng Khung ảnh của MPEG-4 có thể bao gồm một hoặc nhiều đối tượng video Mỗi đối tượng video được đặc trưng bởi thông tin không gian và thời gian dưới dạng hình khuôn, chuyển động và kết cấu và tương ứng với một đối tượng 2D trong cảnh

Bề mặt đối tượng video (Video Object Plane - VOP) là một mẫu thời gian của đối tượng video VOP có thể được mã hóa độc lập với nhau hoặc phụ thuộc nhau bằng cách bù trừ chuyển động Một VOP chứa dữ liệu video được mã hóa ở dạng khối không chồng lấn Một khối không chồng lấn chứa một phần của độ chó sáng và các thành phần sắc độ được lấy mẫu theo không gian Trong tiêu chuẩn hình ảnh MPEG-4, chỉ hỗ trợ một định dạng sắc độ cho khối không chồng lấn là định dạng 4:2:0 Ở định dạng này, mỗi macroblock chứa 4 khối độ chói sáng và 2 khối sắc

độ Mỗi khối gồm 8x8 pixel được mã hóa bằng cách sử dụng phép biến đổi DCT Các hệ số DCT sau đó được lượng tử hóa một cách thích ứng

để đạt được tốc độ bit thấp

3 Phương án đề xuất

Trong phương pháp được đề xuất, một tín hiệu thủy vân được chèn trực tiếp vào chuỗi nhị phân nén MPEG-4 trong khi quá trình phát hiện được thực hiện bằng cách sử dụng chuỗi nhị phân nén mà không có bất kỳ tín hiệu thủy vân nào Phần 3.1 thảo luận về sự hình thành tín hiệu thủy vân

từ các mẫu đồng bộ và tín hiệu thông điệp gốc Phần 3.2 đề cập đến quá trình mà tín hiệu thủy vân được nhúng vào các video MPEG-4 Phần 3.3 thảo luận về phương pháp tăng thích ứng cục bộ để tăng chất lượng video

Trang 5

3.1 Tín hiệu thủy vân trải phổ

Tín hiệu thủy vân thường được giới hạn ở một giá trị nhỏ để đảm bảo tính trong suốt và có thể bị nhiễu từ tín hiệu chủ và nhiễu bổ sung phát sinh từ quá trình xử lý sau đó Tín hiệu trải phổ dễ bị xảy ra lỗi đồng bộ hóa sau quá trình chia tỷ lệ, cắt xén và phép quay Một cặp mẫu được áp dụng trên tín hiệu trải phổ để chống lại sự mất tính đồng bộ Mẫu đầu tiên hạn chế tín hiệu thủy vân để có cấu trúc tuần hoàn định kỳ Đặc biệt, tín hiệu thủy vân w (x , y ) được xây dựng bằng cách lặp lại một ô thủy vân

sơ cấp w ( x , y )^ theo một cách không chồng chéo Nếu việc lát được thực hiện đúng cách, đỉnh luôn xảy ra ở tâm của mỗi ô Nếu một phép biến đổi tuyến tính A được áp dụng cho VOP đã được thủy vân một hệ số tự tương quan h(x , y), do đó các đỉnh mới di chuyển đến x 'và y ' theo

[x ' y '

]T=A [x y ] T (1) Mẫu đồng bộ hóa thứ hai buộc w (x , y ) phải chứa một tập các đỉnh trong miền yêu cầu Yêu cầu này được đáp ứng bằng cách khiến w ( x , y )^ là sự kết hợp của thông điệp mang ký hiệu m(x , y ) và tín hiệu đồng bộ g ( x , y ) Trong miền tần số này g ( x , y ) chứa các đỉnh ở băng tần trung bình, mỗi đỉnh chiếm một hệ số tần và có độ lớn thống nhất Sau quá trình chuyển đổi hình học A được áp dụng cho hình ảnh, hệ số FFT F (u , v ) di chuyển đến một vị trí mới (u , v ) theo phương trình

[u ' v '

]T=(A T

)−1[u v ] T (2)

Do sử dụng hai phương trình trên, chúng ta có thể thu được phép biến đổi tuyến tính A áp dụng cho hình ảnh và thực hiện hoàn nguyên phép biến đổi để thực hiện phương pháp phát hiện Hình 1 (a) Phác thảo quá trình tạo ra tín hiệu thủy vân

3.2 Nhúng thủy vân

Phần này mô tả kỹ thuật nhúng thủy vân trực tiếp vào chuỗi nhị phân được tạo ra để phù hợp với Advanced Simple Profile (ASP) của tiêu chuẩn MPEG-4 Tín hiệu thủy vân w (x , y ) sẽ được thêm vào mặt phẳng

Trang 6

độ chói sáng của VOPs Vì DCT là một phép biến đổi tuyến tính để

thêm tín hiệu thủy vân được biến đổi trực tiếp vào hệ số DCT của các

khối chói sáng, nó tương đương phép cộng trong miền không gian Một

luồng nhị phân sơ cấp được phân tích cú pháp thành mức khối, vectơ

chuyển động được mã hóa có độ dài biến đổi và hệ số DCT Các vectơ

chuyển động được tái cấu trúc sử dụng giải mã VLC và đảo ngược các

bước đoán trước nếu có thể Sau khi tín hiệu thủy vân được nhúng, các

mã VLC được tái tạo lại và chuỗi nhị phân được tái cấu trúc Hình 1 (b):

Mô tả toàn bộ đại cương

Vì tín hiệu 96x96 được nhúng trong hình ảnh 192x192, nên một khối

8x8 sẽ được nhúng trong một khối 16x16 Do đó, tổng số hoán vị có thể

là P64256 Thuộc tính này giúp giới thiệu Giấy phép kỹ thuật số (Digital

License Number) Mỗi người dùng được ủy quyền có một khóa được

ánh xạ tới một trong các cấu hình của tất cả các hoán vị có thể xảy ra

Chuỗi bậc hai là một phương pháp mà lặp lại các (i+i2)K mod 256, trong đó

K là số giấy phép tạo ra 64 vị trí để chèn thủy vân Bảng băm là một

cách tiếp cận khác để làm điều tương tự

(a)

Sửa lỗi Chia tỉ lệ và bổ sung Sự gắn kết

Chia tỉ lệ và nhúng Tín hiệu đã thủy

vân

Tín hiệu thủy vân

Đồng bộ hóa

theo mẫu

Tín hiệu không được đánh dấu

Trang 7

Hình 1 a) Sơ đồ chuẩn bị tín hiệu thủy vân b) Phác thảo cho một trình

nhúng thủy vân Trình nhúng bắt chước giải mã MPEG-4

3.3 Phương pháp tăng thích ứng cục bộ

Phương pháp tăng thích ứng cục bộ để cải thiện việc thể hiện của thủy vân Đối với các vùng tương đối mịn của video, nơi thậm chí chỉ một lượng nhỏ sai lệch cũng có thể thấy, kiểm soát tăng cục bộ sẽ giảm sức

Các hệ số DCT đã thủy vân

Các

hệ số DCT

Nhúng thủy vân

Vecto chuyển động

Thôn tin tiêu đề và hình dạng

Dòng Bit đã thủy vân Dòng Bit không được

đánh dấu

Trang 8

mạnh của nhúng thủy vân để giảm thiểu khả năng cảm nhận thủy vân Đối với các vùng hình ảnh hay biến đổi và vùng kết cấu của hình ảnh, kiểm soát tăng cục bộ làm tăng sức mạnh nhúng để cải thiện độ mạnh

mẽ Phương pháp tăng cục bộ sử dụng thước đo hoạt động cục bộ để điều chỉnh công suất thủy vân trên cơ sở từng khối, được thu trực tiếp từ

hệ số DCT cho các khối trong và được dự đoán bằng cách sử dụng thông tin vectơ chuyển động cho các khối được dự đoán Mô hình tăng cho ra tăng cục bộ L(x , y ) Các hệ số thủy vân sau đó được tính trọng số bằng

L(x , y ) để tạo ra tín hiệu thủy vân sẽ được nhúng vào video:

W¿ (x , y )=αLL( x , y )W (x , y ) (3) trong đó W¿ là thủy vân sẽ được nhúng, αLlà mức tăng toàn cầu do người dùng lựa chọn và W là tín hiệu thủy vân trước khi điều chỉnh mức tăng Đối với mỗi VOP, trọng số tăng cục bộ được quyết định dựa trên hoạt động ước tính trong VOP Đối với mã hóa nội khung VOP,L ( x , y ) là

L(x , y )=DCT (f (x ) , g ( y ))2∑DCT (i, j)2 (4) trong đó f ( x ) và g ( y ) là ánh xạ pixel thứ (x , y ) thành hệ số DCT (f (x), g( y )) Đối với VOP được dự đoán, sẽ sử dụng cùng một công thức nhưng thay

vì tổng năng lượng là ∑DCT (i , j)2, nó là

A i=N 1

N A A+N 2

N A B+N 3

N A C+N 4

N A D (5)

trong đó N 1, N 2, N 3 và N 4 là số pixel đã di chuyển từ Khu vực A, B, C,

D đến khối hiện đang được xem xét Bản phác thảo cho tăng thích ứng cục bộ được thể hiện trong Hình 2 (a)

Trang 9

(b)

(c) Hình 2 a) Bản phác thảo cho phương pháp tăng thích ứng cục bộ b) Tín hiệu thủy vân gốc sẽ được chèn c) Tín hiệu thủy vân cuối sau khi lát

Trang 10

(a)Video I (900 Kb/sec)

Trang 11

(b) Video II (64 Kb/sec) Hình 3 a) Video đã được thủy vân có tốc độ bit 900 Kb / giây và tốc độ bit trọng tải là 1 Kb / khung hình b) Video đã được thủy vân có tốc độ

bit 64 Kb / giây và tốc độ bit trọng tải là 1 Kb / khung hình

4 Kết quả

Thuật toán đã được thử với hai video (một video có nhiều kết cấu so với video khác) được thực hiện trong IIT Kanpur vì không có tập dữ liệu video tiêu chuẩn cho các phương pháp tạo thủy vân Các video được nén

ở các tốc độ bit khác nhau (64-900 Kb / giây) và tốc độ bit của tín hiệu thủy vân thay đổi từ 1 kb / khung hình đến 3 Kb / khung hình Các khung có kích thước 192 x 192 và thủy vân 32 x 32 đã được chèn vào Việc chuẩn bị tín hiệu thủy vân đã được thể hiện trong các hình 2 (b), 2 (c) Kết quả nhúng thủy vân ở 1 Kb / khung hình và video 900 kb / s và

Trang 12

64 kb / s được thể hiện trong Hình 3 Hình 4 cho thấy hiệu suất của mô-đun tăng thích ứng cục bộ

(a)Không có tăng thích ứng cục bộ

Trang 13

(b)Có tăng thích ứng cục bộ Hình 4 a) Video đã được thủy vân có tốc độ bit 900 Kb / giây và tốc độ trọng tải thủy vân là 3Kb / giây và không có mô-đun tăng thích ứng cục

bộ b) Video thủy vân có tốc độ bit 900 Kb / giây và tốc độ trọng tải thủy vân là 3Kb / giây với áp dụng tăng thích ứng cục bộ Sự khác biệt là chất lượng khá rõ ràng ở các vùng có kết cấu thấp như bầu trời và bức tường

5 Đánh giá chủ quan

Một giao thức để đánh giá chất lượng của các khung video có thủy vân

đã được xác định dựa trên khuyến nghị P.910 của ITU-T và ITU-R Rec BT.500 Các khuyến nghị này đề xuất các giao thức khác nhau dựa trên mục tiêu của các đánh giá và sự sẵn có của hiểu biết nền tảng Trong giao thức Absolute Category Rating (ACR), các hình ảnh được hiển thị

và sau đó các câu hỏi liên quan đến chất lượng của nó được đưa ra

Trang 14

Thang đo là rời rạc với các giá trị 1-5 Trong giao thức Degradation Category Rating (DCR), đầu tiên nguồn được trình bày theo đó là hệ thống thử nghiệm Thang đo sử dụng là thang điểm suy giảm rời rạc Các thang đo ACR, DCR không được tuân thủ vì chúng sử dụng các thang đo rời rạc và do đó làm mất đi sự tự do để phân biệt với việc sử dụng Một giao thức được thiết kế trong đó đối tượng được hiển thị hiểu biết nền tảng và hệ thống thử nghiệm nhưng thang đo là liên tục Trong mỗi phiên kiểm tra, người dùng lần đầu tiên được làm quen với các giao diện Tiếp theo là phần thử để kiểm tra độ quen thuộc Sau đó, chúng tôi

đã có một phiên kiểm tra bắt đầu với một dãy ổn định Điểm số cao hơn mức thông thường và điểm số trung bình đã được tính toán

Bài kiểm tra nhận thức chủ quan được thực hiện trên 5 đối tượng là người dùng cuối và không phải chuyên gia về xử lý hình ảnh Thang điểm mà các đối tượng bình chọn là liên tục Trong phiên đầu tiên của bài kiểm tra, video bên dưới có tốc độ bit là 900 Kb / s Trong phiên thứ hai, tốc độ bit đã được thay đổi và các khung riêng lẻ được hiển thị Tỷ

lệ thủy vân vẫn là 1 Kb / khung hình Các biểu đồ sau (hình 5 (a) và hình

5 (b)) cho thấy hiệu suất của hai video

Trang 15

(a)Tốc độ bit tải trọng đã thay đổi

(b)Tốc độ bit của video đã thay đổi

Trang 16

Hình 5 a) Đánh giá chủ quan về các video có tốc độ bit tải trọng đã thay đổi b) Đánh giá chủ quan về video có tốc độ bit của video đã

thay đổi

6 Kết luận

Một kỹ thuật mới để thủy vân số các chuỗi nhị phâm MPEG-4 trong miền nén được đề xuất Kỹ thuật này không chỉ mạnh mẽ đối với các lỗi đồng bộ hóa mà còn cải thiện chất lượng video bằng cách sử dụng kỹ thuật thích ứng cục bộ

7 Tài liệu tham khảo

[1] Hartung, F., Girod, B.: Watermarking of uncompressed and

compressed video Signal Processing 66 (1998) 283–301

[2] Hartung, F.: Watermarking and ﬁngerprinting of uncompressed and compressed video Signal Processing 66 (1998) 283–301

[3] ISO: Information technology - generic coding of moving pictures and associated audio information ISO/IEC 13818-2 (1994)

[4] Langelaar, G., R.Lagendijk: Optimal di erential energy ﬀerential energy

watermarking of dct encoded images and video IEEE Transactions on image Processing 10 (2001) 148– 158

[5] F Jordan, M.K., Ebrahimi, T.: Proposal of a watermarking technique for hiding/retrieving data in compressed and decompressed video

ISO/IEC document JTC1/SC29/WG11 MPEG97/M2281 (1997)

[6] Hsu, C., Wu, J.: Hidden digital watermarks in images IEEE

Transactions on Image Processing 8 (1999) 58–68

[7] D Nicholson, P.K., Delaigle, J.: Watermarking in mpeg4 context European Conference on Multimedia Application Services and

Techniques (1999) 472–492

Trang 17

[8] ISO: Information technology - coding of audio/video objects:video ISO/IEC 14486-2 (October 1998)

[9] ITU-T: Methodology for subjective assesment of the quality of

television pictures Recommendation P.910 (1996)

[10] ITU-R: Subjective video quality assesment methods for multimedia applications Recommendation BT 500-11 (1995)

Định dạng
Số trang	17
Dung lượng	620,29 KB