Trong bài báo cáo này, một thuật toán thủy vân âm thanh đa năng mới lạ được đề xuất dựa trên lượng tử hóa vectơ VQ trong miền biến đổi Cosin rời rạc DCT sử dụng nhãn từ mã và phương thức
Trang 1THUẬT TOÁN KỸ THUẬT THỦY VÂN ÂM THANH
ĐA NĂNG DỰA TRÊN LƯỢNG TỬ HÓA VECTƠ
TRONG MIỀN DCT
Sinh viên thực hiện: TRẦN THỊ NGỌC ANH AT150503
CHU VĂN HIẾU AT150517 NGUYỄN THỊ HUYỀN MY AT150539
Trang 2NGUYỄN THỊ PHƯƠNG THẢO AT150553 TRẦN THỊ TRANG AT150557
Nhóm 4 Lớp L03 Giảng viên hướng dẫn: ThS Hoàng Thu Phương
Hà Nội, 2-2022
LỜI NÓI ĐẦU
Ngày nay, với sự phát triển mạnh mẽ của các mạng máy tính tốc độ cao, đặcbiệt là Internet, các phương tiện kỹ thuật số như phương tiện lưu trữ, phương tiệntruyền thông, đã mở ra một kỷ nguyên mới – kỷ nguyên thông tin số Hầu hết cácthông tin ngày nay đều được lưu trữ dưới dạng số hóa Đồng thời, quá trình toàn cầuhóa mạng Internet đã biến xã hội ảo là nơi diễn ra trao đổi thông tin trong mọi lĩnh vựcchính trị, quân sự, quốc phòng, kinh tế, thương mại Tuy nhiên, công nghệ số cũng tạo
ra khả năng sao chép hoàn hảo, không có bất kỳ khuyết điểm và phân phối lại nhữngsản phẩm này trên toàn thế giới, có hoặc không sự cho phép của người sở hữu Việctrao đổi, phân bố, sao chép và xử lý các sản phẩm số này ngày càng nhanh chóng, đơngiản, nằm ngoài tầm kiểm soát của các tổ chức Vấn đề đặt ra cho tất cả các phươngthức kinh doanh, phân phối tài nguyên số trên mạng là tuân thủ các nguyên tắc vềquyền sở hữu trí tuệ, và không cản trở quá trình phân phối, trao đổi tài nguyên số Nhucầu được bảo vệ bản quyền và sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đềquan trọng và đang được quan tâm
Trong bài báo cáo này, một thuật toán thủy vân âm thanh đa năng mới lạ được đề xuất dựa trên lượng tử hóa vectơ (VQ) trong miền biến đổi Cosin rời rạc (DCT) sử dụng nhãn từ mã và phương thức ràng buộc chỉ số-bit Bằng cách
sử dụng thuật toán này, nó có thể đáp ứng yêu cầu của cả bảo vệ bản quyền và
Trang 3tính toàn vẹn của nội dung đồng thời xác thực cho các tác phẩm nghệ thuật đa phương tiện Các thủy vân (hình khắc chìm) bền vững được nhúng trong hệ số tần số trung bình của biến đổi DCT trong quá trình lượng tử hóa vectơ từ mã được gắn nhãn thủ tục Thủy vân dễ vỡ được nhúng vào các chỉ số của hệ số tần
số cao của biến đổi DCT bằng cách sử dụng phương pháp lượng tử hóa vectơ chỉ số bị ràng buộc nhằm mục đích xác thực tính toàn vẹn của tín hiệu âm thanh gốc Cả hai thủy vân bền vững và thủy vân dễ vỡ có thể được trích xuất mà không có âm thanh gốc tín hiệu và kết quả mô phỏng cho thấy rằng thuật toán của chúng ta có hiệu quả liên quan đến tính minh bạch, mạnh mẽ và xác thực các yêu cầu.
Nội dung bài báo cáo có cấu trúc sau:
CHƯƠNG I: Giới thiệu
CHƯƠNG II: Phép lượng tử vectơ và phép giải mã lượng tử vectơ gán nhãnCHƯƠNG III: Thuật toán thủy vân số được đề xuất
CHƯƠNG IV: Kết quả thực nghiệm và thảo luận
KẾT LUẬN
Chúng em xin gửi lời cảm ơn sâu sắc tới cô Hoàng Thu Phương, người địnhhướng, hướng dẫn và hỗ trợ chúng em rất nhiều trong quá trình hoàn thành báo cáo.Mặc dù chúng em đã cố gắng hoàn thành báo cáo này, các mục tiêu về cơ bản đã đạtđược Tuy nhiên thuật toán kỹ thuật thủy vân âm thanh là một vấn đề khó và phức tạpnên chắc chắn không tránh khỏi thiếu sót Chúng em rất mong sẽ nhận được sự nhậnxét, góp ý và tận tình chỉ bảo từ cô
Một lần nữa chúng em xin chân thành cảm ơn
Trang 4MỤC LỤC
DANH MỤC HÌNH VẼ 5
DANH MỤC BẢNG BIỂU 6
CHƯƠNG 1 GIỚI THIỆU 7
CHƯƠNG 2 PHÉP LƯỢNG TỬ VECTƠ VÀ PHÉP GIẢI MÃ LƯỢNG TỬ VECTƠ GÁN NHÃN 10
2.1 Lượng tử hóa vectơ 10
2.2 Lượng tử hóa vectơ từ mã được gắn nhãn 10
CHƯƠNG 3 THUẬT TOÁN THỦY VÂN SỐ 12
3.1 Quy trình nhúng thủy vân bền vững 12
3.2 Quá trình nhúng thủy vân dễ vỡ 12
3.3 Quy trình giải nén thủy vân 14
CHƯƠNG 4 KẾT QUẢ THỰC NGHIỆM VÀ THẢO LUẬN 17
KẾT LUẬN 22
TÀI LIỆU THAM KHẢO 23
Trang 5DANH MỤC HÌNH
Hình 2 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc 11
Y Hình 3 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc 13
Hình 3 2 Quy trình nhúng thủy vân 14
Hình 3 3 Quy trình giải nén thủy vân 15
Hình 4 1 Tín hiệu âm thanh gốc và thủy vân bền vững 18
Hình 4 2 Tín hiệu âm thanh thủy vân và thủy vân bền vững được trích xuất mà không bị tấn công SNR = 21,87 dB, NC = 1,00 18
Trang 6DANH MỤC BẢNG BIỂU
Bảng 4 1 Hiệu xuất bền vững được đề xuất dưới mặt kỹ thuật trong StirmarkBenchmark cho audio trong V0.2 21Bảng 4 2 Tỷ lệ phần trăm mẫu âm thanh xáo trộn 21
Trang 7CHƯƠNG 1 GIỚI THIỆU
Sự phát triển nhanh chóng và bùng nổ của máy tính mạng và công nghệ đaphương tiện giới thiệu một loạt các những vấn đề thách thức cả về bảo vệ trí tuệ và xácminh tính toàn vẹn của nội dung cho đa phương tiện kỹ thuật số Thủy vân số - Digitalwatermarks gần đây đã được giới thiệu như một công cụ cung cấp bảo vệ bản quyềncho đa phương tiện chất lượng cao tác phẩm nghệ thuật Đó là một kỹ thuật để nhúng
dữ liệu vào âm thanh kỹ thuật số, hình ảnh hoặc video, đồng thời giới thiệu biến dạngđối với đa phương tiện ban đầu, để nó cho phép quyền sở hữu được xác lập hoặc chủ
sở hữu hợp pháp được xác định Các thủy vân được nhúng sau đó có thể được pháthiện hoặc trích xuất từ môi trường thủy vân để xác thực hoặc nhận dạng [1] Với mộtthập kỷ phát triển, thủy vân số như một phương pháp hiệu quả để bảo vệ bản quyền vàxác thực toàn vẹn nội dung của dữ liệu đa phương tiện đã được được khám phá mộtcách sâu sắc và rộng rãi Theo đó, kỹ thuật thủy vân số có thể được phân loại thành thủy vân bền vững và thủy vân dễ vỡ cho các mục tiêu khác nhau Nói chung, chỉ cómột thủy vân được nhúng vào một số dữ liệu đa phương tiện cần bảo vệ bản quyềnhoặc xác thực toàn vẹn nội dung Nhưng trong một số hoàn cảnh đặc biệt, cả hai thủyvân sẽ cần phải được nhúng vào cùng một dữ liệu đa phương tiện để tạo ra thuật toánthực hiện các mục đích khác nhau Ví dụ: chủ sở hữu của các tác phẩm nghệ thuật đaphương tiện mong muốn: sử dụng một thủy vân để xác nhận quyền sở hữu, sử dụngthủy vân thứ hai để xác minh nội dung tính toàn vẹn và sử dụng thủy vân thứ ba đểtruyền đạt tiêu đề phụ đề [2] Tuy nhiên, chỉ có một số thuật toán thủy vân đa năng khảdụng, chủ yếu tập trung vào tín hiệu hình ảnh để thực hiện các yêu cầu của ứng dụng[3], [4] Trong [3], ba kỹ thuật tạo thủy vân ảo để nhúng thủy vân vào không gian thủyvân được đề xuất, đó là Nhúng thủy vân đơn (SWE), Nhúng thủy vân nhiều lớp(MWE) và Nhúng thủy vân lặp lại (IWE) SWE sử dụng hai khóa bí mật để nhúng mộthình ảnh biểu trưng nhị phân có ý nghĩa vào không gian thủy vân, bằng cách sử dụng
kỹ thuật trải phổ và một số tính năng mới SWE sử dụng hai khóa bí mật để nhúng mộthình ảnh biểu trưng nhị phân có ý nghĩa vào không gian thủy vân, bằng cách sử dụng
kỹ thuật trải phổ và một số tính năng mới Nó không yêu cầu thủy vân phải trực giaovới dữ liệu gốc, do đó cho phép chuỗi bit nhúng ngay cả trong các hình ảnh nhỏ Dựa
Trang 8trên SWE, kỹ thuật thứ hai được đề xuất trong [3], được gọi là Nhúng thủy vân nhiềulớp (MWE), được phát triển để nhúng nhiều thủy vân đồng thời trong cùng một khônggian thủy vân Các khóa bí mật khác nhau được sử dụng cho các thủy vân khác nhau.Trong [4], một phương pháp khắc chìm hình ảnh đa năng dựa trên lượng tử hóa vectơnhiều tầng được trình bày, trong đó thủy vân bán dễ vỡ (để xác thực nội dung) và thủyvân mạnh mẽ (để bảo vệ bản quyền) được nhúng vào các giai đoạn VQ khác nhaubằng cách sử dụng các phương pháp khác nhau và cả hai chúng có thể được trích xuất
mà không cần hình ảnh gốc Kể từ khi Hệ thống thính giác của con người (HAS) nhạycảm hơn Hệ thống trực quan (HVS) với thông tin pha tuyệt đối, kỹ thuật thủy vân âmthanh đa năng khó thiết kế và triển khai hơn so với kỹ thuật thủy vân hình ảnh đa năng[5] Cho đến nay, rất ít sơ đồ kỹ thuật thủy vân âm thanh đa năng đã được trình bày Một lược đồ “cocktail” thủy vân âm thanh được giới thiệu trong [6], nơi mà thủy vânbền vững và bán dễ vỡ được phát hiện bởi sử dụng các quy trình phát hiện khác nhau
và sự xáo trộn vị trí cũng đạt được Tuy nhiên, sự bền vững của nó chống lại các thaotác xử lý tín hiệu âm thanh thông thường không được chấp thuận Trong [7], thủy vânbền vững được nhúng vào phần thấp dải tần số sử dụng lượng tử hóa trung bình, trongkhi thủy vân bán dễ vỡ được nhúng vào tần số cao phạm vi bằng cách lượng tử hóa hệ
số đơn Cả thủy vân bền vững và thủy vân bán dễ vỡ có thể được trích xuất không có
âm thanh máy chủ Nhưng sơ đồ thủy vân bán dễ vỡ không thể đạt được sự xáo trộn vịtrí Trong [8], một hỗn loạn ánh xạ dựa trên thủy vân bán dễ vỡ (cho nội dung xác thựcvới sự xáo trộn vị trí) được nhúng trong hệ số wavelet chi tiết dựa trên mô hình xáotrộn tức thời của Phân tích thành phần độc lập (ICA), trong khi thủy vân bền vững (đểbảo vệ bản quyền) là được nhúng dựa trên ý tưởng zero-watermarking Trong [12],một sơ đồ thủy vân nhiều lớp cho tín hiệu giọng nói được đề xuất bởi sự kết hợp mãhóa dự đoán tuyến tính (LPC) và phương pháp VQ, thủy vân bền vững không thực sựđược nhúng trong tín hiệu giọng nói gốc nhưng được trích xuất bằng cách sử dụngphương pháp zero-watermarking Và thủy vân còn lại là thủy vân bán dễ vỡ, chỉ chốnglại các cuộc tấn công của VQ Những nhược điểm này hạn chế lĩnh vực ứng dụng củachúng Những thách thức và yêu cầu kỹ thuật hiện có trong thiết kế các sơ đồ thủy vân
âm thanh đa năng bao gồm [8]:
Trang 91) Làm thế nào để giảm ảnh hưởng của việc nhúng thủy vân sau lên trên thủy vânđược nhúng trước hoặc cách giảm tác động lẫn nhau giữa các thủy vân đượcnhúng?
2) Làm thế nào để giải quyết mâu thuẫn giữa tính bền vững và yêu cầu minh bạch?3) Làm thế nào để đảm bảo việc trích xuất độc lập và không thấy được của từngthủy vân?
4) Cách làm cho toàn bộ chương trình chống lại các thao tác xử lý tín hiệu âmthanh thông thường?
Theo các yêu cầu trên, một học thuyết về sơ đồ thủy vân âm thanh đa năngđược trình bày trong bài báo này bên trong sơ đồ được đề xuất, một thủy vân WF dễ
vỡ (cho nội dung xác thực) được nhúng vào các chỉ số dựa trên lược đồ lượng tử hóavectơ bị ràng buộc, trong khi một thủy vân WR (để bảo vệ bản quyền) được nhúng dựatrên lược đồ lượng tử hóa vectơ được gắn nhãn trong âm thanh máy chủ tín hiệu AO.Chúng đều được nhận dạng trong miền biến đổi Cosine rời rạc, và lý do tại sao chúng
sử dụng miền này là vì các tính năng của Hệ thống âm thanh con người (HAS) có thểđược kết hợp với thủy vân trong miền chuyển đổi một cách hiệu quả hơn, và điều đó
có lợi cho việc không nghe được năng lượng của thông tin nhúng trong miền biến đổi
sẽ trải rộng trên tất cả các phần tần số Bài báo cáo này được chia thành các phần nhưsau: đầu tiên, sự ra đời của lượng tử hóa vectơ và lượng tử hóa vectơ từ mã có nhãn;sau đó đề xuất sơ đồ thủy vân đa năng được mô tả chi tiết, bao gồm cả quy trình nhúng
và chiết xuất; cuối cùng, kết quả mô phỏng được mô tả và thảo luận ngắn gọn về thuậttoán đề xuất được thực hiện
Trang 10CHƯƠNG 2 PHÉP LƯỢNG TỬ VECTƠ VÀ PHÉP GIẢI MÃ
LƯỢNG TỬ VECTƠ GÁN NHÃN
2.1 Lượng tử hóa vectơ
VQ là một phương pháp nén tổn hao hiệu quả với tỷ lệ nén và một bộ giải mãtra cứu bảng đơn giản Bộ định lượng vectơ k-chiều Q có kích thước N là ánh xạ từ không gian Euclide Rk chiều k hành một tập hữu hạn (hoặc sách mã) C = {c0, c1,…, cN-1}trong đó Ci ∈ Rkđược gọi là từ mã và N là kích thước sổ mã
Trong đó k ci ∈ R được gọi là một từ mã và N là kích thước bảng mã Bảng mãthường được tạo ngoại tuyến bởi thuật toán LBG đến từ một tập dữ liệu Tín hiệu được
mã hóa trước tiên được chia thành các vectơ và sau đó được mã hóa bởi bảng mã đàotạo Đối với mỗi đầu vào k-dimensional (k-chiều) vectơ x, chúng ta có thể tìm thấy từ
mã gần nhất Ci dưới một số chỉ số như trong công thức sau:
d( x, cj) = 0 ≤ j ≤ N−1 min d( x , c j)
Trong đó, d (x, c j ) là độ lệch giữa vectơ đầu vào x và từ mã cj, và nó có thể
được tính như sau:
2.2 Lượng tử hóa vectơ từ mã được gắn nhãn
Ý tưởng chính của thuật toán thủy vân bền vững là để gán từng tần số trungbình Vectơ hệ số DCT đến từ mã gần nhất được gán nhãn bởi bit thủy vân tương ứng
Trang 11và phương pháp thủy vân dễ vỡ được đề xuất là điều chỉnh bit chỉ định của các chỉ sốcủa Vectơ hệ số DCT tần số cao bằng cách sử dụng các bit thủy vân dễ vỡ Để đạtđược điều này, hai bộ mã nên được tạo bằng cách sử dụng thuật toán LBG Bộ mãdành cho thủy vân dễ vỡ được tạo bằng cách sử dụng phương pháp LBG tiêu chuẩn.Giả sử bộ mã cho thủy vân bền vững đã được tạo bởi thuật toán LBG thông thường, đểnhận ra các bit thủy vân trong quá trình mà không có tín hiệu âm thanh gốc, chúng ta
có thể chỉ định một nhãn là ‘0’ hoặc ‘1’ cho mỗi từ mã Để thỏa mãn điều kiện là xungquanh mỗi cụm, phải có ít nhất một cụm được gắn nhãn khác nhau, chúng ta sử dụngphương pháp gắn nhãn được đề xuất trong tài liệu [10] như sau, có thể gắn nhãn các từ
mã trong quá trình tạo sổ mã:
Bước 1: Tạo bộ mã C0 với kích thước N/2 từ toàn bộ tập dữ liệu bằng cách sử
dụng thuật toán LBG thông thường
Bước 2: Phân chia toàn bộ tập dữ liệu thành N/2 cụm dựa trên điều kiện gần
nhất với bộ mã C0
Bước 3: Tạo 2 từ mã cho mỗi cụm, tức là phân chia mỗi cụm thành hai cụmcon, bằng cách sử dụng thuật toán LBG thông thường Một được gắn nhãn ‘0’
và khác được gắn nhãn ‘1’, bằng một cách ngẫu nhiên
Bước 4: Thu nhập tất cả các từ mã để tạo thành bộ mã cuối cùng được dán nhãn
C có kích thước N Ghi lại tất cả các nhãn từ mã để tạo thành khóa ghi nhãn
Keyi
Sau khi tạo bảng mã được gắn nhãn C cho robust thủy vân bền vững và bộ mã
CF cho thủy vẫn dễ vỡ, chúng ta có thể sử dụng chúng để thực hiện quá trình nhúng vàgiải nén thủy vân
Hình 2 1 Quy trình lượng tử hóa vectơ chỉ số bị ràng buộc
Trang 12CHƯƠNG 3 THUẬT TOÁN THỦY VÂN SỐ
3.1 Quy trình nhúng thủy vân bền vững
Bước 1: Thủy vân bền vững nhị phân WR đầu tiên được hoán vị bằng khóaKeyWR để tạo thành chuỗi thủy vân WPR được nhúng và WPR đại diện cho tất cảcác bit thủy vân trong WPR
Bước 2: Tín hiệu âm thanh gốc AO được phân đoạn thành các khung có độ dàigấp 4 lần kích thước từ mã được gắn nhãn và phép biến đổi DCT được thựchiện trên mỗi khung, sau đó các hệ số trung tần của mỗi khung được chọn đểtạo thành một vectơ Tất cả các vectơ tạo thành một tập vectơ VR
Bước 3: Với mỗi vectơ vi ∈VR , tìm từ mã gần nhất ci và so sánh nhãn tươngứng Li với bit wPR Nếu Li = wPR, thì từ mã được sử dụng để tái tạo lại Vi Ngượclại, Hãy chọn từ mã gần nhất cj trong số tất cả các từ mã có nhãn wPR để tái tạo
vi
Bước 4: Lặp lại Bước 3 cho đến khi tất cả các bit mờ được nhúng Để tăngcường độ mạnh mẽ của thuật toán mờ chúng ta liên tục nhúng thủy vân WPRvào tín hiệu âm thanh ban đầu cho thời gian T, trong đó
T=⎣ Chiều dài (Ao)/( Kích thước khung × Chiều dài (WPR))⎦
3.2 Quá trình nhúng thủy vân dễ vỡ
Bước 1: Thủy vân dễ vỡ nhị phân WF là lần đầu tiên chuyển đổi thành 1-Chiều
để tạo thành một chuỗi thủy vân WPF và nó được nhân rộng T lần theo độ dàicủa tín hiệu âm thanh gốc A0, trong đó T giống như đã đề cập ở trên
Bước 2: Tín hiệu âm thanh gốc A0 được phân đoạn thành các khung với độ dàigấp 4 lần kích thước từ mã được gắn nhãn và phép biến đổi DCT được thựchiện trên mỗi khung, sau đó các hệ số DCT tần số cao của mỗi khung đượcchọn để tạo thành một vectơ Kích thước của nó cũng giống như kích thước củacuốn sách mã được tạo trước để nhúng thủy vân dễ vỡ và hiệu quả của việc lựachọn kích thước đối với với chất lượng của tín hiệu thủy vân âm thanh cũng sẽđược thảo luận Tất cả các vectơ này tạo thành một tập vectơ VF