Đoạn tần nghe và nhận ra một tín hiệu âm thanh stereo khá nhỏ khoảng 1KHz đến 4KHz, do đó trong quá trình nén tín hiệu âm thanh stereo thì những tần số nằm ngoài khoảng trên không cần th
Trang 1VietNam National University – HoChiMinh City
HoChiMinh CiTy University of Technology
Post Graduate Training Office
Supervisor: Assoc Prof., Ph.D Thuong Le-Tien Trainee : B.Eng Trung-Dung Vo
HCMC, July 2004
Trang 2Lời Cảm Ơn
Tôi xin gửi lời cám ơn trân trọng đến PGS TS Lê Tiến Thường, người đã định hướng nghiên cứu, truyền đạt kiến thức và giúp đỡ tôi rất nhiều trong quá trình thực hiện đề tài khoa học này Thầy đã hình thành cho tôi một phong cách làm việc năng động, hiệu quả và luôn cầu tiến
Tôi xin chân thành cảm ơn các đồng nghiệp của tôi tại Bộ Môn Viễn Thông- Trường Đại Học Bách Khoa Thành Phố Hồ Chí Minh đã luôn hổ trợ và động viên tôi trong suốt quá trình làm việc
Cuối cùng tôi muốn gửi thành công này đến gia đình tôi Bố Mẹ không kỳ vọng mà luôn hy vọng về tôi
Tôi sẽ luôn trẻ và tôi đang trẻ,
Trang 3MỤC LỤC
Chương I : Giới Thiệu Vấn Đề 1
Chương II: Giới Thiệu Khái Quát Về Ââm Thanh Số 5
Chương III: Lý Thuyết Cơ Bản Về Watermarking 14
Chương IV: Các Vấn Đề Trong Quá Trình Thiết Kế, Ước Lượng Và Đánh Giá Watermarking 30
Chương V: Phương Pháp Watermarking Dùng Điều Chế Chỉ Số Lượng Tử 43
Chương VI: Phương Pháp Watermarking Dùng Kỹ Thuật Trải Phổ Đơn Giản 72
Chương VII: Phương Pháp Watermarking Dùng Kỹ Thuật Trải Phổ Cải Tiến 83
Chương VIII: Các Kết Quả Mô Phỏng Dùng Matlab 102
Chương IX: Nhận Xét Và Đánh Giá Kết Quả 158
Chương X: Hướng Phát Triển Đề Tài 165
Tài Liệu Tham Khảo 169
Danh sách các từ viết tắt và mục lục các bảng số liệu và hình vẽ 173
Trang 5CHƯƠNG I: GIỚI THIỆU VẤN ĐỀ NHD: PGS TS LÊ TIẾN THƯỜNG
Nguyên tắc Kerckhoffs:
“Khi đối thủ nhận biết phương pháp thực hiện mã hóa, thì tính bảo mật
thông tin chỉ có thể dựa vào việc lựa chọn khóa mật”
(Auguste Krckhoffs, “La Cryptographie Militaire”, Fuornal des Sciences Militaries, Jan 1883):
“Il faut qu’il n’exige pas le secret, et qu’il puisse sans inconvénient tomber entre les mains de l’ennemi”
Trang 6CHƯƠNG I: GIỚI THIỆU VẤN ĐỀ NHD: PGS TS LÊ TIẾN THƯỜNG
CHƯƠNG I
GIỚI THIỆU VẤN ĐỀ
Dữ liệu số có nhiều ưu điểm: cho phép lưu trữ trong thời gian dài và sao chép với số lần vô hạn định mà không bị suy giảm chất lượng, dễ dàng chia sẻ cho nhiều người sử dụng và phân phối qua mạng… Cuộc cách mạng số, cùng với sự phát triển của Internet, đã cho phép người sử dụng dễ dàng truy cập thông tin và làm tăng đáng kể số lượng tiêu thụ các sản phẩm số Tuy nhiên quá trình này không bảo vệ dữ liệu tránh bị sử dụng bất hợp pháp và xảy ra nhiều thiệt hại kinh tế cho các nhà sản xuất cũng như người nắm giữ bản quyền Khi việc phân phối dữ liệu nén (âm thanh, hình ảnh tĩnh và động…) càng trở nên thông dụng thì vấn đề bảo vệ bản quyền càng trở nên quan trọng và khó khăn hơn
Từ yêu cầu này đã xuất hiện một làn sóng mới nghiên cứu và nỗ lực phát triển trong lĩnh vực xây dựng các kỹ thuật và hệ thống bảo vệ thông tin, với đa dạng các ứng dụng từ đa truyền thông đến quân sự Nhiều kỹ thuật đã ra đời và phát triển mạnh mẽ với các mục đích khác nhau: mã hoá (cryptography), nguỵ trang (steganography) và nhúng thông tin (watermarking)
Đối với kỹ thuật mã hoá, tin tức được bảo vệ nhờ mã hoá, do vậy chỉ những người được cấp phép có quyền sử dụng các dữ liệu số này Nhưng một khi các dữ liệu này đã được giải mã thì vẫn không có cách nào ngăn cấm việc sao chép và phân phối bất hợp pháp
Với kỹ thuật ngụy trang, thông điệp cần truyền được ngụy trang trong một thông điệp khác, độc lập với thông điệp cần truyền Nguyên tắc bảo vệ được thực hiện nhờ che giấu sự tồn tại của thông điệp Nhưng khi kênh truyền ‘ẩn’ bị phát hiện thì thông điệp sẽ không còn tính bảo mật Các phương pháp ngụy trang cũng không bền vững khi dữ liệu bị thay đổi trong suốt quá trình truyền và lưu trữ: quá trình chuyển định dạng dữ liệu, nén, chuyển đỗi từ số sang tương tự và ngược lại
Quá trình nhúng thông tin giải quyết sự yếu kém của hai quá trình trên trong việc bảo vệ quyền trí tuệ về dữ liệu số Quá trình watermarking dấu thông tin bản quyền vào dữ liệu chủ mà vẫn không làm mất đi những đặc tính cơ bản của dữ liệu đối với người sử dụng Watermarking cho phép truy cập dữ liệu mà không cần phải giải mã Người sử dụng nhận biết được sự
Trang 7CHƯƠNG I: GIỚI THIỆU VẤN ĐỀ NHD: PGS TS LÊ TIẾN THƯỜNG
tồn tại của watermark nhưng không thể loại bỏ dữ liệu này bằng các tấn công vô ý hay cố ý
Dữ liệu thêm vào được gọi là watermarking số (chữ ký) và được dùng để mang bản quyền dữ liệu, điều khiển sao chép dữ liệu, hay các dữ liệu cá nhân về người bản quyền nhằm theo dõi các bản sao bị cấm
Kỹ thuật watermarking thực sự phát triển từ năm 1995 và nhận được sự quan tâm rất cao, cả trong lĩnh vực nghiên cứu cũng như lĩnh vực công nghiệp Những bài báo đầu tiên về watermark được thực hiện bởi Tanaka cùng các cộng sự vào năm 1990 và Tirkey vào năm 1993 Nhiều kỹ thuật watermark trên dữ liệu văn bản và ảnh đã chứng minh tính hiệu quả của quá trình watermark Trong những năm gần đây, sự phát triển nhanh chóng của việc phân phối và chia sẻ dữ liệu nén qua Internet đã kích thích mạnh mẽ quá trình nghiên cứu các giải thuật watermarking cho âm thanh và video
Đề tài tập trung nghiên cứu watermarking âm thanh từ yêu cầu thực tế và khả năng ứng dụng về bảo vệ bản quyền tác phẩm âm nhạc trong quá trình ghi âm, phân phối, đặc biệt là trao đổi trực tuyến và theo dõi các tác phẩm âm nhạc đã được đăng ký bản quyền
Hệ thống watermark âm thanh dựa trên tính không hoàn hảo của hệ thống tai nghe của người (HAS: human auditory system) Khai thác đặc tính những thay đổi nhỏ về biên độ sẽ không nhận biết bởi HAS Nhiều kỹ thuật watermark cả trong miền thời gian và tần số đã được thực hiện, các kỹ thuật này vẫn đảm bảo tính trong suốt và bền vững của dữ liệu được nhúng
Mục tiêu đề tài bao gồm:
Nghiên cứu lý thuyết quá trình watermarking đối với dữ liệu âm thanh số Phân tích các giải thuật watermarking về hiệu quả, khả năng ứng dụng cuả chúng
Thực hiện mô phỏng các giai đoạn nhúng và phát hiện watermarking đối vơí các file âm thanh số Việc mô phỏng được thực hiện với các giải thuật khác nhau nhằm đánh giá ưu, khuyết điểm cuả từng loại: watemarking ứng dụng kỹ thuật QIM, watemarking ứng dụng kỹ thuật trải phổ và watemarking ứng dụng kỹ thuật trải phổ cải tiến Xác định khả năng chống xâm nhập và gỡ bỏ dữ liệu bản quyền đã được nhúng bởi các công cụ hiện nay: nén, lọc, tái lấy mẫu…
Trang 8CHƯƠNG I: GIỚI THIỆU VẤN ĐỀ NHD: PGS TS LÊ TIẾN THƯỜNG
Thực hiện chương trình chạy thời gian thực Kiểm chứng lại khả năng chống xâm nhập cuả giải thuật được chọn và chất lượng file âm thanh sau khi watermarking
Chương II sẽ giới thiệu khái quát về âm thanh số Chương III tập trung nghiên cứu lý thuyết cơ bản về watermarking, đặc biệt là watermarking âm thanh số Các vấn đề ước lượng và đánh giá tính hiệu qủa của giải thuật khi ứng dụng cũng được đề cập trong chương này Các vấn đề trong quá trình thiết kế, ước lượng và đánh giá watermarking sẽ được trình bày và phân tích ở chương IV Chương V tập trung trình bày lý thuyết watermarking dùng kỹ thuật điều chế chỉ số lượng tử Phương pháp watermarking sử dụng kỹ thuật trải phổ đơn giản được xem xét ở chương
VI Chương VII trình bày sơ lược kỹ thuật watermarking ứng dụng kỹ thuật trải phổ và đi sâu phân tích watermarking ứng dụng kỹ thuật trải phổ cải tiến Các kết quả mô phỏng sẽ được trình bày ở chương VIII, bao gồm kết quả phương pháp LBM, trải phổ đơn giản, trải phổ và trải phổ cải tiến Các nhận xét và đánh giá chi tiết sẽ được xét ở Chương IX Chương X cũng đề cập các xu hướng phát triển và vấn đề hiện tại của phương pháp watermarking
Trang 9CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
CHƯƠNG II
KHÁI QUÁT VỀ TÍN HIỆU ÂM THANH SỐ
II.1 SƠ LƯỢC ÂM THANH
Âm thanh là những dao động cơ học lan truyền trong không khí hay trong các môi trường khác như nước, gỗ, cao su… Khi đến tai người, những dao động này làm cho màng nhĩ rung động, sau đó được phản ánh lên não qua các sợi dây thần kinh và cuối cùng âm thanh được não cảm nhận Aâm thanh đóng một vai trò quan trọng trong đời sống con người với vai trò là công cụ liên lạc, giao tiếp cũng như cảm nhận thiết yếu nhất
Âm học là ngành chuyên nghiên cứu về âm thanh Ââm học khảo sát thuộc tính của âm thanh và nhất là những hiểu biết sâu sắc sinh lý tai nghe người Điều này rất có ích trong việc tìm kiếm và thực hiện các phép xử lý tín hiệu âm thanh số
Do vận tốc giới hạn (khoảng 300 m/s trong môi trường không khí) nên âm thanh từ một nguồn sẽ được hai tai ghi nhận khác nhau và cho phép phân biệt được vị trí của nguồn Sự khác biệt này làm tai người nghe được âm thanh nổi Độ lan truyền xa cũng không đồng đều theo tần số: âm thanh tần số cao truyền không xa bằng âm thanh tần số thấp Vì vậy tiếng sét ở gần cho nhiều âm sắc, còn tiếng sét ở xa cho nhiều tiếng trầm
Một số yếu tố đặc trưng của âm thanh
Cường độ âm thanh: là đại lượng phản ánh biên độ dao động của âm
thanh Trong thực tế, để so sánh cường độ hai âm thanh, người ta dùng đơn vị decibel (dB)
P1 : cường độ âm thanh thứ nhất
P2 : cường độ âm thanh thứ hai
Trang 10CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
Cao độ: Nếu tín hiệu âm thanh tuần hoàn, thì số lần lặp lại lớn nhất
trong một giây là số đo tần số của âm thanh đó Và chu kỳ là khoảng thời gian kéo dài một lần lặp
Âm sắc: Hai âm thanh có cùng biên độ, cùng tần số nhưng vẫn
thường là khác nhau Đó là do mỗi âm thanh còn có những thành phần dao động khác gọi là hài và độ lớn các hài là khác nhau
II.2 SINH LÝ TAI NGHE NGƯỜI
Tai người là bộ phận thính giác dùng để đón nhận những dao động của âm thanh trong không khí và phản ánh các dao động đó lên não Do cấu tạo hình học của tai và hoạt động của hệ thần kinh mà qua nghiêm cứu, các nhà khoa học đã khám phá nhiều đặc tính trong quá trình của tai Một số đặc tính cơ bản bao gồm:
Đoạn tần số mà tai người nghe được nằm trong khoảng từ 20Hz – 20KHz Đây là trường hợp lý tưởng và chỉ ở những người có thính giác nhạy bén Còn người bình thường thì chỉ nghe được khoảng 15KHz, thậm chí chỉ đến 10KHz Phạm vi tiếng nói càng nhỏ hơn, nhất là trong lãnh vực thoại: chỉ khoảng 300Hz –3400Hz
Mức độ nghe của tai theo tần số không bằng phẳng Tai ta nghe nhạy nhất ở những đoạn tần số từ 2–4 KHz và kém về hai bên
Tai người không cảm nhận được
những âm thanh quá nhỏ và chỉ
nhận được âm thanh có biên độ
lớn hơn một mức nào đó Mức này
gọi là ngưỡng nghe của người Lợi
dụng đặc điểm này mà người ta sử
dụng kỹ thuật lặng hóa để mã hoá
và nén âm thanh
Độ phân biệt của tai người cũng
thay đổi theo biên độ dao động
của âm thanh: ở khu vực âm
thanh lớn thì tai người phân biệt
mức biên độ kém hơn Chuyển đổi luật μ áp dụng đặc điểm này để giảm số mức lượng tử ở vùng biên độ lớn nhờ đó giảm được số bit
0 2 4 6 8 10 12 14 16
Hình II.1 : Mức lặng tín hiệu âm thanh
Trang 11CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
Hiệu ứng che lấp (masking) (còn gọi là hiệu ứng mặt nạ): khi tai người phải nghe một tín hiệu âm thanh biên độ A, tần số f thì sẽ không nghe được những âm thanh có tần số gần đó và biên độ thấp hơn MPEG đã tận dụng đặc tính này để nâng cao hiệu quả nén
Sự kéo dài hiệu ứng che lấp: hiệu ứng mặt nạ không chỉ xảy ra khi âm thanh lớn tồn tại mà còn tiếp tục kéo dài một thời gian ngắn sau khi âm thanh lớn đã mất
Đoạn tần nghe và nhận ra một tín hiệu âm thanh stereo khá nhỏ (khoảng 1KHz đến 4KHz), do đó trong quá trình nén tín hiệu âm thanh stereo thì những tần số nằm ngoài khoảng trên không cần thiết phải giữ lại và có thể dùng một tín hiệu chung cho cả hai kênh để giảm số lượng dữ liệu Đây là trường hợp tổng của tín hiệu hai kênh trái và phải
II.3 XỬ LÝ TÍN HIỆU ÂM THANH SỐ
II.3.1 TÍN HIỆU ÂM THANH SỐ
Ở dạng gốc, tín hiệu âm thanh (tín hiệu âm tần) là tín hiệu tương tự có đường biểu diễn tần số và biên độ liên tục Nói cách khác tín hiệu tương tự có thể được xác định tại một thời điểm bất kỳ và có vô số các giá trị tức thời khác nhau
Tín hiệu âm thanh số là tín hiệu gồm những mẫu được lấy ra từ tín hiệu gốc tương tự và được số hoá theo mã qui định Đây là những tín hiệu rời rạc, cả về mặt thời
gian lẫn giá trị Mỗi
mẫu rời rạc được biễu
diễn bằng một mã nhị
phân
Việc xử lý các mẫu nhị
phân rời rạc theo qui
luật của kỹû thuật số
gọi là phương pháp xử
lý tín hiệu âm thanh
số
Tín hiệu âm thanh
Hình II.2: Các dạng biểu diễn tín hiệu âm thanh
Biểu diễn dạng tương tự
011011001101 Biểu diễn dạng số
Trang 12CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
ƯU VÀ NHƯỢC ĐIỂM CỦA CÔNG NGHỆ XỬ LÝ TÍN HIỆU ÂM THANH SỐ
Ưu điểm
Cải thiện tỷ số tín hiệu/tạp âm (S/N)
Mở rộng dãi tần
Có khả năng sao chép thông tin với số lần vô hạn định mà không giảm chất lượng
Không bị ảnh hưởng bởi sự dao động nhiệt độ và điện áp làm việc
Không bị méo tín hiệu
Không bị méo do dao động tốc độ
Có khả năng tái lập thành phần điện áp một chiều của tín hiệu
Đặc tuyến tần số bằng phẳng
Nhược điểm
Tín hiệu ở dạng dữ liệu số thường dễ bị tổn thất Chỉ mất một vài bit dữ liệu cũng dẫn đến lỗi trong tín hiệu âm thanh sữa các lỗi dữ liệu rất tốn kém về phần mềm cũng như phần cứng
Hệ thống thiết bị xử lý tín hiệu âm thanh số phức tạp và tốn kém hơn so với tín hiệu analog
Bảo hoà tín hiệu sẽ dẫn tới phá huỷ hoàn toàn tín hiệu âm thanh Không thể cắt nối băng ghi âm số như băng ghi âm tương tự, ở đây phải sử dụng phương pháp cắt nối điện tử
II.3.2 CHUYỄN ĐỔI TÌN HIỆU TƯƠNG TỰ SANG TÍN HIỆU ĐIỀU CHẾ XUNG MÃ (PCM: PULSE CODE MODULATION)
Điều chế xung mã PCM là phương thức thường được sử dụng nhất trong kỹ thuật số hoá tín hiệu tương tự nói chung và số hoá tín hiệu âm thanh nói riêng Trong kỹ thuật PCM, tín hiệu tương tự được chuyển thành dãy xung với giá trị biên độ của các xung riêng lẻ được biểu diễn ở dạng mã nhị phân
PCM được đặc trưng bởi ba quá trình, bao gồm lấy mẫu, lượng tử và mã hoá
Trang 13CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
II.3.2.1 BỘ LỌC THÔNG THẤP ĐẦU VÀO
Luật lấy mẫu Nyquist qui định thành phần tần số cao nhất trong tín hiệu được lấy mẫu không vượt quá 0,5*fs, vì vậy phải giới hạn dãi thông của tín hiệu âm tần trước khi lấy mẫu nhằm tránh hiện tượng chồng băng làm sai lệch các thông tin gốc Để thực hiện việc này cần sử dụng một bộ lọc thông thấp gọi là bộ lọc chống chồng băng
Ví dụ: với tần số lấy mẫu là 44,1KHz và tần số giới hạn của tín hiệu âm tần đến 20KHz thì dãi tần gốc chỉ còn cách phổ nhiễu có 4,1KHz
Để đảm bảo độ phân cách giữa hai dãi tần đủ lớn thường phải sử dụng bộ lọc thông thấp có sườn với độ dốc thật cao Bộ lọc chống chồng băng này cần có các yêu cầu kỹ thuật sau:
Đặc tuyến tần số bằng phẳng đến tận tần số giới hạn cao
Sườn bộ lọc phải thật lớn
Độ suy giảm ở ngoài tần số cực đại phải lớn hơn 80dB
Độ méo nhỏ
Trạng thái dao động quá độ phải rất nhỏ
Méo pha ít
Tạp âm nhỏ hơn tạp âm của toàn hệ thống số
Tương tự
Tín hiệuPCMHình II.3 Sơ đồ khối của một hệ thống PCM
Tín hiệu Lọc thông
Lượng tử hoá Mã hoá
Băng tần gốc
Hình II.4 : Phổ tín hiệu âm tần
Trang 14CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
II.3.2.1 LẤY MẪU TÍN HIỆU
Lấy mẫu là ghi nhận tức thời của tín hiệu để được chuỗi xung có giá trị biến thiên theo tín hiệu tương tự đó Lấy mẫu có thể được xem là quá trình rời rạc tín hiệu trên miền thời gian
Tại những thời điểm liên tiếp hay thực tế là cách đều nhau, giá trị tức thời của tín hiệu tương tự được xác định và ghi nhận (lấy mẫu) mà bỏ qua giá trị xuất hiện trong khoảng thời gian giữa hai lần lấy mẫu Khoảng thời gian giữa hai lần lấy mẫu gọi là chu kỳ lấy mẫu T và số lần lấy mẫu trong một giây xác định tần số lấy mẫu fs
Hình vẽ bên minh họa quá trình
lấy mẫu liên tục một tín hiệu
tương tự Trong trường hợp lý
tưởng, độ rộng của xung lấy mẫu τ
có thể vô cùng bé, nhưng trong
thực tế độ rộng xung có giới hạn
và thường nhỏ hơn nhiều so với
chu kỳ của tín hiệu được lấy mẫu
Do đó muốn khôi phục lại tín hiệu
ban đầu thì các xung lấy mẫu phải
đứng sát nhau
Một điều quan trọng cần lưu ý là
tần số lấy mẫu phải tuân theo
định lý lấy mẫu Nyquist Giá trị lấy mẫu tần số fs tối thiểu bằng hai lần giá trị của tần số cao nhất fmax của tín hiệu tương tự được lấy mẫu Để tín hiệu có thể tái tạo chính xác ở phần giải mã thì mỗi chu kỳ của tín hiệu tương tự đầu vào phải được lấy mẫu ít nhất hai lần
Ví dụ: đối với âm thanh có phổ tần lên đến 20 KHz, để có thể khôi phục trung thực tín hiệu thì tần số lấy mẫu tối thiểu phải bằng 40 KHz Tần số lấy mẫu trong công nghệ xử lý âm thanh số được qui định như sau:
¾ 44,1 KHz dùng cho hệ thống đĩa CD
¾ 48 KHz dùng cho hệ băng R-Dat và lĩnh vực âm thanh chuyên dụng
¾ 32 KHz dùng cho lĩnh vực phát thanh số qua vệ tinh
¾ 44,1 KHz (PAL) hoặc 44,056 KHz (NTSC) dùng cho ghi âm PCM trên các thiết bị ghi đĩa hình thông dụng
x(t) Biên độ
Hình II.5: Quá trình lấy mẫu tín hiệu
0 t 2t 4t 6t 8t 11t
t
Trang 15CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
Quá trình lấy mẫu chính là quá trình điều biên xung (PAM: Pulse Amplitude Modulation) và có thể đặc trưng bằng tích của tín hiệu x(t) và hàm xung lấy mẫu δ (t-nT) Tín hiệu đầu ra của bộ lấy mẫu được biểu diễn bằng biểu thức:
x t
Giả thiết rằng tín hiệu ban đầu có phổ ứng với băng thông X(f), có thành phần tần số cao nhất là fmax.Phổ của tín hiệu lấy mẫu được tính theo công thức :
n
e nT x dt
e nT t nT x f
Thay thế chuỗi Fourier của đáp ứng xung:
dt e
T nT
t
m
t mf j n
e t x T t
Phổ của tín hiệu sau khi lấy mẫu gồm có phổ X(f) được lặp lại ở các bội số nguyên lần của tần số lấy mẫu Nếu tần số lấy mẫu không thoả định lý Nyquist thì phổ tín hiệu sau khi lấy mẫu có hiện tượng chồng chập phổ giữa tín hiệu băng cơ sở và thành phần lập lại
II.3.2.2 LƯỢNG TỬ HOÁ
Lượng tử hoá là thay thế một tín hiệu tương tự đã lấy mẫu bằng tập hợp hữu hạn các mức biên độ, tức là rời rạc hoá biên độ tín hiệu Tập hợp hữu hạn các giá trị rời rạc này phụ thuộc vào số bit nhị phân dùng để biểu thị giá trị của một mẫu Số mức lượng tử càng nhiều thì sự phản ánh tín hiệu càng cao và tín hiệu khôi phục càng chính xác, nhưng đòi hỏi số lượng bits sử dụng càng nhiều
Trang 16CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
Ưu điểm của lượng tử hoá là giảm được tạp âm trong hệ thống Lượng tử hoá hạn chế các mức cho phép của các tín hiệu đã lấy mẫu và chuẩn bị để chuyển tín hiệu gốc từ dạng tương tự thành số Nếu sự phân biệt giữa các mức lượng tử lớn hơn mức tạp âm thì máy thu dễ dàng phát hiện được các mức riêng biệt đã phát Không thể tăng độ phân biệt quá mức nếu muốn nhận được đáp ứng hợp lý của tín hiệu Có 3 phương pháp lượng tử: lượng tử nhị phân bình thường, lượng tử nhị phân dịch và lượng tử nhị phân bù
2
Đặc điểm thính giác của tai người là độ nhạy sự thay đổi biên độ ở mức biên độ lớn sẽ kém hơn ở mức biên độ nhỏ Do vậy có thể lượng tử khu vực biên độ lớn bằng ít mức lượng tử hơn khu vực biên độ nhỏ bằng cách phi tuyến hoá các mức lượng tử Điều này giúp giảm được số bit và kích thước khối dữ liệu, cho phép nâng cao chất lượng âm thanh qua việc gia tăng số mức lượng tử ở vùng khu vực có biên độ nhỏ
II.3.2.3 MÃ HOÁ
Mã hoá là thay thế mỗi mức lượng tử cố định bằng một dãy nhị phân gọi là từ mã, tất cả các từ mã điều chứa một số xung nhị phân nhất định và được truyền trong khoảng thời gian giữa hai thời điểm lấy mẫu cạnh nhau Mã hoá là xác định một số nhị phân có chiều dài thích hợp cho mỗi mức lượng tử sao cho không có sự trùng lặp một số cho hai mức lượng tử Trong hệ thống PCM, thực tế thì bộ lượng tử hoá và mã hoá phối hợp một cách có hiệu quả trong bộ biến đổi A/D Nếu không dựa vào xác suất xuất hiện để tối ưu hoá, số mức lượng tử Q thông thường bằng 2N, trong đó N là số bit dùng biểu diễn mỗi mẫu
Các từ mã xuất hiện trong quá trình mã hoá đơn giản được dùng để thay thế cho tín hiệu tương tự Tín hiệu số này có thể truyền trực tiếp trên khoảng cách ngắn hoặc xử lý trước khi truyền trên khoảng cách xa dùng điều chế băng gốc hay băng cao dùng sóng mang Ngoài ra các dữ liệu số này có thể được tổ chức lại và ghi thành tập tin lưu trữ hay truyền đi theo phương thức song song hay nối tiếp
Hiện nay việc lưu trữ các tập tin âm thanh phổ biến nhất là các tập tin âm thanh có phần mở rộng wav, ngoài ra còn các định dạng phổ biến khác như: asf, wma, wmv, mp3, midi, aiff, au, rm
Trang 17CHƯƠNG II: KHÁI QUÁT TÍN HIỆU ÂM THANH SỐ NHD: PGS TS LÊ TIẾN THƯỜNG
II.3.3 CHUYỂN ĐỔI TÍN HIỆU ĐIỀU CHẾ XUNG MÃ PCM SANG
TÍN HIỆU TƯƠNG TỰ
Muốn nghe một tín hiệu âm thanh đã số hoá, tín hiệu PCM phải được chuyển đổi về dạng tín hiệu liên tục về biên độ và thời gian Toàn bộ quá trình chuyển đổi về thành dạng tương tự của tín hiệu PCM có thể chia thành các giai đoạn như sau :
II.3.3.1 BỘ CHUYỂN ĐỔI D/A
Bộ D/A chuyển dãy số nhị phân của tín hiệu PCM thành một xung điện áp, biên độ của xung điện áp tỷ lệ với giá trị của tín hiệu PCM đặt ở cửa vào Với giá trị nhỏ nhất của tín hiệu PCM, bộ chuyển đổi D/A sẽ cho điện áp thấp nhất Về cơ bản, quá trình chuyển đổi này là một sự đảo ngược của quá trình chuyển đổi A/D, tín hiệu PCM được chuyển thành dạng tín hiệu điều chế biên xung PAM qua bôï chuyển đổi D/A
II.3.3.2 MẠCH GIỮ MẪU
Mạch lấy và giữ mẫu khuyết đại độ rộng của các xung PAM và lọc các nhiễu do bộ chuyển đổi D/A gây ra
II.3.3.3 BỘ LỌC THÔNG THẤP ĐẦU RA
Bộ lọc thông thấp tiếp theo sẽ tích phân các xung PAM và tạo thành tín hiệu analog Bên cạnh các chức năng tích phân các xung PAM, bộ lọc thông thấp đầu ra còn có nhiệm vụ loại bỏ phổ nhiễu bao gồm dãi biên xung quanh tần số lấy mẫu và các hài của chúng xuất hiện trong quá trình chuyễn các xung PCM thành xung PAM ở bộ D/A Nếu phổ nhiễu xâm nhập tới các tầng tín hiệu tương tự sẽ tạo ra hỗn hợp tần số mà phần năng lượng chính có thể nằm trong băng tần gốc Trong mọi trường hợp phải đảm bảo tín hiệu tương tự do một hệ âm thanh số cung cấp phải được tách
ra khỏi phổ tần nhiễu Do vậy bộ lọc thông thấp đầu ra phải có dãi tần đúng bằng băng tần gốc và phải đáp ứng đúng những yêu cầu như bộ lọc thông thấp chống chồng băng đứng trước bộ chuyển đổi D/A Thông thường nhiều bộ lọc nối với nhau thành tầng để bù trừ méo pha
Hình 2.6 : Quá trình chuyển đổi số sang tương tự
Số
Tương tự
Giữ mẫu
Bộ chuyển Đổi D/A
Bộ lọc thông thấp
Trang 18CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
CHƯƠNG III
LÝ THUYẾT CƠ BẢN VỀ WATERMARKING
Watermarking có thể xem là lời giải cuả bài toán bản quyền trong truyền thông, trong đó các phương tiện truyền thông tạo thành kênh truyền để tải các dữ liệu đã được watermarking Watermarking khai thác khả năng kênh truyền do sự giới hạn khả năng nghe nhìn của con người Các thuật toán watermarking vì thế có thể so sánh với các thuật toán mã hoá có suy hao như MPEG1
III.1 HỆ THỐNG WATERMARKING
Hệ thống watermarking bao gồm hai giai đoạn: giai đoạn nhúng thực hiện chèn thông tin watermark vào tín hiệu gốc và giai đoạn khôi phục nhằm phát hiện sự có mặt và nội dung cuả watermark Hình vẽ sau mô tả một hệ thống watermarking số tổng quát:
Phần lớn các phương pháp watermarking ứng dụng cho tín hiệu âm thanh số khai thác hiện tượng che thính giác của tai người Hiện tượng này xảy ra
ở cả miền thời gian và tần số Che miền thời gian khi các tín hiệu mức thấp xảy ra trước hay sau các tín hiệu mức cao Che miền tần số tương tự xảy ra khi các thành phần phổ yếu bị che bởi các thành phần phổ mạnh hơn
Dạng watermark sơ khai là watermark tường minh, trường hợp này tín hiệu gốc được người chủ quyền giữ lại đề phòng xảy ra tranh chấp bản quyền Quá trình nhúng và khôi phục watermark không cần sử dụng khóa mật Tính bền vững của hệ thống phụ thuộc hoàn toàn vào phương pháp nhúng
Dữ liệu
âm thanh
Nhiễu Khóa mật
watermark
Tấn công
watermark Khôi phục
watermark
Nhúng watermark
Khóa mật
Hình III.1 Hệ thống watermarking số
Kênh truyền
Trang 19CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
Tuy nhiên khi phương pháp bị phát hiện thì dữ liệu watermark dễ dàng bị gỡ khỏi dữ liệu nhúng Do vậy có thể xem đây là một dạng biến thể của phương pháp ngụy trang (steganography)
Phương pháp watermarking mù thỏa mãn nguyên tắc Kerckhoffs:“Khi đối thủ nhận biết phương pháp thực hiện mã hóa, thì tính bảo mật của thông tin chỉ có thể nằm trong việc lựa chọn khóa mật” Cả 2 quá trình nhúng và khôi phục đều sử dụng khoá nhằm bảo mật dữ liệu watermark được nhúng Tồn tại 2 dạng khóa: khóa riêng và khóa công Khóa riêng cho phép tách watermark ra khỏi dữ liệu gốc nhưng khóa công chỉ cho phép người sử dụng xác định sự tồn tại của watermark
Kênh truyền có thể chịu tác động của nhiễu và các tấn công vô ý hay cố ý nhằm loại bỏ watermark Do vậy, khi thiết kế hệ thống watermark cần xét đến tính bền vững của watermark trước hai loại tác động này Việc tách watermark thực hiện dựa vào tín hiệu nhúng và khoá riêng, do vậy chỉ có người chủ quyền là có thể tạo lại tín hiệu gốc và watermark tồn tại trong tín hiệu đã được nhúng watermark
Nếu muốn đánh cắp bản quyền, thì vấn đề là phải tìm khoá riêng mà không có tín hiệu gốc, nhằm loại bỏ watermark đã được nhúng vào Trường hợp người tranh chấp muốn phá hoại watermark sẽ đồng thời phá hoại dữ liệu âm thanh Trường hợp khác là người tranh chấp chèn thêm watermark mang chủ quyền của họ vào dữ liệu đã được nhúng watermark và sử dụng dữ liệu này làm dữ liệu gốc Khi đó việc kiểm tra watermark của người tranh chấp là thành công nhưng người bản quyền cũng sẽ chứng minh là trong dữ liệu gốc của người tranh chấp cũng chứa watermark của mình Ngược lại người tranh chấp trong trường hợp này không thể chứng minh sự tồn tại của bất kỳ watermark nào nằm trong dữ liệu gốc của người bản quyền
III.2 LỊCH SỬ WATERMARKING
Quá trình nhúng thông tin đã xuất hiện từ xa xưa Trong cuốn Histories, Herodotus ( 486-425 trước công nguyên) kể vào khoảng năm 440 trước công nguyên, Histiỉus đã cạo trọc một nô lệ thân cận và xăm lên đó thông điệp cần truyền Thông điệp này sẽ biến mất khi tóc mọc trở lại Mục đích là xúi giục nổi loạn chống lại người Ba tư Đáng ngạc nhiên là phương pháp này vẫn được một số gián điệp Đức sử dụng đầu thế kỷ 20 Herodotus cũng đề cập đến Demeratus, một người Hi Lạp trong triều đình Ba Tư, cảnh báo
Trang 20CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
cho người Sparta về một cuộc xâm lược sắp xảy ra bởi Xerxes, vua của Ba Tư: ông ta gỡ ỏ sáp khỏi bảng viết, khắc thông điệp rồi phủ sáp che Bảng viết sẽ trông hoàn toàn như bảng để trống và đánh lừa người nhận lẫn người mua
Rất nhiều kỹ thuật được phát minh và thuật loại bởi nhà chiến thuật
Ỉneas, bao gồm kỹ thuật giấu thư dưới đế giày và bông tai, các van bản
khắc trên gỗ sau đó được quét vôi, và các ký hiệu bằng chim bồ câu
Ỉneas cũng đề cập đến kỹ thuật giấu văn bản bằng cách thay đổi chiều cao
nét chữ hoặc tạo các lỗ nhỏ bên trên hay dưới ký tự trong văn bản gốc Kỹ thuật này vẫn được sử dụng đến thế kỷ 17 và sau đó được cải tiến bởi Wilkins (1614–1672): dùng mực vô hình in các chấm nhỏ thay vì tạo các lỗ, kỹ thuật này sau đó được dùng lại bởi các điệp viên Đức suốt hai Thế Chiến Một biến thể của kỹ thuật này vẫn được dùng để bảo mật văn bản và in các khối thành phần ảnh nhỏ nhằm mã hoá dữ liệu như ngày tháng, nhận dạng máy in, nhận dạng người sử dụng
Thuật ngữ watermark bắt nguồn từ kỹ thuật in các ảnh mờ trên giấy giúp xác định nhà sản xuất Khuôn giấy được watermark cổ nhất tìm thấy ra đời năm 1292 và có nguồn gốc ở làng Fabriano, Italia Kỹ thuật này giữ một vai trò quan trọng trong sự phát triển của nền công nghiệp sản xuất giấy Sau khi được khám phá, kỹ thuật này nhanh chóng phổ biến ra toàn Châu Aâu Mặc dù ban đầu được dùng để xác định đại lý hay nhà sản xuất giấy, nhưng sau đó dữ liệu watermark được dùng để nhận dạng kích thước, chất lượng, độ cứng cũng như ngày tháng và nguồn gốc của giấy
Nhiều phương pháp watermarking khác nhau đã được đề nghị trong những năm vừa qua, phần lớn được xem là hệ thống thay thế Những hệ thống này thay thế phần dư thừa của tín hiệu bằng các thông điệp cần nhúng; nhươc điểm chính của chúng là không bền vững khi dữ liệu bị thay đổi Hiện tại, nhiều kỹ thuật watermarking bền vững mới phát triển vượt trội trong việc xây dựng các hệ thống watermarking bảo mật và an toàn
Cho đến hiện nay, mặc dù tồn tại lý thuyết đề cập đến dữ liệu âm thanh và ảnh động, nhưng phần lớn các xuất bản trong lĩnh vực watermarking đều tập trung vào nghiên cứu bản quyền ảnh tĩnh Trong những năm gần đây, sự phát triển nhanh chóng trong việc chia sẻ và phân phối dữ liệu nén qua mạng Internet đã kích thích mạnh mẽ quá trình nghiên cứu các giải thuật cho dữ liệu âm thanh và ảnh động
Trang 21CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
Xuất bản đầu tiên về watermarking do Tanaka và các cộng sự ra đời vào năm 1990, sau đó đến Tirkey và các cộng sự năm 1993 Năm 1995 là thời
điểm bước ngoặt của hướng nghiên cứu này, đánh giấu bằng số lượng xuất
bản cũng như các hoạt động nghiên cứu về watermarking
Số bài báo khoa
Bảng III.1: Số bài báo khao học xuất bản về watermarking số trong những
năm vừa qua (theo INSPEC, tháng 1 năm 1999)
III.3 PHÂN LOẠI WATERMARKING
III.3.1 PHÂN LOẠI DỰA THEO PHƯƠNG PHÁP NHÚNG WATERMARKING
Watermarking âm thanh có thể được phân chia thành watermarking miền
thời gian và watermarking miền tần số, dựa theo miền thực hiện nhúng watermark
Phương pháp watermarking thời gian giấu watermark trực tiếp vào tín hiệu âm thanh số ở miền thời gian
Phương pháp watermarking miền tần số trước tiên chuyển tín hiệu âm thanh sang miền tần số, dùng các phép biến đổi cơ bản: biến đổi Fourier nhanh (FFT: Fast Fourier Transform), biến đổi cosin rời rạc (DCT: Discrete Cosine Transform) hay biến đổi Wavelet rời rạc (DWT: Discrete Wavelet Transform), MCLT (Modulated Complex Lapped Transform) và thực hiện nhúng ở miền tần số, sau đó biến
đổi ngược sang miền thới gian tín hiệu nhúng
Watermarking miền thời gian dễ thực hiện và số lượng phép tính ít hơn so
với watermarking miền tần số Tuy nhiên watermarking miền thời gian sẽ
chống trả yếu hơn khi gặp phải các cuộc công kích bằng các phép xử lý thông thường: nén, lọc, dịch mẫu, thay đổi tỷ lệ thời gian Các tấn công ở
miền tần số sẽ tác dụng đều trên cả khoảng tần số nên tấn công phải mạnh hơn nhiều mới đủ phá huỷ dữ liệu watermark
Trang 22CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
III.3.2 PHÂN LOẠI DỰA THEO CÁCH PHÁT HIỆN WATERMARKING
Dựa theo cách phân loại này có thể chia thành 3 phương pháp: watermarking tường minh, watermarking mù đối xứng và watermarking mù bất đối xứng
đầu tiên Quá trình khôi phục watermark đòi hỏi sự có mặt của dữ liệu gốc, do đó tính bảo mật không cao Hơn nữa hệ thồng sẽ không
an toàn khi giải thuật nhúng bị tiết lộ
Watermarking mù đối xứng: đối với watermarking mù, việc phát hiện được thực hiện mà không cần tín hiệu gốc và quá trình nhúng dữ liệu phụ thuộc vào khoá riêng Watermarking mù đối xứng yêu cầu chìa khoá này phải có mặt ở bộ phát hiện Watermarking trải phổ là một dạng thông dụng của nhất của watermarking mù đối xứng: tín hiệu giả ngẫu nhiên u được dùng để điều chế dữ liệu watermark vào dữ liệu gốc và việc phát hiện dựa vào phép tính tương quan tín hiệu thu với tín hiệu u Vì thế mà khoá riêng u phải đối xứng có mặt ở cả bộ nhúng và bộ phát hiện Điều này làm giảm tính an toàn của quá trình watermarking Trong thực tế, việc sử dụng watermarking đối xứng đòi hỏi bộ phát hiện phải có khả năng phát hiện watermark cho nhiều dữ liệu khác nhau Do vậy có thể xảy ra trường hợp người ăn cắp có thể lấy được khoá riêng của tập các dữ liệu dùng cùng khoá riêng bằng cách tấn công trung bình
Watermarking mù bất đối xứng: là thế hệ watermarking thứ hai, ra đời nhằm cải thiện tính bảo mật của watermark Trong trường hợp watermarking không đối xứng, chữ ký dùng phát hiện sẽ khác với chữ ký nhúng Do đó nhận biết chữ ký phát hiện chưa đủ để biết chữ ký nhúng
Hầu hết các phương pháp watermarking không đối xứng hiện nay là dạng bậc hai, trong đó bộ phát hiện xác định là có watermarking bằng cách tính dạng bình phương của tín hiệu thu Furon đã chứng minh rằng nếu trong watermarking đối xứng, cần O(N) lần tấn công để ước lượng chìa khoá thì trong watermarking bất đối xứng, cần đến O(N2) lần tấn công để ước lượng dạng bình phương, với N là
Trang 23CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
khoảng trải phổ Vì vậy watermarking bất đối xứng có tính an toàn cao hơn
III.4 CÁC ỨNG DỤNG CỦA WATERMARKING
Kỹ thuật watermarking được ứng dụng rộng rãi trong thực tế và chứng tỏ được tính hiệu quả trong nhiều lĩnh vực:
• Bảo vệ bản quyền (Copyright Protection): thông tin về bản quyền sẽ được nhúng trực tiếp vào thông tin cần bảo vệ Trường hợp này đòi hỏi watermark phải nền vững trước các dạng tấn công
• Ngăn chặn sao chép (Copy Protection): thông tin gốc được nhúng watermark để đảm bảo nội dung không bị sao chép bất hợp pháp Các thiết bị sao chép xác định trạng thái của dữ liệu và không cho phép sao chép các dữ liệu đã được watermark
• Giám sát (Tracking): mỗi bản sao chép được nhúng duy nhất với dữ liệu xác định người sử dụng hợp pháp Các watermark này được dùng để phát hiện các bản sao chép trái phép bằng cách nhận dạng người sao chép bất hợp pháp có tên bản quyền được nhúng, kỹû thuật giám sát này gọi là điểm chỉ (Fingerprinting)
watermarking có thể được ứng dụng để giám sát và chứng thực nội dung quãng bá như truyền hình, tín hiệu phát thanh Các watermark trong các tin quảng cáo được dùng để xác định số lần được quảng cáo theo thoả thuận giữa công ty và nhà quảng cáo
• Giấu thông tin (Concealed Communication): ở ứng dụng này, chũ ký sẽ không là thông tin bản quyền mà là thông tin cần giấu
III.5 CÁC YÊU CẦU KHI THỰC HIỆN WATERMARKING SỐ
Quá trình thực hiện watermarking âm thanh số cần thoả mãn các yêu cầu sau:
Chữ ký watermark thêm vào dữ liệu âm thanh gốc phải nằm trong dữ liệu âm thanh, nghĩa là chữ ký không được đặt thành phần mở đầu của dữ liệu, không là một luồng bit riêng hay nằm ở một tập tin riêng biệt khác
Trang 24CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
Nếu biết được thuật toán thì vẫn không thể gỡ bỏ chữ ký ra khỏi dữ liệu âm thanh đã được watermarking
Chữ ký phải không thể nghe được (không nhận biết được) khi nhúng vào tín hiệu âm thanh nhằm đảm bảo chất lượng cuả âm thanh
Khi không phát hiện được chữ ký thì không thể xoá chữ ký ra khỏi dữ liệu âm thanh Một chữ ký được xem là không an toàn khi có thể bị gỡ bỏ hay làm hư bằng cách lấy trung bình, lấy tương quan, phân tích phổ…
Chữ ký phải tồn tại trong trường hợp bị phá hoại vô tình hay cố ý, như là nhiễu cộng, chuyển đỗi D/A và A/D, nén có suy hao… Nghĩa là muốn phá hoại chữ ký thì đồng nghĩa với việc phá hoại cả dữ liệu âm thanh
Với dữ liệu âm thanh đã được watermark thì phải xác định được người chủ quyền và giải quyết được vấn đề tranh chấp bản quyền
III.6 CÁC PHƯƠNG PHÁP WATERMARKING
III.6.1 PHƯƠNG PHÁP LƯỢNG TỬ
Quá trình lượng tử vô hướng bao gồm việc lượng tử giá trị mẫu xn và gán một giá trị mới cho giá trị xn bằng giá trị lượng tử Khi áp dụng để nhúng thông tin, giá trị lượng tử của mẫu được watermarking tính bằng:
=
0,
4/),(
1,4/),(
n n
n n
w D D f q
w D D f q
Với w n là bit cần nhúng vào dữ liệu gốc (bit watermark), q(.) là hàm lượng tử và D là bước lượng tử Hàm lượng tử q ( f) được cho bởi công thức:
D D f D f
Trang 25CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
0
ˆn =
w nếu −D/4< y−q(f n,D)<0 (III.3) Phương pháp này dễ thực hiện và có khả năng chống lại nhiễu nếu nhiễu nhỏ hơn giới hạn D/4 Nghĩa là nếu nhiễu lớn hơn D/4, thì giá trị lượng tử sẽ bị xáo trộn và bộ phát hiện sẽ dịch sai bit watermark
Phương pháp này có thể được cải tiến dùng điều chế dither và được trình bày như sau:
d D d x q
III.6.2 PHƯƠNG PHÁP TRẢI PHỔ
Phương pháp này nhúng chuỗi nhiễu giả ngẫu nhiên vào dữ liệu gốc và phát hiện watermark dựa vào phép tính tương quan giữa chuỗi nhiễu giả ngẫu nhiên với tín hiệu âm thanh được watermarking
Chuỗi nhiễu giả ngẫu nhiên băng rộng có thể được trải ở miền thời gian hay tần số Các phép chuyển đỗi sang miền tần số thường dùng là DCT, FFT, và DWT Dữ liệu watermark nhị phân v= ⎨0,1⎬, hay dạng lưỡng cực tương ứng b= ⎨-1,+1⎬ được điều chế bằng chuỗi giả ngẫu nhiên r(n), chuỗi này được tạo bằng khoá mật Sau đó tín hiệu được điều chế w(n)=br(n) được chia tỷ lệ dựa theo năng lượng của tín hiệu âm thanh x(n) Tín hiệu đã điều chế được cộng vào tín hiệu gốc x(n) để tạo thành tín hiệu âm thanh đã được điều chế y(n):
)()()
Thừa số tỷ lệ α điều khiển độ thương nhượng giữa tính chống xâm nhập và khả năng không nghe được của dữ liệu watermark Quá trình phát hiện sử dụng phép tương quan tuyến tính Do chuỗi giả ngẫu nhiên r(n) đã biết và
nếu e(y1,d1) < e(y1,d2)nếu e(y2,d2) < e(y2,d2)
Trang 26CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
có thể tạo lại bằng khoá bí mật, các bit watermark được phát hiện bằng cách tính tương quan giữa y(n) và r(n):
c
1
)()(
i
n br N
n r n x N
c
1 2 1
)(
1)()(
m = 1 nếu v > τ
Chuỗi giả ngẫu nhiên phải có đặc tính thống kê tương tự như tín hiệu ngẫu nhiên thực, nhưng có thể tái tạo lại bằng khoá mật Chuỗi giả ngẫu nhiên tốt phải có đặc tính là hai chuỗi giả ngẫu nhiên khác nhau sẽ trực giao với nhau Vì vậy tương quan giữa chúng có giá trị rất nhỏ, trong khi giá trị tự tương quan lại rất lớn Chuỗi giả ngẫu nhiên phổ biến nhất là chuỗi có chiều dài lớn nhất (chuỗi M) Chuỗi này là chuỗi nhị phân r(n)= ⎨0,1⎬ có
~
n r
Chuỗi giả ngẫu nhiên r(n)Hình III.2: Khối tiền xử lý của bộ phát hiện dùng phương pháp trải phổ
Trang 27CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
chiều dài N=2m-1 trong đó m là kích thước của thanh ghi dịch tuyến tính có hồi tiếp Chuỗi này có đặc tính tự tương quan và tương quan chéo rất tốt
III.6.3 PHƯƠNG PHÁP KẾT NỐI (PATCHWORK)
Phương pháp này tính độ khác biệt về tổng ước lượng các mẫu giữa 2 tập con có chỉ số ngẫu nhiên và định trước Giá trị khác biệt này có thể chênh lệch so với giá trị qui ước Bằng cách so sánh giá trị khác biệt và giá trị qui ước sẽ giúp xác định dữ liệu có bị tấn công cố ý hay không với một xác suất tin cậy cao
Thuật toán kết nối miền thời gian chống đỡ yếu đối với các tấn công bằng cách thay đổi tỷ lệ thời gian, hơn nữa việc nén âm thanh, lọc và tái lấy mẫu cũng ảnh hưởng đến độ tin cậy của thuật toán kết nối ở miền thời này
Ngược lại thuật toán kết nối miền tần số chống chọi tốt đối với việc nén, lọc và tái lấy mẫu Hơn nữa, do dữ liệu bị thay đổi rất ít trong miền tần sồ khi thay đổi tỷ lệ thời gian một lượng tương đối nhỏ, vì vậy thuật toán kết nối chống chọi tốt với các cuộc tấn công bằng cách thay đổi tỷ lệ thời gian Tuy nhiên điều này chỉ đúng khi áp dụng với khối dữ liệu không bị thay đổi, hay chỉ bị thay đổi một vài mẫu trong khối dữ liệu Vì thế để chống lại các cuộc tấn công bằng cách thay đổi tỷ lệ thời gian, ta cần có thuật toán kết nối phát hiện watermark càng nhanh cành tốt nhằm kiểm tra càng nhiều các khối dữ liệu trong một thời gian cho trước (nghĩa là số mẫu bị thay đổi trong khối càng giảm để xác suất phát hiện watermark càng cao) Cả FFT, DCT và DWT đều có thuật toán nhanh với số lượng phép tính ít hơn nhiều so với thuật toán chuẩn, giúp làm giảm thời gian xử lý Thuật toán nhanh này cho phép cập nhật giá trị của dữ liệu miền tần số của khối dữ liệu bị dịch 1 mẫu từ giá trị dữ liệu ở miền tần số của khối dữ liệu gốc Tuy nhiên, thuật toán nhanh của FFT và DCT không cho phép tính toán nhanh và trực tiếp từ các dữ liệu trong miền thời gian, điều này có nghĩa là phải thực hiện ít nhất một lần chuyển đổi FFT hay DCT cho khối dữ liệu khi cần phát hiện watermark bằng phương pháp watermarking kết nối dựa trên biến đổi FFT hay DCT Phép biến đổi DWT từng phần không đổi lại cho phép tính toán DWT của khối dữ liệu gốc trực tiếp và nhanh từ dữ liệu gốc trong miền thời gian, do vậy làm tăng tốc độ phát hiện watermark
Trang 28CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
III.6.3.1 PHÉP BIẾN ĐỔI DWT TỪNG PHẦN KHÔNG ĐỔI
Ý tưởng cơ bản của DWT cho tín hiệu một chiều là tín hiệu bao gồm 2 thành phần, thành phần tần số cao và thành phần tần số thấp Thành phần không liên tục của tín hiệu nằm ở phần tần số cao Thành phần tần số thấp lại được phân thành 2 thành phần tần số cao và thấp Số lần phân tích của quá trình được xác định tuỳ ứng dụng và chiều dài của tín hiệu gốc Các dữ liệu có được từ phép phân tích trên được gọi là hệ số DWT Tín hiệu gốc có thể được khôi phục từ các hệ số DWT Quá trình tổng hợp này được gọi là biến đổi DWT ngược
DWT song trực giao được định nghĩa bởi bộ lọc phân tích thông thấp (hn), bộ lọc phân tích thông cao (gn), bộ lọc tổng hợp thông thấp( )
~
2 k
n
k n
n h
~ 1
)1(− + − +
)1(− + − +
D 1 2 (III.12) Với k = 0, 1, … k0-1 Nghĩa là DWT ánh xạ C0 thành 1
n n j k
~ 1
2
~
2
12
Trang 29CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
lọc phân tích thông thấp hn vớiù chiều dài bằng 2 và h0=h1=1 Ta viết ( )
~
5 4
3 2
1 2
3 4
3 2 1
2
128
3128
364
1164
111
64
1164
11128
3128
3
8
18
11
8
18
11
z z
z z
z z
z z
z hay
z z z z
z hay
z
+
−
−+
+++
−
−
−++++
−+
1 1
k
k
j
j n n k
1 1
k
k
j
j n
k n j n k
)
0 0
2 2
) 1 ( 2
s j n k
Trang 30CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
III.6.3.2 THUẬT TOÁN KẾT NỐI VỚI BIẾN ĐỔI DWT TỪNG PHẦN KHÔNG ĐỔI
Dữ liệu vào được chia thành các khối dữ liệu Bi chiều dài 2m
), ,
,( +1 +2m− 1 −1
i i
PN nhằm đưa thành phần thống kê vào để PN lệch khỏi giá trị mong đợi Gọi giá trị cần nhúng vào Bi là bit watermark wi Ngoài các giá trị nhúng này cần phải chèn thêm các bit đồng bộ trước các bit watermark nhằm giúp xác định điểm bắt đầu watermarking Thay đổi các hệ số wavelet theo cách thức sau:
Sau cùng, thực hiện biến đổi DWT từng phần không đổi ngược cho các hệ số wavelets 1
, trong đó D ~ k0 là hệ số wavelet đã được thay đổi ở bước trước đó
Chú ý rằng PN của khối dữ liệu đã watermarking B i
~
có phân phối xác suất:
Trang 31CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
),2(
III.6.4 PHƯƠNG PHÁP BẢN SAO (REPLICA)
Ý tưởng cơ bản của phương pháp này là phân tín hiệu gốc thành nhiều đoạn, ứng với mỗi đoạn tạo một bản sao (nhân với một hệ số tỷ lệ) rồi cộng vào đoạn gốc như một tiếng vọng theo trục thời gian hay tần số Quá trình khôi phục cũng có thể tái tạo bản sao từ tín hiệu được nhúng và tính tương quan Một ưu điểm của phương pháp này là rất an toàn với tấn công đồng bộ
Biên độ gốc
Trang 32CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
Giấu tiếng vọng: chèn dữ liệu vào tín hiệu âm thanh gốc bằng cách đưa vào một tiếng vọng trong miền thời gian như sau :
)(.)()
(n x n a x n d
Thông điệp nhị phân được chèn vào bằng cách trì hoãn tín hiệu gốc một trong hai khoảng trễ khác nhau, hoặc trễ d0 mẫu hoặc trễ d1 mẫu Quá trình tách watermark liên quan tới việc tách khoảng trễ d này để xác định xem bit được chèn vào là bit 1 hay bit 0
Phương pháp dịch tần biến đổi x(n) sang miền tần số, sau đó sao chép một dải tần số thấp nào đó, ví dụ trong khoảng từ 1kHz đến 4kHz, rồi dịch tần dải này lên đoạn nhỏ, khoảng 20Hz, sau đó nhân tỷ lệ với một hệ số suy giảm, và cộng vào phổ gốc từ 1020Hz đến 4020Hz, biến đổi ngược lại miền thời gian tạo ra tín hiệu tổng hợp y(n), các thành phần tần số được dịch và cộng trong miền tần số được gọi là tiếng vọng tần số
Tín hiệu được điều chế w(n) tương tự như chuỗi nhiễu giả ngẫu nhiên PN trong phương pháp trải phổ Tín hiệu tổng hợp được biểu diễn bằng:
)()()
Miễn là các thành phần này bất biến khi có tấn công, thì một bản sao watermark w~(n) trong miền tần số sẽ được tái tạo từ tín hiệu nhúng bằng cách xử lý theo quá trình chèn Khi đó, tương quan giữa x(n) và w~(n) được tính toán như sau :
c
)(
~)(
1)(
~)(
Trang 33CHƯƠNG III: LÝ THUYẾT CƠ BẢN VỀ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
thiết Nhưng điều này không cần thiết đới với phương pháp bản sao vì bản sao và tín hiệu gốc sẽ cho tương quan giống nhau trước và sau khi cắt Dĩ nhiên tấn công tỷ lệ thời gian sẽ ảnh hưởng đến đồng bộ bit và gói nhưng điều này là không quan trọng bằng việc đồng bộ chip
III.6.5 PHƯƠNG PHÁP TỰ ĐÁNH GIẤU (SELF-MARKING)
Phương pháp này nhúng watermark bằng cách để lại một giấu vết hiển nhiên trong tín hiệu: chèn một tín hiệu đặc biệt vào tín hiệu âm thanh hoặc thay đổi dạng tín hiệu âm thanh trong miền thời gian hoặc miền tần số
Thay đổi tỷ lệ thời gian là một phương thức tấn công và có thể dùng cho watermarking, phương pháp này liên quan đến việc nén hay giãn tín hiệu âm thanh theo trục thời gian Ý tưởng cơ bản của watermarking thay đổi tỷ lệ thời gian là thay đổi khoảng thời gian giữa hai cực (cặp cực đại và cực tiểu kế tiếp nhau) của tín hiệu âm thanh Chúng ta có thể thay đổi độ dốc của tín hiệu trong các khoảng biên độ nào đó theo bit ta muốn chèn, và phải thay đổi theo tỉ lệ thời gian Ví dụ, bit 1 tương ứng dốc chậm, và bit 0 tương ứng dốc nhanh Một thuận lợi của phương pháp này là watermark có thể tồn tại khi bịù tấn công dịch thời gian
Trang 34
CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
CHƯƠNG IV
CÁC VẤN ĐỀ TRONG QUÁ TRÌNH THIẾT KẾ,
ƯỚC LƯỢNG VÀ ĐÁNH GIÁ
Quá trình khôi phục cần hoặc không cần dữ liệu gốc: tuỳ theo ứng dụng mà quá trình khôi phục watermark có thể cần hay không cần dữ liệu gốc Nếu dữ liệu gốc được dùng thì hệ thống watermarking bền vững hơn Tuy nhiên trong các ứng dụng như giám sát dữ liệu thì dữ liệu gốc không cần sử dụng vì mục đích chỉ cần xác định dữ liệu có bị thay đổi hay không
Trích hoặc xác minh watermark được nhúng : có hai phương pháp tương đương khi nhúng và khôi phục watermark Với phương pháp đầu tiên, một watermark nằm ngoài tập watermark đã biết được nhúng vào dữ liệu gốc, quá trình khôi phục watermark sẽ kiểm tra dữ liệu được nhúng có thuộc tập watermark này hay không Ngõ ra của bộ khôi phục watermark là chỉ số của watermark được nhúng hoặc thông báo “không có watermark được tìm thấy” Với phương pháp thứ hai, watermark được nhúng là quá trình điều chế chuỗi các ký hiệu được đưa đến hệ thống nhúng watermark Trong quá trình tách, các ký tự đã nhúng được trích ra thông qua việc giải điều chế
Độ bền vững: độ bền vững của dữ liệu được watermark trước sự biến đổi hay tấn công có chủ ý là một trong những yêu cầu cốt lõi trong watermarking Tuy nhiên, có những ứng dụng mà độ bền vững kém quan trọng hơn các ứng dụng khác
Trang 35CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
Vấn đề bảo mật và sử dụng khoá: điều kiện chọn lựa cách quản lý khoá khác biệt tuỳ theo ứng dụng Một ví dụ dễ thấy là hệ thống watermarking khoá công như DVD và hệ thống khoá mật riêng được sử dụng cho việc bảo vệ bản quyền
IV.1.1 KHẢ NĂNG KHÔNG NHẬN BIẾT
Một trong yêu cầu quan trọng nhất là sự trong suốt (không nghe thấy) watermark, độc lập với ứng dụng và mục đích của hệ thống watermarking Những thông tin đưa vào trong quá trình nhúng không chỉ gây nhiễu và không mong muốn mà còn làm giảm giá trị kinh tế của dữ liệu được nhúng
Do đó các phương pháp watermarking đều lợi dụng các khuyết điểm của hệ thống thị giác và thính giác của con người để cực đại mức năng lượng watermark mà vẫn không vượt quá ngưỡng cảm nhận Hai vấn đề liên quan đến đặc tính này: thứ nhất là sự đánh giá độ tin cậy của mức độ méo dạng được đưa vào thông qua watermark nhúng và vấn đề thứ hai xảy ra khi xử lý dữ liệu được nhúng Ví dụ, trong watermarking ảnh tính trông thấy được watermark có thể tăng lên nếu như bức ảnh được thay đổi tỉ lệ kích thước
IV.1.2 ĐỘ BỀN VỮNG
Các phương pháp watermarking cơ bản phải chống đỡ trước tất cả các méo dạng do quá trình xử lý dữ liệu cố ý hay không cố ý Cho đến nay vẫn chưa đề xuất được một phương pháp hoàn hảo như thế Do vậy các hệ thống thực tế phải đạt sự thoả hiệp giữa độ bền vững và các yêu cầu đối nghịch khác như khả năng không cảm nhận và tốc độ thông tin Tùy theo mục đích ứng dụng của các phương pháp watermarking, độ bền vững mong muốn có ảnh hưởng đến quá trình thiết kế Ví dụ, trong watermarking ảnh, nếu chúng ta cần một phương pháp mà bền vững với nén JPEG với hệ số nén cao, thì phải thực hiện trong miền biến đổi hơn là thực hiện trong miền không gian Tương tự, nếu phương pháp phải thích hợp với các kiểu biến đổi hình học phổ biến như xoay, tỉ lệ không đồng đều, xén, thì thuật toán thực hiện trong miền không gian sẽ thích hợp hơn Xét méo dạng mà dữ liệu được nhúng phải chịu đựng bởi sự thay đổi chủ ý hay vô ý có thể phân biệt hai nhóm như sau: nhóm thứ nhất bao gồm các dạng méo dạng có thể được xem như nhiễu cộng, ngược lại méo dạng trong nhóm thứ hai có liên quan đến các thay đổi hình học dữ liệu không gian và thời gian với mục đích là gây ra sự không tương thích giữa watermark và khoá mật được sử dụng trong quá trình nhúng Hai loại méo dạng hay tấn công này thường được xem như là tấn công phá hoại và tấn công đồng bộ
Trang 36CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
Tuỳ theo ứng dụng và yêu cầu watermarking, có thể liệt kê các méo dạng và tấn công thường gặp bao gồm:
Nâng cao chất lượng tín hiệu (tăng độ sắc nét, tăng độ tương phản, hiệu chỉnh màu, hiệu chỉnh trung bình)
Nhiễu cộng và nhiễu nhân (nhiễu Gaussian, nhiễu phân bố đều, nhiễu đốm, nhiễu mosquito)
Lọc tuyến tính (thông thấp, thông cao, thông dải)
Lọc không tuyến tính (lọc trung vị, lọc hình thái)
Nén có méo dạng (ảnh: JPEG; video: H.261, H.263, 2, 4; nhạc: MPEG-2 audio, MP3, MPEG-4, G723)
MPEG- Biến đổi quan hệ địa phương và toàn cục (dịch, xoay, tỉ lệ, xén)
Giảm dữ liệu (xén, cắt, biến đổi histogram)
Pha trộn dữ liệu (thêm logo, chèn cảnh)
Biến đổi A/D và D/A ( in-quét ảnh, truyền hình tương tự )
Đa watermarking
Tấn công kết hợp
Trung bình thống kê
Tấn công dạng Mosaic
IV.1.3 TÁCH WATERMARK SỬ DỤNG HAY KHÔNG SỦ DỤNG DỮ LIỆU GỐC
Phương pháp watermarking sử dụng tập dữ liệu gốc trong quá trình khôi phục thường làm tăng độ bền vững không chỉ đối với méo dạng do nhiễu mà còn bền vững đối với méo dạng hình học dữ liệu bởi vì nó cho phép dò tìm và nghịch đảo méo dạng hình học Trong nhiều ứng dụng như giám sát và theo dõi dữ liệu, không thể truy cập dữ liệu gốc Trong các ứng dụng khác, như watermarking ảnh động, việc dùng dữ liệu gốc không thực tế do
Trang 37CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
phải xử lý một khối lượng lớn dữ liệu Trong khi các kỹ thuật watermarking thời kỳ đầu yêu cầu phải sử dụng dữ liệu gốc trong quá trình khôi phục, thì
xu hướng phát triển hiện nay trong các kỹ thuật mới không cần dùng dữ liệu gốc
IV.1.4 TRÍCH WATERMARK VÀ XÁC MINH SỰ HIỆN DIỆN CỦA WATERMARK
Tồn tại hai loại hệ thống watermarking: hệ thống chèn thông tin đặc trưng và kiểm tra sự hiện diện của thông tin này trong quá trình khôi phục watermark, và một hệ thống khác chèn thông tin tuỳ ý vào dữ liệu Ví dụ, thực hiện bảo vệ bản quyền bằng cách xác minh sự hiện diện của watermark đã biết trước Giải thuật watermarking nhúng thông tin tuỳ ý được dùng theo dõi ảnh trên Internet, giải thuật này không chỉ dò tìm ảnh mà còn phân biệt chúng Watermark được nhúng có thể được sử dụng như là một thông số để nhận dạng ảnh hoặc như con trỏ chỉ đến điểm nhập của cơ sở dữ liệu
Điều chú ý là cả hai hệ thống có thể chuyễn đổi qua lại, hệ thống cho phép xác minh watermark có thể được xem như hệ thống khôi phục watermark một bit, và có thể được mở rộng với bất kỳ lượng bit nào bằng cách điều chế với một thông tin bất kỳ Và ngược lại: hệ thống khôi phục watermark có thể được xem như một hệ thống xác minh watermark giả sử rằng thông tin được nhúng đã biết trước
IV.1.5 TÍNH BẢO MẬT VÀ KHÓA WATERMARK
Trong hầu hết các ứng dụng, như bảo vệ bản quyền thì sự bảo mật thông tin được nhúng phải được đảm bảo Điều này thường được xem như là độ bảo mật watermark Những ứng dụng không cần bảo mật bao gồm xác định chỉ số cơ sở dữ liệu ảnh Nếu như vấn đề bảo một được yêu cầu, một khoá mật phải được dùng trong quá trình nhúng và khôi phục watermark Có hai cấp độ bảo mật Ơû cấp độ bảo mật cao nhất, người sử dụng bất hợp pháp không thể đọc hay giải mã watermark được nhúng và cũng không thể xác định được dữ liệu có chứa watermark hay không Cấp độ thứ hai cho phép bất kỳ người sử dụng nào cũng có thể kiểm tra dữ liệu có chứa watermark hay không, nhưng không thể đọc được thông tin nhúng nếu như không có khoá mật Các giải thuật này rất hữu dụng trong lĩnh vực bảo vệ bản quyền cho ảnh Ngay khi các ảnh bản quyền được mở trong các chương trình
Trang 38CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
phần mềm, người sử dụng sẽ được thông báo ảnh đã được đăng ký bản quyền
Những hệ thống này có thể bao gồm nhiều watermark với khoá chung và khoá mật Cũng có thể kết hợp một hay nhiều khoá chung với một khoá mật và nhúng watermark kết hợp khoá chung/khoá mật
Khi thiết kế hệ thống bảo vệ bản quyền hoàn chỉnh, cần phải xem xét đến các vấn đề như tạo, phân phối và quản lý khoá mật (có thể thực hiện bởi một thành phần trung lập), cũng như phải xét đến khía cạnh tích hợp với các hệ thống khác
IV.1.6 GIẢI QUYẾT BẢN QUYỀN HỢP PHÁP
Để giải quyết bản quyền thành công, phải xác định được người đầu tiên nhúng thông tin bản quyền trong trường hợp nó chứa nhiều thông tin bản quyền được nhúng vào Điều này có thể đạt được bằng cách thực hiện các nguyên tắc thiết kế, như tính không khả đảo của watermark hay sử dụng các hàm phụ như đánh giấu thời gian nhúng vào dữ liệu
IV.2 ƯỚC LƯỢNG VÀ ĐÁNH GIÁ CỦA HỆ THỐNG WATERMARK
Bên cạnh việc thiết kế các phương pháp watermarking số, một vấn đề quan trọng là sự ước lượng và đánh giá hợp lý Điều này không chỉ đòi hỏi ước lượng độ bền vững mà còn bao gồm cả ước lượng chủ quan và định lượng độ méo xảy ra trong quá trình nhúng watermark Tổng quát, có sự tương nhượng giữa độ bền vững và khả năng cảm nhận watermark Do đó, để đánh giá và ước lượng hợp lý cần phải đảm bảo rằng các phương pháp đang nghiên cứu phải được kiểm tra trong điều kiện có thể so sánh được
IV.2.1 ƯỚC LƯỢNG VÀ BIỂU DIỄN GIÁ TRỊ ĐẶC TÍNH
Không phụ thuộc vào loại ứng dụng và loại dữ liệu, độ bền vững của watermark phụ thuộc vào các khía cạnh sau :
Số lượng thông tin nhúng vào : đây là một thông số quan trọng bởi
vì nó ảnh hưởng trực tiếp tới độ bền vững watermark, thông tin cần nhúng vào càng nhiều thì độ bền vững càng thấp
Cường độ nhúng watermark (watermark embedding strength) : có sự thương nhượng giữa cường độ nhúng watermark (do đó cũng là độ
Trang 39CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
bền vững watermark) và khả năng cảm nhận watermark Độ bền vững được tăng đòi hỏi phải nhúng càng nhiều, và sẽ tăng khả năng cảm nhận watermark
Kích cỡ và đặc tính tự nhiên của dữ liệu: kích cỡ dữ liệu thường ảnh hưởng trực tiếp đến độ bền vững của watermark được nhúng Ví dụ, trong watermarking ảnh hình ảnh rất nhỏ thường không có giá trị kinh tế
Thông tin bảo mật (như khóa mật): mặc dù lượng thông tin bảo mật không trực tiếp ảnh hưởng đến khả năng cảm nhận watermark và độ bền vững của watermark Nhưng nó đóng một vai trò quan trọng trong việc bảo mật của hệ thống Không gian khóa mật, tức tập giá trị của dữ liệu mật, phải đủ lớn nhằm ngăn cản các tấn công tìm kiếm Nhiều hệ thống bảo mật không thể chống đỡ các dạng tấn công đơn giản với lý do là người thiết kế hệ thống không tuân theo nguyên tắc mã hóa cơ bản trong thiết kế
Khi xét đến các thông số này, các phương pháp watermarking cần được kiểm tra trên các tập dữ liệu khác nhau nhằm đánh giá và ước lượng hiệu suất một cách hợp lý Hơn nữa, để kết quả tính toán có giá trị về mặt thống kê, các phương pháp cần kiểm tra trên các khoá khác nhau và thay đổi với nhiều dữ liệu watermark khác nhau Số lượng thông tin nhúng vào thường là cố định và tuỳ thuộc vào ứng dụng Tuy nhiên, nếu so sánh các phương pháp watermarking, phải đảm bảo rằng lượng thông tin nhúng vào là bằng nhau cho tất cả các phương pháp thông qua kiểm tra
Như đã trình bày ở trên, phải có sự thương nhượng giữa khả năng cảm nhận watermark và độ bền vững watermark Để ước lượng và
so sánh hợp lý, cần phải xem xét khả năng cảm nhận watermark trong quá trình ước lượng Ước lượng khả năng cảm nhận watermark có thể được thực hiện thông qua bài kiểm tra kiểm tra chủ quan hoặc một thước đo chất lượng nào đó Khi sử dụng bài kiểm tra chủ quan, phải tuân thủ giao thức kiểm tra: diễn tả thủ tục kiểm tra và ước lượng Việc kiểm tra này thường bao gồm quá trình 2 bước Bước đầu tiên là sắp xếp các tập dữ liệu bị méo dạng theo thứ tự từ tốt nhất đến xấu nhất Bước 2 là đối tượng được yêu cầu đánh giá mỗi tập dữ liệu, diễn tả khả năng cảm nhận được méo dạng Sự đánh giá này có thể dựa trên, ví dụ, chuẩn đánh giá chất lượng ITU-
R Rec.500 bảng IV.1 liệt kê sự đánh giá (rating hiệu suất ), khả
Trang 40CHƯƠNG IV: THIẾT KẾ, ĐÁNH GIÁ WATERMARKING NHD: PGS TS LÊ TIẾN THƯỜNG
năng cảm nhận và chất lượng tương ứng công việc này được thực hiện trên các dự án của Châu âu OCTALIS (Offer of Content Through Trusted Access Links) đã chứng minh rằng các cá nhân khác nhau,
ví dụ các nhà nghiên cứu và các chuyên gia xử lý ảnh, thì sẽ cho kết quả khác nhau khi sử dụng các bài kiểm tra chủ quan trên các ảnh được nhúng bản quyền Việc kiểm tra chủ quan thì thiết thực cho việc kiểm tra và đánh giá chất lượng giai đoạn cuối cùng, nhưng không thực sự hữu ích trong môi trường nghiên cứu và phát triển
không gây khó chịu
Tốt
Bảng IV.1 : Đánh giá chất lượng ITU-R Rec theo cấp độ từ 1 đến 5
Trong môi trường này, hệ thống thước đo méo dạng manh tính định lượng sẽ hiệu quả hơn nhiều và cho phép so sánh hợp lý giữa các phương pháp khác nhau do các kết quả không phụ thuộc vào ước lượng chủ quan Bảng 5.3 trình bày các thước đo sai lệch dựa trên các pixel được sử dụng phổ biến trong xử lý ảnh và video Hầu hết các thước đo này cũng có thể dùng cho các dạng dữ liệu khác bằng thích nghi chiều Hiện nay, phép đo méo dạng phổ biến nhất trong lĩnh vực nén, mã hoá ảnh và video là tỉ số tín hiệu trên nhiễu (SNR: signal to noise ratio) và tỉ số tín hiệu trên nhiễu đỉnh (PSNR: peak signal-to-noise ratio) Đơn vị đo thường là decibel (dB): SNR(dB)= 10log10(SNR) Dễ thấy các thước đo sai lệch này không tương thích với hệ thống thính giác và thị giác của con người Việc ứng dụng các đánh giá này là một vấn đề trong watermarking số bởi vì các phương pháp watermarking phức tạp sẽ khai thác một hay nhiều khía cạnh khác của hệ thống này Sử dụng thước đo trên để định lượng độ méo dạng trong quá trình nhúng có thể gây ra kết quả sai lầm trong việc định lượng méo dạng
Do đó, cần sử dụng thước đo méo dạng tương thích với hệ thống thính giác và thị giác của con người Trong những năm gần đây rất nhiều nghiên cứu