Watermarking là một kỹ thuật mới cho phép nhúng thôngtin tác giả, gọi là một Watermark, vào các tài liệu số hóa sao cho chất lượng trựcquan của tài liệu không bị ảnh hưởng và khi cần có
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐÀO TẠO SAU ĐẠI HỌC
BÁO CÁO ĐỀ TÀI TIỂU LUẬN MÔN HỌC: TRUYỀN THÔNG ĐA PHƯƠNG TIỆN
Đề tài:
“Tìm hiểu về kỹ thuật Watermarking trong truyền thông đa phương tiện”
Giảng viên: PGS.TS Nguyễn Hoàng Lan – Viện CNTT&TT
Học viên: Nguyễn Văn Tánh
Ngành: Kỹ thuật máy tính và truyền thông
Hà Nội, 05/2012
Trang 2LỜI MỞ ĐẦU
Ngày nay, bên cạnh những ích lợi to lớn, thiết thực mà mạng máy tính đemlại, chúng ta cũng đang đối đầu với những thử thách liên quan đến các vấn đềtruyền thông bảo mật và đặc biệt là vấn đề phân phối các tài liệu đa phương tiện saocho bảo đảm quyền sở hữu trí tuệ Tình trạng sao chép bất hợp pháp, giả mạo cáctác phẩm số hóa gây bức xúc không chỉ riêng các tác giả mà còn cho cả nhữngngười làm pháp luật Những hành vi xâm phạm bản quyền như giả mạo, ăn cắp tácphẩm, sử dụng các tác phẩm không có bản quyền… đang trở nên phổ biến vàngày càng tinh vi
Tuy nhiên với các phương pháp bảo vệ dữ liệu truyền thống như mãhoá, sử dụng khóa đều không đem lại hiệu quả cao trong tình hình hiện nay Cácloại truyền t hông đa phương tiện n h ư â m t h a n h s ố , ả n h s ố , v i d e o là
n h ữ n g dạng dữ liệu rất khó bảo vệ Trong bối cảnh đó, kỹ thuật Watermarking
ra đời như một cứu cánh Watermarking là một kỹ thuật mới cho phép nhúng thôngtin tác giả, gọi là một Watermark, vào các tài liệu số hóa sao cho chất lượng trựcquan của tài liệu không bị ảnh hưởng và khi cần có thể dò lại được Watermark đãnhúng nhằm xác nhận bản quyền
Bài tiểu luận tiến hành nghiên cứu một số vấn đề lý thuyết tổng quan vềWatermarking và các ứng dụng của nó trong công nghệ truyền thông đa phươngtiện, đồng thời tìm hiểu và phân tích sơ bộ về một số kỹ thuật Watermarking trongmôi trường ảnh màu kỹ thuật số
Bài tiểu luận được trình bày thành 4 phần:
Phần 1: Tổng quan về Watermarking Phần 2: Các mô hình Watermarking, các thuật toán và phân loại Phần 3: Watermarking trong môi trường ảnh màu
Phần 4: Độ an toàn Watermarking và tấn công Watermark
Do thời gian thực hiện và kiến thức bản thân còn nhều hạn chế nên chắc chắnkhông tránh khỏi những sai lầm, thiếu sót, kính mong nhận được sự đóng góp ýkiến, bổ sung, sửa đổi của quý thầy cô giáo, các bạn đồng nghiệp, đồng môn để bàitiểu luận hoàn chỉnh hơn, thiết thực hơn
Trang 3Xin chân thành cảm ơn.
Học viên Nguyễn Văn Tánh
Trang 4MỤC LỤC
LỜI MỞ ĐẦU 2
MỤC LỤC 3
CHƯƠNG 1 TỔNG QUAN VỀ WATERMARKING 5
1.1 Lịch sử Watermarking 5
1.2 Các tiêu chí cần có của một thuật toán Watermarking mạnh mẽ 7
1.2.1 Tính bảo mật 7
1.2.2 Tính vô hình 7
1.2.3 Tính vô hình đối với thống kê 7
1.2.4 Tỉ lệ bit 8
1.2.5 Quá trình dò đáng tin cậy 8
1.2.6 Tính bền vững 8
1.2.7 Nhúng nhiều Watermark 8
1.2.8 Blind/non-blind, public/private Watermarking 9
1.2.9 Watermarking đọc được và dò được 9
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark 10
1.2.11 Tính có thể thay đổi tỉ lệ (scalability) 10
1.3 Các ứng dụng của Watermarking 11
1.3.1 Theo dõi phát sóng 11
1.3.2 Nhận ra người chủ sở hữu 12
1.3.3 Bằng chứng về quyền sở hữu 13
1.3.4 Lưu vết giao tác hay dấu vân tay 14
1.3.5 Xác nhận nội dung 15
1.3.6 Kiểm soát sao chép 16
Trang 5CHƯƠNG 2 CÁC MÔ HÌNH WATERMARKING, CÁC THUẬT TOÁN 19
2.1 Mô hình trên quan điểm Watermarking như một dạng truyền thông 19
2.1.1 Mô hình cơ bản 19
2.1.2 Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung chuyển.20 2.1.3 Mô hình Watermarking theo quan niệm truyền thông đa công 21
2.2 Mô hình dựa trên quan điểm hình học 22
2.2.1 Các phân phối và miền trong không gian đa phương tiện 22
2.2.2 Mô hình Watermarking trong không gian nhúng 22
2.3 Các thuật toán Watermarking và phân loại 24
CHƯƠNG 3: WATERMARKING TRÊN ẢNH MÀU 26
3.1 Tổng quan về các thuật toán nhúng Watermark trên ảnh màu 26
3.2 Các thuật toán ví dụ 27
3.2.1 Thuật toán nhúng Watermark trên kênh xanh da trời (blue) 27
3.2.2 Thuật toán nhúng Watermark trên nhiều kênh 28
CHƯƠNG 4 ĐỘ AN TOÀN, TẤN CÔNG WATERMARK 30
4.1 Các phương pháp tiếp cận nhằm tạo Watermark có độ an toàn cao 30
4.1.1 Nhúng thừa, nhúng lặp 30
4.1.2 Mã hóa tán phổ 31
4.1.3 Nhúng trong các hệ số quan trọng cảm nhận được 31
4.1.4 Nhúng trong các hệ số được cho là mạnh mẽ 31
4.1.5 Đảo nhiễu trong bộ dò 32
4.2 Một kiểu tấn công 32
4.2.1 Đặt vấn đề 32
4.2.2 Các cách giải quyết bài toán tác quyền khác nhau của các hệ thống Watermarking khác nhau 33
TỔNG KẾT, HƯỚNG PHÁT TRIỂN ĐỀ TÀI 35
1 Kết luận 35
Trang 62 Hướng phát triển 35 TÀI LIỆU THAM KHẢO 36
Trang 7CHƯƠNG 1 TỔNG QUAN VỀ WATERMARKING
Watermarking là một trong những kỹ thuật giấu dữ liệu hiện đại Nó được địnhnghĩa như là quá trình chèn thông tin vào dữ liệu đa phương tiện nhưng bảo đảmkhông cảm thụ được, nghĩa là chỉ làm thay đổi nhỏ dữ liệu gốc Thông thường người
ta chỉ đề cập đến Watermarking số Đó là một tập các dữ liệu số thứ cấp - gọi làWatermark (mã đánh dấu bản quyền) - được nhúng vào dữ liệu số sơ cấp - gọi là dữliệu bao phủ (ví dụ như văn bản, hình ảnh, video và audio số, ) Dữ liệu sau quá trìnhnhúng được gọi là dữ liệu nhúng Tanaka (1990), Caronni và Tirkel (1993) lần lượtđưa ra những ấn bản đầu tiên về Watermarking nhưng chưa nhận được sự quan tâmđúng mức Mãi đến năm 1995, chủ đề này mới bắt đầu được quan tâm và kể từ đó,Watermarking số đã phát triển rất nhanh với nhiều hướng nghiên cứu và phươngpháp thực hiện khác nhau
Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu,điều khiển việc sao chép, xác nhận giấy tờ hay truyền đạt thông tin khác… trong đóứng dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu
số bằng cách nhúng các thông tin bản quyền Rõ ràng trong ứng dụng này, thông tinnhúng cần phải bền vững trước các thao tác nhằm loại bỏ chúng
a) Sơ đồ nhúng Watermark b) Sơ đồ khôi phục Watermark
Tất cả các phương pháp Watermarking đều có chung các khối sau: một hệthống nhúng Watermark và một hệ thống khôi phục Watermark Ngõ vào làWatermark, dữ liệu cần nhúng và mã cá nhân hay công cộng Watermark có thể ở bất
kì dạng nào như chữ số, văn bản hay hình ảnh Khoá có thể được dùng để tăng cườngtính bảo mật, nghĩa là ngăn chặn những kẻ không có bản quyền khôi phục hay pháhủy Watermark Các hệ thống thực tế dùng ít nhất là một khoá, thậm chí kết hợp nhiềukhoá Ngõ ra là dữ liệu đã được Watermark Quá trình khôi phục Watermark tổngquát Các ngõ vào là dữ liệu đã Watermark, khoá và dữ liệu gốc (có thể có hoặc không
Trang 8tuỳ thuộc vào phương pháp) Ngõ ra hoặc là Watermark khôi phục được hoặc đạilượng nào đó chỉ ra mối tương quan giữa nó và Watermark cho trước ở ngõ vào.
1.1 Lịch sử Watermarking
Nghệ thuật làm giấy đã được phát minh ở Trung Quốc cách đây trên một ngànnăm nhưng mãi đến khoảng năm 1282, các công nghệ Watermark trên giấy mới xuấthiện đầu tiên dưới hình thức một số vị trí khuôn giấy là các mẫu dây mỏng hơn, khi đógiấy sẽ mỏng và trong suốt hơn ở những vị trí dây mỏng Các Watermark giấy nguyênthủy giúp xác nhận xưởng sản xuất hay đơn giản chỉ là để trang trí Vào thế kỉ thứ 18,
ở châu Âu và Mỹ, Watermark trên giấy đã đem lại những lợi ích thiết thực trong việcxác định nhãn hiệu thương mại, ghi nhận ngày sản xuất, chống làm tiền giả Thuật ngữWatermark bắt nguồn từ một loại mực vô hình được viết lên giấy và chỉ hiển thị khinhúng giấy đó vào nước Thuật ngữ digital Watermarking được cộng đồng thế giớichấp nhận rộng rãi vào đầu thập niên 1990 Khoảng năm 1995, sự quan tâm đếnWatermarking bắt đầu phát triển nhanh Năm 1996, hội thảo về che dấu thông lần đầutiên đưa Watermarking vào phần trình nội dung chính Đến năm 1999, SPIE đã tổ chứchội nghị đặc biệt về Bảo mật và Watermarking trên các nội dung đa phương tiện
Cũng trong khoảng thời gian này, một số tổ chức đã quan tâm đến kỹ thuậtWatermarking với những mức độ khác nhau Chẳng hạn CPTWG thử nghiệm hệ thốngWatermarking bảo vệ phim trên DVD SDMI sử dụng Watermarking trong việc bảo vệcác đoạn nhạc Hai dự án khác được liên minh Châu Âu ủng hộ, VIVA và Talisman đãthử nghiệm sử dụng Watermarking để theo dõi phát sóng Vào cuối thập niên 1990,một số công ty đưa Watermarking vào thương trường, chẳng hạn các nhà phân phốinhạc trên internet sử dụng Liqid Audio áp dụng công nghệ của Verance Corporation.Trong lĩnh vực Watermarking ảnh, Photoshop đã tích hợp một bộ nhúng và bộ dòWatermark tên là Digimarc
Ngày nay, các công ty chuyên kinh doanh các hệ thống Watermarking đã tăng đáng
kể, dưới đây là một số ví dụ về các công ty và sản phẩm trong lĩnh vực Watermarking:
Các hệ thống Watermarking âm thanh
Blue Spike, Inc Công nghệ Watermarking của Giovanni, Blue Spike
có thể được dùng để nhận dang, xác nhận và kiểm tracác tài liệu âm thanh
Verance Corporation Verance Corporation - được sát nhập từ ARIS
Technologies, Inc (Cambridge, Mass)và Solana
Trang 9Technology Development Corporatio - sở hữu côngnghệ Watermarking đã có bằng sáng chế Musicode® vàElectronic DNA®.
phép dữ liệu kĩ thuật số được nhúng trong các tài liệu
có giá trị như giấy tờ tài chính, thị thực, giúp ngăn chặngiả mạo, trộm và sử dụng không được phép khác
Các hệ thống Watermarking trên phim
Alpha Tec Ltd
-AudioMark Alpha Tec Ltd là một công ty Hy Lạp phát triểnAudioMark, gói phần mềm thiết kế cho việc nhúng các
Watermark vào tài liệu âm thanh và phimMediaSec
Technologies
Cung cấp công cụ SysCoP (System for CopyrightProtection) để nhúng nhãn hiệu tác quyền vào ảnh vàphim (MPEG )
Bảng - 1: Các công ty và sản phẩm trong lĩnh vực Watermarking
1.2 Các tiêu chí cần có của một thuật toán Watermarking mạnh mẽ
Tùy thuộc vào từng ứng dụng, kỹ thuật Watermarking có những đòi hỏi khácnhau Tuy nhiên có một số yêu cầu chung mà mà hầu hết các ứng dụng thực tếphải đạt được
1.2.1 Tính bảo mật
Giống như trong lĩnh vực mã hóa, tính hiệu quả của một thuật toán không thểdựa vào giả định là các kẻ tấn công không biết cách mà Watermark được nhúng vào tàiliệu đa phương tiện Tuy nhiên, giả định đó lại được dùng để đánh giá độ an toàn củacác sản phẩm thương mại sử dụng Watermarking có giá trị trên thị trường Vì vậy vớimột ứng dụng Watermarking, một khi biết được cách làm việc của bộ nhúng và bộ dò,việc làm cho Watermark không đọc được thường rất dễ dàng Hơn nữa một số kỹthuật sử dụng dữ liệu gốc trong quy trình dò và thường thì các giải pháp loại nàykhông khả thi trong thực tế
1.2.2 Tính vô hình
Trang 10Những nhà nghiên cứu gần đây đã cố nhúng những Watermark bằng cách saocho nó không thể được nhận ra Tuy nhiên yêu cầu này mâu thuẫn với các yêu cầukhác chẳng hạn sức chịu đựng và độ an toàn chống sự bền vững chống được giả mạođặc biệt là các thuật toán nén có mất thông tin Vì mục đích này chúng ta phải khảo sátcác tính chất của HVS và HAS trong quy trình dò Watermark Các thuật toán nénđược dùng hiện nay cho phép đạt được mục tiêu đó, tuy nhiên điều này sẽ không khảthi trong tương lai là do thế hệ của thuật toán nén tiếp theo có thể thay đổi, cần phảicho các người quan sát đã qua huấn luyện (người được yêu cầu so sánh phiên bản củatài liệu gốc và tài liệu được ấn dấu) thấy được Watermark Dĩ nhiên đây không phải làkhó khăn trong thực tế vì người dùng thông thường không có khả năng so sánh đó.
1.2.3 Tính vô hình đối với thống kê
Watermark không thể dò được bằng phương pháp thống kê bởi một ngưởikhông được phép Ví dụ nhiều tác phẩm kỹ thuật số đã được nhúng cùng mộtWatermark sao cho khi thực hiện tấn công dựa trên thống kê thì không tài nào tríchđược Watermark Một giải pháp khả thi là sử dụng Watermark phụ thuộc nội dung
1.2.4 Tỉ lệ bit
Tùy thuộc vào ứng dụng, thuật toán Watermark có thể cho phép một số lượngbit cần ẩn được định nghĩa trước Không tồn tại các quy tắc chung, tuy nhiên đối vớiảnh thì tối thiểu 300 - 400 bit Trong bất kỳ trường hợp nào thì nhà thiết kế hệ thốngphải nhớ rằng tốt nhất là không nên giới hạn số lượng bit được nhúng vào dữ liệu
1.2.5 Quá trình dò đáng tin cậy
Thậm chí khi không có các tấn công cũng như các biến dạng tín hiệu, khả năngkhông dò được Watermark đã nhúng hoặc dò sai Watermark phải rất nhỏ Thôngthường các thuật toán dựa trên thống kê dễ dàng thỏa được các yêu này Tuy nhiên mộtkhả năng như vậy phải được đưa lên hàng đầu nếu ứng dụng Watermarking liên quanđến luật pháp vì có như vây mới tạo sự tin cậy chắc chắn trong các phán quyết cuốicùng
1.2.6 Tính bền vững
Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dưới dạng kỹ thuật sốthông thường có liên quan tới nhiều kiểu biến dạng, chẳng hạn như nén có mất thôngtin, hay trong trường hợp ảnh là các phép lọc, định lại kích thước, cải tiến độ tươngphản, phép quay, v.v Để Watermarking hữu ích, Watermark phải dò được ngay khi
Trang 11cả các biến dạng xảy ra Quan điểm chung để đạt được tính mạnh mẽ chống được cácbiến dạng tính hiệu là đặt Watermark vào các phần quan trọng của tín hiệu Điều nàyphụ thuộc vào cách xử lý của các thuật toán nén có mất thông tin (bỏ qua các phần dữliệu không quan trọng mà không làm ảnh hưởng đến chất lượng của dữ liệu được nén.Điều này dẫn đến một Watermark được ẩn trong các dữ liệu không quan trọng khó tồntại khi bị nén Trong trường hợp Watermarking trên ảnh, sức chịu đựng với các xử lýhình học (dịch chuyển, định lại kích thước, quay, xén ) thì vẫn là một vấn đề mở,những thao tác như vậy rất thông thường và một giải pháp đề ra cần giải quyết đượctrước khi áp dụng Watermark cho bảo vệ tác quyền ảnh.
1.2.7 Nhúng nhiều Watermark
Cần phải cho phép nhúng một tập hợp các Watermark khác nhau trong cùngảnh bằng cách sao cho mỗi Watermark có thể dò được bởi người dùng được cấpquyền Đặc trưng này thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộctính tác quyền được truyền từ người sở hữu tác phẩm đến các tác phẩm khác Hơn nữachúng ta có thể ngăn người khác thực hiện Watermarking cho một tác phẩm đã đượcđóng dấu Trong một số trường hợp việc sửa một Watermark sau khi nhúng là cần thiếtchẳng hạn trong trường hợp của các đĩa DVD, một con dấu có thể được dùng để chỉ sốlượng các bản sao chép được phép Mỗi lần một bản sao chép được thực hiện con dấu
sẽ được sửa đổi để giảm số Sự chỉnh sửa có thể thực hiện được bằng cách xoá bỏ dấu
cũ và nhúng dấu mới hoặc là nhúng một dấu mới chồng lên dấu cũ Khả năng thứ haiđược chọn lựa nhiều hơn bởi vì một Watermark mà có thể xoá được thì yếu và khôngchịu đựng được các tấn công giả mạo
1.2.8 Blind/non-blind, public/private Watermarking
Mối quan tâm đặc biệt là cơ chế sử dụng để khôi phục vết ấn từ ảnh Trong một
số trường hợp để phát triển một thuật toán mạnh mẽ, Watermark được trích bằng cách
so sánh các phiên bản đã được đóng dấu vả chưa đóng dấu Trong đó nhiều phươngpháp được đề xuất chịu đựng được nhiều kỹ thuật xử lý ảnh và các tấn công có thểnhằm vào việc gỡ Watermark hay làm cho nó không thể đọc được Tuy nhiên thôngthường trong thế giới thực, sự có mặt của ảnh gốc trong quá trình dò không được bảođảm, do vậy thuật toán cần ảnh gốc để hồi phục vết ấn không thích hợp cho nhiều ứngdụng thực tế Ngoài ra loại thuật toán này không thể được dùng cho việc chứng minhquyền sở hữu hoàn toàn trừ khi thỏa một số yêu cầu phụ khác như không tựa khả đảo
Trang 12(non-quasi-invertibility) của Watermark, vốn rất khó đạt được và hầu như không thểchứng minh Các kỹ thuật khôi phục Watermark không cần so sánh các tín hiệu đượcmark và không được mark thường gọi là oblivious hay blind Trong các trường hợpkhác thuật ngữ public Watermarking được dùng để đối lại với private Watermarking Thực sự, thuật ngữ public/private Watermarking để chỉ một khái niệm khác: một kỹthuật được gọi là private nếu chỉ có người sở hữu tài liệu hay người được cấp quyềnmới trích Watermark bởi vì anh ta mới là người có thể truy xuất vào ảnh gốc hoặc anh
ta mới là người biết khoá chính xác đúng để trích Watermark từ dữ liệu chủ Trái lạicác kỹ thuật mà cho phép bất kỳ người nào cũng đọc được Watermark được gọi làpublic Hầu hết mọi người cho rằng các cơ chế private dường như mạnh mẽ hơn public
ở chỗ là mỗi khi Watermark được đọc, kỹ thuật public làm cho các kẻ tấn công dễ xóaWatermark hay làm cho Watermark không đọc được chẳng hạn bằng cách đảo quytrình nhúng hay bằng cách nhúng một Watermark đảo (Watermark reversibility) Nóimột cách tổng quát trong số các kỹ thuật Watermarking ảnh được đề xuất gần đây, cácsản phẩm thương mại thường áp dụng các hệ thống public trong khi các nghiên cứu lạitập trung vào tiếp cận private
1.2.9 Watermarking đọc được và dò được
Một Watermark mà có thể dò được chỉ nếu nội dung của nó được biết trước gọi
là một Watermark dò được Ngược lại các kỹ thuật cho phép Watermark đọc đượcngay khi nội dung của nó bỏ qua thì gọi là Watermark đọc được Nói cách khác, theohướng tiếp cận dò được, người ta có thể chỉ cần biết một Watermark có tồn tại trong
dữ liệu hay không Nếu một người không biết Watermark là gì thì không thể phân tíchtài liệu đa phương tiện để tìm ra Watermark Điều này không giống với các kỹ thuậtđọc được, trong đó cơ chế nhúng và trích Watermark được thực hiện sao cho bất kỳ aicũng có thể đọc được Watermark Dĩ nhiên tính chất đọc được/ dò được củaWatermark ảnh hưởng nhiều đến cách mà nó được sử dụng trong các ứng dụng thực
tế Ví dụ giả sử có một tình huống trong đó người ta muốn biết ai là người sở hữu củamột ảnh mà anh ta đã tìm đã tìm thấy đâu đó trên Internet Ngoài ra giả sử rằngWatermark chỉ ra người sở hữu đã được nhúng trong ảnh sử dụng kỹ thuậtWatermarking dò được Không có cách nào để đọc được Watermark nếu không thựchiện các giả định về người sở hữu có thể, bởi vì nhờ tính chất dò được của Watermark
Trang 13chỉ có thể xác định ảnh có thuộc một tác giả cụ thể nào đó (Watermark của anh ta đượcbiết ) không.
1.2.10 Tính khả đảo và tính thuận nghịch của Watermark
Mặc dù tính mạnh mẽ thường được chỉ ra như một yêu cầu chính được thỏamãn, mối quan tâm lớn lại tập trung vào tính khả đảo của Watermark Thuật ngữ khảđảo được dùng với những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa mộtWatermark là khả đảo nếu các người dùng được cấp quyền có thể xoá nó khỏi tài liệu.Trong nhiều ứng dụng tính khả đảo này có thể là một đặc trưng mong đợi, bởi vì nó cóthể cho phép thay đổi tình trạng của một tài liệu cho trước theo lịch sử của nó màkhông cần phải ẩn quá nhiều bit thông tin trong nó Tính khả đảo của Watermark cònđược định nghĩa theo cách khác: đó là khả năng làm mất hiệu lực thừa nhận quyền sởhữu được hỗ trợ bởi Watermarking bằng cách sử dụng kỹ thuật công nghệ đảo để đảolại quy trình Watermarking Một mô hình Watermarking để được sử dụng thành côngtrong ứng dụng bảo vệ quyền sở hữu, tính không khả đảo của Watermark phải đượcthỏa mãn Hơn nữa đây chỉ là một điều kiện cần thiết phải thỏa mãn bởi vì tổng quáthơn tính người ta cần tính không tựa khả đảo của Watermark hơn Ở đây thuật ngữ khảđảo và tựa khả đảo được hiểu theo nghĩa tự nhiên như đã nói trên Không cần đi vàochi tiết, chúng ta có thể nói rằng một Watermark là khả đảo nếu nó có thể tạo ra mộtWatermark ngược (false Watermark) và một tài liệu giả mạo tài liệu gốc mà giống nhưtài liệu gốc sao cho bằng cách nhúng false Watermark vào nó, ta có thể thu được mộttài liệu mà giống hay gần giống với tài liệu gốc thực sự đã được đóng dấu Để tránhviệc dùng nhập nhằng thuật ngữ invertibility, thuật ngữ reversibility được đề xuất
để chỉ rằng một Watermark có thể xóa khỏi ảnh chủ mỗi khi nội dung của nó đượcbiết
1.2.11 Tính có thể thay đổi tỉ lệ (scalability)
Trong các ứng dụng thương mại, chi phí tính toán cho việc nhúng và trích là rấtquan trọng Trong một số ứng dụng việc chèn vào chỉ có thể thực hiện một lần Do đó,chi phí nhúng có thể ít quan trọng hơn là chi phí dò, vốn thường phải xảy ra theo thờigian thực, ví dụ như tốc độ giải mã của các frame video Các yêu cầu tính toánràng buột một Watermark phải đơn giản, nhưng sự đơn giản này có thể giảm trầmtrọng tính chịu đựng giả mạo Hơn nữa, người ta biết rằng tốc độ máy vi tính thì cứtăng xấp xỉ gấp đôi sau 18 tháng, để mà những gì được tính toán không thỏa đáng ngày
Trang 14hôm nay có thể nhanh chóng trở thành hiện thực Do đó người ta rất mong đợi thiết kếmột Watermark mà bộ dò tương thích với mỗi thế hệ máy vi tính Ví dụ thế hệ thứnhất của bộ dò có thể có chi phí tính toán rẻ nhưng có thể không đáng tin cậy bằng bộ
dò ở thế hệ tiếp theo mà có thể cấp cho nhiều tính toán hơn để xử lý với các vấn đềchẳng hạn như các biến dạng hình học
1.3 Các ứng dụng của Watermarking
Phần này trình bày tất cả các ứng dụng của Watermarking trên hầu hết các tàiliệu đa phương tiện (ảnh, âm thanh, phim), bao gồm:
Theo dõi phát sóng (broadcast Watermarking )
Nhận ra người chủ sở hữu (owner identification )
Bằng chứng của quyền sở hữu (proof of owner ship )
Lưu vết giao tác hay dấu vân tay (transaction tracking/fingerprinting )
Sự xác nhận nội dung (content authentication )
Kiểm soát sao chép (copy control)
Những người sở hữu một đoạn nhạc hay phim không muốn tác phẩm của mình
bị xâm phạm tác quyền qua việc thu và phát sóng lại
Một cách để giải quyết điều này là sử dụng hệ thống theo dõi tự động thụ động
và chủ động Hệ thống theo dõi thụ động mô phỏng như một quan sát viên, nó chứamột máy tính chuyên theo dõi nội dung phát sóng và so sánh tín hiệu nhận được vớimột cơ sở dữ liệu các tác phẩm biết trước Lợi điểm của nó là không cần bất kỳ thôngtin liên kết vào quá trình phát sóng và như vậy không đòi hỏi bất kỳ sự hợp tác nào vớicác nhà quảng cáo hay các nhà phát sóng Như vậy có thể áp dụng nó trong các dịch
vụ điều tra thị trường nhằm mục đích cạnh tranh Khó khăn của hệ thống này là:
+ Thứ nhất, việc so sánh tín hiệu nhận được với cơ sở dữ liệu không phảichuyện tầm thường Về nguyên tắc, cần chia tín hiệu nhận được thành các đơn vị có
Trang 15thể phân tích được và tìm chúng trong cơ sở dữ liệu Tuy nhiên mỗi frame của videochứa hàng ngàn bit thông tin và không thực tế chút nào cho quá trình tìm kiếm Nhưvậy hệ thống trước hết phải xử lý tín hiệu thành những chữ ký nhỏ hơn sao cho vừa đủ
để phân biệt với tài liệu khác và phải đủ nhỏ để lưu được trong cơ sở dữ liệu
+ Thứ hai, sự giảm tín hiệu trong quá trình phát sóng là điều không tránh khỏi,
nó thay đổi theo thời gian, tức là sự thu tín hiệu của cùng một nội dung ở các thởi điểmkhác nhau có thể dẫn đến những tín hiệu khác nhau Vì thế, hệ thống không thể tìm nóchính xác trong cơ sở dữ liệu mà chỉ có thể tìm dưới dạng người láng giềng gần nhất,thực tế phức tạp hơn nhiều
+ Thứ ba, ngay cả khi vấn đề tìm kiếm được giải quyết thì việc lưu trữ và quản
lý cơ sở dữ liệu cũng là vấn đề lớn Hơn nữa hệ thống phải theo dõi nhiều vị trí địa lýkhác nhau đồng thời, phải truy xuất và giao tiếp cơ sở dữ liệu trung tâm hoặc là lưu cơ
sở dữ liệu cục bộ
Hệ thống theo dõi chủ động đơn giản hơn về mặt kỹ thuật hơn vì thông tin nhậndạng được giải mã trực tiếp, không cần cơ sở dữ liệu để thông dịch nghĩa của nó Mộtcài đặt của hệ thống này là lưu các mã nhận dạng ở phần đầu file Khó khăn là người
xử lý trung gian và người phân phối cuối cùng không bảo đảm phân phát thông tin đầufile nguyên vẹn Hơn nữa dữ liệu khó sống sót với sự chuyển đổi định dạng
Watermarking là một phương pháp mã hoá thông tin nhận dạng cho theo dõichủ động Nó có thuận lợi là Watermark tồn tại bên trong nội dung tín hiệu phát sóngchứ không phải chỉ trong một đoạn đặc biệt của tín hiệu và vì thế hoàn toàn thươngthích với nền tảng thiết bị phát sóng đã được cài đặt bao gồm cả bộ truyền tải digital vàanalog Tuy nhiên, qui trình nhúng dò Watermark phức tạp hơn việc thêm dữ liệu vàođầu file và tìm được một thuật toán sao cho chất lượng trực quan của nội dung giảmkhông đáng kể nhưng lại có độ an toàn cao cũng là một bài toán thu hút nhiều sự quantâm nghiên cứu Như vậy, bằng cách nhận dạng những Watermark được nhúng trongnội dung số, có thể chỉ ra khi nào và ở đâu nội dung đó được phát song
1.3.2 Nhận ra người chủ sở hữu
Trong thực tế có trường hợp một tác phẩm đã có tác quyền bị sử dụng sai mụcđích và phán quyết của cơ quan luật pháp rất cần thông báo tác quyền trên một hìnhthức hay vị trí nào xem được trên tài liệu được phân phối Thông báo tác quyền chúng
ta thường thấy trên có các tài liệu khả kiến là “Copyright ngày người sở hữu”, “ ngày
Trang 16người sở hữu” hay “Corp ngày người sở hữu” Trên các tác phẩm âm thanh các thôngbáo đó phải được đặt lên bề mặt của đĩa vật lý, tên nhãn hay trên bao bì Dễ thấy rằng,giới hạn của nó là việc nhận dạng người sở hữu tác quyền của một tác phẩm không bảođảm do người ta không quá khó để loại bỏ nó ra khỏi một tài liệu khi tiến hành saochụp lại thậm chí không cần quan tâm rằng đó là một việc làm sai: Chẳng hạn, mộtgiáo viên chụp một số trang từ quyển sách mà quên chụp luôn thông báo tác quyền ởtrang tiêu đề, một họa sĩ sử dụng một bức hình hợp pháp trong mục quảng cáo của báo
có thể xén đi phần có chứa thông tin tác quyền Rồi sau đó các công dân tôn trọng luậtpháp muốn dùng tác phẩm có thể không tài nào xác định được tác phẩm có được bảo
vệ tác quyền hay chưa Một trường hợp khá nổi tiếng là Lena Sjooblom Đây là ảnhthử thông thường nhất trong lĩnh vực nghiên cứu xử lý ảnh và đã xuất hiện không biếtbao nhiêu mà kể ở các bào báo hội nghị nhưng không ai tham khảo tên người sở hữuhợp pháp của nó, đó là hãng Playboy Ban đầu nó là một ảnh phóng to lồng giữa cáctrang của tạp chí Playboy (Tháng 11- 1972 ) Khi ảnh được Scan và dùng cho mụcđích kiểm thử, hầu hết ảnh đã bị xén chỉ còn khuôn mặt và vai của Lena Không may
là dòng chữ ghi Playboy là người sở hữu cũng bị xén mất Từ đó ảnh được phân phốitoàn cầu và hầu hết các nhà nghiên cứu dùng nó trong các bào báo đã không biết rằngchúng là tác quyền của Playboy
Thứ hai là vấn đề thẩm mỹ, dù chỉ đặt ở một phần của ảnh nhưng một dòng chữthông tin tác quyền có thể làm giảm bớt vẻ đẹp của nó Với các tài liệu âm thanh hayphim, vì thông báo tác quyền nằm trên băng đĩa vật lý và bao bì nên sẽ không có thôngbáo nào được sao chép cùng với nội dung của nó
Do các Watermark có thể vừa không thể nhận thấy vừa không thể tách rời tácphẩm chứa nó nên chúng là giải pháp tốt hơn dòng chữ đối với việc nhận ra người sởhữu nếu người dùng tác phẩm được cung cấp bộ dò Watermark Digimarc choảnh là ứng dụng mà ta đang đề cập Nó được tích hợp vào Photoshop Khi bộ dò củaDigimarc nhận ra một Watermark, nó liên lạc với cơ sở dữ liệu trung tâm trên Internet
và dùng thông điệp Watermark như một khóa để tìm thông tin liên lạc cho người sởhữu ảnh Tính hợp pháp của một ứng dụng như vậy chưa được thừa nhận bởi cơ quanpháp luật nhưng nó giúp những người lương thiện dễ dàng tìm ra người họ muốn liênlạc để dùng ảnh Như vậy, nhúng thông tin của người giữ tác quyền của một tác phẩmnhư là một Watermark
Trang 17A có thể nào bảo vệ quyền lợi của mình mà không phải tốn phí đăng ký bằngcách áp dụng Watermark vào ảnh của mình? Nếu A dùng Digimarc, vấn đề khôngđược giải quyết vì bộ dò cũng được kẻ trộm biết Về lý thuyết, ai dò được Watermarkđều có thể xoá bỏ nó Do đó B có thể dùng bộ dò Digimarc, gỡ Watermark của A vàthay vào đó Watermark của mình Để đạt được mức bảo mật trong bằng chứng tácquyền, cần giới hạn tính khả dụng của bộ dò Đối với kẻ trộm không có một bộ dò,việc bỏ Watermark thì rất khó khăn phức tạp Như thế khi A và B ra tòa, A dùng ảnhgốc và ảnh tranh cãi đưa vào bộ dò và bộ dò sẽ cho ra Watermark của A Tuy nhiêncũng có một dạng hệ thống Watermarking mà B có thể dùng và làm như thểWatermark của B nằm trong bản gốc ảnh của A Tấn công được gọi là tấn công đảo(inversion attack) hay tấn công khóa chết (dead lock attack) Không có cách gì để giảiquyết quyền sở hữu bản quyền trong trường hợp này và tòa cũng không thể biết A hay
B có ảnh gốc thực sự Điều này cho thấy rằng chỉ với một mình Watermark mà không
có một nghi thức khác hỗ trợ nó thì sẽ không đủ để giải quyết tình huống bản quyềnnày
Bài toán có thể được giải quyết nếu ta thay đổi phần phát biểu nó: Thay vì cốchứng minh trực tiếp quyền sở hữu bằng cách nhúng một Watermark “A sở hữu ảnhnày”, ta nên cố chứng minh một ảnh bắt nguồn từ ảnh khác Một hệ thống như vậycung cấp một bằng chứng gián tiếp rằng khả năng ảnh tranh cãi là của A cao hơn B,trong đó A là người có phiên bản mà từ đó hai ảnh khác tạo ra
Trang 181.3.4 Lưu vết giao tác hay dấu vân tay
Trong ứng dụng này, Watermark lưu lại một hay nhiều giao dịch đã xảy ratrong những lần sao chép tác phẩm đã có nhúng Watermark Ví dụ, Watermark có thểlưu tên người mua trong mỗi lần mua bán hợp pháp hay phân phối Người sở hữu vàngười tạo ra tác phẩm có thể dùng những Watermark khác nhau trong mỗi bản sao.Nếu tài liệu bị dùng sai mục đích (phát hành hay phân phối trái phép ) người sở hữu cóthể tìm ra người có trách nhiệm
Một giải pháp thông thường cho Watermarking áp dụng cho lưu vết giao tác làdùng các Watermark hữu hình, chẳng hạn các tài liệu thương mại được in cóbackground có chứa các số lớn hơn màu xám, với mỗi bản sao sẽ chứa một số khác
Một ví dụ khác có sử dụng Watermarking cho việc theo dõi giao tác đã được càiđặt bởi DiVX Corporation DiVX bán một DVD player triển khai theo mô hình kinhdoanh pay-per-view Họ cài đăt nhiều kỹ thuật để ngăn giả mạo đĩa của họ, một trong
số đó là Watermark được thiết kế cho lưu vết giao tác Mỗi DVD player phải đặt mộtWatermark duy nhất vào mỗi video mà nó chiếu Nếu ai đó thu lại đoạn video và báncác bản sao, DiVX có thể lấy được bản copy đó và tìm ra kẻ phản bội bằng cách giải
mã Watermark
Một ví dụ khác là trong phân phối các nhật báo phim Suốt quá trình thực hiệnmột phim, kết quả các bức hình mỗi ngày được phân phối cho nhiều người có tham giavào phim Nhưng những nhật báo này được yêu cầu giấu bí mật, không muốn bị lộ rangoài Gặp trường hợp này, trường quay nhanh chónh xác định được người đã làm rò
rỉ thông tinh Trường quay có thể dùng đoạn văn hữu hình ở góc màn hình để xác địnhmỗi bản sao của ảnh Tuy nhiên, các Watermark được chuộng hơn vì đoạn văn bản dễ
bị xóa đi
1.3.5 Xác nhận nội dung
Các tác phẩm kỹ thuật số ngày nay đứng trước nguy cơ bị làm giả nhiều hơn, dễdàng hơn và tinh vi hơn Nếu ảnh là một bằng chứng quan trọng trong điều tra củacảnh sát, sự giả mạo có thể gây ra nhiều vấn đề nghiêm trọng
Bài toán xác nhận thông điệp đã được nghiên cứu rộng rãi trong lĩnh vực mãhóa (crytography) Một tiếp cận mã hóa thông thường cho bài toán này là tạo ra mộtchữ kí điện tử Thuật toán được dùng là mã hóa khoá bất đối xứng Chỉ có tác giảthông điệp mới biết khoá cần để tạo ra các chữ ký Do vậy, kẻ trộm cố thay đổi thông
Trang 19điệp thì sẽ không tạo ra được một chữ ký mới Nếu khi tiến hành so sánh, thông điệpđược sửa đổi khác với chữ ký gốc, ta có thể khẳng định thông điệp đã bị sửa Chữ kýđiện tử đã được áp dụng cho các camera kỹ thuật số bởi Fredman, người gợi ý tạo ramột máy ảnh có chữ ký bên trong Khóa để tạo chữ kí chỉ có trong máy ảnh mà thôi.
Chữ ký dạng như vậy chung qui là một dạng dữ liệu meta được đi kèm với tàiliệu mà chúng xác nhận Điều này cho thấy rất dễ làm mất các chữ ký Chẳng hạn một
hệ thống xác nhận ảnh lưu dữ liệu meta vào phần vào phần đầu (header) của ảnhJPEG Nếu ảnh được chuyển sang dạng khác, chữ ký sẽ bị mất và dĩ nhiên tài liệukhông còn được chứng thực nữa
Một giải pháp hay là những chữ ký trực tiếp vào tài liệu dùng kỹ thuậtWatermarking Epson đề ra một hệ thống như vậy trên nhiều máy ảnh kỹ thuật số củahãng Ta gọi chữ ký này là chữ kí xác nhận (authentication mark) Chữ kí xác nhậnđược thiết kế sao cho trở nên sai lệch dù chỉ gặp sự chỉnh sửa nhỏ nhất được gọi là cácWatermark dễ vỡ (fragile Watermark)
Mối lo ngại về việc các chữ ký có trong tài liệu hay không giờ đây đã bị loạitrừ Điều quan tâm lúc này là việc nhúng Watermark cần bào đảm không thay đổi tàiliệu nhiều quá để nó còn đúng khi so sánh với chữ ký Điều này có thể thực hiện đượcbằng cách xem tài liệu thành hai phần: Một dùng cho việc tính toán bằng chữ ký, mộtdùng cho việc nhúng chữ ký Ví dụ, nhiều tác giả đề xuất tính toán một chữ ký từ cácbit cao của ảnh và nhúng chữ ký vào các bit thấp của ảnh
Nếu một tài liệu có chứa chữ kí xác nhận bị thay đổi, chữ kí xác nhận cũng thayđổi theo Điều này mở ra một hướng nghiên cứu mới là tìm hiểu tài liệu đã bị giả mạonhư thế nào Chẳng hạn nếu một ảnh được chia làm nhiều khối, mỗi khối có một chữ
kí xác nhận, chúng ta dễ phát thảo ra phần nào của ảnh nguyên trạng và phần nào bịchỉnh sửa
Một ví dụ rất hay được áp dụng trong điều tra tội phạm của cảnh sát, sử dụngchữ kí xác nhận khoanh vùng (localized authentication) Cảnh sát nhận được một đoạnphim theo dõi đã bị giả mạo Nếu đoạn phim này dùng các chứng thực chữ ký truyềnthống, dễ thấy rằng họ biết phim bị giả mạo và không tin bất cứ điều gì trong phim.Tuy nhiên nếu dùng một Watermark theo kiểu xác nhận khoanh vùng, họ có thể khámphá rằng trong các khung (frame) của phim vẫn có chỗ tin cậy Như vậy kẻ có liênquan đến tội ác đã bị gỡ bớt các frame có dấu vết của hắn
Trang 20Khi kiểm tra một chữ kí xác nhận đã bị sửa đổi ta cũng có được thông tin “Liệunén có mất có được áp dụng vào tài liệu hay không” Hầu hết các thuật toán nén ảnh cómất đều áp dụng sự lượng tử hóa, chính điều này đã để lại các thay đổi thống kê trongmột Watermark và có thể nhận diện được.
1.3.6 Kiểm soát sao chép
Các ứng dụng đã đề cập ở trên hầu hết có tác dụng sau khi có ai đó làm sai.Chẳng hạn theo dõi phát sóng giúp phát hiện nhà phát sóng bất lương đã ăn chặn tiềnsau khi biết họ đã phát sóng không đúng thời lượng Còn lưu vết giao tác chỉ ra kẻphản bội sau khi họ đã làm lộ và phân phối các bản sao bất hợp pháp Các kỹ thuật này
có tể nói là chữa bệnh chứ không phòng bệnh Rõ ràng là sẽ tốt hơn nếu ngăn ngay từđầu những hành vi bất hợp pháp, như vậy một ứng dụng kiểm soát sao chép ngănkhông cho tạo các bản sao bất hợp pháp từ nội dung đã có bản quyền
Mã hóa cũng có thể dùng để cài đặt cho ứng dụng dạng này Tài liệu được mãhóa với một khóa duy nhất, nếu không có khóa thì không dùng được Tuy nhiên khóanày được cung cấp theo kiểu khó mà sao chép hay phân phối lại (nhằm hạn chế thếpnhất khả năng khách hàng cho khóa của họ cho người khác xài miễn phí) Ví dụ, nhiềusóng TV được mã hóa, khóa giải mã được tích hợp vào một thẻ thông minh (smartcard) cho các khách hàng nào trả tiền Thẻ thông tin được giấu vào hộp antene của TV.Nếu ai đó cố tình xem hay thu sóng mà không có thẻ thông minh card chắc chắn chỉthấy hình nhiễu Điều đáng quan tâm là mã hóa không thực sự giải quyết tốt ứng dụngnày, vì chúng dễ bị phá bằng ba cách sau: Thứ nhất, cố giải mã tín hiệu với hàng triệutrường hợp khóa có thể Tuy nhiên nếu khóa ≥ 50 bit thì điều này không thực hiệnđược Thứ hai, dùng công nghệ đảo phần mềm hay phần cứng chứa khóa (Giống nhưcrack phần mềm) Ví dụ như chương trình DeCSS của Jon Johanasen và hai cộng sựngười Đức CSS (Content Scrambling System ) là hệ thống mã hoá dùng để chống ghiDVD bất hợp pháp Jon đã dùng công nghệ đảo áp dụng cho một đầu đọc DVD và tìmkhóa giải mã của nó Sau đó bất kỳ video nào đã được mã hóa cũng có thể được giải
mã Cách thứ ba là trả tiền để có một khóa rồi sao chép nội dung đã được giải mã Một
kẻ trộm muốn thu và phát lại sóng vệ tinh chỉ cần đăng ký là khách hàng, mua một thẻthông minh, nối đầu đọc với đầu thu, cứ thể thu lại nội dung đã được giải mã Ví dụnày chỉ ra yếu kém chính của bảo vệ nội dung sử dụng mã hóa: Một nội dung muốn
Trang 21dùng được cần phải giải mã, khi đã được giải mã rồi, tất cả các bảo vệ coi như khôngcòn.
Điều chúng ta cần là làm sao cho dữ liệu media xem được nhưng vẫn ngănkhông cho thu lại Một kỹ thuật làm được điều này, trong trường hợp video NTSC đó
là quy trình chống sao chép videocassette của Marovision Quy trình này sửa tín hiệuvideo sao cho làm rối loạn điều khiển trên VCRs Tín hiệu thu được có thể xem tốttrên TV nhưng với VCR nó sẽ tạo ra những thứ kông thể xem được Tuy nhiên, kỹthuật này chỉ áp dụng cho tím hiệu TV tuần tự , không được cho audio và các kiểu tínhiệu số khác Do vậy mặc dù hệ thống của Macrovision thích hợp để chống thu videobất hợp pháp bằng VCRs, nó lại không dùng được cho đầu DVDs, VCRs số, hay các
kỹ thuật thu video số khác
Do các Watermark được nhúng trong nội dung nên chúng có mặt khi có nộidung và như vậy nó cung cấp một phương pháp tốt hơn để cài đặt các ứng dụng kiểmsoát sao chép Nếu mọi thiết bị thu được gắn bộ dò Watermark , việc thu có thể bị cácthiết bị thu ngăn cản khi chúng dò ra một Watermark dạng như “không được chép”.Một hệ thống như vậy đã được “Copy protection Technical Working Group”(CPTWG) dùng cho đầu video DVD và SDMI dùng cho audio
Vấn đề đặt ra là làm sao bảo đảm rằng mọi đầu thu chứa bộ dò Watermark.Chẳng có động lực tự nhiên nào để các nhà sản xuất đầu thu lại bỏ thêm chi phí để tíchhợp bộ dò vào sản phẩm của họ Trong thực tế, theo cách nhìn của khách hàng thì bộ
dò Watermark chỉ làm chỉ làm giảm giá trị của đầu thu vì dĩ nhiên họ muốn thiết bịcủa mình có thể sao chép được bất kì tài liệu nào họ muốn (Cho dù điều đó là khônghợp pháp)
Giải pháp trực tiếp cho vấn đề này đòi hỏi luật quy định các đầu thu phải có bộ
dò Watermark Tuy nhiên, cho đến bây giờ thì chưa có luật nào như vậy, và thỏa yêucầu đó là cả một vấn đề vì nó cần sự tham gia tất cả các quốc gia Vì lẽ này, CPTWG
và SDMI đều không phụ thuộc luật nói trên CPTWG và SDMI đưa ra yêu cầu vàocam kết tác quyền là “Nhà sản xuất đầu thu nào sử dụng kỹ thuật của họ phải có bộdò” Cách tiếp cận này phù hợp ở chỗ nó dưa trên những luật đã có sẵn trên hầu hếtcác nước Bất lợi của nó là nó cho phép nhà sản xuất tạo ra bộ thu không chứa bộ dòWatermark khi họ không dùng kỹ thuật có đề cập yêu cầu đó Một giải pháp dung hòa
là cho phép lưu hành cả hai hai loại thiết bị (có và không cài Watermarking): Chẳng