Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ (LV thạc sĩ)
Trang 1Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
Trang 2Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Tôi xin cam đoan luận văn "Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ " là kết quả nghiên cứu của riêng
tôi Các số liệu, kết quả nêu trong luận văn là trung thực Đƣợc các tác giả cho phép tham khảo và sử dụng các tài liệu đăng tải trên các tác phẩm, tạp chí và các trang Web theo danh mục tài liệu tham khảo của luận văn
Thái Nguyên, ngày 15 tháng 05 năm 2015
Nguyễn Niên
Trang 3Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Để hoàn tất một luận văn thạc sĩ yêu cầu sự tập trung, sự cố gắng và độc lập nghiên cứu Bản thân tôi sau những năm tháng học tập vất vả và nghiên cứu cũng đã cố gắng để hoàn thành được luận văn này Tôi luôn ghi nhận những sự đóng góp giúp đỡ nhiệt tình của những người bên cạnh mình,
sự ủng hộ, hỗ trợ của bố mẹ bạn bè giúp tôi có thêm động lực để hoàn thành khóa luận tốt nghiệp, nhân đây tôi muốn gửi lời cảm ơn nhất tới họ
Lời đầu tiên em gửi lời cảm ơn chân thành và sâu sắc nhất đến PGS.TS Bùi Thế Hồng thầy đã tận tụy hướng dẫn, động viên, giúp đỡ em trong suốt thời gian thực hiện luận văn
Em xin chân thành cảm ơn quý Thầy Cô Khoa Công Nghệ Thông Tin Trường Đại học Công Nghệ và Truyền Thông Thái Nguyên đã truyền đạt kiến thức quý báu cho chúng em trong những năm học vừa qua
Chân trọng cảm ơn đến Bố, Mẹ, luôn là nguồn động viên trên mỗi bước đường học vấn Xin chân thành cảm ơn tập thể lớp K12G đã ủng hộ, giúp đỡ
và động viên tôi trong thời gian học tập và nghiên cứu luận văn
Mặc dù tôi đã cố gắng hoàn thành luận văn trong phạm vi và khả năng cho phép nhưng chắc chắn sẽ không tránh khỏi những thiếu sót Tôi kính mong
nhận được sự cảm thông và tận tình chỉ bảo của quý Thầy Cô và các bạn
Thái Nguyên, ngày 20 tháng 06 năm 2015
Học viên
Nguyễn Niên
Trang 4Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
LỜI CAM ĐOAN i
LỜI CẢM ƠN iii
MỤC LỤC iv
DANH SÁCH CÁC CHỮ VIẾT TẮT vi
DANH SÁCH HÌNH VẼ vii
MỞ ĐẦU 1
Chương 1: GIỚI THIỆU CHUNG VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN TRÊN ẢNH SỐ 4
1.1 Giới thiệu chung 4
1.2 Giấu tin là gì và vài nét về lịch sử giấu tin 5
1.2.1 Định nghĩa 5
1.2.2 Phân loại các kỹ thuật giấu tin 6
1.3 Mô hình kỹ thuật giấu tin và một số thuật ngữ cơ bản 7
1.4 Một số ứng dụng đang được triển khai 9
1.5 Giấu tin trong dữ liệu đa phương tiện 11
1.5.1 Giấu tin trong ảnh 11
1.5.2 Giấu tin trên ảnh tĩnh 13
1.6 Giới thiệu chung về kỹ thuật thuỷ vân 16
1.6.1 Thủy vân số (Watermarking) và Giấu tin mật ( Steganography) 16
1.6.2 Các yêu cầu cơ bản của hệ thuỷ vân trên ảnh 19
1.7 Những tấn công trên hệ thuỷ vân 21
1.8 Những khuynh hướng tiếp cân của kỹ thuật thuỷ vân 22
1.8.1 Hướng tiếp cận dựa trên miền không gian ảnh 22
1.8.2 Hướng tiếp cận dựa trên miền tần số của ảnh 23
1.9 Một số kỹ thuật bổ trợ cho kỹ thuật thuỷ vân số trên ảnh 24
Chương 2: KỸ THUẬT THỦY VÂN ẢNH SỐ DỰA VÀO CÁC PHÉP BIẾN ĐỔI 26
2.1 Các phép biến đổi miền không gian ảnh sang miền tần số 26
2.1.1 Phép biến đổi Fourier rời rạc 26
2.1.2 Phép biến đổi Cosin rời rạc 27
2.1.3 Phép biến đổi sóng nhỏ (Wavelet) 28
Trang 5Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
2.1.5 Kỹ thuật trải phổ trong truyền thông 31
2.1.6 Các kỹ thuật kiểm định thuỷ vân 33
2.2 Mô hình thị giác người 34
2.2.1 Nhạy cảm về sự tương phản 35
2.2.3 Nhạy cảm về tần số 36
2.2.4 Mặt nạ thị giác 38
Chương 3: THIẾT KẾ CHƯƠNG TRÌNH THỦY VÂN ẢNH SỐ DỰA VÀO PHÉP BIẾN ĐỔI SÓNG NHỎ SỬ DỤNG CÁC ĐẶC TRƯNG CỦA HỆ THỐNG THỊ GIÁC CỦA CON NGƯỜI 39
3.1 Cài đặt một số thuật toán thủy vân dựa vào phép biến đổi sóng nhỏ sử dụng các đặc trưng của hệ thống thị giác của con người 39
3.2 Các độ đo chất lượng mang tính nhận thức 43
3.3 Thiết kế chương trình chạy thử 44
3.3.1 Chương trình nhúng 44
3.3.2 Chương trình trích thủy vân 49
3.3.3 Chương trình kiểm tra 52
KẾT LUẬN 56
TÀI LIỆU THAM KHẢO 58
Trang 6Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
CSF Contrast Sensitivity Function Hàm nhạy cảm tương phản
DCT Discrete Cosine Transform Biến đổi cosine rời rạc
DFT Discrete Fourier Transform Biến đổi Fourier
DWT Discrete Wavelet Transform Biến đổi sóng nhỏ rời rạc
HVS Human visual system Hệ thống trực quan của con người MSE Mean squared error Sai số bình phương trung bình
NC Normalized Correlation Hệ số tương quan
PSNR Peak Signal to noise ration Tỷ số tín hiệu cực đại trên nhiễu
HH Horizontally and vertically
high - pass
Theo chiều ngang và theo chiều dọc cao - vượt qua
HL Horizontally high - pass and
vertically low - pass
Theo chiều ngang cao - qua và theo chiều dọc thấp - qua
LH Horizontally low - pass and
vertically high pass
Theo chiều ngang thấp - qua và theo chiều dọc cao - qua
LL Horizontally and vertically low
– pass
Theo chiều ngang và theo chiều dọc thấp - vượt qua
Trang 7Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Hình 1.1 Phân loại các kỹ thuật giấu tin 7
Hình 1.2 Lược đồ chung cho quá trình giấu tin 7
Hình 1.3 Lược đồ cho quá trình giải mã 8
Hình 1.4 Hai ảnh trước và sau khi giấu tin giống hệt nhau 10
Hình 1.5 Thực chất bên trong ảnh đã giấu có chứa thông tin của người chủ sở hữu 10
Hình 1.6 Phân loại các kỹ thuật thuỷ vân 17
Hình 1.7 Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số của Mỹ) 18
Hình 1.8 Ảnh Lena đã được nhúng thuỷ vân là logo ở hình bên phải 19
Hình 2.1 Cấu trúc phân tích 30
Hình 2.2 Ảnh được phân tích 30
Hình 2.3 Vấn đề thuỷ vân dưới góc nhìn của truyền thông 33
Hình 2.4 Ngưỡng biến đổi nhỏ nhất mà con ngườicảm nhận được với các độ chói I khác nhau 35
Hình 2.5 Hàm nhạy cảm tương phản dựa trên mẫu của Mannos và Sakrison 37
Hình 2.6 Sự cảm nhận ba màu của thị giác người 37
Hình 2.7 Độ nhạy cảm của mắt người với các tần số thời gian khác nhau 38
Hình 3.1 Lược đồ đề xuất cho thủy vân ảnh 41
Hình 3.2 Nhúng thủy vân vào các hệ số sóng nhỏ dương 42
Trang 8Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
MỞ ĐẦU
ĐẶT VẤN ĐỀ
Thủy vân số là phương pháp nhúng một lượng thông tin nào đó vào một sản phẩm đa phương tiện cấn được bảo vệ quyền sở hữu mà không làm ảnh hưởng nhiều đến chất lượng của sản phẩm Thủy vân số hứa hẹn một giải pháp cho vấn đề bảo vệ bản quyền đối với sản phẩm số khi sản phẩm đó được
sử dụng trong môi trường mở mà không cần đến việc mã hóa Thủy vân phải tồn tại bền vững với sản phẩm và phải không được loại bỏ bằng bất kỳ những tấn công có chủ đích hay không chủ đích nào trừ khi phá hủy sản phẩm Trong những năm gần đây sự bùng nổ của công nghệ thông tin, đặc biệt là
sự bùng nổ của Internet và các phương tiện dữ liệu số (như các bức ảnh, các audio, video ), đã mang lại nhiều thuận lợi cho người sử dụng, nhưng bên cạnh đó vấn đề ăn cắp bản quyền, xuyên tạc thông tin, truy cập thông tin trái phép… đang tăng, đòi hỏi không ngừng tìm các giải pháp mới hữu hiệu đảm bảo cho sự an toàn và bảo mật thông tin Như chúng ta biết, thông tin số được
sử dụng rộng rãi trong một môi trường mở Trong hoàn cảnh như thế, nhu cầu được bảo vệ bản quyền và sở hữu trí tuệ các sản phẩm số đã trở thành một vấn đề hết sức quan trọng và đang được sự quan tâm của giới khoa học và công nghệ Đây là một vấn đề nghiên cứu mới và phức tạp không chỉ ở trong nước mà còn với cả thế giới công nghệ thông tin Trong một vài năm trở lại đây đã có nhiều hội nghị quốc tế về vấn đề này và giải pháp được đưa ra là phương pháp thủy vân số Giải pháp này tuy mới đưa ra những đã nhận được
sự quan tâm rất lớn của các nhà khoa học và đã có nhiều những nghiên cứu trong lĩnh vực thủy vân số trong đó đã có nhiều những công trình nghiên cứu rất có giá trị về lĩnh vực này Các ứng dụng phổ biến của thủy vân số đang được nghiên cứu bao gồm bảo vệ bản quyền, in vân tay, nhận thức thông tin, phát hiện xuyên tạc, điều khiện truy cập và giấu thông tin mật
Trang 9Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Thủy vân trên ảnh số là một trong những kỹ thuật được phát triển sớm nhất trong các kỹ thuật thủy vân nói chung Thủy vân trên ảnh số giống như một ảnh được “dán tem” sở hữu của người chủ Thủy vân phải mang thông tin
có ý nghĩa xác định duy nhất người được sở hữu ảnh đó
Việc thủy vân có thể được thực hiện trực tiếp trên các điểm ảnh hoặc trên miền biến đổi của ảnh Hiện tại, người ta đã sử dụng các phép biến đổi rời rạc như phép biến đổi Fourier (DFT), phép biến đổi cosine(DCT) và phép biến đổi sóng nhỏ (DWT) Các kỹ thuật thủy vân dựa vào DCT và DWT đã được một số tác giả nghiên cứu và chứng tỏ khá bền vững trước những tấn công thông thường
Từ những phân tích trên và trong khuôn khổ của một luận văn thạc sỹ, tác
giả thực hiện đề tài "Bảo vệ bản quyền ảnh số bằng kỹ thuật thủy vân dựa vào phép biến đổi sóng nhỏ "
1 ĐỐI TƯỢNG PHẠM VI NGHIÊN CỨU
- Nghiên cứu, đánh giá kỹ thuật bảo vệ bản quyền ảnh số dựa vào các phép biến đổi sóng nhỏ
- Tìm hiểu các đặc trưng của hệ thống thị giác của con người nhằm phát triển các kỹ thuật giấu tin sao cho có thể giấu thông tin bản quyền vào các hệ
số biến đổi mà không ảnh hưởng đến chất lượng của ảnh dưới góc nhìn của thị giác con người
- Các công cụ lập trình và phần mềm dùng để cài đặt chương trình thử nghiệm
2 PHƯƠNG PHÁP NGHIÊN CỨU
- Nghiên cứu các tài liệu có liên quan về bảo vệ bản quyền ảnh số
- Tìm hiểu và phát hiện các vấn đề trong thực tế, so sánh, đánh giá và đưa ra giải pháp
- Cài đặt thử nghiệm trên những giải pháp được đưa ra
Trang 10Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Chương 3: Thiết kế chương trình thủy vân ảnh số dựa vào phép biến đổi sóng
nhỏ sử dụng các đặc trưng của hệ thống thị giác của con người
5 Ý NGHĨA KHOA HỌC CỦA ĐỀ TÀI
- Nghiên cứu, đánh giá kỹ thuật bảo vệ bản quyền dựa vào các phép biến đổi sóng nhỏ
- Cải tiến, phát triển kỹ thuật bảo vệ bản quyền dựa vào phép biến đổi sóng nhỏ rời rạc DWT kết hợp với các đặc trưng của hệ thống thị giác con người
Trang 11Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Chương 1:
GIỚI THIỆU CHUNG VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN
TRÊN ẢNH SỐ 1.1 Giới thiệu chung
Cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc sống của chúng ta Những thuận lợi mà thông tin kỹ thuật số mang lại cũng sinh ra những thách thức và cơ hội mới cho quá
trình đổi mới Sự ra đời những phần mềm có tính năng rất mạnh, các thiết bị
mới như máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in, máy ghi âm
kỹ thuật số, v.v, đã với tới thế giới tiêu dùng rộng lớn để sáng tạo, xử lý và
thưởng thức các dữ liệu đa phương tiện (multimedia data) Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình trao đổi thông tin
trong mọi lĩnh vực chính trị, quân sự, quốc phòng, kinh tế, thương mại Và chính trong môi trường mở và tiện nghi như thế đã xuất hiện những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu hiệu cho vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép v.v Đi tìm giải pháp cho những vấn đề này không chỉ giúp ta hiểu thêm
về công nghệ phức tạp đang phát triển rất nhanh này mà còn đưa ra những cơ hội kinh tế mới cần khám phá
Các giải pháp cho những vấn đề trên
Trong một quá trình phát triển lâu dài, nhiều phương pháp bảo vệ thông tin đã được đưa ra trong đó giải pháp dùng mật mã học là giải pháp được ứng dụng rộng rãi nhất Các hệ mã mật đã được phát triển nhanh chóng và được ứng dụng rất phổ biến cho đến tận ngày nay Thông tin ban đầu sẽ được mã hoá thành các ký hiệu vô nghĩa, sau đó sẽ được lấy lại thông qua việc giải mã nhờ khoá của hệ mã Đã có rất nhiều những hệ mã phức tạp được sử dụng như DES, RSA, NAPSACK và phương pháp này đã được chứng minh thực tế là rất hiệu quả và được ứng dụng phổ biến
Trang 12Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Nhưng ở đây ta không định nói về các hệ mã mật mà ta tìm hiểu về một phương pháp đã và đang được nghiên cứu và ứng dụng rất mạnh mẽ ở nhiều
nước trên thế giới đó là phương pháp giấu tin (data hiding) Đây là phương pháp mới và phức tạp, nó đang được xem như một công nghệ chìa khoá cho
vấn đề bảo vệ bản quyền, nhận thực thông tin và điều khiện truy cập ứng dụng trong an toàn và bảo mật thông tin
Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là phương pháp mã hoá làm cho các thông tin hiện rõ có được mã hoá hay không vì tín hiệu thu được toàn những ký hiệu vô nghĩa còn đối với phương pháp giấu thông tin thì người ta sẽ khó biết được là có thông tin giấu bên trong Một khi những thông tin mã hoá bị phát hiện thì những tên tin tặc sẽ tìm mọi cách để triệt phá Và cuộc chạy đua giữa những người bảo vệ thông tin và bọn tin tặc vẫn chưa kết thúc tuyệt đối về bên nào Trong hoàn cảnh đó thì giấu thông tin trở thành một phương pháp hữu hiệu
Giấu thông tin, xét theo khía cạnh tổng quát thì cũng là một hệ mã mật, nhằm đảm bảo tính an toàn thông tin Phương pháp này ưu điểm là ở chỗ việc gửi đi những bức ảnh thông thường sẽ không gây ra sự chú ý của người khác
Sự vô hình của thông tin chứa trong ảnh sẽ đánh lừa được sự phát hiện của những tên tin tặc Giấu tin trong ảnh và hệ mã mật có quan hệ mật thiết với nhau, cùng xây dựng nên một hệ thống an toàn và bảo mật thông tin
1.2 Giấu tin là gì và vài nét về lịch sử giấu tin
1.2.1 Định nghĩa
Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào
đó vào trong một đối tượng dữ liệu số khác
Kỹ thuật giấu thông tin nhằm hai mục đích: một là bảo mật cho dữ liệu được đem giấu, hai là bảo mật cho chính đối tượng được dùng để giấu tin Hai mục đích khác nhau này dẫn đến hai khuynh hướng kỹ thuật chủ yếu của giấu tin Khuynh hướng thứ nhất là giấu tin mật (steganography), khuynh hướng này tập trung vào các kỹ thuật giấu tin sao cho giấu được nhiều thông tin và
Trang 13Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
quan trọng là người khác khó phát hiện được một đối tượng có bị giấu tin bên trong hay không Khuynh hướng thứ hai là thuỷ vân số (watermarking) Khuynh hướng thuỷ vân số có miền ứng dụng lớn hơn nên được quan tâm nghiên cứu nhiều hơn và thực tế đã có rất nhiều những kỹ thuật dành cho khuynh hướng này [2]
1.2.2 Phân loại các kỹ thuật giấu tin
Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đây nên xu hướng phát triển vẫn chưa ổn định Nhiều phương pháp mới, theo nhiều khía cạnh khác nhau đang và chắc chắn sẽ được đề xuất, bởi vậy một định nghĩa chính xác, một sự đánh giá phân loại rõ ràng chưa thể có được Một số tác giả đã đưa ra các cách đánh giá phân loại, thậm chí các định nghĩa, nhưng không lâu sau lại có các định nghĩa khác, một sự phân loại khác được đề xuất Sơ đồ phân loại trên Hình 1.1 được Fabien A P Petitcolas đề xuất năm 1999
Sơ đồ phân loại này như một bức tranh khái quát về ứng dụng và kỹ thuật giấu thông tin Dựa trên việc thống kê sắp xếp khoảng 100 công trình đã công bố trên một số tạp chí, cùng với thông tin về tên và tóm tắt nội dung của khoảng 200 công trình đã công bố trên internet, có thể chia lĩnh vực giấu dữ liệu ra làm hai hướng lớn, đó là watermarking và steganography Nếu như watermark quan tâm nhiều đến các ứng dụng giấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu (trước các biến đổi thông thường của tệp dữ liệu môi trường) thì steganography lại quan tâm tới các ứng dụng che giấu các bản tin đòi hỏi độ mật và dung lượng càng lớn càng tốt Đối với từng hướng lớn này, quá trình phân loại theo các tiêu chí khác có thể tiếp tục được thực hiện, ví dụ dựa theo ảnh hưởng các tác động từ bên ngoài có thể chia watermark thành hai loại, một loại bền vững với các tác động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: phải dễ bị phá huỷ trước các tác động nói trên Cũng có thể chia watermark theo đặc tính, một loại cần được che dấu để chỉ có một số những người tiếp xúc với nó có thể
Trang 14Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
thấy được thông tin, loại thứ hai đối lập, cần được mọi người nhìn thấy Chi tiết hơn về vấn đề này sẽ được trình bày trong phần sau [2]
Hình 1.1 Phân loại các kỹ thuật giấu tin
1.3 Mô hình kỹ thuật giấu tin và một số thuật ngữ cơ bản
Mô hình của kỹ thuật giấu tin cơ bản được mô tả trong các Hình 1.2 và 1.3 Trong đó, Hình 1.2 biểu diễn quá trình giấu tin cơ bản Phương tiện chứa bao gồm các đối tượng được dùng làm môi trường để giấu tin như text, audio, video, ảnh …
Bộ nhúng thông tin
Phương tiện chứa
đã được giấu tin
Phân phối
Kho
á
Infomation hiding
Giấu thông tin
Robust Copyright marking
Thuỷ vân bền vững
Imperceptible Watermarking
Thuỷ vân “dễ vỡ”
Visible Watermarking
Thuỷ vân hiển
Trang 15Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Thông tin cần giấu là một lượng thông tin mang một ý nghĩa nào đó tuỳ thuộc vào mục đích của người sử dụng Thông tin sẽ được giấu vào trong phương tiện chứa nhờ một bộ nhúng Bộ nhúng là những chương trình, những thuật toán để giấu tin và được thực hiện với một khoá bí mật giống như các hệ
mã mật cổ điển Sau khi giấu tin ta thu được phương tiện chứa đã giấu và được phân phối sử dụng trên mạng
Hình 1.3 chỉ ra các công việc giải mã thông tin đã giấu Quá trình giải
mã được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quá trình nhúng Kết quả thu được gồm phương tiện chứa gốc và thông tin đã giấu Bước tiếp theo thông tin giấu sẽ được xử lí kiểm định so sánh với thông tin giấu ban đầu
Hình 1.3 Lược đồ cho quá trình giải mã
Một số thuật ngữ cơ bản:
datahiding: là thuật ngữ chỉ kỹ thuật giấu tin nói chung bao gồm cả giấu
tin mật và thuỷ vân số
steganography: chỉ kỹ thuật giấu tin mật trong một đối tượng
watermarking: thuỷ vân số, chỉ những kỹ thuật giấu tin dùng để bảo vệ
đối tượng chứa thông tin giấu
Kiểm định
Phương tiện chứa (audio, ảnh, video)
Thông tin giấu
Bộ giải
mã tin
Phương tiện chứa đã được giấu tin
Khoá
Trang 16Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
phương tiện chứa (host signal): là phương tiện gốc được dùng để nhúng
thông tin Trong dấu thông tin trong ảnh thì nó mang tên ảnh chứa, còn trong audio là audio chứa v.v
thông tin cần giấu (embeded data): là lượng thông tin được nhúng vào
trong phương tiện chứa Trong giấu tin mật (steganography), thông tin giấu được gọi là thông điệp giấu (message), còn trong kỹ thuật thuỷ vân số thì thông tin giấu được gọi là thuỷ vân (watermark)
1.4 Một số ứng dụng đang được triển khai
Bảo vệ bản quyền tác giả (copyright protection): Đây là ứng dụng cơ bản
nhất của kỹ thuật thuỷ vân số (digital watermarking) - một dạng của phương pháp giấu tin Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video và cần được lưu thông trên mạng Để bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm
Trang 17Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
a) Ảnh hoa hồng gốc b) Ảnh hoa hồng sau khi giấu
thông tin bản quyền
Hình 1.4 Hai ảnh trước và sau khi giấu tin giống hệt nhau
Hình 1.5 Thực chất bên trong ảnh đã giấu có chứa thông tin của người chủ sở hữu
Nhận thực thông tin hay phát hiện xuyên tạc thông tin
(authentication and tamper detection):
Một tập các thông tin sẽ được giấu trong phương tiện chứa sau đó được
sử dụng để nhận biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không Các thuỷ vân nên được ẩn để tránh được sự tò mò của kẻ thù, hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên
Trang 18Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
tạc nội dung hay là chỉ bị nén mất dữ liệu) Yêu cầu chung đối với ứng dụng
này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững
Giấu vân tay và dán nhãn (fingerprinting and labeling):
Thuỷ vân trong những ứng dụng này đựơc sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân tránh sự xoá giấu vết trong khi phân phối
Kiểm soát sao chép (copy control):
Các thuỷ vân trong những trường hợp này được sử dụng để kiểm soát sao chép đối với các thông tin Các thiết bị phát hiện ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc/ghi Ví dụ như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật Các ứng dụng loại này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc
Giấu tin mật (steganography):
Các thông tin giấu được trong những trường hợp này càng nhiều càng tốt, việc giải mã để nhận được thông tin cũng không cần phương tiện chứa ban đầu Các yêu cầu mạnh về chống tấn công của kẻ thù không cần thiết lắm thay vào đó là thông tin giấu phải được giấu kín
1.5 Giấu tin trong dữ liệu đa phương tiện
1.5.1 Giấu tin trong ảnh
Giấu thông tin trong ảnh, hiện nay, là một bộ phận chiếm tỉ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong các hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiện truy cập, giấu thông
Trang 19Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
tin mật Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của các nhà cá nhân, tổ chức, trường đại học, và viện nghiên cứu trên thế giới Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi
và chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa Và ngày nay, khi ảnh số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh đã đem lại rất nhiều những ứng dụng quan trọng trên nhiều lĩnh vực trong đời sống xã hội Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng Phần mềm WinWord của MicroSoft cũng cho phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính
an toàn của thông tin Tài liệu sau đó được truyền trực tiếp qua máy fax hoặc lưu truyền trên mạng Theo đó, việc nhận thực chữ kí, xác thực thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào Thêm vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính, các thông tin này được số hoá và lưu trữ trong hệ thống máy tính hay trên mạng Chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng Việc nhận thực cũng như phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng và cấp thiết Một đặc điểm của giấu thông tin trong ảnh đó là thông tin được giấu trong ảnh một cách vô hình, nó như là một cách truyền thông tin mật cho nhau mà người khác không thể biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay đổi, đặc biệt đối với ảnh mầu hay ảnh xám Gần đây báo chí đã đưa tin vụ việc ngày 11-9 gây chấn động nước Mỹ và toàn thế giới, chính tên trùm khủng bố quốc tế Osma BinLaDen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với đồng bọn, và đã qua mặt được Cục tình báo trung ương Mỹ CIA và
Trang 20Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
các cơ quan an ninh quốc tế Chắc chắn sau vụ việc này, việc nghiên cứu các
vấn đề liên quan đến giấu thông tin trong ảnh sẽ rất được quan tâm
1.5.2 Giấu tin trên ảnh tĩnh
Qua phần trên, chúng ta đã nắm bắt được một số khái niệm cơ bản của giấu tin Trong phần này chúng ta sẽ đi sâu tìm hiểu vấn đề giấu tin trong ảnh, lần lượt xem xét những nội dung sau:
Giấu thông tin trong ảnh, những đặc trưng và tính chất
Giấu thông tin trong ảnh đen trắng và ảnh màu, ảnh đa cấp xám
Cấu trúc ảnh Bitmap
Một số kỹ năng xử lí ảnh trong kỹ thuật giấu tin
Chúng ta chú ý là khi ta nói đến kỹ thuật giấu tin có nghĩa là ta đang nói đến giấu tin thông mật (khái niệm steganography) còn ở phần sau chúng
ta sẽ nói đến kỹ thuật thuỷ vân số (watermarking) và cả hai kỹ thuật này đều thuộc lĩnh vực giấu tin (datahiding)
Giấu tin trong ảnh, những đặc trưng và tính chất
Như đã được giới thiệu ở trên, giấu tin trong ảnh chiếm vị trí chủ yếu trong các kỹ thuật giấu tin chính vì vậy mà các kỹ thuật giấu tin phần lớn cũng tập trung vào các kỹ thuật giấu tin trong ảnh Các phương tiện chứa khác nhau thì cũng sẽ có các kỹ thuật giấu khác nhau Đối tượng ảnh là một đối tượng dữ liệu được tri giác tĩnh có nghĩa là dữ liệu tri giác không biến đổi theo thời gian ( không giống như audio và video ) và có nhiều định dạng cũng như tính chất của các ảnh khác nhau nên các kỹ thuật giấu tin trong ảnh phải chú ý những đặc trưng và các tính chất cơ bản sau đây:
Phương tiện chứa có dữ liệu tri giác tĩnh:
Dữ liệu gốc ở đây là dữ liệu của ảnh tĩnh, dù đã giấu thông tin vào trong ảnh hay chưa thì khi ta xem ảnh bằng thị giác, dữ liệu ảnh không thay đổi theo thời gian, điều này khác với dữ liệu audio hay là video vì khi ta nghe hay xem thì dữ liệu gốc sẽ thay đổi liên tục với tri giác của con người theo các đoạn hay
Trang 21Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
các bài, các cảnh Sự khác biệt này ảnh hưởng lớn đối với các kỹ thuật giấu thông tin trong ảnh với kỹ thuật giấu thông tin trong audio hay video
Kỹ thuật giấu phụ thuộc ảnh
Kỹ thuật giấu tin phụ thuộc vào các loại ảnh khác nhau Chẳng hạn như đối với ảnh đen trắng, ảnh xám hay ảnh màu ta cũng có những kỹ thuật riêng
do các loại ảnh có những đặc trưng khác nhau (sẽ được trình bày kỹ hơn ở phần sau) Ảnh nén và ảnh không nén cũng có những kỹ thuật giấu khác nhau
vì ảnh nén có thể mất mát thông tin ảnh do nén ảnh…
Kỹ thuật giấu tin lợi dụng tính chất hệ thống thị giác của con người:
Giấu tin trong ảnh ít nhiều cũng gây ra những thay đổi trên giữ liệu ảnh gốc Giữ liệu ảnh được quan sát bằng hệ thống thị giác (HVS - Human Vision System) của con người nên các kỹ thuật giấu tin phải đảm bảo một yêu cầu cơ bản là những thay đổi trên ảnh phải rất nhỏ sao cho bằng mắt thường không thể nhận ra được sự thay đổi đó vì có như thế thì mới đảm bảo được độ an toàn cho thông tin giấu Rất nhiều các kỹ thuật đã lợi dụng các tính chất của
hệ thống thị giác để giấu tin chẳng hạn như mắt người cảm nhận về sự biến đổi về độ chói kém hơn sự biến đổi về màu hay cảm nhận của mắt về màu xanh da trời (Blue) là kém nhất trong ba màu cơ bản RGB…
Giấu thông tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay đổi kích thước ảnh:
Các phép toán thực hiện công việc giấu thông tin sẽ được thực hiện trên
dữ liệu của ảnh Dữ liệu ảnh bao gồm cả phần header, bảng màu (có thể có)
và dữ liệu ảnh Khi giấu thông tin, các phương pháp giấu đều biến đổi các giá trị của các bit trong dữ liệu ảnh chứ không thêm vào hay bớt đi dữ liệu ảnh
Do vậy mà kích thước ảnh trước hay sau khi giấu thông tin là như nhau
Trang 22Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Đảm bảo yêu cầu chất lượng ảnh sau khi giấu thông tin:
Đây là một yêu cầu quan trọng đối với giấu thông tin trong ảnh Sau khi giấu thông tin bên trong, ảnh phải đảm bảo được yêu cầu không bị biến đổi để
có thể bị phát hiện dễ dàng so với ảnh gốc Yêu cầu này dường như khá đơn giản đổi với ảnh màu hoặc ảnh xám bởi mỗi một pixel ảnh được biểu diễn bởi nhiều bit, nhiều giá trị và khi ta thay đổi một giá trị nhỏ nào đó thì chất lượng ảnh không thay đổi, thông tin giấu khó bị phát hiện, nhưng đối với ảnh đen trắng thì việc giấu thông tin phức tạp hơn nhiều, vì ảnh đen trắng mỗi pixel ảnh chỉ gồm hai giá trị hoặc trắng hoặc đen, và nếu ta biến đổi một bit từ đen thành trắng mà không khéo thì sẽ rất dễ bị phát hiện Do đó yêu cầu đối với các thuật toán giấu thông tin trong ảnh màu hay ảnh xám và giấu thông tin trong ảnh đen trắng là khác nhau Trong khi đối với ảnh màu thì các thuật toán chú trọng vào việc làm sao cho giấu được càng nhiều thông tin càng tốt thì các thuật toán áp dụng cho ảnh đen trắng lại tập trung vào làm thế nào để thông tin giấu khó bị phát hiện
Thông tin trong ảnh sẽ bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh:
Vì phương pháp giấu ảnh dựa trên việc điều chỉnh các giá trị của các bit theo một qui tắc nào đó và khi giải mã sẽ theo các giá trị đó để tìm được thông tin giấu Theo đó, nếu một phép biến đổi nào đó trên ảnh làm thay đổi giá trị của các bit thì sẽ làm cho thông tin giấu sẽ bị sai lệch Chính đặc điểm này mà giấu thông tin trong ảnh có tác dụng nhận thực và phát hiện xuyên tạc thông tin
Cần ảnh gốc khi giải mã ảnh ?
Các kỹ thuật giấu tin phải phân biệt rõ ràng quá trình giải mã ảnh để lấy thông tin giấu có cần ảnh gốc hay không Đa số các kỹ thuật giấu tin mật thì thường không cần ảnh gốc khi giải mã Thông tin được giấu trong ảnh sẽ được mang cùng với dữ liệu ảnh, khi giải mã chỉ cần ảnh đã mang thông tin giấu mà không cần dùng đến ảnh gốc để so sánh đối chiếu
Trang 23Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Thủy vân số trên ảnh tĩnh
Như chúng ta đã biết, giấu tin trong ảnh (datahiding) có hai hướng nghiên cứu chủ yếu là giấu tin mật (steganography) và thuỷ vân số (watermarking) Trong các phần 2, chúng ta đã tìm hiểu các khái niệm cơ bản
về giấu tin mật, những đặc điểm, tính chất và một số thuật toán giấu tin Hướng nghiên cứu thứ hai là thuỷ vân số sẽ được trình bày trong các phần sau đây Cụ thể, chúng ta tìm hiểu những vấn đề cơ bản sau đây của thuỷ vân số
Phân biệt giữa Steganography và Watermarking
Các yêu cầu cơ bản của một hệ thuỷ vân số ẩn
Các tấn công trên thuỷ vân
Phân loại các kỹ thuật thuỷ vân theo ứng dụng
Những khuynh hướng tiếp cận của các kỹ thuật thuỷ vân
Một số kỹ thuật bổ trợ cho thuỷ vân
1.6 Giới thiệu chung về kỹ thuật thuỷ vân
1.6.1 Thủy vân số (Watermarking) và Giấu tin mật ( Steganography)
Như đã giới thiệu ở phần trước, tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể hiện ở hai khía cạnh Một là bảo vệ cho dữ liệu đem giấu và hai là bảo vệ cho chính đối tượng được sử dụng để giấu tin Tương ứng với hai khía cạnh đó chúng ta có hai khuynh hướng kỹ thuật rõ ràng đó là giấu tin mật (steganography) và thuỷ vân số (watermarking) Từ
“thuỷ vân” có xuất xứ từ kỹ thuật đánh dấu nước thời xưa Kỹ thuật này là kỹ thuật đánh dấu chìm một hình ảnh logo nào đó lên trên giấy nhằm mục đích trang trí và phân biệt được xuất xứ của sản phẩm giấy [1]
Trong kỹ thuật giấu tin mật, thông tin cần giấu được gọi là thông điệp (message) còn trong kỹ thuật thuỷ vân số thì được gọi là thuỷ vân (watermark) Thuỷ vân có thể là một chuỗi các kí tự, hay một hình ảnh, logo nào đó
Trang 24Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiện sao chép v.v…Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại
có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng
có những tính năng khác biệt tương ứng:
Hình 1.6 Phân loại các kỹ thuật thuỷ vân
Các kỹ thuật thuỷ vân trên Hình 1.6 được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó Thuỷ vân
“dễ vỡ” (fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân
bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ) Các kỹ thuật thuỷ vân
có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin (authentication) và phát hiện xuyên tạc thông tin (tamper detection) Rất dễ hiểu vì sao những ứng dụng này cần đến kỹ thuật thuỷ vân dễ vỡ Ví dụ như
để bảo vệ chống xuyên tạc một ảnh nào đó ta nhúng một thuỷ vân vào trong ảnh và sau đó phân phối, quảng bá ảnh đó Khi cần kiểm tra lại ảnh ta sử dụng
hệ thống đọc thủy vân Nếu không đọc được thuỷ vân hoặc thuỷ vân đã bị sai
Robust Copyright marking
Thuỷ vân bền vững
Imperceptible Watermarking
Thuỷ vân ẩn
Watermarking
Thuỷ vân số
Fragile Watermarking
Thuỷ vân “dễ vỡ”
Visible Watermarking
Thuỷ vân hiện
Trang 25Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
lệch nhiều so với thuỷ vân ban đầu đã nhúng vào ảnh thì có nghĩa là có thể ảnh đó đã bị thay đổi Cái khó ở đây là ta phải phân biệt giữa sai lệch thuỷ vân do xuyên tạc và sai lệch do lỗi đường truyền Ngược lại, với kỹ thuật thuỷ vân dễ vỡ là kỹ thuật thuỷ vân bền vững (robust) Các kỹ thuật thuỷ vân bền vững thường được ứng dụng trong các ứng dụng bảo vệ bản quyền Trong những ứng dụng đó, thuỷ vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp Thuỷ vân được nhúng trong sản phẩm như một hình thức dán tem bản quyền Trong trường hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân Một yêu cầu lí tưởng đối với thuỷ vân bền vững là nếu muốn loại bỏ thuỷ vân thì chỉ có một cách duy nhất là phá huỷ sản phẩm
Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ vân hiện Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến mà chúng ta thường thấy VTV3, CCTV, TV5…Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc Đối với thuỷ vân hiện, thông tin bản quyền hiện thị ngay trên sản phẩm
Hình 1.7 Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số của Mỹ)
Trang 26Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Hình 1.8 Ảnh Lena đã được nhúng thuỷ vân là logo ở hình bên phải
Còn đối với thuỷ vân ẩn thì cũng giống như giấu tin, bằng mắt thường không thể nhìn thấy thuỷ vân Đây cũng là nội dung chính được trình bày trong cuốn sách này Trong vấn đề bảo vệ bản quyền, thuỷ vân ẩn mang tính
“bất ngờ” hơn trong việc phát hiện sản phẩm bị đánh cắp Trong trường hợp này, người chủ sở hữu hợp pháp sẽ chỉ ra bằng chứng là thuỷ vân đã được nhúng trong sản phẩm bị đánh cắp
1.6.2 Các yêu cầu cơ bản của hệ thuỷ vân trên ảnh
Hệ thuỷ vân số trên ảnh cũng là một hệ giấu tin nên cũng có một số đặc điểm và tính chất giống như giấu tin trong ảnh như:
Phương tiện chứa là ảnh hai chiều tĩnh,
Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi kích thước ảnh,
Kỹ thuật giấu phụ thuộc vào tính chất của hệ thống thị giác con người, Khi giải tin có thể cần ảnh gốc
Ngoài một số đặc điểm chung ra, kỹ thuật thuỷ vân số được phân biệt với kỹ thuật giấu tin mật ở những đặc trưng sau đây:
Thông tin trong ảnh có bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh? Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật thuỷ vân thì chỉ có trong trong loại thuỷ vân “dễ vỡ” Còn đối với loại thuỷ vân bền vững thì lại yêu cầu chống lại được những phép biến đổi thông thường trên ảnh
Trang 27Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Thuỷ vẩn ẩn hay thuỷ vân hiện ?
Không giống như giấu tin mật với yêu cầu bắt buộc là thông điệp giấu phải ẩn bên trong ảnh sao cho mắt thường không nhìn thấy được thì kỹ thuật thuỷ vân số lại có hai loại là thuỷ vân ẩn và thủy vân hiện Nghĩa là có loại thuỷ vân cho phép nhìn thấy được thông tin đem nhúng vào (trong trường hợp này ta dùng từ nhúng thay cho từ giấu thích hợp hơn) và có loại không nhìn thấy Loại thuỷ vân hiện được sử dụng cho mục đích công bố công khai về chủ quyền sở hữu, ngược lại, loại thuỷ vân ẩn được sử dụng với mục đích gài
bí mật các thông tin xác nhận chủ quyền sở hữu
Tính chất bền vững
Tính chất này là tính chất quan trọng nhất của một hệ thuỷ vân bền vững Nghĩa là hệ thuỷ vân phải chống lại được các phép biến đổi, hay các tấn công có chủ đích hoặc không có chủ đích lên thuỷ vân
Thuỷ vân cái gì?
Một câu hỏi đầu tiên đối với hệ thuỷ vân là thông tin gì sẽ được giấu vào bên trong ảnh? Kiểu thuỷ vân hay dùng nhất là một chuỗi các kỹ tự, chuỗi
kí tự được nhúng trực tiếp lên ảnh mang những thông tin như tác giả, tiêu đề hay ngày tháng, hay thông tin bản quyền…Tuy nhiên, sử dụng chuỗi kí tự lại
bị một hạn chế, đó là mỗi kỹ tự biểu diễn bằng nhiều bit nếu như vì một lí do nào đó một bit bị lỗi thì sẽ làm sai cả kí tự và do đó chỉ cần một phép biến đổi đơn giản như phép biến đổi JPEG cũng có thể làm cho thuỷ vân bị sai lệch rất nhiều Chúng ta cũng có thể dùng ảnh để giấu, khi đó ta sẽ có ảnh trong ảnh Khi giải tin thì một số điểm ảnh có thể sai nhưng hình tổng thể sẽ được giữ nguyên Trong những kỹ thuật gần đây, người ta sử dụng thuỷ vân là một chuỗi bit sinh ngẫu nhiên theo một luật phân phối xác suất nào đó Và sau đó
áp dụng các lí thuyết xác suất thông kê để chứng thực thuỷ vân Kỹ thuật này chúng ta sẽ tìm hiểu ở phần sau
Trang 28Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Trong các loại thuỷ vân thì thuỷ vân ẩn và bền vững là loại được quan tâm nghiên cứu nhiều nhất vì ý nghĩa ứng dụng lớn của nó như đã nói ở phần trên Do vậy, hai tính chất quan trọng nhất của hệ thuỷ vân mà các nhà nghiên cứu đang cố gắng đạt được là thuộc tính ẩn và thuộc tính bền vững Nhưng đây lại là mấu chốt của sự phức tạp vì hai thuộc tính này mâu thuẫn nhau Nếu như để đảm bảo thuộc tính ẩn, thuỷ vân phải được giấu trong những vị trí
ít có ý nghĩa tri giác nhất, ít bị chú ý nhất thì để đảm bảo được thuộc tính bền vững, thuỷ vân phải chịu được những phép xử lí ảnh phổ biến như dịch chuyển ảnh hay nén JPEG Ví dụ như phép nén JPEG loại bỏ ở ảnh những thông tin ít có tính tri giác nhất để làm giảm kích thước của ảnh mà vẫn đảm bảo được chất lượng ảnh Khi đó thì những dữ liệu của thuỷ vân nằm trong vùng này sẽ bị mất đi hoặc bị biến đổi sai lệch hoàn toàn Với tính phức tạp của yêu cầu cho một hệ thuỷ vân, phần sau đây chúng ta sẽ tìm hiểu những giải pháp kỹ thuật đã được đưa ra của các nhà khoa học trên thế giới
1.7 Những tấn công trên hệ thuỷ vân
Phương pháp thuỷ vân nên chống lại được một số phép xử lý ảnh thông thường và một số tấn công có chủ đích Cho đến nay vẫn chưa có một hệ thống thuỷ vân hoàn hảo và cũng không rõ ràng việc liệu có tồn tại hay không một hệ thống thuỷ vân an toàn tuyệt đối Vì vậy, trong thực tế thì thuỷ vân phải cân nhắc giữa bền vững với các thuộc tính khác như lượng thông tin giấu, tính ẩn…Dựa vào yêu cầu của ứng dụng mà sẽ ảnh hưởng đến phương pháp thuỷ vân Dựa vào những biến đổi có chủ đích hay không có chủ đích đối với hệ thuỷ vân mà ta có thể phân biệt thành hai nhóm xuyên tạc sau: một là các biến đổi được xem như là các nhiễu đối với dữ liệu hai là làm mất tính đồng bộ để không thể lấy tin ra được Hãy xem một vài phép thay đổi sau đây:
- Biến đổi tín hiệu: làm sắc nét, thay đổi độ tương phản, màu, gamma…
- Nhiễu cộng, nhiễu nhân…
- Lọc tuyến tính
Trang 29Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
- Nén mất thông tin
- Biến đổi affine cục bộ hoặc toàn cục
- Giảm dữ liệu:cropping, sửa histogram
- Chuyển mã (gif Jpeg)
- Chuyển đổi tương tự - số
- Thuỷ vân nhiều lần
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền vững sao cho các tấn công sẽ làm cho giá trị thương mại của ảnh gốc sẽ bị ảnh hưởng
1.8 Những khuynh hướng tiếp cân của kỹ thuật thuỷ vân
1.8.1 Hướng tiếp cận dựa trên miền không gian ảnh
Đây là hướng tiếp cận cơ bản và tự nhiên trong số các kỹ thuật thuỷ vân Miền không gian ảnh là miền dữ liệu ảnh gốc, tác động lên miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm ảnh Đây là hướng tiếp cận tự nhiên bởi lẽ khi nói đến việc giấu tin trong ảnh người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn Một phương pháp phổ biến của hướng tiếp cận này là phương pháp thay thể bit ít quan trọng nhất của mỗi điểm ảnh mà ta đã tìm hiểu trong các kỹ thuật giấu tin mật
Ý tưởng cơ bản của phương pháp thay thế bit ít quan trọng nhất LSB (Least Significant Bit) là chọn ra từ mỗi điểm ảnh các bit có ít ý nghĩa nhất về mặt tri giác để sử dụng cho việc giấu tin Bit nào được coi là ít tri giác nhất và bao nhiêu bit có thể được lấy ra để thay thế thì phụ thuộc vào tính chất hệ thống thị giác cuả con người và phụ thuộc vào nhu cầu về chất lượng ảnh trong các ứng dụng Ví dụ, trong ảnh 24 bit màu, mỗi màu được biểu diễn bởi
24 bit tương ứng với ba màu RGB, mỗi màu chiếm 1 byte Người ta sử dụng một tính chất của mắt người là sự cảm nhận về màu B (Blue) kém hơn so với hai màu RG, chính vì thế mà người ta thường chọn bit cuối cùng trong 8 bit biểu diễn màu B của mỗi điểm ảnh để giấu tin Thay đổi bit cuối cùng trong 8
Trang 30Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
bit biểu diễn màu B chỉ làm cho giá trị biểu diễn màu B tăng hoặc giảm đi 1 đơn vị Do vậy, các bit ít quan trọng nhất trong trường hợp này là bit thứ 24 của mỗi điểm ảnh Một số thuật toán muốn giấu nhiều hơn và chất lượng ảnh thấp hơn một chút có thể sử dụng bit cuối cùng của mỗi byte biểu diễn mỗi màu RGB làm bit ít quan trọng nhất Trong trường hợp này thì mỗi điểm ảnh
sẽ chọn ra được 3 bit LSB
Tuy nhiên, phương pháp này cũng có nhiều hạn chế như không đảm bảo được tính bền vững của thuỷ vân đối với các thao tác như quay ảnh hoặc nén ảnh Jpeg chẳng hạn Điều này là dễ hiểu vì các thao tác nói trên cũng loại
bỏ hoặc làm sai lệch các bit ít quan trọng nhất
1.8.2 Hướng tiếp cận dựa trên miền tần số của ảnh
Hướng tiếp cận dựa trên miền không gian ảnh như đã trình bày ở trên là cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập tự nhiên Nhưng trong nhiều trường hợp, cách khảo sát trực tiếp này gặp phải những khó khăn nhất định hoặc rất phức tạp và hiệu quả không cao
Ngoài phương pháp khảo sát trực tiếp này chúng ta có thể dùng nhiều phương pháp khảo sát gián tiếp khác thông qua các kĩ thuật biến đổi Các biến đổi này làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền mới này với các biến số mới Phương pháp biến đổi này cũng giống như phương pháp đổi biến trong tính tích phân hay phương pháp đổi hệ toạ độ trong toán giải tích của toán phổ thông quen thuộc
Mỗi một cách biến đổi sẽ có những thuật lợi riêng, tuỳ từng trường hợp
mà chúng ta dùng biến đổi nào Sau khi khảo sát xong các tín hiệu và hệ thống rời rạc trong miền các biến số mới này, nếu cần thiết chúng ta sẽ dùng các biến đổi ngược để đưa chúng về miền biến số độc lập cũ
Trang 31Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Phương pháp khảo sát gián tiếp này sẽ làm đơn giản rất nhiều các công việc mà chúng ta gặp phải khi dùng phương pháp khảo sát trực tiếp trong miền biến số độc lập tự nhiên Đối với chúng ta, hệ thống rời rạc cần khảo sát chính là miền không gian các điểm ảnh, có nhiều phép biến đổi cho dữ liệu ảnh trong đó có một số phương pháp biến đổi được sử dụng rất phổ biến như Fourier, biến đổi Cosin rời rạc, Wavelet…Đây là những phép biến đổi được
sử dụng nhiều trong các kỹ thuật xử lí ảnh
Trước hết ta khảo sát một số phép biến đổi đang được ứng dụng nhiều trong kỹ thuật thuỷ vân
1.9 Một số kỹ thuật bổ trợ cho kỹ thuật thuỷ vân số trên ảnh
Phương pháp thuỷ vân số là một phương pháp mới và rất phức tạp, có thể nói việc nghiên cứu vẫn đang diễn ra và đang được các nhà nghiên cứu hình thành dần khung lí thuyết cho nó Nhưng cho đến nay những kỹ thuật đưa ra cũng chỉ là những thử nghiệm, lúc thì người ta dùng các công cụ lí thuyết mật mã học, lúc thì kỹ thuật truyền thông, khi lại sử dụng lí thuyết thông tin …cho nên những kỹ thuật thuỷ vân cũng hết sức phong phú Và như vậy, khi làm về thuỷ vân ta phải biết nhiều kỹ thuật ở nhiều lĩnh vực lí thuyết khác nhau Tuy nhiên, qua khảo sát gần đây của giáo sư Deepa Kunder của trường đại học Toronto có hai khuynh hướng chủ yếu đã được hình thành đó
là khuynh hướng sử dụng lí thuyết thông tin và lí thuyết truyền thông
Theo giáo sư, khuynh hướng lí thuyết truyền thông thực tế hơn so với lí thuyết thông tin, và có thể sử dụng dễ dàng hơn trong thiết kế thuật toán Có một vài sự khác biệt đặc trưng giữa hai khuynh hướng này Kỹ thuật thuỷ vân dựa trên lí thuyết truyền thông thường sử dụng những cơ sở lí thuyết trong truyền thông để thiết kế như việc dùng lí thuyết phân tích thống kê để tạo thuỷ vân và kiểm định thuỷ vân lấy ra so với thuỷ vân được nhúng vào, kỹ thuật trải phổ tín hiệu để truyền tin hay kỹ thuật tạo nhiễu cộng và lọc nhiễu Trong khi đó, khuynh hướng dùng lí thuyết thông tin lại sử dụng những cơ sở phân
Trang 32Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
tích chung để phân tích làm sao thu được hiệu suất cao nhất, chiến lược tốt nhất cho một thuật toán cụ thể hay khả năng chịu tấn công đối với một kỹ thuật thuỷ vân Một sự khác biệt nữa trong hai khuynh hướng kỹ thuật thuỷ vân này là sự đánh giá hệ thống thuỷ vân Đối với khuynh hướng sử dụng lí thuyết truyền thông thì thường nhận biết thuỷ vân và đánh giá hệ thống thuỷ vân thông qua độ bền vững của thuỷ vân trước và sau khi giấu bằng phép đo
hệ số tương quan giữa thuỷ vân được nhúng và thuỷ vân được lấy ra hay tỉ lệ bit lỗi (BER - Bit Error Rate) Còn những kĩ thuật theo khuynh hướng lí thuyết thông tin thì chủ yếu hệ thống được đánh giá thông qua khả năng giấu Nghĩa là tổng số bit có thể được nhúng và được lấy ra một cách đáng tin cậy
Để giúp cho nghiên cứu và có thể cài đặt nhanh chóng các thuật toán thuỷ vân, phần tiếp theo đây, chúng ta sẽ tìm hiểu một số kỹ thuật thuỷ vân theo hai khuynh hướng trên
Trang 33Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Chương 2:
KỸ THUẬT THỦY VÂN ẢNH SỐ DỰA VÀO CÁC PHÉP BIẾN ĐỔI
2.1 Các phép biến đổi miền không gian ảnh sang miền tần số
Như đã giới thiệu ở phần trên, để khảo sát hệ thống rời rạc, trong nhiều trường hợp, chúng ta thường biến đổi hệ thống rời rạc đó sang một miền biến
số khác Có nhiều phép biến đổi khác nhau như biến đổi tín hiệu và hệ thống rời rạc sang miền Z, biến đổi sang miền tần số liên tục hay sang miền tần số rời rạc Mỗi phép biến đổi sẽ có những thuận lợi riêng, tuỳ theo yêu cầu khảo sát mà ta sẽ lựa chọn phép biến đổi phù hợp Trong trường hợp khảo sát miền không gian ảnh người ta thường biến đổi miền không gian rời rạc tín hiệu điểm ảnh sang miền tần số rời rạc bằng các phép biến đổi như Fourier, Cosin rời rạc hay Wavelet(sóng nhỏ)…Các phép biến đổi này khá phức tạp về ý nghĩa cũng như cài đặt Trong các phương pháp biến đổi hay dùng thì các kỹ thuật thuỷ vân được trình bày trong luận văn này sử dụng phép biến đổi sóng nhỏ nên một số phép biến đổi khác chỉ được trình bày sơ lược về mặt toán học còn phép biến đổi sóng nhỏ sẽ được trình bày chi tiết hơn Một vấn đề nữa là hệ thống rời rạc mà ta đang nghiên cứu là hệ thống hai chiều (áp dụng cho ảnh) nên các phép biến đổi cũng chỉ được trình bày trên biến đổi hai chiều
2.1.1 Phép biến đổi Fourier rời rạc
Phép biến đối Fourier rời rạc viết tắt là DFT (Discrete Fourier Transform) là một công cụ toán học được dùng để chuyển cách biểu diễn tín hiệu và hệ thống rời rạc sang miền tần số rời rạc Thực chất của cách biểu diễn này là lấy từng điểm rời rạc trên vòng tròn đơn vị trong mặt phẳng Z để biểu diễn Việc biểu diễn trong miền tần số rời rạc đặc biệt hiệu quả khi xuất hiện các thuật toán tính toán nhanh DFT ta gọi là phép biến đổi Fourier nhanh FFT ( Fast Fourier Transform)
Định nghĩa biến đổi Fourier rời rạc cho tín hiệu hai chiều ( ảnh số )