Trong các kỹ thuật thuỷ vân ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT được sử dụng nhiều nhất.. Nghiên cứu tìm hiểu các kỹ thuật thủy vân số để bảo vệ
Trang 2LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS BÙI THẾ HỒNG
Thái Nguyên - 2010
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan những kết quả đạt được trong luận văn này là do tôi nghiên cứu, sưu tầm, tổng hợp và sắp xếp lại phù hợp với yêu cầu của luận văn Toàn bộ những điều được trình bày trong khóa luận hoặc là của cá nhân, hoặc được tham khảo và tổng hợp từ các nguồn tài liệu khác nhau
Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan của mình Nếu có điều gì sai trái, tôi xin chịu mọi hình thức kỷ luật theo qui định
Thái Nguyên, tháng 10 năm 2010
Học viên Trần Thị Son
Trang 4LỜI CẢM ƠN
Trong suốt quá trình học tập và hoàn thành luận văn nghiên cứu “Thuỷ
vân ảnh số dựa vào phép biến đổi Cosine rời rạc” tác giả nhận được sự
hướng dẫn quý báu của các thầy cô, anh chị, các bạn và các em Với lòng kính trọng và biết ơn sâu sắc tôi xin bày tỏ lòng cảm ơn chân thành đến sự hỗ trợ giúp đỡ của nhiều người:
Trước hết tác giả xin gửi lời cảm ơn sâu sắc đến người thầy kính mến PGS.TS Bùi Thế Hồng, người đã tận tình giúp đỡ tác giả về đề tài về kiến thức và tinh thần cho tác giả trong suốt quá trình hoàn thành tốt luận văn
Xin cảm ơn các Thầy trong hội đồng bảo vệ đề cương đã cho tôi những quý báo để hoàn chỉnh luận văn này
Thành công của tác giả phải kể đến sự giúp đỡ nhiệt tình của các bạn lớp CHK7 trường Đại học Thái Nguyên, các bạn đã giúp tác giả thu thập tài liệu, ủng hệ về tinh thần và tạo điều kiện thuận lợi để tác giả hoàn thành tốt luận văn của mình Tác giả xin gửi lời cảm ơn đến các bạn
Xin cảm bố mẹ, người chồng yêu quý đã luôn bên cạnh động viên và giúp đỡ tôi học tập làm việc hoàn thành luận văn
Xin chân thành cảm ơn!
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC HÌNH VẼ TRONG LUẬN VĂN vi
DANH MỤC CÁC BẢNG BIỂU TRONG LUẬN VĂN viii
LỜI NÓI ĐẦU 1
1 Giới thiệu tổng quan về đề tài 1
2 Lý do chọn đề tài 1
3 Mục tiêu nghiên cứu và tính cấp thiết của đề tài 1
4 Phạm vi nghiên cứu và ứng dụng 2
5 Ý nghĩa khoa học 2
6 Phương pháp nghiên cứu 2
7 Bố cục của luận văn 2
Chương 1: Tổng quan về thuỷ vân ảnh số 2
Chương 2: Thuỷ vân ảnh số dựa vào phép biến đổi Cosine rời rạc(DCT) 3
Chương 3: Thiết kế và phát triển chương trình thử nghiệm 3
NỘI DUNG NGHIÊN CỨU 4
CHƯƠNG I: TỔNG QUAN VỀ THUỶ VÂN ẢNH SỐ 4
1.1 Cấu trúc một số loại ảnh thông dụng 4
1.1.1 Khái niệm về ảnh số 4
1.1.2 Ảnh bitmap (BMP) 5
Trang 61.1.3 Ảnh JPEG (Joint Photographic Expert Group) 6
1.2 Giấu tin trong ảnh 7
1.2.1 Khái niệm giấu tin 7
1.2.2 Mục đích của việc giấu tin 7
1.3 Giới thiệu về thuỷ vân 7
1.3.1 Thuỷ vân là gì? 7
1.3.2 Phân loại thuỷ vân 8
1.3.3 Mục đích của việc “Thuỷ vân” 10
1.3.4 Truyền thông tin mật (Steganography) 13
1.4 Thuỷ vân ảnh số 14
1.4.1 Thông tin trong ảnh có bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh 15
1.4.2 Thuỷ vẩn ẩn hay thuỷ vân hiện 15
1.4.3 Tính chất bền vững 15
1.4.4 Thuỷ vân cái gì 15
1.5 Thuỷ vân trên đa phương tiện (video, audio,…) 18
1.6 Những tấn công trên hệ thuỷ vân 19
1.7 Những khuynh hướng tiếp cận của kỹ thuật thuỷ vân 19
1.7.1 Hướng tiếp cận dựa trên miền không gian ảnh 19
1.7.2 Hướng tiếp cận dựa trên miền tần số của ảnh 21
1.8 Một số kỹ thuật bổ trợ cho các kỹ thuật thuỷ vân số trên ảnh 22
CHƯƠNG II: THUỶ VÂN ẢNH SỐ DỰA VÀO PHÉP BIẾN ĐỔI COSINE RỜI RẠC (DCT) 24
2.1 Phép biến đổi Cosine rời rạc 24
2.1.1 Định nghĩa biến đổi Cosine rời rạc hai chiều 24
Trang 72.1.2 Đặc điểm của phép biến đổi DCT trên ảnh hai chiều: 25
2 2 Các thuật toán thủy vân ảnh dựa vào phép biến đổi Cosine rời rạc 28
2.3 Một số cải tiến, mở rộng đối với các thuật toán thuỷ vân dựa vào phép biến đổi Cosine rời rạc 42
CHƯƠNG 3: THIẾT KẾ VÀ PHÁT TRIỂN CHƯƠNG TRÌNH THỬ NGHIỆM 51
3.1 Cài đặt một số thuật toán thuỷ vân dựa vào phép biến đổi Cosine rời rạc 51
3.2 Cài đặt một số cải tiến đối với thuật toán thủy vân dựa vào phép biến đổi Cosine rời rạc 57
3.3 Đánh giá và so sánh kết quả đạt được 65
KẾT LUẬN 68
TÀI LIỆU THAM KHẢO 69
Trang 8DANH MỤC CÁC HÌNH VẼ TRONG LUẬN VĂN
Hình 1.1: Phân loại các kỹ thuật thuỷ vân 8
Hình 1.2: Ví dụ về thuỷ vân hiện (Trên trang Web thư viện số của Liên Bang Mỹ) 9
Hình 1.3: Ảnh Lena đã nhúng thuỷ vân là logo ở hình bên phải 10
Hình 1.4: Hai ảnh trước và sau khi giấu tin giống hệt nhau 11
Hình 1.5: Thực chất bên trong ảnh có chứa thông tin người chủ sở hữu 12
Hình 1.6: Sơ đồ nhúng thuỷ vân và tìm lại thuỷ vân 13
Hình 1.7: Thuỷ vân dòng Text vào ảnh chủ 16
Hình 1.8: Kết quả thu được khi thực hiện thuỷ vân 16
Hình 1.9: Kết quả thu được khi thuỷ vân bức ảnh nhỏ vào ảnh chủ 17
Hình 2.1: Ảnh Lena.bmp 26
Hình 2.2: Năng lượng phân bố của ảnh qua phép biến đổi DCT 26
Hình 2.3: Phân chia 3 miền tần số ảnh của phép biến đổi DCT 27
Hình 2.4: Quá trình nhúng thuỷ vân 30
Hình 2.5: Ảnh chủ trong kỹ thuật DCT 34
Hình 2.6: Ảnh thuỷ vân trong kỹ thuật DCT 34
Hình 2.7: Ảnh thu được sau khi thuỷ vân trong kỹ thuật DCT 34
Hình 2.8: Quá trình giải mã 35
Hình 2.9: Ảnh thu được sau khi tách thuỷ vân 37
Hình 2.10 Ảnh Lena.BMP 512 × 512 a = 10 38
Trang 9Hình 2.11: Ảnh Lena sau khi giấu tin 40
Hình 2.12: Ảnh Lena sau 5 lần tấn công làm sắc 40
Hình 2.13: Các ảnh mô tả cropping 41
Hình 2.14: Ảnh chủ 48
Hình 2.15: Ảnh thuỷ vân 48
Hình 2.16: K = 5; Cỡ khối = 8 49
Hình 2.17: K = 5; Cỡ khối = 16 49
Hình 3.1: Ảnh chủ 66
Hình 3.2: Ảnh thuỷ vân 66
Hình 3.3: Ảnh sau khi thuỷ vân theo Shoemarker 66
Hình 3.4: Ảnh sau khi thuỷ vân bằng kỹ thuật cải tiến 66
Trang 10DANH MỤC CÁC BẢNG BIỂU TRONG LUẬN VĂN
Bảng 1: Chọn một khối ảnh bất kỳ 8x8 32
Bảng 2: Thu được khối 8x8 sau khi biến đổi DCT 32
Bảng 3: Thu được khối 8x8 sau khi biến đổi ngược DCT 33
Bảng 4: Thực nghiệm với ảnh Lena.Bmp 512 × 512 (chưa nén JPEG) 38
Bảng 5: Thực nghiệm với ảnh Lena.Bmp 512 × 512 với các trường hợp nén JPEG 39
Bảng 6: Kết quả kiểm nghiệm với phép tấn công làm sắc ảnh 39
Trang 11LỜI NÓI ĐẦU
1 Giới thiệu tổng quan về đề tài
Trong kỷ nguyên số, thông tin số được sử dụng rộng rãi trong một môi trường mở, tài nguyên được phân phối cho nhiều người sử dụng, nhu cầu được bảo vệ bản quyền và sở hữu trí tuệ các sản phẩm số đã trở thành một vấn
đề quan trọng và được nhiều cơ sở nghiên cứu quan tâm
Thuỷ vân ảnh được đánh giá mang lại nhiều hứa hẹn trong ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc Việc thuỷ vân có thể thực hiện trực tiếp trên miền không gian ảnh hoặc trên miền biến đổi ảnh Hiện tại, người ta
đã sử dụng các phép biến đổi rời rạc như phép biến đổi Fourier (DFT), phép biến đổi Cosine (DCT) và phép biến đổi sóng nhỏ (DWT)
Phép biến đổi cosine rời rạc viết tắt là DCT (Discrete Cosine Transform) được sử dụng rất phổ biến trong kỹ thuật xử lí ảnh số nói riêng và
xử lí tín hiệu số nói chung Trong các kỹ thuật thuỷ vân ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT được sử dụng nhiều nhất Lý do ở đây là phép biến đổi DCT đã được dùng trong dạng chuẩn ảnh JPEG Nếu áp dụng DCT thì cũng theo chuẩn của JPEG và do đó sẽ tránh được mất thuỷ vân do phép nén JPEG
2 Lý do chọn đề tài
- Đề tài mang tính ứng dụng và thực tiễn
- Đáp ứng yêu cầu bảo vệ bản quyền các sản phẩm đa phương tiện trong môi trường phân phối lưu thông Internet
- Phù hợp với chuyên ngành của học viên
3 Mục tiêu nghiên cứu và tính cấp thiết của đề tài
Trang 12Nghiên cứu tìm hiểu các kỹ thuật thủy vân số để bảo vệ bản quyền hoặc chứng minh quyền sở hữu của bức ảnh số
- Nghiên cứu tìm cách cải tiến, mở rộng đối với một vài kỹ thuật thuỷ vân dựa vào phép biến đổi DCT nhằm đảm bảo chất lượng của ảnh, đồng thời nâng cao độ bền vững của thuỷ vân trước những tấn công thông thường
- Cài đặt thử nghiệm lược đồ thuỷ vân dựa vào phép biến đổi DCT trên ảnh tĩnh
4 Phạm vi nghiên cứu và ứng dụng
- Nghiên cứu, đánh giá kỹ thuật thuỷ vân trên ảnh tĩnh
- Công cụ lập trình và phần mềm dùng để cài đặt các ứng dụng của thuỷ vân trên ảnh
5 Ý nghĩa khoa học
- Nghiên cứu, đánh giá kỹ thuật thuỷ vân trên ảnh tĩnh
- Thủy vân phải tồn tại bền vững không bị xoá bởi các tấn công khác
6 Phương pháp nghiên cứu
- Nghiên cứu các tài liệu liên quan
- Tìm hiểu và phát hiện các vấn đề trong thực tế
- So sánh đánh giá và đưa ra các giải pháp
- Cài đặt thử nghiệm trên những cải tiến được đưa ra
7 Bố cục của luận văn
Luận văn gồm 3 chương:
Chương 1: Tổng quan về thuỷ vân ảnh số
1 Cấu trúc một số loại ảnh thông dụng
2 Giấu tin trong ảnh
3 Giới thiệu về thủy vân
4 Thuỷ vân ảnh số
Trang 135 Thuỷ vân trên đa phương tiện(video, audio)
6 Những tấn công trên hệ thuỷ vân
7 Những khuynh hướng tiếp cận của kỹ thuật thuỷ vân
Chương 2: Thuỷ vân ảnh số dựa vào phép biến đổi Cosine rời rạc(DCT)
1 Phép biến đổi Cosine rời rạc
2 Các thuật toán thuỷ vân ảnh dựa vào phép biến đổi Cosine rời rạc
3 Một số cải tiến, mở rộng đối với các thuật toán thuỷ vân dựa vào phép biến đổi cosine rời rạc
Chương 3: Thiết kế và phát triển chương trình thử nghiệm
1 Cài đặt một số thuật toán thủy vân dựa vào phép biến đổi Cosine rời rạc
2 Cài đặt một số cải tiến đối với thuật toán thủy vân dựa vào phép biến đổi Cosine rời rạc
3 Đánh giá so sánh các kết quả đạt được
Trang 14NỘI DUNG NGHIÊN CỨU
CHƯƠNG I: TỔNG QUAN VỀ THUỶ VÂN ẢNH SỐ
1.1 Cấu trúc một số loại ảnh thông dụng
1.1.1 Khái niệm về ảnh số
Ảnh trong thực tế là ảnh liên tục về không gian và về giá trị độ sáng, một ảnh có thể được định nghĩa là một hàm hai chiều f(x,y) trong đó x và y là toạ độ trong không gian và biên độ của hàm f tại bất kỳ cặp toạ độ (x,y) nào cũng gọi là cường độ của ảnh tại điểm đó Khái niệm cấp xám thường được dùng để đề cập đến cường độ của ảnh đơn sắc Ảnh màu được tạo thành từ sự kết hợp của các ảnh 2D riêng biệt Ví dụ, trong hệ thống màu RGB, một ảnh màu là sự phối hợp của ba thành phần màu (đỏ, xanh lá cây, xanh ra trời) riêng biệt Chính vì lý do này, rất nhiều kỹ năng áp dụng với ảnh đơn sắc cũng có thể áp dụng với ảnh màu bằng cách xử lý ba thành phần ảnh riêng biệt
Chuyển đổi một ảnh thông thường sang dạng số yêu cầu toạ độ không gian cũng như biên độ của ảnh đó phải được số hoá, nghĩa là các tín hiệu liên tục được biến đổi thành các tín hiệu rời rạc thông qua quá trình lấy mẫu (sampling - rời rạc hoá về không gian) và lượng tử hoá (quantization - chuyển đối tín hiệu tương tự dạng tín hiệu số) các thành phần của ảnh mà về nguyên tắc bằng mắt thường không thể phân biệt được hai điểm kề nhau Do đó, khi các giá trị x, y và biên độ của hàm f là xác định, mang giá trị rời rạc, ta gọi một ảnh là ảnh số
Sau quá trình lấy mẫu và lượng tử hoá, ta thu được một ma trận số thực gồm M hàng và N cột Một giá trị (x,y) của ma trận được gọi là một điểm ảnh
Trang 15(pixel hay pel), mỗi điểm ảnh được xác định bởi toạ độ và màu Như vậy, một ảnh số là tập hợp nhiều điểm ảnh, ta nói ảnh gồm M x N điểm
1.1.2 Ảnh bitmap (BMP)
Ảnh bitmap (hay Windows bitmap) được phát triển bởi microsoft Corporation, được lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển thị dữ liệu không phụ thuộc vào khung chỉ định màu trên bất kỳ phần cứng nào Các ảnh bitmap thường được lưu trữ với phần mở rộng phổ biến bmp (hoặc dạng ít hơn gặp hơn là dib – device independent bitmap)
độ phân giải ảnh, số màu sử dụng
- Bảng Palette màu: Định nghĩa các màu sẽ được sử dụng trong ảnh
- Bitmap data: Nằm ngay sau phần palette màu, chứa giá trị màu của các điểm ảnh Các điểm ảnh được lưu theo các dòng từ trái sang phải, các dòng ảnh được lưu từ dưới lên trên Giá trị mỗi điểm ảnh là một chỉ số trỏ tới phần tử màu tương ứng của bảng màu
Người ta ký hiệu số bit trên một điểm ảnh (bit per pixel) là n Một ảnh bitmap n – bit có 2n màu, giá trị n càng lớn thì ảnh càng có nhiều màu và càng
rõ nét Các giá trị thường gặp của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh high color – 65536 màu) và 24 (ảnh true color – 16 triệu màu) Ảnh 24 bit cho chất lượng ảnh trung thực nhất
Trang 16Đặc điểm nổi bật của ảnh bitmap là ảnh không được nén bởi bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin - một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tuỳ thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với ảnh được nén (chẳng hạn GIF, JPEG hay PNG)
1.1.3 Ảnh JPEG (Joint Photographic Expert Group)
Ảnh JPEG là ảnh có tỉ lệ nén dữ liệu rất cao, thường dùng cho ảnh chụp Đây là một định dạng ảnh rất thông dụng hiện nay, phần mở rộng hay gặp nhất của ảnh JPEG là jpg ngoài ra còn có jpeg, jpe phương pháp nén ảnh JPEG là một trong những phương pháp nén ảnh hiệu quả, có tỉ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này có thể chấp nhận được và việc loại
bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ thống thị giác người
Quá trình nén ảnh JPEG thường trải qua các giai đoạn:
- Chuyển đổi hệ thống màu RGB sang hệ thống màu YCbCr (Y: Intensity, Cb: Blue/Yellow, Cr: Red/Green)/
- Loại bỏ các thông tin thừa trong ảnh gốc, các thông tin được chọn để loại bỏ thường có đặc điểm ít gây chú ý với mắt người, có mặt chúng hay không con người cũng khó nhận thấy
- Biến đổi Cosine rời rạc ảnh ban đầu được chia thành các khối 8*8 và thực hiện phép biến đổi Cosine rời rạc trên các khối này
- Lượng tử hoá: Dựa vào ma trận lượng tử và công thức để lượng tử hoá các hệ số DCT (DCT Coefficients)
Trang 17Sắp xếp theo hình zig-zag: Các hệ số DCT sau khi được lượng tử hoá phần lớn đều mang giá trị 0, ta sắp xếp theo hình zig – zag, sẽ được các hệ số DCT khác 0 nằm phía trên bên trái của ma trận lượng tử
- Nén không mất dữ liệu: Thuật toán Huffman thường được sủ dụng để nén, tạo ảnh JPEG
Với các ưu điểm có được, ảnh JPEG được công nhận là chuẩn để lưu trữ ảnh màu thực tế (theo chuẩn ISO 10918 - 1)
1.2 Giấu tin trong ảnh
1.2.1 Khái niệm giấu tin
Giấu tin là kỹ thuật nhúng một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác Một trong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc
1.2.2 Mục đích của việc giấu tin
Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể hiện ở hai khía cạnh:
Một là bảo vệ cho dữ liệu đem giấu (embedded), thông tin mật được giấu kỹ trong đối tượng khác sao cho người khác không phát hiện được
Hai là bảo vệ chính đối tượng được dùng để giấu tin (hot data), như ứng dụng bảo vệ bản quyền, phát hiện xuyên tạc thông tin (watermarking),…
1.3 Giới thiệu về thuỷ vân
1.3.1 Thuỷ vân là gì?
“Thuỷ vân” có xuất xứ từ thời xưa Đây là kỹ thuật đánh dấu chìm một hình ảnh, một lôgô, hay một dữ liệu nào đó trên giấy nhằm mục đích trang trí
Trang 18và phân biệt được xuất xứ của sản phẩm giấy Như vậy, thông tin cần giấu được gọi là “ thuỷ vân”
Nói đến kỹ thuật thuỷ vân số là nói đến kỹ thuật giấu tin nhằm đếm những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền chống xuyên tạc, nhận thực thông tin, điều khiển truy cập,… Có thể thấy rõ phần ứng dụng của thủy vân là rất lớn, mỗi ứng dụng lại có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng có những tính năng khác biệt tương ứng
1.3.2 Phân loại thuỷ vân
Dựa và các tính chất , đặc trưng, ứng dụng của từng kỹ thuật mà người
ta phân làm hai: Thuỷ vân bền vững và thuỷ vân dễ vỡ
Hình 1.1: Phân loại các kỹ thuật thuỷ vân
Robust Copyright marking
Thuỷ vân hiện
Trang 19Thuỷ vân bền vững (Robust Copyright Marking) là thuỷ vân tồn tại bền vững cùng với dữ liệu, không dễ dàng bị phá huỷ trước những biến đổi, tấn công lên dữ liệu Các kỹ thuật này thường được dùng trong các ứng dụng bảo
vệ bản quyền, chứng minh quyền sở hữu Trong những ứng dụng đó, thuỷ vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp Thuỷ vân được nhúng trong sản phẩm như một hình thức dán tem bản quyền Trong trường hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân Một yêu cầu lí tưởng là nếu muốn loại bỏ thuỷ vân chỉ còn cách phá huỷ sản phẩm
Thuỷ vân bền vững lại được chia làm hai loại là thuỷ vân ẩn và thuỷ vân hiện Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ để không gây ảnh hưởng đến chất lượng ảnh gốc Đối với thuỷ vân hiện thông tin bản quyền hiển thị ngay trên sản phẩm ví dụ như các logo, biểu tượng hay giống như tên kênh trên chương trình ti vi ta thường thấy VTV1, VTV3,…các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt không gây ảnh hưởng đến chất lượng ảnh gốc
Đối với thuỷ vân hiện thông tin bản quyền hiển thị ngay trên sản phẩm
Hình 1.2: Ví dụ về thuỷ vân hiện (Trên trang Web thƣ viện số của Liên Bang Mỹ)
Trang 20Hình 1.3: Ảnh Lena đã nhúng thuỷ vân là logo ở hình bên phải
Còn đối với thuỷ vân ẩn thì cũng giống như giấu tin, thuỷ vân phải đảm bảo tính chất ẩn trên ảnh, bằng mắt thường không thể nhìn thấy được Tính chất ẩn sẽ làm cho sản phẩm không bị ảnh hưởng cảm nhận bằng mắt thường như đối với thuỷ vân hiện Đây là một tính chất ưu việt hơn của thuỷ vân ẩn
do đó người ta tập trung vào nghiên cứu các kỹ thuật thuỷ vân ẩn Còn trong vấn đề bảo vệ bản quyền, thuỷ vân ẩn mang tính “bất ngờ” hơn Khi người nào đó định sử dụng sản phẩm của người khác, người ta sẽ không nhìn thấy
và không biết rằng sản phẩm đó đã bị đánh dấu bản quyền, nếu sử dụng trái phép thì người chủ sở hữu hợp pháp sẽ kiện với bằng chứng là thuỷ vân đã được nhúng trong đó
Thuỷ vân dễ vỡ (Fragile Watermarking) là thuỷ vân dễ bị biến đổi trước những tấn công lên dữ liệu Các kỹ thuật này thường được dùng trong các ứng dụng nhận thực thông tin, đảm bảo tính toàn vẹn dữ liệu
1.3.3 Mục đích của việc “Thuỷ vân”
Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể hiện ở các khía cạnh sau:
Thứ nhất là bảo vệ cho dữ liệu đem giấu (embedded), thông tin mật được giấu trong đối tượng khác sao cho người khác không phát hiện được
Thứ hai là bảo vệ cho chính đối tượng được dùng để giấu tin (host data), như ứng dụng của bảo vệ bản quyền, phát hiện xuyên tạc thông tin,…
Trang 21Tưng ứng với hai khía cạnh đó chúng ta có hai khuynh hướng kỹ thuật
rõ ràng đó là giấu tin mật (Steganography) và thuỷ vân số (Watermarking)
Trong kỹ thuật giấu tin mật, thông tin cần giấu gọi là thông điệp (thuỷ vân), trong kỹ thuật thuỷ vân số thì gọi là thủy vân (Watermark) Thuỷ vân có thể là một chuỗi các ký tự hay một hình ảnh logo nào đó
1.3.3.1 Bảo vệ bản quyền tác giả (copyright protection)
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số, một dạng của phương pháp giấu tin Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả sẽ được nhúng vào trong các sản phẩm kỹ thuật số trước khi đưa vào lưu thông, phân phối Thuỷ vân này chỉ một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm Giả
sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video
và cần được lưu thông trên mạng Để bảo vệ các sản phẩm chống lại các hành
vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến chất lượng cảm nhận của sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm
Hình 1.4: Hai ảnh trước và sau khi giấu tin giống hệt nhau
Trang 221.3.3.2 Nhận thực thông tin và phát hiện xuyên tạc thông tin (authentication and tamper detection)
Một tập các thông tin sẽ được giấu trong sản phẩm Sau đó, các thông tin này sẽ được sử dụng để nhận biết xem sản phẩm gốc có bị thay đổi hay không Trong trường hợp này, các thuỷ vân thường có dạng ẩn để không bị phát hiện và nếu có bị lộ thì cũng khó làm giả và cũng dễ nhận ra những chỗ
đã bị xuyên tạc Trong các ứng dụng thực tế, người ta mong muốn tìm được
vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ bị nén mất dữ liệu) Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững
Hình 1.5: Thực chất bên trong ảnh có chứa thông tin người chủ sở hữu
1.3.3.3 Lăn tay hoặc dán nhãn (fingerprinting or labeling)
Thuỷ vân trong những ứng dụng này đựơc sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng loại này thì yêu cầu cơ bản chính là đảm bảo độ an toàn cao cho các thuỷ vân không bị xoá hoặc thay đổi trong quá trình phân phối
Trang 231.3.3.4 Kiểm soát sao chép (copy control)
Các thuỷ vân trong những trường hợp này được sử dụng để kiểm soát sao chép không hợp lệ đối với các sản phẩm kỹ thuật số Các thiết bị phát hiện
ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc/ghi Ví dụ như
hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật Các ứng dụng loại này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc
1.3.4 Truyền thông tin mật (Steganography)
Các thông tin được giấu trong các trường hơp này càng nhiều càng tốt Việc giải mã để nhận được thông tin cũng không cần phương tiện chứa thông tin gốc
Một mẫu cơ bản về quy trình thủy vân và tìm lại thuỷ vân:
Hình 1.6: Sơ đồ nhúng thuỷ vân và tìm lại thuỷ vân
Ảnh chủ
Xuyên tạc (tấn công )
Ảnh sau thuỷ vân
Ảnh chủ
Tìm lại Quyết định (so
sánh, hiệu chỉnh)
Chữ
ký tìm được
Khoá
Chữ ký,
hình
ảnh, text
Trang 241.3.4.1 Quy trình thuỷ vân
Dữ liệu đưa vào là ảnh chủ và đối tượng dùng để nhúng vào ảnh (watermark), watermark có thể ở bất kỳ dạng nào như chữ số, văn bản hay hình ảnh Khoá có thể được dùng để tăng cường tính bảo mật, ngăn chặn những kẻ không có bản quyền khôi phục hay phá huỷ watermark Sau đó bằng cách sử dụng kỹ thuật thuỷ vân để nhúng watermark vào ảnh chủ ta thu được ảnh sau khi nhúng Ảnh sau khi nhúng có thể nhìn thấy watermark (thuỷ vân hiện) hoặc không nhìn thấy watermark (thuỷ vân ẩn) Ảnh sau khi thuỷ vân có thể bị những tấn công bên ngoài có chủ đích hoặc không có chủ đích như nén ảnh, xuyên tạc ảnh,……
1.3.4.2 Quy trình tìm lại thủy vân
Dữ liệu vào là ảnh đã được thuỷ vân, khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào phương pháp tìm thuỷ vân) Dữ liệu ra là watermark khôi phục được hoặc đại lượng nào đó chỉ ra mối tương quan giữa watermark thu đựơc và watermark cho trước ở dữ liệu vào Ta so sánh giữa watermark trước khi nhúng và watermark khôi phục để chứng thực bản quyền của sản phẩm
1.4 Thuỷ vân ảnh số
Hệ thuỷ vân số trên ảnh cũng là một hệ giấu tin nên cũng có một số đặc điểm và tính chất giống như giấu tin trong ảnh như:
Phương tiện chứa có dữ liệu tri giác tĩnh
Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi kích thước ảnh
Kỹ thuật giấu phụ thuộc vào tính chất của hệ thống thị giác con người Khi giải tin có cần phương tiện chứa gốc (ảnh gốc)
Trang 25Ngoài một số đặc điểm chung ra, kỹ thuật thuỷ vân số được phân biệt với kỹ thuật giấu tin mật ở những đặc trưng sau đây:
1.4.1 Thông tin trong ảnh có bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh
Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật thuỷ vân thì chỉ có trong trong loại thuỷ vân dễ vỡ Còn đối với loại thuỷ vân bền vững thì lại yêu cầu chống lại được những phép biến đổi thông thường
trên ảnh
1.4.2 Thuỷ vẩn ẩn hay thuỷ vân hiện
Không giống như giấu tin mật với yêu cầu bắt buộc là thông điệp giấu phải ẩn bên trong ảnh sao cho mắt thường không nhìn thấy được thì kỹ thuật thuỷ vân số lại có hai loại là thuỷ vân ẩn và thủy vân hiện Nghĩa là thuỷ vân
ẩn thì mắt thường không nhìn thấy được nó được dùng mục đích gài bí mật các thông tin trong ảnh để xác nhận chủ quyền của bức ảnh Thuỷ vân hiện cho phép nhìn thấy được thông tin đem nhúng vào, nó được sử dụng cho mục đích công bố công khai về chủ quyền sở hữu (trong trường hợp này ta dùng từ
nhúng thay cho từ giấu thích hợp hơn)
1.4.3 Tính chất bền vững
Tính chất này là tính chất quan trọng nhất của một hệ thuỷ vân bền vững Nghĩa là hệ thuỷ vân phải chống lai được các phép biến đổi, hay các tấn công có chủ đích hoặc không có chủ đích lên thuỷ vân
1.4.4 Thuỷ vân cái gì
Một câu hỏi đầu tiên đối với hệ thuỷ vân là thông tin gì sẽ được giấu vào bên trong ảnh? Kiểu thuỷ vân hay dùng nhất là một chuỗi các ký tự mã ASCII, chuỗi kí tự được nhúng trực tiếp lên ảnh mang những thông tin như
Trang 26tác giả, tiêu đề hay ngày tháng…Tuy nhiên, chuỗi ký tự mã ASCII lại bị một hạn chế đó là mỗi ký tự biểu diễn bằng nhiều bít nếu vì một lí do nào đó một bít bị lỗi thì sẽ làm sai cả kí tự và do đó chỉ cần một phép biến đổi đơn giản như phép biến đổi JPEG cũng có thể làm cho thuỷ vân bị sai lệch rất nhiều
Ví dụ thuỷ vân dòng chữ “IBM” vào bức ảnh
Hình 1.7.1: Ảnh chủ Hình 1.7.2: Text thuỷ
vân (watermark) Hình 1.7: Thuỷ vân dòng Text vào ảnh chủ
Kết quả thu được:
Hình 1.8: Kết quả thu đƣợc khi thực hiện thuỷ vân
Trang 27Chúng ta cũng có thể dùng ảnh để giấu, khi đó ta sẽ có ảnh trong ảnh Khi giải tin thì một số điểm ảnh có thể sai nhưng hình tổng thể sẽ được giữ nguyên Do đó khi lựa chọn ảnh làm thuỷ vân phải lựa chọn những bức ảnh đơn giản, dễ nhận dạng như logo,
Ví dụ về thuỷ vân một bức ảnh nhỏ vào ảnh chủ
Hình 1.9: Kết quả thu đƣợc khi thuỷ vân bức ảnh nhỏ vào ảnh chủ
Trong những kỹ thuật gần đây, người ta sử dụng thuỷ vân là một chuỗi bít sinh ngẫu nhiên theo một luật phân phối xác suất nào đó và sau đó áp dụng các lí thuyết xác suất thống kê để chứng thực thuỷ vân Kỹ thuật này chúng ta
sẽ tìm hiểu ở phần sau
Trong các loại kỹ thuật thuỷ vân thì kỹ thuật thuỷ vân ẩn, bền vững là loại kỹ thuật được quan tâm nghiên cứu nhiều nhất vì ý nghĩa ứng dụng lớn của nó như đã nói ở phần trên Do vậy, hai tính chất quan trọng nhất của hệ thuỷ vân mà các nhà nghiên cứu đang cố gắng đạt được là thuộc tính ẩn và thuộc tính bền vững Nhưng đây lại là mấu chốt của sự phức tạp vì hai thuộc tính mâu thuẫn nhau này Nếu như để đảm bảo thuộc tính ẩn thì thuỷ vân phải được giấu trong những vị trí mà ít có ý nghĩa tri giác nhất, ít bị chú ý nhất
Trang 28nhưng để đảm bảo được thuộc tính bền vững thì thuỷ vân phải chịu được những phép xử lí ảnh phổ biến như dịch chuyển ảnh hay nén JPEG Ví dụ như phép nén JPEG loại bỏ ở ảnh những thông tin ít có tính tri giác nhất để làm giảm kích thước của ảnh mà vẫn đảm bảo được chất lượng ảnh Khi đó thì những dữ liệu của thuỷ vân nằm trong vùng này sẽ bị mất đi hoặc bị biến đổi sai lệch hoàn toàn Với tính phức tạp của yêu cầu cho một hệ thuỷ vân, phần sau đây chúng ta sẽ đi tìm hiểu những giải pháp kỹ thuật đã được đưa ra của các nhà khoa học trên thế giới
1.5 Thuỷ vân trên đa phương tiện (video, audio,…)
Kỹ thuật giấu thông tin rong ảnh phụ thuộc vào hệ thống thị giác của con người (HVS – Human Vision System) còn kỹ thuật giấu thông tin trong audio phụ thuộc vào hệ thống thính giác của con người (HAS - Human Auditory System) HAS cảm nhận được các tín hiệu ở dải tần rộng và công suất thay đổi lớn, nhưng lại kém trong việc phát hiện sự khác biệt nhỏ giữa các dải tần và công suất Điều này có nghĩa là, các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng Kênh truyền tin cũng
là một vấn đề Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu Giấu thông tin trong audio yêu cầu rất cao về tính đồng bộ và tính an toàn của thông tin
Giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác giả Ta có thể lấy một ví dụ là các hệ thống chương trình trả tiền xem theo video clip (pay per view application) Các thuật toán trước đây thường cho phép giấu ảnh vào trong video, nhưng gần đây kỹ thuật cho
phép giấu cả âm thanh và hình ảnh vào video
Trang 291.6 Những tấn công trên hệ thuỷ vân
Phương pháp thuỷ vân nên chống lại được một số phép xử lý ảnh thông thường và một số tấn công có chủ đích Cho đến nay vẫn chưa có một hệ thống thuỷ vân hoàn hảo và cũng không rõ ràng việc liệu có tồn tại hay không một hệ thống thuỷ vân an toàn tuyệt đối Vì vậy, trong thực tế thì thuỷ vân phải cân đối giữa bền vững với các thuộc tính khác như lượng thông tin giấu, tính ẩn…Dựa trên các yêu cầu của ứng dụng, người ta sẽ lựa chọn một phương pháp thuỷ vân thích hợp nhất Từ những biến đổi có chủ đích hay không có chủ đích đã biết đối với hệ thuỷ vân mà ta có thể phân biệt thành hai nhóm xuyên tạc sau: một là các biến đổi được xem như là các nhiễu đối với
dữ liệu hai là làm mất tính đồng bộ để không thể lấy tin ra được Hãy xem một vài phép thay đổi sau đây:
- Biến đổi tín hiệu: làm sắc nét, thay đổi độ tương phản, màu, gamma…
- Nhiễu cộng, nhiễu nhân…
- Lọc tuyến tính
- Nén mất thông tin
- Biến đổi affine cục bộ hoặc toàn cục
- Giảm dữ liệu:cropping, sửa histogram
- Chuyển mã (gif Jpeg)
- Chuyển đổi tương tự số
- Thuỷ vân nhiều lần
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền vững sao cho các tấn công sẽ làm cho giá trị thương mại của ảnh gốc sẽ bị ảnh hưởng
1.7 Những khuynh hướng tiếp cận của kỹ thuật thuỷ vân
1.7.1 Hướng tiếp cận dựa trên miền không gian ảnh
Đây là hướng tiếp cận cơ bản và tự nhiên của các kỹ thuật thuỷ vân Miền không gian ảnh (spatial domain) là miền dữ liệu ảnh gốc, tác động lên
Trang 30miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm ảnh Đây là hướng tiếp cận tự nhiên bới lẽ khi nghĩ đến việc giấu tin trong ảnh người ta nghĩ ngay đến việc thay đổi giá trị các điểm ảnh để giấu Một phương pháp phổ biến sử dụng hướng tiếp cận này đó là phương pháp thay thể bít ít quan trọng nhất của mỗi điểm ảnh mà ta đã tìm hiểu trong các kỹ thuật giấu tin mật
Ý tưởng cơ bản của phương pháp thay thế bít ít quan trọng nhất LSB (Least Significant Bit) là chọn ra từ mỗi điểm ảnh các bít có ít ý nghĩa nhất về mặt tri giác để sử dụng cho việc giấu tin Bít nào được coi là ít tri giác nhất và bao nhiêu bít có thể được lấy ra để thay thế thì phụ thuộc vào tính chất hệ thống thị giác cuả con người và tuỳ từng ứng dụng cần chất lượng ảnh sau khi giấu cao hay thấp Ví dụ, trong ảnh 24 bít mau, mỗi bít được biểu diễn bởi 24 bít tương ứng với ba màu RGB, mỗi màu chiếm 1 byte Người ta sử dụng một tính chất của mắt người là sự cảm nhận về màu B (Blue) kém hơn so với hai màu RG, chính vì thế mà người ta thường chọn bít cuối cùng trong 8 bít biểu diễn màu B của mỗi điểm ảnh để giấu tin Thay đổi bít cuối cùng trong 8 bít biểu diễn màu B chỉ làm cho giá trị biểu diễn màu B tăng hoặc giảm đi 1 đơn
vị Do vậy, các bít ít quan trọng nhất trong trường hợp này là bít thứ 24 của mỗi điểm ảnh Một số thuật toán muốn giấu nhiều hơn và chất lượng ảnh thấp hơn một chút có thể sử dụng bít cuối cùng của mỗi byte biểu diễn mỗi màu RGB làm bít ít quan trọng nhất Trong trường hợp này thì mỗi điểm ảnh sẽ chọn ra được 3 bít LSB
Tuy nhiên, phương pháp này cũng có nhiều hạn chế như không đảm bảo được tính bền vững của thuỷ vân Điều này rất dễ hiểu phương pháp dựa vào trực tiếp giá trị của điểm ảnh để giấu Khi giá trị điểm ảnh bị thay đổi do các biến đổi ảnh hay do một phép xử lí ảnh thông thường nào đó như quay ảnh, nén Jpeg thì thông tin giấu sẽ bị sai Một hạn chế nữa là nếu thuật toán bị
Trang 31lộ ra thì thông tin nhúng dễ dàng được lấy ra và có thể bị sửa đi theo nghĩa khác
1.7.2 Hướng tiếp cận dựa trên miền tần số của ảnh
Hướng tiếp cận dựa trên miền không gian ảnh như đã trình bày ở trên là cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên miền giá trị rời rạc của các điểm ảnh người ta gọi là trên miền biến số độc lập
tự nhiên Nhưng trong nhiều trường hợp cách khảo sát trực tiếp này gặp phải những khó khăn nhất định hoặc rất phức tạp và hiệu quả không cao
Ngoài phương pháp khảo sát trực tiếp này chúng ta có thể dùng nhiều phương pháp khảo sát gián tiếp khác thông qua các kĩ thuật biến đổi Các biến đổi này làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền mới này với các biến số mới Phương pháp biến đổi này cũng giống như phương pháp đổi biến trong tính tích phân hay phương pháp đổi hệ toạ độ trong toán giải tích của toán phổ thông quen thuộc
Mỗi một cách biến đổi sẽ có những thuật lợi riêng của nó, tuỳ từng trường hợp mà chúng ta dùng biến đổi nào Sau khi khảo sát xong các tín hiệu
và hệ thống rời rạc trong miền các biến số mới này nếu cần thiết chúng ta sẽ dùng các biến đổi ngược để đưa chúng về miền biến số độc lập cũ
Phương pháp khảo sát gián tiếp này sẽ làm đơn giản rất nhiều các công việc mà chúng ta gặp phải khi dùng phương pháp khảo sát trực tiếp trong miền biến số độc lập tự nhiên Đối với chúng ta hệ thống rời rạc cần khảo sát chính là miền không gian các điểm ảnh, có nhiều phép biến đổi cho dữ liệu ảnh trong đó có một số phương pháp biến đổi được sử dụng rất phổ biến như Fourier, biến đổi Cosine rời rạc, Wavelet…Các phép biến đổi này được sử dụng rất nhiều trong các kỹ thuật xử lí ảnh
Trang 32Trong phần một số kỹ thuật bổ trợ cho các phương pháp thuỷ vân ở phần sau sẽ trình bày một số phép biến đổi này đang được ứng dụng rất nhiều trong kỹ thuật thuỷ vân
1.8 Một số kỹ thuật bổ trợ cho các kỹ thuật thuỷ vân số trên ảnh
Phương pháp thuỷ vân số là một phương pháp mới và rất phức tạp, có thể nói việc nghiên cứu vẫn đang diễn ra và đang được các nhà nghiên cứu hình thành dần khung lý thuyết cho nó Nhưng cho đến nay những kỹ thuật đưa ra cũng chỉ là những thử nghiệm, lúc thì người ta dùng các công cụ lý thuyết mật mã học, lúc thì kỹ thuật truyền thông, khi lại sử dụng lý thuyết thông tin, cho nên những kỹ thuật thuỷ vân cũng hết sức phong phú và như vậy khi làm về thuỷ vân ta phải biết nhiều kỹ thuật và nhiều lĩnh vực lý thuyết khác nhau Tuy nhiên qua khảo sát gần đây của giáo sư Deepa Kunder của Trường đại học Toronto thì có 2 khuynh hướng chủ yếu đã được hình thành
đó là khuynh hướng sử dụng lý thuyết thông tin và lý thuyết truyền thông
Theo giáo sư, khuynh hướng lý thuyết truyền thông thực tế hơn so với
lý thuyết thông tin và có thể sử dụng dễ dàng hơn trong thiết kế thuật toán Có một vài sự khác biệt đặc trưng giữa hai khuynh hướng này Kỹ thuật thuỷ vân dựa trên lý thuyết truyền thông thường sử dụng những cơ sở lý thuyết trong truyền thông để thiết kế như việc dùng lý thuyết phân tích thống kê để tạo thuỷ vân và kiểm định thuỷ vân lấy ra so với thuỷ vân được nhúng vào Kỹ thuật trải phổ tín hiệu để truyền tin hay kỹ thuật tạo nhiễu cộng và lọc nhiễu Trong khi đó, khuynh hướng dùng lý thuyết thông tin lại sử dụng những cơ sở phân tích chung để phân tích chung để làm sao thu được hiệu suất cao nhất, chiến lược tốt nhất cho một thuật toán cụ thể hay khả năng chịu tấn công đối với một kỹ thuật thuỷ vân Một sự khác biệt nữa giữa hai khuynh hướng kỹ thuật thuỷ vân này là sự đánh giá hệ thống thuỷ vân Đối với khuynh hướng
Trang 33sử dụng lý thuyết truyền thông thì thường nhận biết thuỷ vân và đánh giá hệ thống thuỷ vân thông qua độ bền vững của thuỷ vân trước và sau khi giấu bằng phép đo hệ số lấy ra tỉ lệ bít lỗi (BER-Bit Error Rate) Còn những kỹ thuật theo khuynh hướng lý thuyết thông tin thì chủ yếu hệ thống được đánh giá thông qua khả năng giấu Nghĩa là tổng số bít có thể được nhúng và được lấy ra một cách đáng tin cậy
Trang 34CHƯƠNG II: THUỶ VÂN ẢNH SỐ DỰA VÀO PHÉP
BIẾN ĐỔI COSINE RỜI RẠC (DCT)
2.1 Phép biến đổi Cosine rời rạc
Biến đổi cosine rời rạc viết tắt là DCT - Discrete Cosine Transform được đưa ra bởi Ahmed và các đồng nghiệp của ông vào năm 1974 Từ đó cho đến nay, nó được sử dụng rất phổ biến trong nhiều các kỹ thuật xử lí ảnh
số nói riêng và các kỹ thuật xử lí tín hiệu số nói chung Trong các kỹ thuật thuỷ vân ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT cũng được sử dụng nhiều nhất Lí do ở đây là phép biến đổi DCT đã được dùng trong dạng chuẩn ảnh JPEG Nếu áp dụng DCT thì cũng theo chuẩn của JPEG và do đó sẽ tránh được mất thuỷ vân do phép nén JPEG
2.1.1 Định nghĩa biến đổi Cosine rời rạc hai chiều
Biến đổi DCT hai chiều tổng quát là biến đổi trên khối hai chiều bất kì M*N, trong đó các khối kích thước 8*8, 16*16 được sử dụng nhiều nhất Tuy nhiên, chúng ta sẽ chỉ tìm hiểu phép biến đổi DCT trên khối 8*8 được sử dụng trong chuẩn nén ảnh JPEG Vì tiêu chuẩn chọn khối phổ biến nhất vẫn là 8×8, có thể giải thích vấn đề này trên phương diện khả năng xử lý của phần cứng: Bởi vì, khối 8×8 trùng khớp với kích thước dữ liệu cực đại mà công nghệ vi mạch điện tử hiện thời có thể xử lý tại một thời điểm
Phép biến đổi thuận DCT 8*8 được định nghĩa như sau:
)12(cos(
)16
)12(cos(
),(4
)()()
,
(
k l
v l u
k l
k X v
u v
u
Còn biến đổi ngược IDCT được định nghĩa như sau:
Trang 35)16
)12(cos(
),(4
)()()
,
(
k l
v l u
k v
u I v u l
k
Trong đó:
I(u,v) được gọi là hệ số DCT và là số thực
X(k,l) là các mẫu gốc trong khối ma trận 8x8
u: Tần số ngang chuẩn hoá 0u7
2.1.2 Đặc điểm của phép biến đổi DCT trên ảnh hai chiều:
Thể hiện đặc tính nội dung về tần số của thông tin ảnh Hệ số bên góc trái (0,0) lớn đặc trưng cho giá trị trung bình thành phần một chiều gọi là hệ
số DC, còn các hệ số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần
số cao theo hướng ngang và theo hướng thẳng đứng gọi là các hệ số AC
u=0 u>0
v>0 v=0
Trang 36Hình 2.1: Ảnh Lena.bmp Hình 2.2: Năng lƣợng phân bố
của ảnh qua phép biến đổi DCT
Bản thân biến đổi DCT không nén được dữ liệu vì cũng sinh ra 64 hệ
số
Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo đường chéo, thì tướng ứng theo các hướng đó, các hệ số biến đổi DCT cũng lớn
Tóm lại, DCT làm giảm độ tương quan không gian của thông tin trong block Điều đó cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT
có xu hướng có phần dư thừa ít hơn Hơn nữa, các hệ số DCT chứa thông tin
về nội dung tần số không gian của thông tin trong block Nhờ các đặc tính tần
số không gian của hệ thống nhìn của mắt người, các hệ số DCT có thể được
mã hoá phù hợp, chỉ các hệ số DCT quan trọng nhất mới được mã hoá để truyền đi
Khối hệ số DCT có thể chia thành 3 miền: Miền tần số cao, miền tần số giữa, miền tần số thấp Trong đó, các thông tin trong miền tần số cao thường không mang tính tri giác cao, khi nén JPEG thì thường loại bỏ thông tin trong
Trang 37miền này Miền tần số thấp chứa các thông tin quan trọng ảnh hưởng đến tri
(a)
(b)
(c)
Hình 2.3: Phân chia 3 miền tần số ảnh của phép biến đổi DCT
(a): Miền tần số thấp, (b): Miền tần số ở giữa, (c): Miền tần số cao Trong các thuật toán thuỷ vân, miền hệ số DCT tần số cao thường không được sử dụng do nó thường không bền vững với các phép xử lí ảnh, hoặc nén ảnh JPEG Miền tần số cao cũng khó được sử dụng do một sự thay đổi dù nhỏ trong miền này cũng dẫn đến chất lượng tri giác của ảnh Vì vây, miền tần số ở giữa thường hay được sử dụng nhất và cũng cho kết quả tốt nhất Trong thuật toán đề xuất cũng sử dụng miền tần số ở giữa (phần được bôi đen trong hình vẽ số 2.3)
Trang 38Trong thuật toán dưới đây sẽ sử dụng phương pháp nhúng thuỷ vân trong miền tần số của ảnh, giải tần được sử dụng để chứa tín hiệu thuỷ vân là miền tần số ở giữa của một khối DCT 8x8 Trong đó, các khối DCT 8x8 là những khối ảnh cùng kích thước đã được chọn ra ngẫu nhiên từ ảnh ban đầu
và được áp dụng phép biến đổi Cosine rời rạc DCT để chuyển sang miền tần
số Mỗi tín hiệu thuỷ vân sẽ được chứa trong một khối
2 2 Các thuật toán thủy vân ảnh dựa vào phép biến đổi Cosine rời rạc
Mô tả thuật toán
Chọn một khối bất kì B và biến đổi DCT khối đó thu được B’
Chọn hai hệ số ở vị trí bất kì trong miền tần số ở giữa của khối DCT,
giả sử đó là b’(i,j) và b’(p,q) Tính
d = || b’(i,j)|- |b’(p,q)|| mod a
Trong đó, a là một tham số thoả mãn: a = 2(2t+1), t là số
nguyên dương
Trang 39Bit si sẽ được nhúng sao cho thoả mãn điều kiện:
d >= 2t+1 nếu s i = 1
d < 2t+1 nếu s i = 0
Nếu d<2t+1 mà si = 1 thì một trong hai hệ số DCT b’(i,j) hoặc
b’(p,q) có trị tuyệt đối lớn hơn sẽ bị thay đổi để d>=2t +1 theo công
thức sau:
max(|b’(i,j)|, |b’(p,q)|) + (INT(0.75 *a) - d)
Với hàm max(|b’(i,j)|, |b’(p,q)|) là hàm chọn ra hệ số có trị tuyệt đối
lớn hơn, hệ số được chọn sẽ được cộng thêm một lượng là:
(INT(0.75 *a) - d), Hoặc cũng có thể biến đổi một trong hai hệ số theo công thức:
min(|b’(i,j)|, |b’(p,q)|) - (INT(0.25 *a) + d )
Với hàm min(|b’(i,j)|, |b’(p,q)|) là hàm chọn ra hệ số có trị tuyệt đối nhỏ hơn, hệ số được chọn sẽ bị trừ đi một lượng là (INT(0.25 *a) + d), trong đó INT() là hàm lấy phần nguyên của một số thực
Tương tự, nếu d >= 2t+1 mà si = 0 thì một trong hai hệ số DCT b’(i,j) hoặc b’(p,q) có trị tuyệt đối lớn hơn sẽ được thay đổi để thoả mãn d<2t