Chương 1 TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN Chương này tập trung trình bày một số khái niệm liên quan đến ảnh số, các phép biến đổi ma trận sử dụng trong xử lý ảnh, kỹ thuật giấu tin, thuỷ
Trang 1TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
TRẦN ANH TRÚC
GIẤU TIN THUẬN NGHỊCH TRÊN ẢNH JPEG
VÀ ỨNG DỤNG TRONG BẢO MẬT DỮ LIỆU
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2016
Trang 2TRẦN ANH TRÚC
GIẤU TIN THUẬN NGHỊCH TRÊN ẢNH JPEG
VÀ ỨNG DỤNG TRONG BẢO MẬT DỮ LIỆU
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: PGS.TS PHẠM VĂN ẤT
THÁI NGUYÊN - 2016
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng
cá nhân, không sao chép lại của người khác Trong toàn bộ nội dung của luận văn, những điều được trình bày hoặc là của cá nhân hoặc là được tổng hợp từ nhiều nguồn tài liệu Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan của mình
Tác giả luận văn
Trang 4LỜI CẢM ƠN
Lời đầu tiên, tôi xin bày tỏ lòng biết ơn sâu sắc đến đến Ban Giám Hiệu, các thầy giáo, cô giáo phòng sau đại học trường đại học Công Nghệ Thông Tin & Truyền Thông, và các thầy giáo ở Viện Công Nghệ Thông Tin đã giảng dạy và cung cấp cho tôi những kiến thức rất bổ ích trong thời gian học, giúp tôi có nền tảng tri thức để phục vụ nghiên cứu khoa học sau này
Đặc biệt, tôi xin bày tỏ sự kính trọng và lòng biết ơn sâu sắc đến thầy giáo PGS.TS Phạm Văn Ất người đã tận tình hướng dẫn, chỉ bảo và giúp đỡ tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn này
Tôi cũng xin bày tỏ lòng cảm ơn đến gia đình và bạn bè, những người luôn quan tâm, động viên và khuyến khích tôi
Tác giả luận văn
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
MỤC LỤC iii
DANH MỤC CÁC BẢNG v
DANH MỤC CÁC HÌNH v
MỞ ĐẦU 1
Chương 1 TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN 3
1.1 Một số khái niệm cơ bản 3
1.1.1 Khái niệm về giấu tin 3
1.1.2 Vài nét về lịch sử giấu tin 3
1.1.3 Phân loại kỹ thuật giấu tin 5
1.1.4 Mô hình kỹ thuật giấu tin 6
1.2 Các hướng tiếp cận của kỹ thuật giấu tin trong ảnh 7
1.2.1 Tiếp cận trên miền không gian ảnh 7
1.2.2 Tiếp cận trên miền tần số ảnh 8
1.3 Thủy vân số trên ảnh 9
1.3.1 Các yêu cầu cơ bản của hệ thuỷ vân 11
1.3.2 Mô hình hệ thống thuỷ vân 12
1.3.3 Những tấn công trên hệ thuỷ vân 14
1.3.4 Đánh giá chất lượng ảnh trong thuỷ vân 15
1.3.5 Ứng dụng của thuỷ vân 16
1.4 Ảnh số 18
1.4.1 Khái niệm và phân loại ảnh số 18
1.4.2 Định dạng ảnh 19
1.5 Các phép biến đổi ma trận 21
1.5.1 Biến đổi Cosine rời rạc DCT 21
1.5.2 Biến đổi Wavelet rời rạc DWT 24
Trang 6Chương 2 MỘT SỐ KỸ THUẬT GIẤU TIN THUẬN NGHỊCH TRÊN ẢNH JPEG 25
2.1 Một số hướng tiếp cận trong giấu tin thuận nghịch 25
2.1.1 Sử dụng phương pháp dịch chuyển histogram 25
2.1.2 Sử dụng phép biến đổi mở rộng hiệu 29
2.1.3 Sử dụng nén bảo toàn 37
2.1.4 Sử dụng đặc trưng nén JPEG 38
2.2 Ảnh nén JPEG 39
2.3 Một số lược đồ nhúng tin thuận nghịch trên ảnh JPEG 41
2.3.1 Lược đồ nhúng tin thuận nghịch CLTT 42
2.3.2 Lược đồ nhúng tin thuận nghịch LS 47
2.3.3 Lược đồ nhúng tin thuận nghịch TSTA 47
2.3.4 Phân tích khả năng nhúng tin và chất lượng ảnh 51
2.3.5 Thực nghiệm 56
2.3.6 Kết luận 60
Chương 3 XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM 61
3.1 Môi trường thử nghiệm 61
3.2 Ảnh thử nghiệm 61
3.3 Cài đặt chương trình 63
3.4 Kết quả thử nghiệm 65
3.4.1 Khả năng nhúng tin 65
3.4.2 Chất lượng ảnh 65
3.5 Ứng dụng 67
3.5.1 Mô tả bài toán 67
3.5.2 Phương pháp giải quyết bài toán 67
KẾT LUẬN 69
TÀI LIỆU THAM KHẢO 70
Trang 7DANH MỤC CÁC BẢNG
Bảng 2.1 Kết quả tiền xử lý và nhúng tin trên Hình 2.5 44
Bảng 2.2 Kết quả trích tin và khôi phục ảnh gốc 46
Bảng 2.3 Kết quả nhúng tin trên Hình 2.5 của thuật toán TSTA 49
Bảng 2.4 Kết quả trích tin và khôi phục các dãy hệ số lượng tử gốc 51
Bảng 2.5 Kết quả khảo sát 9 đường chéo theo lược đồ CLTT 52
Bảng 2.6 Kết quả khảo sát 5 đường chéo theo lược đồ TSTA 52
Bảng 2.7 Khả năng nhúng tin của 3 lược đồ 58
Bảng 2.8 Kết quả thực nghiệm chất lượng ảnh của các lược đồ 59
Bảng 3.1 Khả năng nhúng tin của 2 lược đồ 65
Bảng 3.2 Kết quả thực nghiệm chất lượng ảnh của các lược đồ 66
DANH MỤC CÁC HÌNH Hình 1.1 Phân loại kỹ thuật giấu tin 5
Hình 1.2 Lược đồ của quá trình giấu tin 6
Hình 1.3 Lược đồ giải mã tin giấu 7
Hình 1.4 Phân loại các kỹ thuật thuỷ vân 10
Hình 1.5 Mô hình quá trình nhúng thuỷ vân 13
Hình 1.6 Mô hình quá trình tách và kiểm định thuỷ vân 14
Hình 1.7 Cấu trúc tệp ảnh bitmap 19
Hình 2.1 Biểu đồ histogram của ảnh màu Pepper 26
Hình 2.2 Sơ đồ nén ảnh JPEG chuẩn Baseline 39
Hình 2.3 Khối hệ số DCT 40
Hình 2.4 Bảng lượng tử của thành phần Y ứng với tỷ lệ nén 15:1 trong Photoshop CS5 40
Hình 2.5 Một khối DCTLT của ảnh Pepper 41
Hình 2.6 Các đường chéo của khối DCTLT 42
Hình 2.7 Lược đồ nhúng tin LS 47
Trang 8Hình 2.8 Sự thay đổi của khối DCTLT sau khi nhúng 55
Hình 2.9 Bộ ảnh thử nghiệm 57
Hình 3.1 Bộ ảnh thử nghiệm 63
Hình 3.2 Giao diện nhúng tin 64
Hình 3.3 Giao diện trích tin và khôi phục ảnh gốc 64
Hình 3.4 Sơ đồ nhúng đề thi vào ảnh JPEG 68
Hình 3.5 Sơ đồ trích đề thi và xác thực tính toàn vẹn 68
Trang 9MỞ ĐẦU
Ngày nay, cùng với sự ra đời và phát triển rộng rãi của mạng Internet, nhu cầu trao đổi thông tin qua mạng ngày càng lớn Thông tin đã trở thành sẵn sàng và trực tuyến Chúng ta đang sống trong xã hội của thông tin, đã có truyền tin thì thường có yêu cầu bí mật quốc gia, có bí mật quân sự, có bí mật công nghệ, có bí mật kinh tế, và rất nhiều bí mật cá nhân nữa Chính vì vậy, vấn đề an toàn và bảo mật thông tin luôn nhận được sự quan tâm của nhiều lĩnh vực Các công nghệ và giải pháp để bảo vệ thông tin đã và đang được nghiên cứu, phát triển phù hợp với nhiều dạng lưu trữ các thông tin và phương thức truyền tải thông tin
Giải pháp bảo mật thông tin được sử dụng phổ biến nhất là dùng các hệ mật mã như: Hệ mã hoá công khai, hệ mã hoá bí mật Với giải pháp này, thông tin ban đầu (bản rõ) sẽ được mã hoá thành bản mật mã (bản mật) Tuy vậy các bản mật mã dễ gây sự chú ý của tin tặc Một phương pháp khác đã và đang được nghiên cứu, ứng dụng rất mạnh mẽ ở nhiều lĩnh vực đó là phương pháp giấu tin mật (Steganography) Theo phương pháp này, tin mật được nhúng vào một tệp môi trường, ví dụ tệp ảnh Tệp ảnh chứa tin mật được truyền đi và người nhận có thể khôi phục tin mật từ ảnh nhận được Phương pháp này khá an toàn vì vừa có khóa bảo mật vừa không gây sự chú ý của tin tặc Nhiều cách thức giấu tin mật đã được nghiên cứu và ứng dụng, trên nhiều định dạng khác nhau như âm thanh, hình ảnh và video…Cả hai phương pháp trên đều có những ưu, nhược điểm nhất định Mã hoá giúp che giấu nội dung thông tin, giấu tin mật giúp che giấu hoạt động trao đổi thông tin Trên thực
tế, để đảm bảo an toàn cho các kênh trao đổi thông tin bí mật ta cần phải kết hợp cả hai phương pháp này
Giấu dữ liệu là một lĩnh vực rộng lớn, Các phương pháp giấu tin và thủy vân được nghiên cứu phổ biến trên ảnh nén bảo toàn như BMP, TIF, PRG
Trang 10Đối với các ảnh loại này, việc nhúng tin được thực hiện trực tiếp trên ma trận điểm ảnh Tuy nhiên, các kỹ thuật nhúng tin đó không áp dụng được trên ảnh nén có mất mát thông tin Gần đây, có một số công trình nghiên cứu về giấu tin thuận nghịch trên ảnh JPEG Đây là một hướng nghiên cứu mới có nhiều ứng dụng Vì vậy, em chọn đề tài: “Giấu tin thuận nghịch trên ảnh JPEG
và ứng dụng trong bảo mật dữ liệu” làm luận văn tốt nghiệp của mình.
Cấu trúc của luận văn:
Ngoài phần mở đầu, phần kết luận, phần mục lục và tài liệu tham khảo Luận văn được bố cục thành 3 chương, cụ thể như sau:
Chương 1: Tổng quan về kỹ thuật giấu tin
Chương 2: Một số kỹ thuật giấu tin thuận nghịch trên ảnh JPEG
Chương 3: Phần mềm thử nghiệm và ứng dụng
- Kết luận và những kiến nghị về hướng phát triển
Mặc dù trong quá trình nghiên cứu và hoàn thành luận văn em đã rất nỗ lực và cố gắng Song do thời gian và trình độ còn hạn chế nên luận văn khó tránh khỏi những thiếu sót, kính mong nhận được sự đóng góp, chỉ bảo của các thầy giáo, cô giáo và các bạn để luận văn được hoàn thiện hơn
Trang 11Chương 1 TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN
Chương này tập trung trình bày một số khái niệm liên quan đến ảnh số, các phép biến đổi ma trận sử dụng trong xử lý ảnh, kỹ thuật giấu tin, thuỷ vân
số và úng dụng
1.1 Một số khái niệm cơ bản
1.1.1 Khái niệm về giấu tin
Giấu tin là một kỹ thuật giấu một lượng thông tin số nào đó vào một đối tượng dữ liệu khác
Kỹ thuật giấu tin nhằm hai mục đích: một là bảo mật cho dữ liệu được đem giấu, hai là bảo vệ cho chính đối tượng được giấu tin ở trong Hai mục đích khác nhau này dẫn đến hai kỹ thuật chủ yếu của giấu tin Hướng thứ nhất
là giấu tin mật, nhằm tập trung vào các kỹ thuật giấu tin sao cho người khác khó phát hiện được đối tượng có chứa thông tin mật bên trong Hướng thứ hai
là thuỷ vân số, hướng thuỷ vân số có miền ứng dụng lớn hơn nên được quan tâm nghiên cứu nhiều hơn và thực tế đã có rất nhiều kỹ thuật đã được đề xuất
1.1.2 Vài nét về lịch sử giấu tin
Kỹ thuật giấu tin đã được đề xuất và sử dụng từ thời xa xưa, và sau này
đã được phát triển ứng dụng cho nhiều lĩnh vực Từ Steganography bắt nguồn
từ Hi Lạp với ý nghĩa là tài liệu được phủ (coevered writting) Các câu chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ Có lẽ những ghi chép sớm nhất về kỹ thuật giấu thông tin thuộc về sử gia Hi Lạp Herodotus Khi bạo chúa Herodotus bị vua Darius bắt ở Susa vào thế kỷ thứ
V trước công nguyên, ông ta đã gửi một bài báo bí mật cho con rể của mình là Aristagoras ở Miletus Để thực hiện điều này, Histiaeus đã cạo trọc đầu một
nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ ấy Khi tóc của người nô lệ mọc đủ dài người nô lệ được gửi tới Miletus
Trang 12Một câu chuyện khác về thời Hi Lạp cổ đại cũng do Herodotus ghi lại Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong Demeratus, một người Hi Lạp, cần thông báo cho Sparta rằng Xerxes định xâm chiếm Hi Lạp Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại các viên thuốc bằng một lớp sáp mới Những viên thuốc được để ngỏ và lọt qua mọi sự kiểm soát một cách dễ dàng
Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong một thời gian dài Người Roman cổ đã biết sử dụng những chất sẵn có như nước quả, nước tiểu và sữa để viết các thông báo bí mật giữa những hàng văn
tự thông thường Khi bị hơ nóng, những thứ mực không nhìn thấy trở lên sẫm màu và có thể đọc dễ dàng Mực không màu cũng được sử dụng rất gần đây, như trong thời gian chiến tranh Thế giới II Như vậy ý tưởng về che giấu thông tin đã có từ hàng nghìn năm về trước nhưng chủ yếu được áp dụng trong quân đội và các cơ quan tình báo Mãi cho tới vài thập niên gần đây, do
sự phát triển rộng rãi của Internet, nhu cầu bảo mật thông tin cho cá nhân và các cơ sở tư nhân và các giao dịch trên mạng máy tính ngày một trở thành bức thiết, giấu thông tin mới nhận được sự quan tâm của các nhà nghiên cứu với hàng loạt công trình có giá trị được áp dụng rộng rãi và công khai trong hoạt động sản xuất, quản trị và kinh doanh Cuộc cách mạng số hóa thông tin và sự phát triển nhanh chóng của mạng truyền thông là nguyên nhân chính dẫn đến
sự thay đổi này Gần đây, những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, cộng với sự lưu thông phân phối trên mạng diện rộng của các dữ liệu đa phương tiện đã làm nảy sinh nhiều vấn đề nhức nhối về nạn
ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc trái phép càng đòi hỏi phải đẩy mạnh hơn nữa việc nghiên cứu trong lĩnh vực này
Trang 131.1.3 Phân loại kỹ thuật giấu tin
Có thể chia lĩnh vực giấu tin thành hai hướng chính, đó là thuỷ vân số và giấu tin mật
Kỹ thuật giấu tin mật luôn chú trọng đến tính che giấu, với tính che giấu,
các đối thủ khó có thể phát hiện được đối tượng có chứa tin mật bên trong hay không; hơn nữa, nếu phát hiện có giấu tin thì việc giải mã thông tin mật cũng khó có thể thực hiện được Đồng thời, các kỹ thuật giấu tin mật còn quan tâm lượng tin có thể được giấu
Phạm vi ứng dụng của thuỷ vân đa dạng hơn, tuỳ theo mục đích của hệ thuỷ vân mà người ta lại chia thành các hướng nhỏ như: thuỷ vân dễ vỡ và thuỷ vân bền vững Thuỷ vân bền vững quan tâm nhiều đến việc nhúng những mẩu tin đòi hỏi độ bền vững cao của thông tin được giấu trước các biến đổi thông thường trên dữ liệu môi trường Thuỷ vân dễ vỡ yêu cầu thông tin giấu
sẽ bị sai lệch nếu có bất kỳ sự thay đổi nào trên dữ liệu chứa Như vậy, kỹ thuật giấu tin có thể được phân loại như trong hình 1.1
Giấu thông tin
Thuỷ vân bền vững
Trang 141.1.4 Mô hình kỹ thuật giấu tin
Mô hình của kỹ thuật giấu tin được mô tả trong Hình 1.2 và 1.3 Trong
đó, Hình 1.2 biểu diễn quá trình giấu tin Phương tiện chứa bao gồm các đối tượng được dùng làm môi trường để giấu tin như các tệp Multimedia Thông tin cần giấu là một lượng thông tin mang một ý nghĩa nào đó tuỳ thuộc vào mục đích của người sử dụng Thông tin sẽ được giấu vào trong môi trường chứa nhờ một bộ nhúng Bộ nhúng là những chương trình, thuật toán để giấu tin và được thực hiện với một khoá bí mật giống như các hệ mật mã cổ điển Sau khi giấu tin ta thu được môi trường đã giấu tin và được phân phối trên các phương tiện truyền thông khác nhau
Hình 1.2 Lược đồ của quá trình giấu tin
Hình 1.3 chỉ ra các công việc của quá trình giải mã thông tin đã được giấu Quá trình giải mã được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin kết hợp với khoá để giải mã thông tin Khoá để giải
mã thông tin có thể giống hoặc khác với khoá để nhúng thông tin Kết quả thu được gồm môi trường gốc và thông tin đã được giấu Tuỳ trường hợp, thông tin tách được có thể cần xử lí, kiểm định so sánh với thông tin giấu ban đầu
Khoá
Thông tin cần giấu
Dữ liệu môi trường
đã được giấu tin
Trang 15Thông qua dữ liệu mật được tác ra từ môi trường chứa tin giấu, người ta có thể biết được trong quá trình phát tán dữ liệu có bị tấn công hay không
Với một hệ thống giấu tin mật, tính an toàn của dữ liệu cần giấu được quan tâm đặc biệt Một hệ thống được xem là có độ bảo mật cao nếu độ phức tạp của các thuật toán thám mã khó có thể thực hiện được trên máy tính Tuy nhiên, cũng có một số hệ thống lại quan tâm đến số lượng thông tin có thể được giấu, hoặc quan tâm đến sự ảnh hưởng của thông tin mật đến môi trường chứa dữ liệu
1.2 Các hướng tiếp cận của kỹ thuật giấu tin trong ảnh
1.2.1 Tiếp cận trên miền không gian ảnh
Miền không gian ảnh là miền dữ liệu ảnh gốc, tác động lên miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm ảnh Đây là hướng tiếp cận tự nhiên bởi vì khi nói đến việc giấu tin trong ảnh
Dữ liệu môi trường (audio, video, ảnh )
đã được giấu tin
Hình 1.3 Lược đồ giải mã tin giấu
Kiểm định
Trang 16người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn, một phương pháp phổ biến của hướng tiếp cận này là phương pháp tác động đến bit ít quan trọng của mỗi điểm ảnh
Tuy nhiên, phương pháp này cũng có nhiều hạn chế, chẳng hạn như không đảm bảo được tính bền vững của thông tin giấu đối với các thao tác biến đổi như quay ảnh hoặc nén ảnh Jpeg Điều này là dễ hiểu vì các thao tác nói trên cũng loại bỏ hoặc làm sai lệch các bit ít quan trọng nhất của mỗi điểm ảnh
1.2.2 Tiếp cận trên miền tần số ảnh
Hướng tiếp cận dựa trên miền không gian ảnh như đã trình bày ở trên là cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập tự nhiên Nhưng trong nhiều trường hợp, cách khảo sát trực tiếp này gặp phải những khó khăn nhất định hoặc rất phức tạp và hiệu quả không cao
Ngoài phương pháp khảo sát trực tiếp, có thể dùng phương pháp khảo sát gián tiếp thông qua các kỹ thuật biến đổi Các biến đổi này làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền mới với các biến số mới Phương pháp biến đổi này cũng giống như phương pháp biến đổi trong phép tính tích phân hay phương pháp đổi hệ toạ độ trong giải tích của toán phổ thông quen thuộc
Mỗi cách biến đổi sẽ có những thuận lợi riêng, tuỳ từng trường hợp mà chúng ta chọn phép biến đổi nào cho phù hợp Sau khi khảo sát, biến đổi xong các tín hiệu và hệ thống rời rạc trong miền các biến số mới này, nếu cần thiết
có thể dùng các biến đổi ngược để đưa chúng trở lại miền biến số độc lập Phương pháp khảo sát gián tiếp sẽ làm đơn giản rất nhiều các công việc gặp phải khi dùng phương pháp khảo sát trực tiếp trong miền biến số độc lập
Trang 17tự nhiên Hệ thống rời rạc cần khảo sát chính là miền không gian các điểm ảnh Có một số phương pháp biến đổi được sử dụng rất phổ biến như: Furier, Cosin rời rạc (DCT), Wavelet… Đây là những phép biến đổi được sử dụng nhiều trong các kỹ thuật xử lý ảnh và âm thanh Trong giấu tin, đặc biệt trong
kỹ thuật thuỷ vân tiếp cận theo miền tần số, các phép biến đổi từ miền biến số
tự nhiên của ảnh sang miền tần số như biến đổi Furier, biến đổi cosin rời rạc, Wavelet được sử dụng phổ biến
1.3 Thủy vân số trên ảnh
Như đã giới thiệu ở trên, tính an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể hiện ở hai khía cạnh Một là bảo vệ cho dữ liệu đem giấu và hai là bảo vệ cho chính đối tượng sử dụng để giấu tin Tương ứng với hai khía cạnh đó
có hai khuynh hướng kỹ thuật rõ ràng đó là giấu tin mật và thuỷ vân số
Thuỷ vân trên ảnh số là kỹ thuật nhúng một lượng thông tin số vào một bức ảnh số và thông tin nhúng được gắn liền với bức ảnh chứa và dữ liệu thuỷ vân có thể được hiển thị hoặc ẩn phụ thuộc vào mỗi kỹ thuật thuỷ vân cụ thể Trong kỹ thuật thuỷ vân số thì thông tin nhúng được gọi là thuỷ vân Thuỷ vân có thể là một chuỗi ký tự, hay một hình ảnh, logo nào đó
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiển sao chép… Có thể thấy rõ là phần ứng dụng của thuỷ vân rất lớn, mỗi ứng dụng lại có những yêu cầu riêng, do đó các kỹ thuật thủy vân cũng có những tính năng khác biệt tương ứng Có thể chia các kỹ thuật thủy vân theo nhóm như trong hình 1.4
Trang 18Hình 1.4 Phân loại các kỹ thuật thuỷ vân
Các kỹ thuật thủy vân trên hình 1.4 được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và khía cạnh ứng dụng những kỹ thuật đó Trong thực tế, tuỳ theo mục đích, yêu cầu của bài toán mà ta sẽ chọn kỹ thuật thuỷ vân phù hợp Tuy nhiên, các kỹ thuật trên cũng có một số đặc điểm giống nhau
Thuỷ vân dễ vỡ là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho sản phẩm khi phân phối trong môi trường nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như thuỷ vân gốc Các kỹ thuật thuỷ vân có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin và phát hiện xuyên tạc thông tin Rất dễ hiểu vì sao những ứng dụng này cần đến kỹ thuật thủy vân dễ vỡ Ví dụ như để bảo vệ chống xuyên tạc, một ảnh nào đó ta nhúng một thuỷ vân vào trong ảnh và sau đó phân phối, quảng bá ảnh đó Khi cần kiểm tra lại ảnh ta sử dụng hệ thống đọc thuỷ vân Nếu không đọc được thuỷ vân hoặc thuỷ vân đã bị sai lệch nhiều so với thuỷ vân ban đầu đã nhúng vào ảnh thì có nghĩa là ảnh đó đã bị thay đổi
Thuỷ vân
Thuỷ vân ẩn Thuỷ vân hiện Thuỷ vân ẩn Thuỷ vân hiện
Trang 19Ngược lại, với kỹ thuật thủy vân dễ vỡ là kỹ thuật thuỷ vân bền vững Các kỹ thuật thủy vân bền vững thường được sử dụng trong các ứng dụng bảo
vệ bản quyền Trong những ứng dụng đó, thuỷ vân đóng vai trò là thông tin
sở hữu của người chủ hợp pháp Thuỷ vân được nhúng trong các sản phẩm như một hình thức dán tem bản quyền Trong trường hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân Một yêu cầu lý tưởng đối với thuỷ vân bền vững là nếu muốn loại bỏ thuỷ vân thì cách duy nhất là phá huỷ sản phẩm Thuỷ vân bền vững lại được chia thành hai loại là thủy vân ẩn và thuỷ vân hiện Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến VTV1, VCT2, HBO… Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc Đối với thuỷ vân hiện, thông tin bản quyền hiển thị ngay trên sản phẩm Còn đối với thuỷ vân ẩn thì cũng giống như giấu tin, yêu cầu tính ẩn cao, bằng mắt thường không thể nhìn thấy thuỷ vân Trong vấn đề bảo vệ bản quyền, thủy vân ẩn mang tính bất ngờ hơn trong việc phát hiện sản phẩm bị lấy cắp Trong trường hợp này, người chủ sở hữu hợp pháp sẽ chỉ ra bằng chứng là thuỷ vân đã được nhúng trong sản phẩm bị đánh cắp
1.3.1 Các yêu cầu cơ bản của hệ thuỷ vân
Hệ thuỷ vân số trên ảnh cũng là một hệ giấu tin nên cũng có một số đặc điểm và tính chất giống giấu tin trong ảnh Đó là:
- Phương tiện chứa là ảnh hai chiều tĩnh
- Thủy vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi kích thước ảnh
- Thông tin được giấu vào trong ảnh nhưng không ảnh hưởng nhiều đến chất lượng ảnh
Trang 20- Kỹ thuật giấu phụ thuộc vào bản chất của hệ thống thị giác con người
- Ngoài một số đặc điểm chung nêu trên, kỹ thuật thuỷ vân trên ảnh số được phân biệt với kỹ thuật giấu tin mật ở những đặc trưng sau đây:
Thông tin thuỷ vân có hoặc không bị biến đổi khi ảnh chứa bị thay đổi
Đối với hệ thống thuỷ vân bền vững, yêu cầu thông tin thuỷ vân không thay đổi trước các tác động làm thay đổi thông tin trên ảnh chứa thuỷ vân Ngược lại, hệ thống thuỷ vân dễ vỡ yêu cầu thông tin thuỷ vân sẽ bị thay đổi (vỡ) nếu có bất cứ thay đổi nào trên ảnh chứa thuỷ vân
Thuỷ vân ẩn, thuỷ vân hiện
Không giống như giấu tin mật với yêu cầu bắt buộc là thông điệp giấu phải ẩn bên trong ảnh sao cho mắt thường không phát hiện được sự tồn tại của thông tin giấu thì kỹ thuật thủy vân số lại có hai loại là thuỷ vân ẩn và thuỷ vân hiện Nghĩa là có loại thuỷ vân cho phép nhìn thấy được thông tin đem nhúng vào, có loại không nhìn thấy Loại thuỷ vân hiện được sử dụng cho mục đích công bố công khai về quyền sở hữu, ngược lại, thuỷ vân ẩn được sử dụng với mục đích giấu bí mật các thông tin xác nhận quyền sở hữu sản phẩm
Tính chất bền vững
Đây là tính chất quan trọng nhất của một hệ thuỷ vân bền vững Đối với
hệ thống thuỷ vân này, yêu cầu hàng đầu là hệ thuỷ vân phải chống lại được các phép biến đổi, hay các tấn công có chủ định hoặc không có chủ định lên ảnh chứa thuỷ vân Tiêu chuẩn của hệ thuỷ vân này là thủy vân phải tồn tại cùng với sự tồn tại của ảnh chứa, thủy vân chỉ bị phá huỷ khi chấp nhận mất
đi đáng kể chất lượng của ảnh chứa
1.3.2 Mô hình hệ thống thuỷ vân
Một mô hình hệ thống thuỷ vân tổng quát được xem xét theo hai quá trình:
Quá trình nhúng thuỷ vân
Trang 21Mô hình quá trình nhúng thuỷ vân được thể hiện qua hình 1.5
Hình 1.5 Mô hình quá trình nhúng thuỷ vân
Quá trình tách thuỷ vân
Ảnh chứa thuỷ vân SW trong quá trình phân phối có thể bị sử dụng trái phép, người sử dụng có thể đã dùng một số phép biến đổi ảnh thông thường
để tấn công vào SW nhằm phá huỷ thủy vân nếu có trong SW, các tấn công trên
Ảnh chứa thuỷ vân SW
Khoá K
Trang 22- Tuỳ theo kỹ thuật, ảnh gốc S có thể sử dụng;
- Việc tách thủy vân được thực hiện theo một thuật toán đã xác định Kết quả là thông tin thủy vân W* tách được từ SW*
- Thuỷ vân tách được cần so sánh với thuỷ vân gốc W để đưa ra những kết luận
Mô hình quá trình tách thuỷ vân trong hệ thống thuỷ vân được trình bày trong hình 1.6
Hình 1.6 Mô hình quá trình tách và kiểm định thuỷ vân
1.3.3 Những tấn công trên hệ thuỷ vân
Hệ thống thủy vân cần chống lại được một số phép xử lý ảnh thông thường và một số tấn công có chủ định đối với ảnh chứa thuỷ vân Tuỳ theo mục tiêu bảo vệ, trong thực tế khi tiến hành thuỷ vân phải cân nhắc giữa tính bền vững với các thuộc tính khác như lượng thông tin giấu, tính ẩn… Dựa vào những biến đổi có chủ định hay không có chủ định đối với hệ thuỷ vân
mà ta có thể phân biệt thành một số loại tấn công sau:
- Biến đổi tín hiệu, làm sắc nét, thay đổi độ tương phản, màu, gam màu;
- Nhiễu cộng, nhiễu nhân;
Thuỷ vân tách W*
Kiểm định
Thuỷ vân gốc
W
Kết luận
Trang 23- Giảm dữ liệu: cropping, sửa histogram;
- Thuỷ vân nhiều lần
Yêu cầu cơ bản nhất của hệ thống thuỷ vân bền vững là đảm bảo tính bền vững của thuỷ vân sao cho các tấn công có chủ định với mục đích loại bỏ thuỷ vân sẽ làm cho giá trị thương mại của ảnh gốc bị ảnh hưởng lớn thậm chí đến việc huỷ sản phẩm gốc
1.3.4 Đánh giá chất lượng ảnh trong thuỷ vân
Hệ thống thuỷ vân theo hai hướng, thuỷ vân dễ vỡ và thuỷ vân bền vững Trong thuỷ vân bền vững thì kỹ thuật thuỷ vân ẩn có nhiều hướng ứng dụng Trong hệ thống thuỷ vân ẩn, thuỷ vân được nhúng mang tính bất ngờ trong việc chứng minh quyền sở hữu cho nên yêu cầu cơ bản đối với kỹ thuật này là: tính ẩn của thuỷ vân trong ảnh chứa, ảnh được nhúng thuỷ vân vẫn đảm bảo chất lượng thương mại so với ảnh gốc: tính bền vững của thuỷ vân trước các tấn công thông thường lên ảnh chứa Liên quan đến những yếu tố này, các
kỹ thuật đánh giá chất lượng ảnh được sử dụng
1.3.4.1 Chất lượng ảnh gốc và ảnh chứa thuỷ vân
Trong giấu tin nói chung, và trong hệ thống thuỷ vân ẩn nói riêng, một yêu cầu cao được đặt ra là ảnh sau khi nhúng thông tin có sự sai khác so với ảnh gốc càng ít càng tốt Có thể sử dụng hệ thống thị giác của con người để cảm nhận và đánh giá tiêu chuẩn này
Việc đánh giá, so sánh một cách chính xác sự sai khác về chất lượng ảnh gốc F và ảnh sau khi nhúng thông tin thuỷ vân G có thể thực hiện qua việc tính giá trị PSNR (Peak Signal to Noise Ratio) giữa ảnh gốc F và ảnh chứa thuỷ vân G cùng có kích thước min theo công thức:
Trong đó:
Trang 242 1
)) , ( 1
) , ( (
1
j i j
G j i F n
m MSE
n m
là bình phương độ lệch giữa ảnh gốc F và ảnh chứa thuỷ vân G
Với các phép nén ảnh, người ta chấp nhận giá trị PSNR trong khoảng 40dB Giá trị PSNR càng lớn thể hiện sự sai khác giữa ảnh gốc và ảnh sau khi nhúng thông tin càng thấp
30-1.3.4.2 So sánh thuỷ vân tách được với thủy vân gốc
Thủy vân được nhúng sau khi giải mã sẽ được so sánh để kiểm định, chứng thực thuỷ vân Có những thuỷ vân nhìn thấy được và mang ý nghĩa nhận biết thì công việc trở nên đơn giản chẳng hạn như thuỷ vân là một chuỗi
ký tự ASCII mang thông tin nào đó như tên tác giả, ngày tháng… thì khi giải
mã ta cũng dễ dàng nhận biết được thông tin Hay như thuỷ vân là một ảnh nào đó chẳng hạn thì giải mã ta cũng được một ảnh tương tự và ta có thể nhìn thấy sự khác biệt giữa hai ảnh
Tuy nhiên, trong một số trường hợp thì thuỷ vân là một chuỗi bit, khi đó công việc nhận diện thuỷ vân sẽ không đơn giản Hoặc ngay cả trong trường hợp thuỷ vân là những thông tin mang ý nghĩa nhận biết được thì cũng phải
có kỹ thuật để kiểm định, định lượng sự đúng sai của thuỷ vân
Có nhiều kỹ thuật để kiểm định, định lượng thuỷ vân Kỹ thuật đơn giản nhất là ta tính tỷ lệ đúng sai từng bit theo công thức:
SR = (số bít trùng nhau) / (tổng số bit)
1.3.5 Ứng dụng của thuỷ vân
Yêu cầu cơ bản nhất của hệ thống thủy vân là phải đảm bảo tính chất bền vững và người ta đã ứng dụng kỹ thuật giấu tin vào vào một số bài toán sau:
Bài toán bảo vệ quyền tác giả
Đây là ứng dụng cơ bản nhất của kỹ thuật thủy vân số Một thông tin nào
đó mang ý nghĩa đặc trưng riêng bản quyền được sở hữu bởi tác giả thì gọi nó
Trang 25là thủy vân, thông tin này sẽ được nhúng vào trong các sản phẩm đa phương tiện, và nó là minh chứng cho bản quyền của tác giả nhằm bảo vệ các sản phẩm chống lại các hành vi vi phạm lấy cắp hoặc làm nhái Các yêu cầu kỹ thuật đối với ứng dụng này là thủy vân phải tồn tại bền vững cùng với sản phẩm, chỉ khi muốn bỏ thủy vân này mà không được phép của người chủ sở hữu hay tác giả thì chỉ còn có cách là phá hủy sản phẩm đó
Bài toán giấu tin mật
Với bài toán này, thông tin cần được che giấu trong trường hợp này là cần được bảo vệ trước các đối tượng không được phép Việc giải mã nó để nhận được thông tin cũng không cần dữ liệu môi trường gốc Đối với các thuật toán giấu thông tin mật này không quan tâm đến việc bảo vệ thông tin mật trước sự tấn công, phá hoại của các đối thủ mà thay vào đó là các thuật toán rất chú trọng đến tính ẩn và tính an toàn đối với dữ liệu thông tin cần che giấu Do đó, các thuật toán giấu tin này có độ bảo mật cao sẽ được dùng trong
các ứng dụng giấu tin mật
Bài toán xác thực thông tin
Với bài toán này, một số thông tin sẽ được che giấu trong dữ liệu nguồn
và thông tin này sẽ được sử dụng để nhận biết xem dữ liệu nguồn có bị thay đổi, biến dạng hay không Với loại ứng dụng này thì thủy vân cần được ẩn để tránh được sự tò mò, nhận thấy của đối thủ, hơn nữa việc làm giả các thủy vân hợp lệ hay xuyên tạc thông tin nguồn cũng rất cần được quan tâm chú ý Các ứng dụng trong thực tế, người ta mong muốn tìm được vị trí bị xuyên phá cũng như nhận biết được các thay đổi Các yêu cầu chung đối với loại ứng
dụng này là khả năng giấu thông tin rất cao và thủy vân không cần bền vững
Bài toán kiểm soát sao chép
Với bài toán này, thủy vân được sử dụng để kiểm soát việc sao chép thông tin Các thiết bị phát hiện ra thủy vân thường được cài đặt sẵn trong các
Trang 26hệ thống đọc và ghi Các ứng dụng thuộc bài toán này yêu cầu thủy vân phải được đảm bảo an toàn và cũng sử dụng phương pháp phát hiện thủy vân đã
giấu mà không cần thông tin gốc
Bài toán dán nhãn hay giấu vân tay
Với bài toán này, thủy vân số được sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Như các thủy vân khác nhau sẽ được nhúng vào các bản sao khác nhau của thông tin gốc trước khi gửi đi cho nhiều người khác nhau Yêu cầu của các ứng dụng này là đảm bảo độ an toàn cao cho các thủy vân nhằm tránh sự xóa dấu vết trong khi phân phối, truyền tải
1.4 Ảnh số
1.4.1 Khái niệm và phân loại ảnh số
Ảnh số là tập hợp bao gồm hữu hạn các phần tử được gọi là điểm ảnh (pixel), mỗi điểm ảnh được biểu diễn bởi một số hữu hạn các bit
Trên phương diện toán học, ảnh số được xem như là một ma trận nguyên dương gồm m hàng và n cột, mỗi phần tử của ma trận đại diện cho một điểm ảnh Dựa theo màu sắc ta có thể chia ảnh số thành 3 loại cơ bản: Ảnh nhị phân, ảnh đa cấp xám và ảnh màu (true color)
Ảnh nhị phân
Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và màu còn lại cho đối tượng của ảnh Nếu hai màu là đen và trắng thì gọi là ảnh đen trắng Như vậy, ảnh nhị phân được xem như một ma trận nhị phân
Ảnh đa mức xám
Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau trong khoảng màu đen - màu trắng Như vậy, ảnh đa mức xám xem như là ma trận không âm có giá trị tối đa là 255 Mỗi điểm ảnh trong ảnh đa cấp xám biểu diễn cường độ sáng của ảnh tại điểm đó
Trang 27Ảnh màu
Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn bởi
một số byte (thường là 3 byte) đại diện cho 3 thành phần màu và như vậy, ảnh
màu có thể xem như 3 ma trận nguyên ứng với 3 thành phần màu của các điểm ảnh Hệ màu RGB sẽ bao gồm 3 ma trận màu tương ứng với các giá trị Red, Green và Blue Đây là hệ màu được sử dụng phổ biến nhất
Ngoài ra, ảnh cũng cũng có thể được phân thành hai loại: Ảnh có tần số cao và ảnh có tần số thấp
1.4.2 Định dạng ảnh
Ảnh bitmap
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh dạng raster khá
phổ biến Các tập tin đồ họa lưu dưới dạng BMP thường có đuôi là BMP
hoặc DIB (Device Independent Bitmap)
Hình 1.7 Cấu trúc tệp ảnh bitmap
Các thuộc tính tiêu biểu của một tập tin ảnh BMP là:
- Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n
Một ảnh BMP n-bit có 2n màu Giá trị n càng lớn thì ảnh càng có nhiều màu,
Trang 28và càng rõ nét hơn Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lượng hình ảnh trung thực nhất
- Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel)
- Chiều rộng của ảnh (width), cho bởi điểm ảnh
Cấu trúc tập tin ảnh BMP bao gồm 4 phần:
Bitmap Header (14 bytes): giúp nhận dạng tập tin bitmap
Bitmap Information (40 bytes): lưu một số thông tin chi tiết giúp hiển
thị ảnh
Color Palette (4*x bytes), x là số màu của ảnh: định nghĩa các màu sẽ
được sử dụng trong ảnh
Bitmap Data: lưu dữ liệu ảnh
Đặc điểm nổi bật nhất của định dạng BMP là tập tin hình ảnh thường không được nén bằng bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin một điểm ảnh sẽ được mô tả bởi một hay nhiều byte
tùy thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP
thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG)
Ảnh JPEG
Ảnh JPEG là một định dạng ảnh đã qua xử lý nén ảnh, thuật toán nén là
thuật toán JPEG(Joint Photographic Experts Group) - một trong những
phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh sẽ bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người
Trang 29Một số đặc điểm của ảnh JPEG là:
- Ảnh có dung lượng nhỏ, dùng phổ biến trên các thiết bị di động, các trang web
- Ảnh JPEG có thể hiển thị các hình ảnh với các màu chính xác colour), có thể lên đến 16 triệu màu
(true Ảnh sử dụng thuật toán nén JPEG sẽ bị mất thông tin so với ảnh gốc
Do đó một số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, và các vùng sẽ mất đi sự rõ nét
Các định dạng khác
Ngoài hai định dạng ảnh kể trên còn có rất nhiều định dạng ảnh khác phổ biến được kể đến như:
- Ảnh raster: PNG, ICO, GIFF, TIFF,…
- Ảnh vector: AI, CorelDRAW, CGM, DXF, EVA, EMF, Gerber, HVIF, IGES, PGML,…
- Ảnh RAW: CIFF, DNG, ORF
1.5 Các phép biến đổi ma trận
Như chúng ta đã biết, ảnh số được lưu dưới dạng các ma trận điểm ảnh
Do đó, các phép biến đổi ảnh số thực chất là các phép biến đổi trên các ma trận Trong mục này, ta xét các phép biến đổi ma trận được sử dụng nhiều trong xử lý ảnh Các phép biến đổi này thường trả về những nét đặc trưng nhất của ảnh, qua đó có thể sử dụng các đặc trưng này để tiến hành xử lý ảnh
1.5.1 Biến đổi Cosine rời rạc DCT
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh hay video Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số và biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không gây tổn hao đến chất lượng Lý do chọn biến đổi cosine cho xử lý ảnh
Trang 30số là biến đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn
và G f là tập n hệ số DCT tương ứng của đầu vào Hệ số đầu tiên G0
được gọi là phần tử DC (Direct Current) và các hệ số còn lại được gọi là phần
tử AC (Alternating current) Các hệ số này có thể bao gồm cả số âm và số
dương
Phép biến đổi IDCT biến đổi các hệ số DCT (DC và AC) từ miền tần
số về miền thời gian được xác định theo công thức:
tử còn lại có giá trị nhỏ, thường xấp xỉ bằng 0
Phép biến đổi DCT 2-D
Phép biến đổi DCT 1-D phù hợp với các mẫu dữ liệu âm thanh Nhưng không phù hợp ảnh, do dữ liệu ảnh có quan hệ trên không gian hai chiều
Trang 31(hàng, cột) Tuy nhiên, đối với ảnh ta có thể áp dụng DCT 1-D hai lần: trên
các hàng và trên các cột Do vậy ta gọi phép biến đổi này là DCT 2-D
Phép biến đổi thuận DCT 2-D đối với mn giá trị của p trên không
gian 2 chiều được xác định theo công thức:
,
1
nÕu 08
88
i j
i C
Trang 32Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnh P
để nhận được khối hệ số DCT (G) theo công thức:
Trong một vài năm gần đây, một số lược đồ thủy vân dựa trên phép biến đổi DCT kết hợp với các giải thuật trí tuệ nhân tạo như: giải thuật di truyền, giải thuật tối ưu bầy đàn, mạng neural,… đã được nhiều nhà khoa học quan tâm nghiên cứu
1.5.2 Biến đổi Wavelet rời rạc DWT
Việc tính toán các hệ số Wavelet tại tất cả các tỉ lệ là một công việc hết
sức phức tạp Nếu tính toán như vậy sẽ tạo ra một lượng dữ liệu khổng lồ Để giảm thiểu công việc tính toán người ta chỉ chọn ra một tập nhỏ các giá trị tỉ
lệ và các vị trí để tiến hành tính toán Hơn nữa nếu việc tính toán được tiến
hành tại các tỷ lệ và các vị trí trên cơ sở luỹ thừa cơ số 2 thì kết quả thu được
sẽ hiệu quả và chính xác hơn rất nhiều Quá trình chọn các tỷ lệ và các vị trí
để tính toán như trên tạo thành lưới nhị tố (dyadic) Một phân tích như trên hoàn toàn có thể thực hiện được nhờ biến đổi Wavelet rời rạc (DWT) Do đó, việc tính toán biến đổi DWT thực chất là sự rời rạc hoá biến đổi Wavelet liên tục (CWT); việc rời rạc hoá được thực hiện với sự lựa chọn các hệ số a và b
Trang 33Chương 2 MỘT SỐ KỸ THUẬT GIẤU TIN THUẬN NGHỊCH TRÊN ẢNH JPEG
Nội dung chương này trình bày một số kỹ thuật giấu tin theo các hướng tiếp cận khác nhau như:
- Dịch chuyển Histogram
- Phương pháp mở rộng hiệu
- Sử dụng nén bảo toàn
- Sử dụng đặc trưng nén JPEG
Đối với phương pháp sử dụng đặc trưng nén JPEG, luận văn trình bày
kỹ thuật giấu tin thuận nghịch CLTT [3], LS [4] và kỹ thuật cải tiến TSTA [1] nhằm nâng cao khả năng nhúng của phương pháp sử dụng đặc trưng nén JPEG
2.1 Một số hướng tiếp cận trong giấu tin thuận nghịch
Trong nhiều ứng dụng như y tế, tòa án và quân sự, ngoài việc trích tin, thì việc khôi phục lại dữ liệu gốc từ dữ liệu chứa tin là yêu cầu bắt buộc Các
kỹ thuật giấu tin có khả năng như vậy được gọi là giấu tin thuận nghịch Giấu
tin thuận nghịch có vai trò quan trọng trong lĩnh vực giấu tin, đặc biệt trong lĩnh vực xác thực dữ liệu
Trong giấu tin thuận nghịch thường dùng một số phương pháp như: dịch chuyển Histogram; sử dụng phép biến đổi mở rộng hiệu; sử dụng nén bảo
toàn và sử dụng đặc trưng nén JPEG
2.1.1 Sử dụng phương pháp dịch chuyển histogram
Histogram là khái niệm cơ bản trong xử lý ảnh Histogram là bảng thống kê tần số giá trị cường độ sáng của các điểm ảnh Đối với ảnh màu, cường độ sáng của một điểm ảnh được xác định theo công thức:
Trang 34trong đó: R, G, B là giá trị các thành phần màu và Y là cường độ sáng của điểm ảnh
Ví dụ: từ ảnh màu pepper ta có thể dễ dàng xác định được biểu đồ histogram tương ứng như hình 2.1
(a) ảnh pepper.bmp (b) Biểu đồ histogram
Hình 2.1 Biểu đồ histogram của ảnh màu Pepper
Kỹ thuật giấu tin thuận nghịch NSAS dựa trên dịch chuyển histogram của ảnh được đề xuất bởi Ni và các đồng nghiệp, họ chỉ ra rằng kỹ thuật giấu này có độ phức tạp thấp và thời gian thực hiện nhỏ, không làm thay đổi nhiều nội dung ảnh
Sau đó để nâng cao lượng thông điệp giấu trong ảnh Hwang và các đồng nghiệp để xuất kỹ thuật HKC dựa trên cải tiến kỹ thuật của Ni
Đến năm 2008, Kuo và các đồng nghiệp cải thiện lượng thông điệp giấu bằng cách cải tiến kỹ thuật giấu HKC dựa trên hình thức chia khối
Tuy nhiên các kỹ thuật này mặc dù không làm thay đổi nhiều nội dung của vật mang tin nhưng nó để lại một dấu hiệu không bình thường trên lược
đồ histogram của các ảnh đó Vì vậy dựa trên quan sát một loạt histogram của
Trang 35các dữ liệu sau khi giấu tin bằng các kỹ thuật trên có thể dễ dàng phát hiện ra
dữ liệu có giấu tin sử dụng kỹ thuật này
2.1.1.1 Phương pháp giấu tin thuận nghi ̣ch NSAS
Vào năm 2006, Ni và các đồng nghiệp đã đề xuất lược đồ giấu tin thuật nghịch NSAS trên ảnh dựa trên dịch chuyển histogram của ảnh Theo kỹ thuật
đề xuất của Ni quá trình giấu tin gồm các bước dưới đây:
Bước 1 Tìm một điểm zero (điểm không) và một điểm peak (điểm
đỉnh) Điểm zero và điểm peak là điểm có giá trị cấp xám trong lược đồ histogram của ảnh là nhỏ nhất (Zero) và bằng cực đại (Peak)
Bước 2 Quét toàn bộ ảnh theo trình tự từ trái sang phải, từ trên xuống
Các pixel có giá trị xám nằm trong khoảng [điểm peak, điểm zero] được tăng lên một giá trị Nó sẽ làm cho tần số của điểm peak+1 bằng 0
Bước 3 Nhúng bit thông điệp “0” và “1” lần lượt vào trong các giá trị
xám peak và peak+1 theo nguyên tắc sau:
Giả sử pixel đang xét là 154 kiểm tra bit cần nhúng nếu là bit “1” thì pixel 154 sẽ tăng lên 1, ngược lại nếu bit cần nhúng là bit “0” thì pixel 154 vẫn giữ nguyên
Cuối cùng chúng ta nhận được ảnh đã nhúng, sau đó chúng ta có thể chuyển đến người nhận thông qua internet Người nhận có thể khôi phục lại trực tiếp thông điệp và ảnh gốc bằng kỹ thuật biến đổi ngược
Trong kỹ thuật NSAS chúng ta thấy khả năng giấu thông điệp phụ thuộc vào độ lớn của điểm peak Tuy nhiên làm thế nào để truyền thông tin về điểm zero và điểm peak hay thông tin bổ sung thông điệp giấu từ người gửi đến người nhận là không được đề cập trong tài liệu này Để cải tiến vấn đề này Hwang và các đồng nghiệp của ông đề xuất kỹ thuật giấu thuật nghịch HKC
Trang 36Kỹ thuật HKC do J H Hwang và cộng sự đề xuất năm 2006, dựa trên phương pháp dịch chuyển biểu đồ tần suất như sau:
- Chọn điểm có tần suất lớn nhất (gọi là điểm Peak) trong biểu đồ
- Chọn hai điểm Zero1 và Zero2 (các điểm có cột tần suất có giá trị bằng 0) ở bên trái và bên phải điểm Peak
- Thực hiện làm rỗng hai cột tần suất tại vị trí Peak+1 và Peak -1
Để có thể khôi phục ảnh gốc, bản đồ định vị được đề xuất dùng để lưu trữ thông tin vị trí của các điểm gồm: điểm Peak, Zero1, giá trị tần suất Zero1, điểm Zero2, tần suất của điểm Zero2 Bản đồ định vị này chuyển thành một chuỗi nhị phân và được ghép vào chuỗi thông tin M cùng giấu vào ảnh
Thuật toán giấu thuận nghịch HKC
Bước 1 Tìm ra một điểm peak và hai điểm Zero Điểm peak và các điểm
zero tương ứng với số pixel của chúng là lớn nhất và nhỏ nhất trong ảnh
Bước 2 Nhằm để khôi phục chính xác ảnh gốc, một bản đồ vị trí được
đề xuất dùng để lưu trữ thông tin vị trí của các pixel (như là điểm peak, điểm zero bên trái điểm peak, điểm zero bên phải điểm peak) trong lược đồ HKC
Bước 3 Khởi tạo không gian để nhúng thông điệp Các pixel được định
vị trong histogram nằm ở bên trái giữa điểm peak và điểm zero bên trái sẽ dịch sang trái một pixel Tương tự, các pixel được định vị nằm ở bên phải giữa điểm peak và điểm zero bên phải sẽ dịch sang phải một pixel
Trang 37Bước 4 Nhúng thông tin mật vào trong ảnh
* Nhận xét
Phương pháp Hwang đã đóng gói được sản phẩm thủy vân, xong
histogram của ảnh thủy vân tại điểm peak rất bất thường: Cao vọt tại điểm peak, nhưng lại rất thấp tại điểm lân cận peak – 1, peak + 1 Nhược điểm này
đã được khai thác để thám tin phương pháp Hwang
2.1.1.3 Phương pháp giấu tin thuận nghịch HKC cải tiến:
Do lược đồ HKC không nói làm thế nào để tăng số cặp (điểm peak, các điểm Zero) trong bản đồ định vị vị trí để tăng dung lượng giấu nhiều hơn nữa
Để làm điều này Kuo và các đồng nghiệp (2008) để xuất kỹ thuật giấu cải tiến của HKC bằng phương pháp chia khối, thuật toán như sau:
Bước 1: Chia miền dữ liệu ảnh thành các khối bằng nhau Ví dụ chia
thành 4 khối
Bước 2: Tính histogram cho mỗi khối Sau đó tìm điểm Max và hai điểm
min trong mỗi khối Đồng thời, tạo ra không gian nhúng thông điệp bằng cách dịch chuyển lần lượt hai mặt của điểm max sang bên trái và bên phải một đơn
vị
Bước 3: Một bản đồ vị trí được tạo ra để lưu trữ thông tin của các pixel
(điểm max, điểm min bên trái, điểm min bên phải trong mỗi khối)
Bước 4: Nhúng thông tin mật vào trong ảnh
2.1.2 Sử dụng phép biến đổi mở rộng hiệu
Năm 2003 Tian đã đề xuất kỹ thuật mở rộng hiệu – DE (Difference expansion) Kỹ thuật này tạo ra một số giá trị nhỏ để đại diện cho các tính năng của dữ liệu gốc Sau đó các giá trị này được mở rộng ra để nhúng các bít thủy vân Các thông tin thủy vân được chuyển thành dãy nhị phân, rồi được nhúng vào bít ít quan trọng nhất LSB (least significant bit) của giá trị mở
Trang 38rộng, tiếp theo hình ảnh đã được thủy vân được khôi phục lại bằng cách sử dụng các giá trị sửa đổi
Trong thủy vân thuận nghịch, lược đồ Tian là một trong những lược đồ nhận được nhiều sự quan tâm của các nhà nghiên cứu Phương pháp này chia ảnh gốc thành các cặp giá trị điểm ảnh (dưới đây gọi điểm ảnh thay cho giá trị điểm ảnh) Với mỗi cặp điểm ảnh khả mở (x,y) có thể nhúng thuận nghịch một bít bằng phép biến đổi mở rộng hiệu
Alattar và Mohammad đã phát triển phép biến đổi mở rộng hiệu từ cặp 2 điểm ảnh sang véc tơ n điểm ảnh, do đó cải thiện được khả năng nhúng tin so với lược đồ Tian Tuy nhiên, tốc độ thực hiện của hai lược đồ này chậm và chỉ phù hợp với véc tơ có ít phần tử
Lee và các cộng sự đề xuất phương pháp chọn một phần tử có giá trị nằm ở khoảng giữa giá trị min và max của véc tơ làm cơ sở Sau đó tạo các hiệu giữa phần tử phần tử cơ sở với các phần tử khác và nhúng một bít trên các hiệu khác 0 Khodaei và cộng sự đề xuất một lược đồ tương tự nhưng chọn phần tử ở giữa véc tơ làm phần tử cơ sở Sau đây là trình bày tóm tắt một số kỹ thuật thuỷ vân thuận nghịch liên quan
Trang 39thuộc {0,1} Rõ ràng khi (x,y) khả mở thì ta có thể khôi phục được bít b và cặp điểm ảnh gốc (x,y) theo các công thức:
M thường được gọi là bản đồ định vị khả mở hay bản đồ định vị
(Location Map) Bản đồ M được nén theo thuật toán bảo toàn dữ liệu để nhận được mã nén MN Mã nén MN và một số thông tin chung (ký hiệu H ) như: