Tên hình Ý nghĩaHình 1.1 Lược đồ chung cho quá trình giấu tin Hình 1.2 Lược đồ chung cho quá trình tách tin Hình 1.3 Sự khác nhau giữa mã hóa và giấu tin Hình 2.1 Lọc theo tần số thấp và
Trang 1NGÔ THỊ THU HÀ
NGHIÊN CỨU KỸ THUẬT
THỦY VÂN BỀN VỮNG SỬDỤNG CHO VIỆC XÁC THỤC ẢNH TRƯỜNG ĐẠI HỌC s ư PHẠM HẢ NỘI 2
LUẬN VĂN THẠC s ĩ MÁY TÍNH
HÀ NỘI, 2015
Trang 2TRƯỜNG ĐẠI HỌC s ư PHẠM HẢ NỘI 2
NGÔ THỊ THU HÀ
NGHIÊN CỨU KỸ THUẬT
THỦY VÂN BỀN VỮNG SỬDỤNG CHO VIỆC XÁC THỤC ẢNH
Chuyên ngành: Khoa Học Máy Tính
Mã số: 60 48 01 01
LUẬN VĂN THẠC s ĩ MÁY TÍNH
Người hướng dẫn khoa học: PGS.TS Bùi Thế Hồng
HÀ NỘI, 2015
Trang 3Đe hoàn thành luận văn thạc sĩ, tác giả xin bày tỏ lòng biết ơn tới Ban chủ nhiệm cùng các thầy cô khoa CNTT, phòng Đào tạo Sau đại học, trường Đại học Sư phạm Hà Nội 2 đã tạo mọi điều kiện thuận lợi cho tác giả trong quá trình học tập, thực hiện và hoàn thành luận văn.
Tác giả xin chân thành cảm ơn các thầy cô giáo trong chuyên ngành Khoa học máy tính, trường Đại học sư phạm Hà Nội 2, đã nhiệt tình giảng dạy và giúp đỡ tác giả trong quá trình thực hiện luận văn Đặc biệt, tác giả xin bày tỏ lòng biết ơn sâu sắc về sự hướng dẫn tận tình chu đáo của PGS.TS Bùi Thế Hồng trong suốt thời gian nghiên cứu và thực hiện luận văn
Cuối cùng, tác giả muốn bày tỏ lòng biết ơn đối với gia đình, người thân, bạn
bè đồng nghiệp đã giúp đỡ, động viên tác giả trong quá trình học tập và thực hiện đề tài
Dù đã rất cố gắng nhưng luận văn không thể tránh khỏi những thiếu sót, tác giả mong nhận được sự góp ý của quý thầy, cô giáo và các bạn
Hà Nội, tháng 12 năm 2015
Tác giả
Ngô Thị Thu Hà
Trang 4Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Hà Nội, tháng 12 năm 2015
Tác giả
Ngô Thị Thu Hà
Trang 5MỞ ĐẦU 1
Chương 1: GIỚI THIỆU CHUNG VỀ KỸ THUẬT GIẤU TIN 3
VÀ THỦY VÂN TRÊN ẢNH SỐ 3
1.1 Tổng quan về kỹ thuật giấu tin 3
1.1.1 Định nghĩa 3
1.1.2 Vài nét về lịch sử giấu t i n 3
1.1.3 Mô hình kỹ thuật giấu tin và các thuật ngữ cơ b ản 4
1.1.4 Sự khác biệt giữa mã hóa và giấu tin 5
1.2 Giới thiệu về ảnh 6
1.2.1 Ả nh 6
1.2.2 Một số cấu trúc ảnh 8
1.2.3 Giấu tin trong ảnh 12
1.3 Những yêu cầu cơ bản của hệ thuỷ vân trên ảnh số 14
1.4 Những tấn công trên hệ thuỷ v â n 15
1.5 Những ứng dụng chủ yếu của hệ thuỷ vân 17
1.5.1 Bảo vệ bản quyền tác giả (Copyright protection): 17
1.5.2 Nhận thực thông tin và phát hiện xuyên tạc thông tin (authentication and tamper detection) 17
1.5.3 Lăn tay hoặc dán nhãn (fingerprinting or labeling): 17
1.5.4 Kiểm soát sao chép (copy control): 18
1.6 Những khuynh hướng tiếp cận của kỹ thuật thuỷ v â n 18
1.6.1 Hướng tiếp cận dựa trên miền không gian ản h 18
1.6.2 Hướng tiếp cận dựa trên miền tần số của ảnh 19
Chương 2: KỸ THUẬT THỦY VÂN ẢNH SỐ 20
D ựA VÀO CÁC PHÉP BIỂN ĐỔI RỜI RẠC 20
2.1 Các phép biến đổi rời r ạ c 20
2.1.1 Phép biến đổi Cosine rời rạ c 20
2.1.2 Phép biến đổi sóng nhỏ rời rạc 21
Trang 62.2.1 Thủy vân ảnh số dựa vào phép biến đổi Cosine rời rạ c 24
2.2.1.2 Kỹ thuật thuỷ vân của Shoemarker 25
2.2.1.3 Kỹ thuật thuỷ vân sử dụng phép biến đổi DCT kết hợp với ma trận số giả ngẫu nhiên 27
2.2.2 Thủy vân ảnh số dựa vào phép biến đổi sóng nhỏ rời rạc 28
2.2.2.1 Đặc điểm của phép biến đổi DWT trên ảnh hai chiều 28
2.3 Kỹ thuật thủy vân bền vững ứng dụng trong xác thực ảnh dựa vào phép biến đổi rời rạc DWT kết hợp với phép biến đổi ma trận H ankel 34
2.3.1 Phép biến đổi ma trận H ankel 34
2.3.2 Lược đồ thủy vân bền vững sử dụng phép biến đổi DWT kết hợp Hankel 35
CHƯƠNG 3: CÀI ĐẶT VÀ THỬ NGHIỆM LƯỢC ĐỒ THỦY VÂN BỀN VỮNG DÙNG ĐÊ XÁC THỰC ẢNH D ựA VÀO PHÉP BIẾN ĐỔI DWT KẾT HỢP PHÉP BIẾN ĐỔI HANKEL 37
3.1 Các độ đo đánh giá hiệu quả của thuật toán nhúng thủy vân 37
3.1.1 Độ cảm nhận của ảnh chủ sau khi bị thủy vân 37
3.1.2 Độ bền vững của thủy v â n 37
3.2 Lược đồ nhúng thủy vân và xác thực ảnh g ố c 39
3.2.1 Nhúng thủy v â n 39
3.2.2 Xác thực ảnh 40
3.3 Kết quả thử nghiệm 41
KẾT LUẬN 44
Trang 7C hữ viết tắt Diễn giải Ý nghĩa
DCT Discrete Cosine Transform Biến đổi Co sin rời rạcDWT Discrete Wavelet Transform Biến đổi sóng nhỏ rời rạcIDWT Invert Discrete Wavelet Transform Biên đôi ngược DWTDFT Discrete Fourier Transform Biến đổi Forier rời rạcPRNS Pseudo random number sequence Tỉ sô tín hiệu nhiêu
JPEG Joint Photographic Experts Một định dạng ảnh nén
LL Horizontally and vertically lowpass Lọc thấp ngang và dọc
LH Horizontally lowpass and vertically
highpass
Lọc thấp ngang và lọc cao dọc
HL Horizontally highpass and
vertically lowpass
Lọc cao ngang và lọc thấp dọc
HH Horizontally and vertically
highpass
Lọc cao ngang và lọc thấp ngang
Trang 8Tên hình Ý nghĩa
Hình 1.1 Lược đồ chung cho quá trình giấu tin
Hình 1.2 Lược đồ chung cho quá trình tách tin
Hình 1.3 Sự khác nhau giữa mã hóa và giấu tin
Hình 2.1 Lọc theo tần số thấp và tần số cao
Hình 2.2 Cấu trúc phân tích được qua phép biến đổi sóng nhỏ 2 chiều mức 2Hình 2.3 Ảnh gốc và năng lượng phân bố của ảnh qua phép biến đổi DCTHình 2.4 Phân chia 3 miên tân sô ảnh của phép biên đôi DCT
Hình 3.1 Ảnh gốc Lena, thủy vân gốc và ảnh Lena đã được nhúng thủy vânHình 3.2 Ảnh gốc Mandril, thủy vân gốc và ảnh Mandril đã được nhúng thủy
vân
Hình 3.3 Ket quả xác thực ảnh đã thủy vân đối với ảnh Lena
Hình 3.4 Kết quả xác thực ảnh đối với ảnh Mandril
Trang 9MỞ ĐẦU
1 Lý do chọn đề tài
Ngày nay, sự xuất hiện của Internet và mạng máy tính đã giúp cho việc trao
đổi thông tin trở nên nhanh gọn, dễ dàng E-mail cho phép người ta nhận hay gửi
thư ngay trên máy tính của mình; E-business cho phép thực hiện các giao dịch buôn
bán trên mạng, Tuy nhiên, điều đó lại làm phát sinh những vấn đề mới Thông tin
quan trọng nằm ở kho dữ liệu hay đang trên đường truyền có thể bị trộm cắp, có thể
bị làm sai lệch, có thể bị giả mạo, Điều đó có thể làm ảnh hưởng tới các tổ chức,
các công ty hay cả một quốc gia Bởi những bí mật kinh doanh, tài chính là mục tiêu
của các đối thủ cạnh tranh, những thông tin về an ninh quốc gia là mục tiêu của các
tổ chức tình báo trong và ngoài nước, Việc trao đổi thông tin, xuất bản thông tin
trên Internet có nhiều nguy cơ không an toàn do vấn nạn vi phạm bản quyền thông
tin ngày càng tăng Vì vậy, tốc độ phát triển như vũ bão của Internet và các công
nghệ có liên quan đang đưa đến một sức ép khá nặng nề cho những nhà quản lý, bảo
vệ thông tin Do đó, những nhà cung cấp thông tin đòi hỏi phải có các công cụ hỗ
trợ cho việc bảo vệ bản quyền sản phẩm của họ, nhận dạng được những bản sao các
thông tin bị đánh cắp hoặc bị xuyên tạc với ý đồ xấu
Trên thực tế, nhu cầu bảo vệ quyền tác giả, quyền sở hữu thông tin là rất lớn,
đặc biệt là ảnh số Kỹ thuật thủy vân bền vững hứa hẹn là một phương pháp hiệu
quả bởi nó cho phép chủ sở hữu thông tin số có thể nhúng và giấu những bằng
chứng xác thực về bản quyền của mình mà không làm ảnh hưởng đến nội dung
thông tin
Từ thực tế trên, nhằm mục đích nghiên cứu và thử nghiệm kỹ thuật thủy vân
bền vững dùng để xác thực và khôi phục ảnh gốc dựa vào một số phép biến đổi, em
chọn đề tài tốt nghiệp là “Nghiên cứu kỹ thuật thủy vân bền vững sử dụng cho việc
xác thực ảnh”.
2 Mục đích nghiên cứu
- Nghiên cứu và phát triển lược đồ thủy vân bền vững để xác thực ảnh số dựa vào sự kết hợp giữa phép biến đổi sóng nhỏ rời rạc DWT và phép biến đổi Hankel
Trang 10- Cài đặt thử nghiệm lược đồ thủy vân đề xuất và đánh giá, so sánh hiệu quả.
3 Nhiệm vụ nghiên cứu
- Các kỹ thuật thủy vân trên ảnh
- Kỹ thuật thủy vân bền vững ứng dụng trong xác thực sự toàn vẹn của ảnh dựa vào phép biến đổi rời rạc DWT kết hợp với và phép biến đổi ma trận Hankel
- Phát triển chương trình thử nghiệm để so sánh đánh giá một số lược đồ thủy vân bền vững bảo vệ sự toàn vẹn ảnh số
4 Đối tượng và phạm vi nghiền cứu
- Phạm vi nghiên cứu của đề tài là lý thuyết về thủy vân nói chung, kỹ thuật thủy vân bền vững trên ảnh, các phép biến đổi rời rạc và phép biến đổi ma trận
- Nghiên cứu cơ chế mã hóa và giải mã thủy vân trên ảnh với cơ chế xác thực bản gốc
5 Những đóng góp mới của đề tài
- Tìm hiểu và nghiên cứu các kỹ thuật thủy vân để bảo vệ sự toàn vẹn choảnh số
- Cải tiến và nâng cao độ chính xác khi bảo vệ tính toàn vẹn của ảnh số
- Cài đặt chương trình thử nghiệm để bảo vệ sự toàn vẹn của ảnh số với cơ chế xác thực công khai
6 Phương pháp nghiên cứu
- Phương pháp nghiên cứu chủ yếu là phương pháp tiếp cận lý thuyết, sau đó
áp dụng lý thuyết để kiểm chứng Dựa trên kết quả kiểm chứng đó để đưa ra kết luận và các đề xuất nhằm hoàn thành mục tiêu nghiên cứu
- Nghiên cứu về lý thuyết thủy vân bền vững trên ảnh Nghiên cứu ứng dụng và mô tả chi tiết về kỹ thuật thủy vân bền vững ứng dụng trong bảo vệ bản quyền ảnh dựa vào các phép biến đổi rời rạc và phép biến đổi ma trận
Trang 11Chương 1: GIỚI THIỆU CHUNG VỀ KỸ THUẬT GIẤU TIN
VÀ THỦY VÂN TRÊN ẢNH SÓ
1.1 Tổng quan về kỹ thuật giấu tin
1.1.1 Định nghĩa
Theo Nguyễn V ăn Tảo, Đ ỗ Trung Tuấn, B ùi Thế Hồng: Giấu thông tin (Steganography) là một kỹ thuật nhúng thông tin (embeding) vào trong một nguồn
đa phương tiện gọi là các phương tiện chứa (host data) mà không nhận biết được
sự tồn tại của thông tin giấu (invisible).[2]
Ta cũng có thể định nghĩa tổng quát như sau: Giấu tin là kỹ thuật nhúng một lượng thông tin số nào đó vào trong một đối tượng dữ liệu số khác.
1.1.2 Vài nét về lịch sử giấu tin
Từ Steganography bắt nguồn từ tiếng Hi Lạp và được sử dụng cho tới ngày nay, nó có nghĩa là tài liệu được phủ (covered writing) Các câu chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ Có lẽ những ghi chép sớm nhất về
kỹ thuật giấu thông tin (thông tin được hiểu theo nghĩa nguyên thủy của nó) thuộc về
sử gia Herodotus người Hy lạp Khi bạo chúa Hy lạp Histiaeus bị vua Darius bắt giữ
ở Susa vào thế kỷ thứ năm trước Công nguyên, ông đã gửi một thông báo bí mật cho con rể của mình là Aristagoras ở Miletus Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ ấy Khi tóc của người nô lệ này mọc đủ dài, anh ta đã được gửi tới Miletus
Một câu chuyện khác ở thời Hy-Lạp cổ đại cũng do Herodotus ghi lại Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong Demeratus, một người Hy lạp, cần thông báo cho Sparta rằng Xerxes định xâm chiếm Hy lạp Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các viên thuốc và khắc thông báo lên
bề mặt các viên thuốc này, sau đó bọc lại các viên thuốc bằng một lớp sáp mới Những viên thuốc được để ngỏ và lọt qua mọi sự kiểm tra một cách dễ dàng
Một cách giấu tin phổ biến là sử dụng mực không màu Đây là một phương tiện hữu hiệu cho bảo mật thông tin trong một thời gian dài Người Romans cổ đã biết
sử dụng những chất sẵn có như nước quả, nước tiểu và sữa để viết các thông báo bí
Trang 12mật giữa những hàng văn tự thông thường Khỉ bị hơ nóng, những loại mực không nhìn thấy này sẽ trở nền sẫm màu và cố thể đọc được một cách dễ dàng.
Ý tưởng che giấu thông tín đã có từ hàng nghìn năm về trước nhưng kỹ thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo Gần đây, giấu thông tin mới được các nhà nghiên cứu và các viện cồng nghệ thông tin quan tâm và
đã có rất nhiều các công trình nghiền cứu về vấn đề này Cuộc cách mạng số hoá thông tin và sự phát ưiển nhanh chống của mạng truyền thông là nguỵên nhân chính dẫn đến sự thay đổi này Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, và sự lưu thông phân phối trên mạng của các dữ liệu đa phương tiện
đã sinh ra nhiều Yấn đề nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc trái phép
1.1.3 Mô hình kỹ thuật giấu tin và các thuật ngữ Ctf bản
Mô hình củã kỹ thuật giấu tin cơ bản được mô tả trong Hình 1.1 và 1.2
Thông tin cần giấu là một lượng thông tin mang một ý nghĩa nào đó tuỳ thuộc vào mục đích của người sử dụng Thông tin sẽ được giấu vào trong một phương tiện chứa nhờ một bộ nhúng Bộ nhúng là những chương trình, thuật toán giấu tin, được thực hiện với một khoá bí mật giống như các hệ mã mật cổ điển Sau khi giấu tin, các phương tiện chứa tin sẽ được gửi đi hoặc được phân phối trên mạng
0
ấ
Phương riêu chứa (video,
ảnh, âm thanh, vản bàn )
Hình ĩ ĩ Lược đồ chung cho quá trình giấu tin
Hình 1.2 chỉ ra các công việc giải mã thông tin đã giấu Quá trình giải mã được thực hiện thồng qua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quá trình nhứng Kết quả thu được gồm phương tiện chứa gốc và thông tin
Trang 13đã giấu Bước tiếp theo, thông tin giấu sẽ được xử lý, kiểm định so sánh với thông tin giấu ban đầu.
Thông tin cần giấu (embeded data): ỉà thông tin được nhúng vào trong phương tiện chứa Trong giấu tin mật, thông tin cần giấu là các thông điệp (message), còn trong kỹ thuật thuỷ vân số thì thông tin cần giấu chính là các thuỷ vân (các dấu hiệu công khai hoặc bí mật)
1.1.4 Sự khác biệt giữa m ã hóa và giấu tin
Theo N guyễn V ăn Tảo: Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là phương pháp mã hoả làm cho các thông tin hiện rõ ỉà nó có được mã hoắ hay không còn đối với phương pháp giấu thông tin thì người ta sẽ khó biết được ỉà có
Trang 14thông tin giấu bên trong do tỉnh chất ẩn (invisibỉe) của thông tin được giấu Một khi những thông tin mã hoá bị phát hiện thì những tên tin tặc sẽ tìm mọi cách để triệt phá Và cuộc chạy đua giữa những người bảo vệ thông tin và bọn tin tặc vẫn chưa kết thúc tuyệt đối về bên nào Trong hoàn cảnh đỏ thì giấu thông tin trở thành một phương pháp hữu hiệu [3]
Sự khác nhau này ta có thể thấy rõ qua hình 1.3
Hình 1.3 Sự khác nhau giữa mã hóa V « giấu tin 1.2 Giới thiêu về ảnh
Trang 15Ảnh xám: giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit (giá
Ví dụ về biểu diễn ảnh màu:
Ma trận biểu diễn mức xám của thảnh phần RED:
Trang 161.2.2 M ột số cấu trú c ảnh
1.2.2.1 Ả nh BM P (Bitmap)
Trong đồ họa máy vi tính, BMP, còn được biết đến với tên tiếng Anh khác
là Windows bitmap, là một định dạng tập tin hình ảnh khá phổ biến Các tập tin đồ
họa lưu dưới dạng BMP thường có đuôi là BMP hoặc DIB
Các thuộc tính tiêu biểu của một tập tin ảnh BMP là
So bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n Một ảnh
BMP n-bit có 2" màu Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng rõ nét hơn Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh 256 màu),
16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu) Ảnh BMP 24-bit có chất lượng hình ảnh trung thực nhất
chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).
Chiều rộng của ảnh (width), cho bởi điểm ảnh.
Cấu trúc tập tin ảnh BMP bao gồm 4 phần
Bitmap H eader (14 bytes): giúp nhận dạng tập tin bitmap
Bitmap Inform ation (40 bytes): lưu một số thông tin chi tiết giúp hiển thị ảnh.Color Palette (4*x bytes), X là số màu của ảnh: định nghĩa các màu sẽ được
sử dụng trong ảnh
Bitmap D ata: lưu dữ liệu ảnh
Đặc điểm nổi bật nhất của định dạng BMP là tốc độ vẽ và tốc độ xử lý nhanh, tập tin hình ảnh thường không được nén bằng bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin - một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG, hay PNG)
Định dạng BMP được hỗ trợ bởi hầu hết các phần mềm đồ họa chạy trên Windows, và cả một số ứng dụng chạy trên MS-DOS Ngay từ W indows 3.1, Microsoft đã cho ra đời phần mềm P aintB rush, một phần mềm hỗ trợ vẽ hình ảnh đơn giản và lưu hình ảnh được vẽ dưới dạng BMP 16 hay 256 màu Tuy nhiên, do
Trang 17kích thước tập tin ảnh BMP quá lớn, định dạng BMP không phù hợp để trao đổi hình ảnh qua mạng Internet (do hạn chế về tốc độ truyền dữ liệu).
I.2.2.2 Ả nh JPEG (Joint Photographie Experts Group)
JPEG là một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Chất lượng ảnh bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người
Phần mở rộng của các file JPEG thường có dạng jpeg, jfif, jpg, JPG, hay JPE; dạng jpg là dạng được dùng phổ biến nhất Hiện nay dạng nén ảnh JPEG rất được phổ biến trong điện thoại di động cũng như những trang thiết bị lưu giữ có dung lượng nhỏ
Trong không gian màu YUV, nhãn thị của con người rất nhạy cảm với thảnh phần Y và kém nhạy cảm với hai loại u và V Phương pháp nén JPEG đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh Hệ thống nén thành phần Y của ảnh với mức độ suy giảm ít hơn so với u , V, bởi người ta ít nhận thấy sự thay đổi của u và V so với Y
Giống như GIF, JPEG cũng được sử dụng rất nhiều trên web Lợi ích chính của chúng là có thể hiển thị các hình ảnh với các màu chính xác (true-colour) chúng
có thể lên đến 16 triệu màu Điều đó cho phép chúng được sử dụng tốt nhất cho các hình ảnh chụp và hình ảnh minh hoạ với lượng màu lớn
Nhược điểm lớn nhất của JPEG là chất lượng ảnh đã bị nén mất đi, một số đường bao giữa các khối màu sẽ xuất hiện điểm mờ, các vùng sẽ mất đi sự rõ nét JPEG làm giảm chất lượng cho các bức vẽ ít màu, tạo nên những chỗ nhòe thay cho các đường sắc nét, đồng thời độ nén cũng thấp cho các hình vẽ ít màu Giống như định dạng mp3, JPEG sẽ không thể phục hồi giống như hình ảnh ban đầu dù dung lượng được tăng lên giống dung lượng ảnh thật Các ảnh JPEG không thể làm trong suốt hoặc chuyển động
Trang 181.2.2.3 Ảnh GIF (Graphics Interchange Format)
GIF là một định dạng tập tin hình ảnh bitmap cho hình ảnh dùng ít hơn 256 màu sắc khác nhau và hoạt hình dùng ít hơn 256 màu cho mỗi khung hình GIF là định dạng nén dữ liệu đặc biệt hữu ích cho việc truyền hình ảnh qua đường truyền lưu lượng nhỏ Định dạng này được CompuServe cho ra đời vào năm 1987 và nhanh chóng được dùng rộng rãi trên World Wide Web
Tập tin GIF dùng nén dữ liệu bảo toàn trong đó kích thước tập tin có thể được giảm mà không làm giảm chất lượng hình ảnh, cho những hình ảnh có ít hơn
256 màu số lượng tối đa 256 màu làm cho định dạng này không phù hợp cho các hình chụp (thường có nhiều màu sắc), tuy nhiên các kiểu nén dữ liệu bảo toàn cho hình chụp nhiều màu cũng có kích thước quá lớn đối với truyền dữ liệu trên mạng hiện nay GIF được phát triển dành cho những ảnh có tính chất thay đổi Nó được
sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như là ảnh hoạt hình hoặc là sơ đồ, hình vẽ nút bấm
Định dạng GIF dựa vào các bảng màu: một bảng chứa tối đa 256 màu khác nhau cho biết các màu được dùng trong hình Một trong số các màu trong bảng màu
có thể được đặt là trong suốt
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh JPEG nén lại nhưng làm mất một số dữ liệu trong ảnh
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG không giới hạn số màu mà chúng sử dụng
1.2.2.4 Ảnh PNG (Portable Network Graphics)
PNG là một dạng hình ảnh sử dụng phương pháp nén dữ liệu mới - không làm mất đi dữ liệu gốc PNG được tạo ra nhằm cải thiện và thay thế định dạng ảnh GIF với một định dạng hình ảnh không đòi hỏi phải có giấy phép sáng chế khi sử dụng PNG nén tốt hơn và có nhiều tính năng kỹ thuật hay hơn GIF Tất cả tính năng của GIF, trừ nén hoạt hình, đều được hỗ trợ bởi PNG Các trình duyệt mạng hiện đại đều hỗ trợ PNG
Trang 19PNG được hỗ trợ bởi thư viện tham chiếu libpng, một thư viện nền tảng độc lập bao gồm các hàm của c để quản lý các hình ảnh PNG.
Động cơ thúc đẩy cho việc tạo ra định dạng PNG bắt đầu vào khoảng đầu năm 1995, sau khi Unisys công bố họ sẽ áp dụng bằng sáng chế vào thuật toán nén
dữ liệu LZW (Lempel- Zip- Welch) sử dụng trong định dạng GIF
Một tập tin PNG bao gồm 8-byte kí hiệu (89 50 4E 47 0D OA 1A OA được viết trong hệ thống có cơ số 16, chứa các chữ "PNG" và 2 dấu xuống dòng, ở giữa
là sắp xếp theo số lượng của các thành phần, mỗi thành phần đều chứa thông tin về hình ảnh c ấ u trúc dựa trên các thảnh phần được thiết kế cho phép định dạng PNG
có thể tương thích với các phiên bản cũ khi sử dụng
PNG là cấu trúc như một chuỗi các thành phần, mỗi thành phần chứa kíchthước, kiểu, dữ liệu, và mã sửa lỗi ngay trong nó
Chuỗi được gán tên bằng 4 chữ cái phân biệt chữ hoa chữ thường Sự phânbiệt này giúp bộ giải mã phát hiện bản chất của chuỗi khi nó không nhận dạng được Với chữ cái đầu, viết hoa thể hiện chuỗi này là thiết yếu Chuỗi thiết yếu chứa thông tin cần thiết để đọc được tệp và nếu bộ giải mã không nhận dạng được chuỗi thiết yếu, việc đọc tệp phải được hủy
Một bộ giải mã phải có thể thông dịch để đọc và hiển thị một tệp PNG
IHDR phải là thành phần đầu tiên, nó chứa đựng header
PLTE chứa đựng bảng màu (danh sách các màu)
IDAT chứa đựng ảnh Ảnh này có thể được chia nhỏ chứa trong nhiều phần IDAT Điều này làm tăng kích cỡ của tệp lên một ít nhưng nó làm cho việc phát sinh ảnh PNG mượt hơn
IEND đánh dấu điểm kết thúc của ảnh
PNG không hỗ trợ ảnh động
Tổng kết
PNG, GIF và JPEG là 3 định dạng ảnh phổ biến nhất trên Internet hiện nay
và tùy thuộc vào nhu cầu của mỗi người mà chúng ta sẽ sử dụng chúng PNG hỗ trợ màu trong suốt tốt, giữ được chất lượng ảnh tốt GIF hỗ trợ tốt các ảnh động và ảnh 8-bit JPEG được áp dụng rộng rãi trong nghề nhiếp ảnh và các bức hình trên
Trang 20Internet, tuy nhiên hãy cẩn thận vì định dạng này sẽ làm giảm chất lượng bức ảnh sau mỗi lần lưu trữ.
1.2.3 Giấu tin trong ảnh
Giấu tin trong ảnh chiếm vị trí chủ yếu trong các kỹ thuật giấu tin, vì vậy các kỹ thuật giấu tin phần lớn cũng tập trung vào các kỹ thuật giấu tin trong ảnh Các phương tiện chứa khác nhau thì cũng sẽ có các kỹ thuật giấu khác nhau Đối tượng ảnh là một đối tượng dữ liệu tĩnh, dữ liệu tri giác không biến đổi theo thời gian Dữ liệu ảnh có nhiều định dạng, mỗi định dạng có những tính chất khác nhau nên các
kỹ thuật giấu tin trong ảnh thường chú ý những đặc trưng và các tính chất cơ bản sau đây:
1 Phương tiện chứa cỏ dữ liệu tri giác tĩnh Dữ liệu gốc ở đây là dữ liệu của ảnh
tĩnh, dù đã giấu thông tin vào trong ảnh hay chưa thì khi ta xem ảnh bằng thị giác,
dữ liệu ảnh không thay đổi theo thời gian, điều này khác với dữ liệu audio hay là video vì khi ta nghe hay xem thì dữ liệu gốc sẽ thay đổi liên tục với tri giác của con người theo các đoạn hay các bài, các cảnh Sự khác biệt này ảnh hưởng lớn đối với các kỹ thuật giấu thông tin trong ảnh với kỹ thuật giấu thông tin trong audio hay video
2 Kỹ thuật giấu phụ thuộc ảnh Kỹ thuật giấu tin phụ thuộc vào các loại ảnh khác
nhau Chẳng hạn đối với ảnh đen trắng, ảnh đa mức xám hay ảnh màu ta có những
kỹ thuật riêng do các loại ảnh có những đặc trưng khác nhau
3 Kỹ thuật giấu tin lợi dụng tính chất hệ thong thị giác của con người Giấu tin
trong ảnh ít nhiều cũng gây ra những thay đổi trên dữ liệu ảnh gốc Dữ liệu ảnh được quan sát bằng hệ thống thị giác của con người nên các kỹ thuật giấu tin phải đảm bảo một yêu cầu cơ bản là những thay đổi trên ảnh phải rất nhỏ sao cho bằng mắt thường khó nhận ra được sự thay đổi đó vì có như thế thì mới đảm bảo được độ
an toàn cho thông tin giấu Nhiều kỹ thuật đã lợi dụng các tính chất của hệ thống thị giác để giấu tin chẳng hạn như mắt người cảm nhận về sự biến đổi độ chói kém hơn
sự biến đổi màu, cảm nhận của mắt về màu xanh da trời là kém nhất trong ba màu
cơ bản
Trang 214 Giấu thông tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay đổi kích thước ảnh Các thuật toán thực hiện công việc giấu thông tin sẽ được thực hiện trên
dữ liệu của ảnh Dữ liệu ảnh bao gồm cả phần header, bảng màu và dữ liệu ảnh Khi giấu thông tin, các phương pháp giấu đều biến đổi các giá trị của các bit trong dữ liệu ảnh chứ không thêm vào hay bớt đi dữ liệu ảnh Do vậy mà kích thước ảnh trước hay sau khi giấu thông tin là như nhau
5 Đảm bảo chất lượng ảnh sau khi giấu tin Đây là một yêu cầu quan trọng đối với
giấu tin trong ảnh Sau khi giấu tin bên trong, ảnh phải đảm bảo được yêu cầu không bị biến đổi lớn để có thể bị phát hiện dễ dàng so với ảnh gốc Yêu cầu này khá đơn giản đối với ảnh màu hoặc ảnh đa mức xám bởi mỗi một điểm ảnh được biểu diễn bởi nhiều bit, và khi ta thay đổi một giá trị nhỏ nào đó thì chất lượng ảnh thay đổi không đáng kể, thông tin giấu khó bị phát hiện Đối với ảnh đen trắng thì việc giấu thông tin phức tạp hơn nhiều, vì mỗi điểm ảnh chỉ là trắng hoặc đen, và nếu ta biến đổi một bit từ đen thành trắng mà không khéo thì sẽ rất dễ bị phát hiện
Do đó, yêu cầu đối với các thuật toán giấu thông tin trong ảnh màu hay ảnh đa mức xám và giấu thông tin trong ảnh đen trắng là khác nhau Trong khi đối với ảnh màu thì các thuật toán chú trọng vào việc làm sao giấu được càng nhiều thông tin càng tốt thì các thuật toán áp dụng cho ảnh đen trắng lại tập trung vào việc làm thế nào để thông tin giấu khó bị phát hiện nhất
6 Thông tin giấu trong ảnh sẽ bị biến đổi nếu cổ bất cứ biến đồi nào trên ảnh Vì
phương pháp giấu tin trong ảnh dựa trên việc điều chỉnh các giá trị của các bit theo một qui tắc nào đó và khi giải mã sẽ theo các giá trị đó để tìm được thông tin giấu Theo đó, nếu một phép biến đổi nào đó trên ảnh làm thay đổi giá trị của các bit thì
sẽ làm cho thông tin giấu bị sai lệch Nhờ đặc điểm này mà giấu thông tin trong ảnh
có tác dụng nhận thực và phát hiện xuyên tạc thông tin
7 Vai trò của ảnh gốc khi giải tin Các kỹ thuật giấu tin phải xác định rõ ràng quá
ừình lọc ảnh để lấy thông tin giấu cần đến ảnh gốc hay không Đa số các kỹ thuật giấu tin mật thường không cần ảnh gốc khi lọc tìm thông tin đã giấu Thông tin được giấu trong ảnh sẽ được mang cùng với dữ liệu ảnh, khi tách tin chỉ càn ảnh đã mang thông tin giấu mà không cần dùng đến ảnh gốc để so sánh đối chiếu
Trang 221.3 Những yêu cầu cơ bản của hệ thuỷ vân trên ảnh số
Hệ thuỷ vân số trên ảnh cững là một hệ giấu tin nên cũng có một số đặc điểm
và tính chất giống như giấu tin trong ảnh như:
- Phương tiện chứa là ảnh hai chiều tĩnh,
- Thuỷ vân trên ảnh tác động lên dữ liệu ảnh nhưng không làm thay đổi kích thước ảnh,
- Kỹ thuật thủy vân phụ thuộc vào tính chất hệ thống thị giác con người,
- Khi giải tin có thể cần ảnh gốc
Ngoài một số đặc điểm chung ra, kỹ thuật thuỷ vân số được phân biệt với kỹ thuật giấu tin mật ở những đặc trưng sau đây:
Thông tin trong ảnh có bị biến đổi nếu có bất cứ một biến đổi nào trên ảnh ?
Tính chất này có trong kỹ thuật giấu tin mật nhưng đối với kỹ thuật thuỷ vân thì chỉ có trong loại thuỷ vân “dễ vỡ” Còn đối với loại thuỷ vân bền vững thì lại yêu cầu chống lại được những phép biến đổi thông thường trên ảnh
Thuỷ vấn ẩn hay thuỷ vân hiện ?
Không giống như giấu tin mật với yêu cầu bắt buộc là thông điệp giấu phải ẩn bên trong ảnh sao cho mắt thường không nhìn thấy được thì kỹ thuật thuỷ vân số lại
có hai loại là thuỷ vân ẩn và thủy vân hiển Nghĩa là có loại thuỷ vân cho phép nhìn thấy được thông tin đem nhúng vào (trong trường hợp này ta dùng từ nhúng thay cho
từ giấu thích hợp hơn) và có loại không nhìn thấy Loại thuỷ vân hiển được sử dụng cho mục đích công bố công khai về chủ quyền sở hữu, ngược lại, loại thuỷ vân ẩn được sử dụng với mục đích gài bí mật các thông tin xác nhận chủ quyền sở hữu
Tính chất bền vững
Tính chất này là tính chất quan trọng nhất của một hệ thuỷ vân bền vững Nghĩa là hệ thuỷ vân phải chống lại được các phép biến đổi, hay các tấn công có chủ đích hoặc không có chủ đích lên thuỷ vân
Thuỷ vân cái gì?
Một câu hỏi đầu tiên đối với hệ thuỷ vân là thông tin gì sẽ được giấu vào bên trong ảnh? Kiểu thuỷ vân hay dùng nhất là một chuỗi các kỹ tự, chuỗi kí tự được
Trang 23nhúng trực tiếp lên ảnh mang những thông tin như tác giả, tiêu đề hay ngày tháng, hay thông tin bản quyền Tuy nhiên, sử dụng chuỗi kí tự lại bị một hạn chế Đó là mỗi ký tự biểu diễn bằng nhiều bit, do vậy nếu như vì một lí do nào đó một bit bị lỗi thì sẽ làm sai cả kí tự và chỉ cần một phép biến đổi đơn giản như phép biến đổi JPEG cũng có thể làm cho thuỷ vân bị sai lệch rất nhiều Chúng ta cũng có thể thuỷ vân một bức ảnh nhỏ, khi đó sẽ là ảnh trong ảnh Khi giải tin thì một số điểm ảnh có thể sai nhưng hình tổng thể sẽ được giữ nguyên Trong những kỹ thuật gần đây, người ta sử dụng thuỷ vân là một chuỗi bit sinh ngẫu nhiên theo một luật phân phối xác suất nào
đó Sau đó, áp dụng các lí thuyết xác suất thống kê để chứng thực thuỷ vân
Trong các loại thuỷ vân thì thuỷ vân ẩn và bền vững được quan tâm nghiên cứu nhiều hơn vì ý nghĩa ứng dụng lớn của nó như đã nói ở phần trên Do vậy, hai tính chất quan ữọng nhất của hệ thuỷ vân mà các nhà nghiên cứu đang cố gắng đạt được là thuộc tính ẩn và thuộc tính bền vững Nhưng đây lại là mấu chốt của sự phức tạp vì hai thuộc tính này mâu thuẫn nhau Neu như để đảm bảo thuộc tính ẩn, thuỷ vân phải được giấu trong những vị trí ít có ý nghĩa tri giác nhất, ít bị chú ý nhất thì để đảm bảo được thuộc tính bền vững, thuỷ vân phải chịu được những phép xử lí ảnh phổ biến như dịch chuyển ảnh hay nén JPEG Ví dụ như phép nén JPEG loại bỏ ở ảnh những thông tin ít có tính tri giác nhất để làm giảm kích thước của ảnh mà vẫn đảm bảo được chất lượng ảnh Khi đó thì những dữ liệu của thuỷ vân nằm trong vùng này
sẽ bị mất đi hoặc bị biến đổi sai lệch hoàn toàn Yới tính phức tạp của yêu cầu cho một hệ thuỷ vân, phần sau đây chúng ta sẽ tìm hiểu những giải pháp kỹ thuật đã được đưa ra của các nhà khoa học trên thế giới
1.4 Những tấn công trên hệ thuỷ vân
Phương pháp thuỷ vân nên chống lại được một số phép xử lý ảnh thông thường và một số tấn công có chủ đích Cho đến nay vẫn chưa có một hệ thống thuỷ vân hoàn hảo và cũng không rõ ràng việc liệu có tồn tại hay không một hệ thống thuỷ vân an toàn tuyệt đối Vì vậy, trong thực tế thì thuỷ vân phải cân đối giữa bền vững với các thuộc tính khác như lượng thông tin giấu, tính ẩn D ựa trên các yêu cầu của ứng dụng, người ta sẽ lựa chọn một phương pháp thuỷ vân thích hợp nhất Từ những
Trang 24biến đổi có chủ đích hay không có chủ đích đã biết đối với hệ thuỷ vân mà ta có thể phân biệt thành các nhóm như sau:
Tấn công đơn giản: là dạng tấn công cố gắng làm hỏng thủy vân đã được nhúng bằng cách thao tác lên toàn bộ dữ liệu đã được nhúng thủy vân mà không có ý định nhận dạng để tách lấy thủy vân
Tấn công phát hiện: là sự tấn công với mục đích loại bỏ đi mối quan hệ và vô hiệu hóa khả năng khôi phục thủy vân, làm cho bộ phát hiện không thể xác định được thủy vân Điều này được thực hiện chủ yếu bằng các phép biến đổi hình học: phóng
to, thu nhỏ, xoay lật, cắt xén,
Tấn công nhập nhằng: là sự tấn công với mục đích gây nhầm lẫn bằng cách tạo ra dữ liệu gốc giả hoặc dữ liệu đã được nhúng thủy vân giả Ví dụ: kẻ tấn công có thể làm giảm tính xác thực của thủy vân bằng cách nhúng một hoặc nhiều thủy vân
bổ sung sao cho thủy vân mới không thể phân biệt được với thủy vân ban đầu
Tấn công loại bỏ: nhằm mục đích phân tích để xác định ra thủy vân hoặc dữ liệu gốc, tách dữ liệu đã được nhúng thủy vân thành dữ liệu gốc và thủy vân
Tuy nhiên sự phân biệt trên nhiều khi không rõ ràng, nhiều khả năng tấn công không thể xếp vào một nhóm cụ thể nào
Dưới đây là một số phép thay đổi:
- Biến đổi tín hiệu: làm sắc nét, thay đổi độ tương phản, màu, gamma
- Nhiễu cộng, nhiễu nhân
- Lọc tuyến tính
- Nén mat thông tin
- Giảm dữ liệu: cropping, sửa histogram
Nguyên tắc cơ bản của phương pháp thuỷ vân là đảm bảo đủ tính bền vững sao cho các tấn công sẽ làm cho giá trị thương mại của ảnh gốc bị ảnh hưởng
Trang 251.5 Những ứng dụng chủ yếu của hệ thuỷ vân
1.5.1 Bảo vệ bản quyền tác giả (copyright protection):
Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số, một dạng của phương pháp giấu tin Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả sẽ được nhúng vào trong các sản phẩm kỹ thuật số trước khi đưa vào lưu thông, phân phối Thuỷ vân này chỉ một mình người chủ sở hữu hợp pháp sản phẩm đó có và được dùng để chứng minh cho bản quyền sản phẩm Giả sử có một sản phẩm dữ liệu đa phương tiện như ảnh, âm thanh, video cần được lưu thông trên mạng Đe bảo vệ sản phẩm, chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến chất lượng cảm nhận của sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm
1.5.2 Nhận thực thống tin và phát hiện xuyên tạc thông tin (authentication and tamper detection)
Một tập các thông tin sẽ được giấu trong sản phẩm Sau đó, các thông tin này
sẽ được sử dụng để nhận biết xem sản phẩm gốc có bị thay đổi hay không Trong trường hợp này, các thuỷ vân thường có dạng ẩn để không bị phát hiện và nếu có bị lộ thì cũng khó làm giả và cũng dễ nhận ra những chỗ đã bị xuyên tạc Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ bị nén mất dữ liệu) Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững
1.5.3 Lăn tay hoặc dán nhãn (fingerprinting or labeling):
Thuỷ vân trong những ứng dụng này đựơc sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều
Trang 26người Yới những ứng dụng loại này thì yêu cầu cơ bản chính là đảm bảo độ an toàn cao cho các thuỷ vân không bị xoá hoặc thay đổi trong quá trình phân phối.
1.5.4 Kiểm soát sao chép (copy control):
Các thuỷ vân trong những trường hợp này được sử dụng để kiểm soát sao chép không hợp lệ đối với các sản phẩm kỹ thuật số Các thiết bị phát hiện ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc/ghi Các ứng dụng loại này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc
1.6 Những khuynh hướng tiếp cận của kỹ thuật thuỷ vân
1.6.1 Hướng tiếp cận dựa trên miền không gian ảnh
Đây là hướng tiếp cận cơ bản và tự nhiên trong số các kỹ thuật thuỷ vân Miền không gian ảnh là miền dữ liệu ảnh gốc Tác động lên miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm ảnh Đây là hướng tiếp cận tự nhiên bởi vì khi nói đến việc giấu tin trong ảnh người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn Một phương pháp phổ biến của hướng tiếp cận này là thay thế bit ít quan trọng nhất của mỗi điểm ảnh mà ta đã tìm hiểu trong các kỹ thuật giấu tin mật
Ý tưởng cơ bản của phương pháp thay thế bit ít quan trọng nhất LSB (Least Significant Bit) là chọn ra từ mỗi điểm ảnh các bit có ít ý nghĩa nhất về mặt tri giác để
sử dụng cho việc giấu tin Việc bit nào được coi là ít tri giác nhất và bao nhiêu bit có thể được lấy ra để thay thế đều phụ thuộc vào tính chất hệ thống thị giác của con người và nhu cầu về chất lượng ảnh trong các ứng dụng Ví dụ, trong ảnh 24 bit, mỗi màu được biểu diễn bởi 24 bit tương ứng với ba màu RGB, mỗi màu chiếm 1 byte Người ta sử dụng một tính chất của mắt người là sự cảm nhận về màu B (Blue) kém hơn so với hai màu R (Red) và G (Green), chính vì thế bit cuối cùng trong 8 bit biểu diễn màu B của mỗi điểm ảnh thường được chọn để giấu tin Thay đổi bit cuối cùng trong 8 bit biểu diễn màu B chỉ làm cho giá trị biểu diễn màu B tăng hoặc giảm đi 1 đơn vị Do vậy, các bit ít quan trọng nhất trong trường hợp này là bit thứ 24 của mỗi điểm ảnh Một số thuật toán muốn giấu nhiều thông tin hơn và chấp nhận chất lượng ảnh thấp hơn một chút đã coi bit cuối cùng của mỗi byte màu RGB như các bit ít