Từ thực tế thấy được những khó khăn đó bài luận văn này đã trình bày một phương pháp phát hiện những thông tin mật được ẩn giấu trong ảnh.. Một nhóm tác giả Pfitzmann và Westfeld đã giới
Trang 1MỤC LỤC
Trang Trang phụ bìa
Lời cảm ơn
Mục lục
Danh mục từ viết tắt
Danh mục bảng
Danh mục hình ảnh
PHẦN MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Lịch sử nghiên cứu 3
2.1 Trên thế giới 3
2.2 Tại Việt Nam 4
3 Mục tiêu 5
4 Đối tượng và phạm vi nghiên cứu 5
5 Phương pháp nghiên cứu 5
6 Những đóng góp mới của đề tài.Những vấn đề chưa làm được 6
6.1 Những đóng góp mới của đề tài 6
6.2 Những vấn đề mà đề tài chưa thực hiện được 7
6.3 Kết cấu của đề tài 8
CHƯƠNG 1: TỔNG QUAN VỀ KỸ THUẬT PHÁT HIỆN ẢNH GIẤU TIN 10
1.1 Khái niệm 10
1.2 Các kỹ thuật ẩn thông tin 10
1.3 Phân tích tin ẩn giấu thường dựa vào các yếu tố 11
Trang 21.4 Các phương pháp phân tích tin ẩn giấu 11
1.4.1 Phân tích trực quan 11
1.4.2 Phân tích theo định dạng ảnh 11
1.4.3 Phân tích thống kê 12
CHƯƠNG 2: TỔNG QUAN VỀ ẢNH BITMAP VÀ ẢNH PORTABLE NETWORK GRAPHICS (PNG) 13
2.1 Ảnh Bitmap 13
2.1.1 Giới thiệu 13
2.1.2 Cấu trúc ảnh Bitmap 13
2.1.2.1 Bitmap File Header 14
2.1.2.2 Bitmap Information 15
2.1.2.3 Color pelette 15
2.1.2.4 Bitmap Data 16
2.2 Ảnh Portable Network Graphics (PNG) 17
2.2.1 Lịch sử và phát triển 17
2.2.2 Thông tin kỹ thuật 18
2.2.2.1 Phần đầu của tập tin 18
2.2.2.2 Các thành phần trong tập tin 18
2.2.3 Ảnh động 18
CHƯƠNG 3: KỸ THUẬT PHÁT HIỆN ẢNH CÓ GIẤU TIN LSB DỰA TRÊN DỊCH CHUYỂN HISTOGRAM 19
3.1 Khái niệm bit có trọng số thấp 19
3.2 Ý tưởng 20
3.3 Dịch chuyển histogram 21
3.4 Phân tích tin mật LSB dựa trên dịch chuyển histogram 22
3.5 Thuật toán 26
Trang 33.6 Tách tin mật 28
3.6.1 Ý tưởng thuật toán tách 28
3.6.2 Thuật toán tách 29
CHƯƠNG 4: THỬ NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 30
4.1 Môi trường cài đặt 30
4.2 Thử nghiệm mức độ phát hiện chính xác của kỹ thuật phát hiện ảnh có giấu tin 35
4.2.1 Thử nghiệm phát hiện khi giấu theo tỉ lệ 36
4.2.2 Thử nghiệm khi giấu một tệp tin 38
4.2.3 Thử nghiệm khi giấu ảnh trong ảnh 39
4.3 Đánh giá kỹ thuật phát hiện ảnh có giấu tin 40
4.3.1 Độ đo đánh giá 40
4.3.2 Đánh giá kỹ thuật theo Fmeasure 42
4.3.3 Nhận xét 51
4.4 Kết quả đạt được 52
KẾT LUẬN 53 TÀI LIỆU THAM KHẢO
Trang 4DANH MỤC BẢNG
Bảng 2.1: Thông tin byte của Bitmap File Header 14
Bảng 3.1: Một vài hệ số tịnh tiến 23
Bảng 4.1: Tỉ lệ nhúng của ảnh sau khi nhúng theo tỉ lệ 36
Bảng 4.2: Kết quả phát hiện sau khi giấu tin 38
Bảng 4.3: Bảng kết quả tỉ lệ nhúng ảnh trong ảnh 39
Bảng 4.4: Bảng kết quả phân lớp 40
Bảng 4.5: Bảng kết quả thử nghiệm nhúng ảnh với tỉ lệ 50% và 100% 44
Bảng 4.6: Bảng kết quả từ 100 ảnh trong đó ảnh nhúng 50% và 50 ảnh gốc 49
Bảng 4.7: Bảng kết quả 100 ảnh trong đó 50 ảnh đƣợc nhúng 100% và 50 ảnh gốc 50
Bảng 4.8: Bảng kết quả phát hiện cho ảnh đƣợc nhúng 50% và ảnh nhúng 100% 50
Trang 5DANH MỤC HÌNH ẢNH
Hình 1.1: Mô hình giấu tin, phát hiện và tách tin 10
Hình 3.1: Biểu diễn nhị phân của số thập phân 149, với LSB được đánh dấu 19
Hình 3.2 : Ý tưởng hình thành nên thuật toán phát hiện ảnh có giấu tin 20
Hình 3.3: Ảnh chuẩn “Lena” và dịch chuyển histogram của nó 21
Hình 3.4: Mối quan hệ chức năng giữa và tỉ lệ nhúng p 24
Hình 3.5: Mô hình minh họa việc tách tin 28
Hình 4.1: Giao diện chương trình phát hiện ảnh có giấu tin 30
Hình 4.2: Kiểm tra histogram của ảnh nghi ngờ có giấu tin mật 31
Hình 4.3: Chọn ảnh để kiểm tra 31
Hình 4.4: Các nút chức năng trước khi kiểm tra 32
Hình 4.5: Histogram của ảnh RGB 32
Hình 4.6: Thông tin về ảnh sau khi kiểm tra 33
Hình 4.7: Tách tin mật được giấu trong ảnh 34
Hình 4.8: Tập ảnh thử nghiệm chương trình 35
Hình 4.9: Tệp tin txt với số lượng từ sẽ được nhúng thử nghiệm 38
Hình 4.10: Tập ảnh bất kỳ được dùng để nhúng trong ảnh 39
Hình 4.11: Tập 50 ảnh không có giấu tin bất kỳ 42
Hình 4.12: Tập ảnh giấu thử nghiệm được với tỉ lệ 50% và 100% 43
Trang 6PHẦN MỞ ĐẦU
1 Lý do chọn đề tài
Sự phát triển của Internet đã mang lại nhiều biến đổi không ngừng trong xã hội và mọi lĩnh vực, dường như nó là một phần không thể thiếu trong đời sống hiện đại của con người Là nơi truyền tải lượng thông tin khồng lồ về kiến thức văn hóa, xã hội, giáo dục,
an ninh nên Internet không thể tránh khỏi việc gây ra những khó khăn trong kiểm soát tất
cả thông tin dữ liệu được truyền tải
Mức độ lan truyền của thông tin trên internet ngày càng nhiều, ngày càng dày đặc, điều này cũng là một bất cập lớn khi nguy cơ sử dụng trái phép, ăn cắp và sao chép thông tin mật ngày càng tăng mạnh Hằng năm, khối lượng thông tin dữ liệu mật bị đánh cắp và
sử dụng trái phép từ những kẽ hở trong hệ thống đã trở thành nổi ám ảnh của hàng triệu người dùng trên thế giới
Để bảo vệ thông tin mật của mình những cá nhân hoặc tổ chức đã ẩn giấu những thông tin ấy vào các nguồn đa phương tiện Từ đó mà xu hướng giấu thông tin mật trong ảnh phát triển rồi dần dần lan rộng
Do tính ưu việt của các kỹ thuật giấu tin là “vô hình”, nên nó trở thành công cụ hữu ích cho một số tổ chức trao đổi thông tin quan trọng trong môi trường truyền thông công cộng.Có ý kiến cho rằng mạng lưới khủng bố Al-Qaida đã sử dụng hình thức liên lạc này
để giao tiếp trong kế hoạch tấn công nước Mỹ ngày 11 tháng 9 năm 2001 Chúng đã nhúng các thông điệp vào hình ảnh rồi đặt trên các bản tin hoặc trang web công khai Các tên khủng bố chỉ việc lấy hình ảnh về và trích các thông điệp ẩn bên trong Và như vậy chúng đã có một kênh thông tin liên lạc “an toàn, hiệu quả” mà không gây bất kỳ sự nghi ngờ nào Rõ ràng việc sử dụng các kỹ thuật để giấu tin không phải là bất hợp pháp song cũng có những trường hợp lợi dụng kỹ thuật giấu tin để thực hiện những hành vi bất hợp pháp như: Tuyên truyền những sản phẩm văn hóa không lành mạnh, truyền những thông tin kế hoạch khủng bố, lúc đó hậu quả của nó thật nghiêm trọng
Một điều thực sự cần thiết của việc giấu tin nữa là khi giấu thì làm sao biết rằng thông tin mật đã được giấu ? Việc khai phá lại những thông tin ẩn trong các nguồn đa phương tiện cũng là một lợi ích thiết thực để bảo vệ bản quyền Khi thông tin được lan truyền trên mạng, làm sao để xác định đúng bản quyền đó là của cá nhân mình, tổ chức
Trang 7mình trong khi phân loại và kiểm soát thông tin dữ liệu ảnh trong môi trường truyền thông đang là bài toán cấp thiết đối với một số ban ngành, đặc biệt là lĩnh vực an ninh chính trị Mặt khác, việc nghiên cứu khả năng phát hiện thông tin ẩn cũng sẽ làm tăng mức độ an toàn cho kỹ thuật giấu tin, đặc biệt là kỹ thuật giấu tin mật
Từ thực tế thấy được những khó khăn đó bài luận văn này đã trình bày một phương pháp phát hiện những thông tin mật được ẩn giấu trong ảnh Lợi ích lớn nhất mà chương trình có thể đem lại chính là những hiểu biết về thông tin mật được ẩn giấu trong ảnh Giải quyết những khúc mắc làm sao biết một ảnh đã được giấu tin mật
Đồng thời, luận văn cũng đem lại những kiến thức về bảo mật hệ thống, ngăn chặn những lỗi không cần thiết trong hệ thống, tránh được khả năng bị lợi dụng vào những âm mưu
Trang 82 Lịch sử nghiên cứu
2.1 Trên thế giới
Phát hiện ảnh có giấu tin đã có một khoảng thời gian được nghiên cứu khá lâu trong lịch sử Một nhóm tác giả Pfitzmann và Westfeld đã giới thiệu kỹ thuật phát hiện trong bài báo [7] nội dung bài báo này chủ yếu giới thiệu một kỹ thuật phát hiện dựa trên hệ thống phân tích các cặp giá trị (PoV – Pairs of Values) được trao đổi trong thông điệp nhúng Phương pháp này cung cấp kết quả đáng tin cậy cho kỹ thuật giấu tin dựa trên sự thay thế tuần tự các bit ít quan trọng nhất Tuy nhiên, đối với thông điệp dài so với số điểm ảnh trong ảnh, phương pháp này chỉ có thể phát hiện một cách bất kỳ các thông điệp rời rạc
Cũng là một phương pháp phát hiện ảnh giấu tin nhằm vào kỹ thuật giấu tin mật trên LSB đã được một nhóm tác giả khác là J Fridrich, M Goljan, và R Du giới thiệu trong bài báo[5] nội dung bài báo này nói về phương pháp phân tích đối ngẫu (RS-Regular Singular) là một kỹ thuật phát hiện ảnh có giấu tin hiệu quả bằng cách kiểm tra khả năng giảm chất lượng trong các bit ít quan trọng nhất Kỹ thuật này phát hiện ra chiều dài thông điệp bằng cách xem xét dung lượng không đổi trong mặt phẳng LSB và mặt phẳng LSB dịch chuyển Kỹ thuật phân tích RS đáng tin cậy để phát hiện các LSB không liên tục được ẩn trong ảnh kỹ thuật số
Ngoài ra còn có các thuật toán phân tích tin mật mù phân tích linh hoạt hơn vì chúng có thể nhanh chóng được điều chỉnh thành những phương pháp phân tích tin mật hoàn toàn mới Nhưng những phương pháp này cũng có hạn chế là các thuật toán này không cho ta biết số lượng thông điệp mật
Trong bài viết này, chúng tôi giới thiệu một kỹ thuật phân tích tin mật mới dựa trên dịch chuyển histogram Kỹ thuật này được giới thiệu bởi hai tác giả TaoZhang và Xijian Ping trong bài báo [6] có tên “Reliable detection of LSB steganography based on the difference image histogram”, có nghĩa là “Phương pháp hiệu quả để phát hiện tin mật LSB dựa trên dịch chuyển histogram” Kỹ thuật này ứng dụng cho kỹ thuật giấu tin mật LSB Thuật toán sẽ tìm ra được tin mật được giấu bằng cách dùng các thay thế LSB tuần tự hay bất kỳ, đồng thời ước lượng số thông điệp một cách chính xác
Trang 92.2 Tại Việt Nam
Kỹ thuật phát hiện ảnh có giấu tin đã được tiến sĩ Hồ Thị Hương Thơm nghiên cứu
Cô tìm hiểu rất nhiều phương pháp phát hiện giấu tin trong ảnh khác nhau Cô cũng đã đưa ra nhiều ưu điểm và khuyết điểm của mỗi kỹ thuật và tính thực tiễn của kỹ thuật khi được ứng dụng trong cuộc sống mang lại nhiều lợi ích thiết thực
Một bài báo nghiên cứu về kỹ thuật phát hiện ảnh có giấu tin của cô như: [3] tựa đề bài báo là “Phát hiện ảnh giấu tin sử dụng kỹ thuật giấu thuận nghịch dựa trên dịch chuyển histogram” Bài báo nói về năm 2007, Hwang và các đồng nghiệp đề xuất kỹ thuật giấu thuận nghịch (HKC) cải tiến phương pháp giấu của Ni (NSAS) dựa trên dịch chuyển histogram của ảnh Kỹ thuật giấu này tạo ra một sự phân bố không bình thường trên histogram của ảnh sau khi thông điệp được giấu Kuo và các đồng nghiệp của ông đã nêu ra vấn đề không an toàn của kỹ thuật này và đề xuất kỹ thuật phát hiện tương ứng Nhưng kỹ thuật họ đề xuất chỉ có thể phát hiện khi ảnh được giấu với lượng thông điệp giấu lớn 100% khả năng của kỹ thuật HKC, trong một số trường hợp khác nó không thể phát hiện Vì vậy nhóm nghiên cứu của
cô đã đưa ra một số cải tiến phù hợp để có thể phát hiện cho các trường hợp giấu với lượng thông điệp giấu khác nhau sử dụng kỹ thuật giấu HKC Những nghiên cứu này đã được áp dụng vào việc phân loại và kiểm soát thông tin dữ liệu ảnh trong môi trường truyền thông công cộng
Nhóm tác giả Nguyễn Hạnh Phúc, Nguyễn Văn Thủy, Nguyễn Thế Cường cũng giới thiệu một bài báo [1] tựa đề bài báo là “Một số vấn đề trong phát hiện ảnh có giấu tin” Nội dung bài báo cho người đọc hiểu thêm về khái niệm phát hiện thông tin được ẩn giấu trên các nguồn đa phương tiện, cách thức phát hiện dựa vào những yếu tố cần thiết nào và các phương pháp để phát hiện Đồng thời trong bài báo, những tác giả này cũng giới thiệu đến bạn đọc một kỹ thuật phát hiện ảnh có giấu tin của những thông điệp được ẩn giấu trong những cặp điểm ảnh thuộc miền Reversible Contrast Mapping (RCM), và cung cấp khả năng phục hồi lại ảnh một cách hoàn hảo Ý tưởng của kỹ thuật phát hiện này dựa vào xác suất xuất hiện của các bit ít ảnh hưởng nhất (bit LSB)
Trang 103 Mục tiêu
Phát hiện ảnh có giấu tin nỗ lực chống lại mục tiêu lớn nhất của giấu tin trong ảnh, tức là làm cho thông tin bí mật trong ảnh phải lộ diện và ước tính lượng thông điệp được nhúng trong các nguồn đa phương tiện
Trong luận văn đề cập đến bài toán "Nghiên cứu khả năng phát hiện ảnh giấu tin" Mục tiêu của bài toán là phát hiện "Có tồn tại tin giấu trong ảnh hay không ? "
4 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu chủ yếu của đề tài này là một ảnh bất kỳ bị nghi ngờ là có giấu thông tin bí mật mà ta thu thập được từ một cá nhân hoặc tổ chức nào đó, hay một ảnh bất kỳ tải về từ internet, ảnh do chính chúng ta giấu tin
Phạm vi nghiên cứu của đề tài dùng cho ảnh Bitmap (BMP) và ảnh Portable Network Graphic (PNG), độ phân giải trong khoảng 512x512, 800x600, 1024x1024, 256x256
5 Phương pháp nghiên cứu
Tìm hiểu về những kỹ thuật giấu tin trong ảnh bằng nhiều cách khác nhau như: giấu trên các bit ít ảnh hưởng nhất, giấu trên miền dữ liệu của ảnh Nhóm chọn ra một cách giấu phù hợp là kỹ thuật giấu tin trên các bit ít ảnh hưởng nhất và tìm hiểu cách thức giấu tin trên các bit ít ảnh hưởng nhất
Tìm hiểu tổng quan về phát hiện ảnh có giấu tin và các kỹ thuật phát hiện ảnh có giấu tin trên các bit ít ảnh hưởng nhất Có rất nhiều kỹ thuật phát hiện ảnh có giấu tin trên các bit ít ảnh hưởng nhất nhưng nhóm chọn ra một kỹ thuật phù hợp với khả năng nhất Sau đó nhóm chọn ngôn ngữ để lập trình là ngôn ngữ MatLab Nhóm tìm đọc những tài liệu về MatLab
Trang 116 Những đóng góp mới của đề tài Những vấn đề chưa làm được
6.1 Những đóng góp mới của đề tài
- Chương trình có khả năng phát hiện những thông tin được ẩn giấu trong ảnh
là một tệp tin txt và bức ảnh Phát hiện trên hai định dạng ảnh là BMP, PNG
có độ phân giải trong khoảng 512x512, 800x600, 1024x1024, 256x256
- Khả năng phát hiện đúng của chương trình là 70%
- Khi nhúng vào ảnh một tệp tin txt số lượng từ là 6800 trở lên (giấu tin theo tỉ
lệ khoảng 60%) thì chương trình có khả năng phát hiện chính xác ảnh giấu tin
- Phát hiện được trường hợp ảnh giấu trong ảnh
- Một đóng góp mới của đề tài là có thể xem được histogram của ảnh đầu vào
và qua đó có thể thấy được chất lượng của ảnh
- Chương trình có khả năng chỉnh sửa tỉ lệ so sánh cho phù hợp với từng trường hợp để không bỏ sót những ảnh có giấu tin mà khả năng người giấu giấu quá ít, và chỉ cho phép chỉnh sửa trong khoảng phù hợp Giao diện chương trình dễ nhìn, đẹp mắt Hình ảnh có thể phóng to để xem rõ nét
- Chương trình có khả năng tách tin mật nếu như thông điệp được giấu trong ảnh là một tệp tin txt
Trang 126.2 Những vấn đề mà đề tài chưa thực hiện được
- Khả năng phát hiện chính xác của chương trình chỉ ở mức trung bình
- Trường hợp ảnh giấu tin có độ phân giải lớn hơn khoảng đã đề cập thì phát
hiện không chính xác
- Chương trình mà nhóm tác giả làm chủ yếu là phát hiện có hay không sự tồn
tại của những thông tin mật ẩn giấu trong ảnh Chức năng tách tin
mật theo kèm việc phát hiện ảnh giấu tin nhằm mục đích chứng minh rằng có
sự tồn tại của những thông tin mật được giấu trong bức ảnh đó Và chỉ
lấy được thông tin mật khi mà tin mật được giấu thông thường tức là không
có khóa bảo vệ Nếu thông tin mật được mã hóa khi giấu thì sau khi tách tin
mật vẫn bị mã hóa, do thời gian và khả năng còn hạn chế nhóm tác giả không
thực hiện bước giải mã
- Khi tách thông tin trong ảnh chỉ tách trường hợp thông tin được ẩn giấu dưới
dạng tệp tin txt Trường hợp thông điệp giấu là một chuỗi cũng khó phát hiện
vì độ dài của chuỗi khá ngắn dẫn đến khi giấu vào ảnh thì những sự thay đổi
trên ảnh xảy ra không đáng kể do đó mà khó phát hiện được
Trang 136.3 Kết cấu của đề tài
Chương 1: Tổng quan về kỹ thuật phát hiện ảnh giấu tin
Giới thiệu khái niệm tổng quan về phát hiện tin ẩn giấu tin trong các nguồn đa phương tiện Chương này cho chúng ta hiểu thêm rằng để phát hiện một thông tin bị nghi ngờ là có ẩn giấu trong bất kỳ một nguồn đa phương tiện thì chúng ta phải biết thông tin
ấy được ẩn giấu vị trí nào trên nguồn đa phương tiện
Bên cạnh đó những yếu tố cần thiết để phân tích tin ẩn giấu trong nguồn đa phương tiện cũng phần nào tạo nên hướng đi chính xác cho kỹ thuật phân tích Từ những yếu tố phân tích đã nêu sẽ lựa chọn phương pháp phù hợp Trong những phương pháp ấy có những kỹ thuật nào có thể giúp chúng ta phát hiện, lựa chọn kỹ thuật thuộc phương pháp
ấy
Chương 2: Tổng quan về ảnh Bitmap và ảnh Portable Network Graphic
(PNG)
Thực tế thì định dạng ảnh nào cũng có thể giấu tin nhưng do chất lượng và khả năng
vô hình của thông tin mật mà những định dạng ảnh Bitmap và PNG thường được ứng dụng nhiều trong kỹ thuật giấu tin Những định dạng ảnh này có chất lượng và khả năng giấu tin cao, khi giấu với lượng thông tin nhiều thì chất lượng ảnh không thay đổi rõ rệt quá Điều này lại không xảy ra đối với ảnh JPEG thường dùng để lan truyền trên Internet
vì khả năng giảm chất lượng của định dạng ảnh này cao
Trong phần này, nhóm tác giả giới thiệu tổng quan về lịch sử, cấu trúc của ảnh BMP
và ảnh PNG Phần này sẽ đóng góp phần nào những hiểu biết, những kiến thức về ảnh số trong đời sống hàng ngày ta luôn tiếp cận
Chương 3: Kỹ thuật phát hiện ảnh có giấu tin LSB dựa trên dịch chuyển
histogram
Sau khi đã hiểu những kiến thức về ảnh, biết được những thông tin mật thường được
ẩn giấu trên các bit ít ảnh hưởng nhất và từ kỹ thuật đã chọn lựa thuộc phương pháp phân tích thống kê Chương này cho ta hiểu những cách thức cũng như thuật toán mà kỹ thuật thực hiện trên bức ảnh nghi ngờ là có giấu tin như thế nào để ra kết quả cuối cùng
Trang 14 Chương 4: Thử nghiệm và đánh giá
Sau khi hoàn thiện chương trình và tiến hành thử nghiệm chương trình trên các định dạng ảnh Khảo sát mức độ chính xác của kỹ thuật từ đó đưa ra bảng đánh giá về kỹ thuật Nhận xét chung và những kết quả đạt được
Trang 15CHƯƠNG 1: TỔNG QUAN VỀ KỸ THUẬT PHÁT HIỆN ẢNH
GIẤU TIN
1.1 Khái niệm
Steganalysis là kỹ thuật phát hiện sự tồn tại của thông tin ẩn giấu trong nguồn đa phương tiện Giống như thám mã, mục đích của Steganalysis là phát hiện ra thông tin ẩn
và phá vỡ tính bí mật của vật mang tin ẩn
Tùy vào bài toán cụ thể, thành công của kỹ thuật phát hiện sự tồn tại của thông tin
ẩn giấu được đánh giá khác nhau Một số bài toán chỉ cần phát hiện có hay không tin ẩn giấu trong vật mang tin Một số bài toán yêu cầu sửa đổi hay phá hủy tin ẩn giấu trong vật mang tin
Hình 1.1: Mô hình giấu tin, phát hiện và tách tin
1.2 Các kỹ thuật ẩn thông tin
Khi chúng ta muốn phát hiện bất kỳ một nguồn đa phương tiện nào mà nghi ngờ có chứa thông tin mật thì chúng ta cần phải biết thông tin đó được ẩn ở nơi nào để hỗ trợ cho việc phát hiện nhanh chóng Có những cách giấu như sau:
- Nối thêm vào tập tin
- Ẩn trong phần tiêu đề không sử dụng của tập tin , gần phần bắt đầu nội dung tập tin
- Phân tán thông tin ẩn trên toàn bộ tập tin, thay đổi LSB (Least Significant Bit), giấu trên miền dữ liệu ảnh
- Và nhiều phương pháp khác
Trang 161.3 Phân tích tin ẩn giấu thường dựa vào các yếu tố
- Phân tích dựa vào các đối tượng có thể mang tin
- Phân tích bằng so sánh đặc trưng: So sánh vật mang tin chưa được giấu tin
với vật mang tin đã được giấu tin, đưa ra sự khác biệt giữa chúng
- Phân tích dựa vào thông điệp cần giấu để dò tìm
- Phân tích dựa vào các thuật toán giấu tin và các đối tượng giấu đã biết: Kiểu
phân tích này phải quyết định các đặc trưng của đối tượng giấu tin, chỉ ra
công cụ giấu tin (thuật toán) đã sử dụng
- Phân tích dựa vào thuật toán giấu tin, đối tượng gốc và đối tượng sau khi giấu
tin
1.4 Các phương pháp phân tích tin ẩn giấu
1.4.1, Phân tích trực quan
Đây là phương pháp đơn giản nhất mặc dù kết quả thường không được đáng tin cậy
Để phát hiện khả năng một ảnh có giấu tin hay không bằng việc phân tích ảnh một cách
trực quan và tìm kiếm những điểm bất thường như: Xem các thuộc tính của tập tin/nội
dung tập tin: Kích thước khác nhau, ngày và giờ khác nhau, nội dung sửa đổi, tổng kiểm
tra (checksum)
Ngoài ra, sự thay đổi bảng màu (của một màu) dù nhỏ để giấu thông điệp bí mật có
thể dẫn đến kết quả là sự thay đổi màu sắc lớn trên ảnh gốc, đặc biệt là nếu ảnh gốc có
chứa các màu sắc khác nhau ở mức độ cao Với phương pháp phân tích này thường khó
phát hiện với ảnh có độ nhiễu cao và kích cỡ lớn
Dựa vào khả năng nghe để phát hiện ra sự khác biệt (WAV, MPEG, etc.)
1.4.2, Phân tích theo định dạng ảnh
Phương pháp này thường dựa vào các dạng ảnh bitmap hay là ảnh nén để đoán nhận
kỹ thuật giấu hay sử dụng như các ảnh bitmap thường hay sử dụng giấu trên miền LSB,
ảnh nén thường sử dụng kỹ thuật giấu trên các hệ số biến đổi như DCT, DWT, DFT
Trang 171.4.3, Phân tích thống kê
Trước khi giấu tin, trên ảnh không chứa thông điệp thì mỗi cặp hai giá trị là phân phối không đều Sau khi giấu tin, giá trị trong mỗi cặp có xu hướng trở nên bằng nhau Hơn nữa, nếu các kỹ thuật giấu tin mật giấu các bit thông điệp một cách tuần tự vào các điểm ảnh liên tiếp nhau, bắt đầu tứ góc trên trái thì ta sẽ quan tâm được sự thay đổi đột ngột trong các thống kê
Phân tích biểu đồ tần số có thể được sử dụng để có thể xác định một tập tin với một thông điệp ẩn
Đây là phương pháp sử dụng các lý thuyết thống kê và thống kê toán sau khi đã xác định được nghi vấn đặc trưng Phương pháp này thường đưa ra độ tin cậy cao hơn và đặc
biệt là cho các ảnh dữ liệu lớn
Trang 18CHƯƠNG 2: TỔNG QUAN VỀ ẢNH BITMAP VÀ ẢNH
PORTABLE NETWORK GRAPHICS (PNG)
Trong số rất nhiều định dạng ảnh được sử dụng hiện nay, về cơ bản thì ảnh nào cũng
có thể giấu thông tin mật nhưng còn tùy vào khả năng giảm chất lượng của từng định dạng ảnh mà người dùng sẽ lựa chọn những định dạng ảnh nào để giấu Những định dạng ảnh như JPG, JPEG có dung lượng nhẹ nên chúng được dùng nhiều để lan truyền trên mạng nhưng khả năng giảm chất lượng của những định dạng này cao và giấu càng nhiều chất lượng càng giảm Để bảo đảm khả năng an toàn cho thông tin mật thường thì chúng được giấu vào những định dạng ảnh chuẩn, chất lượng tốt, có khả năng giấu nhiều trong
số những định dạng ảnh này nhóm tác giả sẽ tìm hiểu hai định dạng ảnh cơ bản là PNG [10] và BMP [8]
2.1 Ảnh Bitmap
2.1.1, Giới thiệu
Ảnh BITMAP được phát triển bởi Microsoft Corporation, tên tệp tin mở rộng mặc định của một tệp ảnh BITMAP là BMP, nét vẽ được thể hiện là các điểm ảnh Ảnh BMP được sử dụng trên Microsoft Windows và các ứng dụng chạy trên Windows từ version 3.0 trở lên
Đặc điểm nổi bật nhất của định dạng BMP là tập tin ảnh thường không được nén bằng bất kỳ thuật toán nào Khi lưu ảnh, các điểm ảnh được ghi trực tiếp vào tập tin một điểm ảnh sẽ được mô tả bởi một hay nhiều byte tùy thuộc vào giá trị n của ảnh Do đó, một hình ảnh lưu dưới dạng BMP thường có kích cỡ rất lớn, gấp nhiều lần so với các ảnh được nén (chẳng hạn GIF, JPEG hay PNG)
2.1.2, Cấu trúc ảnh Bitmap
Cấu trúc một tệp ảnh BMP gồm có bốn phần:
- Bitmap File Header: Lưu trữ thông tin tổng hợp về tệp ảnh BMP
- Bitmap Information: Lưu trữ thông tin chi tiết về ảnh Bitmap
- Color Palette: Lưu trữ định nghĩa của màu được sử dụng cho Bitmap
- Bitmap Data: Lưu trữ từng điểm ảnh của hình ảnh thực tế
Trang 192.1.2.1, Bitmap File Header
Bảng 2.1: Thông tin byte của Bitmap File Header
3 – 6 File_Size Kích thước File Kiểu Long trong turbo C
11 – 14 OffsetBit Byte bắt đầu vùng dữ
liệu
Offset của byte bắt đầu vùng dữ liệu
15 -18 Isize Số byte cho vùng info 40 byte
19 – 22 Width Chiều rộng của ảnh
23 – 26 Height Chiều cao của ảnh BMP Tính bằng pixel
27 – 28 Planes Số planes màu Cố định là 1
29 – 30 bitCount Số bít cho một pixel Có thể là 1,4,6,16,24
31-34 Compression Kiểu nén dữ liệu
0: Không nén 1: Nén
runlength 8bits/pixel 2: Nén runlength 4bits/pixel
35 -38 ImageSize Kích thước ảnh Tính bằng byte
Trang 2039 – 42 XpelsPerMeter Độ phân giải ngang Tính bằng pixel/metr
43 – 46 YpelsPerMeter Độ phân giải dọc Tính bằng pixel/metr
47 – 50 ColorsUsed Số màu sử dụng trong
4: Bitmap là ảnh 16 màu, mỗi điểm ảnh được biểu diễn bởi 4 bit
8: Bitmap là ảnh 256 màu, mỗi điểm ảnh biểu diễn bởi 1 byte
16: Bitmap là ảnh highcolor, mỗi dãy 2 byte liên tiếp trong bitmap biểu diễn cường
độ tương đối của màu đỏ, xanh lá cây, xanh lơ của một điểm ảnh
24: Bitmap là ảnh True Color (224 màu), mỗi dãy 3 byte liên tiếp trong bitmap biểu diễn cường độ tương đối của màu đỏ, xanh lá cây, xanh lơ (RGB) của một điểm ảnh Thành phần Color Used của cấu trúc Bimap Header xác định số lượng màu của Pelette màu thực sự được sử dụng để hiện thị trên ảnh Bitmap Nếu thành phần này bằng
0, ảnh Bitmap sử dụng số lượng màu lớn nhất tương ứng với Bitcount
Trang 21Kích thước của vùng Palette màu = 4 * số màu của ảnh Bảng màu xuất hiện trong tập tin BMP sau tiêu đề BMP và tiêu đề DIB
Vì Palette màu của màn hình có cấu tạo theo thứ tự Red - Green - Blue nên khi đọc Palette màu của ảnh BMP vào thì phải chuyển đổi cho phù hợp Số màu của ảnh được biết dựa trên số bit cho 1 pixel cụ thể là: 8 bits / pixel: ảnh 256 màu 4 bits / pixel: ảnh 16 màu,
24 bits / pixel ảnh 24 bit màu
2.1.2.4, Bitmap Data
Phần Bitmap Data nằm ngay sau phần Color Palette của ảnh BMP Đây là phần chứa các giá trị màu của các điểm ảnh trong BMP Dữ liệu ảnh được lưu từng điểm cho đến hết hàng ngang (từ trái sang phải), và từng hàng ngang cho đến hết ảnh (từ dưới lên trên) Mỗi byte trong vùng Bitmap Data biểu diễn 1 hoặc nhiều điểm ảnh tùy theo số bits cho một pixel
Trang 222.2 Ảnh Portable Network Graphics (PNG)
PNG [10] (từ viết tắt trong tiếng Anh của Portable Network Graphics) là một dạng hình ảnh sử dụng phương pháp nén dữ liệu mới - không làm mất đi dữ liệu gốc PNG được tạo ra nhằm cải thiện và thay thế định dạng ảnh GIF với một định dạng hình ảnh không đòi hỏi phải có giấy phép sáng chế khi sử dụng PNG được hỗ trợ bởi thư viện tham chiếu libpng, một thư viện nền tảng độc lập bao gồm các hàm của C để quản lý các hình ảnh PNG
Những tập tin PNG thường có phần mở rộng là PNG và png và đã được gán kiểu chuẩn MIME là image/png (được công nhận vào ngày 14 tháng 10 năm 1996)
2.2.1, Lịch sử và phát triển
Động cơ thúc đẩy cho việc tạo ra định dạng PNG bắt đầu vào khoảng đầu năm 1995, sau khi Unisys công bố họ sẽ áp dụng bằng sáng chế vào thuật toán nén dữ liệu LZW- được sử dụng trong định dạng GIF Thuật toán được bảo vệ bởi bằng công nhận độc quyền sáng tạo ở trong nước Mỹ và tất cả các nước trên thế giới Một người “anh em” của
nó là MNG đã được tạo ra để giải quyết vấn đề ảnh động PNG lại tăng thêm sự phổ biến của nó vào tháng 8 năm 1999, sau khi hãng Unisys huỷ bỏ giấy phép của họ đối với các lập trình viên phần mềm miễn phí, và phi thương mại
- Phiên bản 1.0 của đặc tả PNG được phát hành vào ngày 1 tháng 7 năm 1996,
và sau đó xuất hiện vơi tư cách RFC 2083 Nó được tổ chức W3C khuyến nghị vào ngày 1 tháng 10 năm 1996
- Phiên bản 1.1, với một số thay đổi nhỏ và thêm vào 3 thành phần mới, được phát hành vào ngày 31 tháng 12 năm 1998
- Phiên bản 1.2, thêm vào một thành phần mở rộng, được phát hành vào ngày
11 tháng 8 năm 1999
- PNG giờ đây là một chuẩn quốc tế (ISO/IEC 15948:2003), và cũng được công bố như một khuyến nghị của W3C vào ngày 10 tháng 11 năm 2003 Phiên bản hiện tại của PNG chỉ khác chút ít so với phiên bản 1.2 và không có thêm thành phần mới nào
Trang 232.2.2, Thông tin kỹ thuật
2.2.2.1, Phần đầu của tập tin
Một tập tin PNG bao gồm 8-byte kí hiệu (89 50 4E 47 0D 0A 1A 0A) được viết trong hệ thống có cơ số 16, chứa các chữ "PNG" và 2 dấu xuống dòng, ở giữa là sắp xếp theo số lượng của các thành phần, mỗi thành phần đều chứa thông tin về hình ảnh Cấu trúc dựa trên các thành phần được thiết kế cho phép định dạng PNG có thể tương thích với các phiên bản cũ khi sử dụng
Một bộ giải mã phải có thể thông dịch để đọc và hiển thị một tệp PNG
- IHDR phải là thành phần đầu tiên, nó chứa đựng header
- PLTE chứa đựng bảng màu (danh sách các màu)
- IDAT chứa đựng ảnh Ảnh này có thể được chia nhỏ chứa trong nhiều phần IDAT Điều này làm tăng kích cỡ của tệp lên một ít nhưng nó làm cho việc phát sinh ảnh PNG mượt hơn (streaming manner)
- IEND đánh dấu điểm kết thúc của ảnh
2.2.3, Ảnh động
PNG không hỗ trợ ảnh động Nhưng một định dạng khác phức tạp hơn dựa trên ý tưởng và các thành phần của PNG là MNG được thiết kế cho ảnh động, tuy nhiên định dạng này không cho phép hiển thị một ảnh trong trường hợp hệ thống không hỗ trợ được hình động Một định dạng khác là APNG cũng dựa trên PNG hỗ trợ ảnh động và tương thích lùi, nhưng đơn giản hơn MNG Tuy nhiên, đến thời điểm 2005 những dịnh dạng này vẫn chưa được hỗ trợ rộng rãi
Trang 24CHƯƠNG 3: KỸ THUẬT PHÁT HIỆN ẢNH CÓ GIẤU TIN LSB
DỰA TRÊN DỊCH CHUYỂN HISTOGRAM
3.1 Khái niệm bit có trọng số thấp
Bit có trọng số thấp là bit có ảnh hưởng ít nhất tới việc quyết định tới màu sắc của mỗi điểm ảnh, vì vậy khi ta thay đổi bit ít quan trọng của một điểm ảnh thì màu sắc của mỗi điểm ảnh mới sẽ tương đối gần với điểm ảnh cũ Việc xác định LSB của mỗi điểm ảnh trong một bức ảnh phụ thuộc vào định dạng của ảnh và số bit màu dành cho mỗi điểm của ảnh đó Ví dụ đối với ảnh 16 bit thì 15 bit là biểu diễn 3 màu RGB của điểm ảnh còn bit cuối cùng không dùng đến thì ra sẽ tách bit này ra ở mỗi điểm ảnh để giấu tin, hoặc với ảnh 256 màu thì bit cuối cùng trong 8 bit biểu diễn một điểm ảnh được coi là bit ít quan trọng nhất
Hình 3.1: Biểu diễn nhị phân của số thập phân 149, với LSB được đánh dấu
Trong ví dụ này ta coi bit cuối cùng là bit ít quan trọng nhất, thay đổi giá trị của bit này thì sẽ thay đổi giá trị của điểm ảnh lên hoặc xuống đúng một đơn vị, ví dụ như giá trị điểm ảnh là 149 thì khi thay đổi bit cuối cùng nó có thể mang giá trị mới là 148 nếu đổi bit cuối cùng từ 1 thành 0 Với sự thay đổi nhỏ đó ta hi vọng là cấp độ màu của điểm ảnh
sẽ không bị thay đổi nhỉều
Trang 253.2 Ý tưởng
Hình 3.2 : Ý tưởng hình thành nên thuật toán phát hiện ảnh có giấu tin
TaoZhang và Xijian Ping nghĩ rằng tồn tại một sự khác biệt nào đó giữa hai bức ảnh trước và sau khi giấu tin Hai ông cũng hiểu rằng sự khác biệt đó không thể nhìn bằng mắt thường, sau khi xem histogram của ảnh trước và sau khi giấu tin thì hai ông đã thấy rằng có sự dịch chuyển histogram của ảnh gốc và ảnh sau khi giấu tin Ví dụ cụ thể như histogram lúc đầu cao hơn, sau khi giấu tin thì tụt xuống thấp, xuất hiện nhiều vùng trống hơn
Đa phần các hệ thống giấu tin mật không hoàn toàn an toàn và có thể để lại các dấu vết dễ nhận biết dưới dạng này hay dạng khác Mặc dù con người khó nhận ra các dấu vết này nhưng với các kỹ thuật phân tích thống kê, các điểm khác lạ trong ảnh sẽ được phát hiện ra Sau khi xem xét đặc điểm của kỹ thuật giấu tin mật trên LSB, nhóm tác giả [6] Tao Zhang và Xijian Ping đã giới thiệu phương pháp dựa trên sự dịch chuyển histogram của ảnh làm công cụ phân tích thống kê để phát hiện ảnh giấu tin Hình 3.2 mô phỏng ý tưởng phát hiện ảnh có giấu tin dựa trên dịch chuyển histogram Các ký hiệu số trên hình 3.2 có ý nghĩa như sau:
(1) Ảnh gốc “Lena” chưa được giấu tin
(2) Quan sát histogram của ảnh gốc Lena ta thấy các tần số đối xứng với nhau qua gốc tọa độ
(3) Bức ảnh nhị phân sẽ được giấu vào ảnh gốc Lena
(4) Ảnh Lena sau khi giấu tin
Trang 26(5) Quan sát histogram của ảnh gốc Lena sau khi giấu tin thấy rằng tần số của ảnh không còn cân bằng và đối xứng với nhau qua gốc tọa độ
TaoZhang và Xijian Ping đã dựa trên sự thay đổi của hai biểu đồ này để hình thành nên thuật toán phát hiện ảnh có giấu tin
3.3 Dịch chuyển histogram
Kỹ thuật phát hiện ảnh có giấu tin được TaoZhang và Xijian Ping đề xuất [6] nhằm phân tích tin mật dạng LSB dựa trên dịch chuyển histogram (DIH- Difference Image Histogram) Hệ số tịnh tiến giữa các dịch chuyển histogram (DIH- Difference Image Histogram) được định nghĩa là trị số tương quan yếu giữa mặt phẳng LSB (Least
Significant Bit) và các mặt phẳng bit còn lại, và hệ số này được dùng để phân biệt ảnh
mang và ảnh có tin chìm Thuật toán không chỉ giúp phát hiện ra tin mật bằng cách dùng các thay thế LSB tuần tự hay bất kỳ trong ảnh, mà còn ước lượng chính xác số lượng tin được nhúng Đối với các ảnh nén thô, thuật toán này có hiệu quả tốt hơn và cải thiện được tốc độ xử lý một cách rõ rệt
Gọi giá trị cường độ của ảnh I ở vị trí ( ) là ( ), và dịch chuyển ảnh được
định nghĩa là:
( ) ( ) ( ) ( )
Dịch chuyển histogram được định nghĩa là histogram của dịch chuyển ảnh D
Hình 3.3: Ảnh chuẩn “Lena” và dịch chuyển histogram của nó (a) Hình chuẩn “Lena”;
(b) Dịch chuyển histogram của “Lena”
Trang 273.4 Phân tích tin mật LSB dựa trên dịch chuyển histogram
Kỹ thuật giấu tin mật LSB là kỹ thuật giấu tin đơn giản nhất Kỹ thuật này nhúng thông điệp bí mật trong một tập hợp con mặt phẳng LSB của ảnh Nhiều công cụ giấu tin mật thông dụng nhƣ S-Tools 4, Steganos và StegoDos dựa trên thay thế LSB trong miền không gian
Các thông điệp bí mật có thể đƣợc nhúng vào mặt phẳng LSB bằng cách thay thế bất kỳ hay thay thế tuần tự Thay thế LSB tuần tự dễ thực hiện hơn nhƣng gây vấn đề an ninh nghiêm trọng vì có sự khác biệt thống kê rõ ràng giữa phần đƣợc sửa và phần chƣa đƣợc sửa của ảnh giấu tin mật Thay thế LSB bất kỳ rải thông điệp mật trong ảnh vì vậy vấn đề an ninh đƣợc cải thiện hơn
Giả sử có một ảnh mang I kích cỡ pixel Rõ ràng dung lƣợng dữ liệu cực đại
có thể giấu đƣợc theo kỹ thuật giấu tin LSB là bit Định nghĩa tỉ lệ nhúng là tỉ lệ của chiều dài thông điệp đƣợc nhúng với dung lƣợng cực đại của ảnh Thuật toán xác định ảnh giấu tin hay không dựa vào mốc tỉ lệ nhúng p=0% (p<0 ảnh không giấu tin, p>0 ảnh
có giấu tin)
Gọi dịch chuyển histogram của ảnh là h i , và histogram của ảnh sau khi đã dịch
chuyển tất cả bit trong mặt phẳng LSB là f i , và histogram của ảnh sau khi đã cho tất cả
bit trong mặt phẳng LSB bằng 0 là g i Tồn tại mối quan hệ sau giữa , và :
( )
( )
( ) trong đó là hệ số tịnh tiến từ histogram đến Khi ta có
Trang 28các mặt phẳng bit còn lại Do đó, đối với ảnh đã giấu tin như vậy, ta có:
5 , 5 , 5, Liệt kê một vài hệ số tịnh tiến của
ảnh gốc “Lena” và hai tấm ảnh giấu tin với tỉ lệ nhúng 5 và
Bảng 3.1: Một vài hệ số tịnh tiến
Ảnh gốc
i=0 0.2316 0.5368 0.2316 i=1 0.3115 0.5025 0.1860 i=2 0.3527 0.4841 0.1632
5
i=0 0.2451 0.5098 0.2451 i=1 0.2805 0.5009 0.2186 i=2 0.3025 0.4934 0.2041
i=0 0.2503 0.4993 0.2503 i=1 0.2502 0.5004 0.2494 i=2 0.2508 0.5005 0.2487 Khi phân tích kỹ hơn các hệ số tịnh tiến này, chúng tôi biết rằng đối với một tấm ảnh
tự nhiên, có mối tương quan yếu giữa mặt phẳng LSB và các mặt phẳng bit khác Khi càng có nhiều thông điệp mật được nhúng vào, tương quan càng yếu hơn và cuối cùng mặt phẳng LSB độc lập với các mặt phẳng bit khác Từ phương trình (3), chúng tôi biết rằng gồm 2 phần: và , và kiểm tra thống kê cho thấy trong các tấm ảnh tự nhiên, 2 phần này đóng góp ngang nhau cho , tức là:
Trang 29(7)
, và giả thuyết thống kê phương
pháp ẩn liệu là đối với một bức hình tự nhiên, biểu thức này thỏa mãn
(8) trong khi hình ảnh giấu thông tin với mặt phẳng LSB nhúng hoàn toàn, có
(9) Các thí nghiệm khác chỉ ra rằng với một đã cho nhất định, giá trị giảm nhẹ so
với việc chiều dài của các thông điệp bí mật nhúng khi tỷ lệ nhúng p tăng lên , giảm xấp xỉ xuống 1 Để nghiên cứu ra mối quan hệ chức năng giữa và tỷ lệ nhúng , chúng tôi đã tạo ra một loạt các hình ảnh giấu thông tin bằng các thông điệp bí mật có tỷ
lệ nhúng giao động từ 0 đến trong gia số 5 Cho hình ảnh giấu thông tin được
tạo ra với tỷ lệ nhúng là p như S p , hình được tạo bằng cách đảo ngược tất cả bits trong
LSB mặt phẳng là S p thành R p Tính giá trị của của tất cả ảnh S p và R p (chú ý giá trị đối với bằng với giá trị của đối với S p) Tuy nhiên, chúng tôi chú ý rằng trong
ảnh S p chỉ khoảng pixels bị lật bởi nhúng thông điệp trong khi tại R p khoảng pixels bị lật Do đó, ảnh tương đương với ảnh giấu thông tin có “tỷ lệ nhúng”
2-p Hình 3.4 trình bày mối quan hệ chức năng giữa với tỷ lệ nhúng khi trong bức ảnh “Lena”
Hình 3.4: Mối quan hệ chức năng giữa và tỉ lệ nhúng p
Trang 30Chúng tôi lập mô hình mối quan hệ giữa và tỷ lệ nhúng p sử dụng đa thức bậc hai
Chúng tôi sẽ trao đổi để tìm cách có được p ước lượng thông điệp
gán giá trị cho bốn điểm chính Bốn điểm chính lần lượt là ( ), ( ), ( ) và ( ) Giờ ta có phương trình sau :
{
( ) ( ) ( )
Cho = , và và phương trình ( ) được rút gọn thành: