Trong đồ án này chúng em tìm hiểu về kỹ thuật ẩn thông tin trong ảnh số, với việc áp dụng các thuật toán giấu tin trong ảnh nhị phân từ đó nâng cấp lên với ảnh màu, với một số định dạng
Trang 1TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN
LUẬN VĂN TỐT NGHIỆP
ẨN THÔNG TIN TRONG ẢNH
GVHD : TS.NGUYỄN THANH BÌNH SVTH : LƯƠNG XUÂN TRUNG
PHÙNG THỊ MỸ VIÊN Lớp : 08TH2D
Khoá : 12
TP Hồ Chí Minh, tháng 07 năm 2012
Trang 2TỔNG LIÊN ĐOÀN LAO ĐỘNG VIỆT NAM TRƯỜNG ĐẠI HỌC TÔN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN
LUẬN VĂN TỐT NGHIỆP
ẨN THÔNG TIN TRONG ẢNH
GVHD : TS.NGUYỄN THANH BÌNH SVTH : LƯƠNG XUÂN TRUNG
PHÙNG THỊ MỸ VIÊN Lớp : 08TH2D
Khoá : 12
TP Hồ Chí Minh, tháng 07 năm 2012
Trang 3LỜI CẢM ƠN
Nhóm em xin bày tỏ lòng biết ơn sâu sắc nhất tới giảng viên hướng dẫn TS.Nguyễn Thanh Bình, thầy đã tận tình hướng dẫn và giúp đỡ chúng em rất nhiều trong quá trình tìm hiểu và nghiên cứu để chúng em có thể hoàn thành tốt đề tài tốt nghiệp của mình
Nhóm em xin gửi lời cảm ơn đến Ban giám hiệu và các thầy cô giảng viên của trường đại học Tôn Đức Thắng đã giảng dạy chúng em trong suốt 4 năm học, cung cấp cho chúng em những kiến thức chuyên môn cần thiết và quý báu giúp chúng em hiểu rõ hơn các lĩnh vực nghiên cứu để hoán thành đề tài dược giao
Xin cảm ơn bạn bè và gia đình đã động viên cổ vũ, đóng góp ý kiến, và trao đổi trong suốt quá trình học tập cũng như làm tốt nghiệp, giúp chúng em hoàn thành để tài đúng thời hạn
Trang 4NHẬN XÉT CỦA GIẢNG VIÊN HƯỚNG DẪN
Trang 5
NHẬN XÉT CỦA GIẢNG VIÊN PHẢN BIỆN
Trang 6
LỜI NÓI ĐẦU
Trong thời đại bùng nổ thông tin ngày này, vấn đề bảo mật đang được đẩy mạnh và phát triển với nhiều cách thức bảo mật để thông tin luôn được an toàn khi lưu thông trên mạng thông tin Với việc luôn có những cách thức mới để bảo mật an toàn thông tin, chúng em chọn đề tài này để tìm hiểu và nghiên cứu cách thức bảo mật thông tin nhúng, là cách thức giấu thông tin vào một vật chủ nhằm đánh lạc hướng cũng như che giấu đi phần thông tin nhạy cảm được bảo mật
Giấu tin mật (steganography) là một lĩnh vực khoa học và nghệ thuật giấu thông tin trong đa phương tiện Hệ thống Steganography giấu các thông tin mật số vào trong đối tượng số khác mà khó bị phát hiện bằng kỹ thuật thông thường Trước kia con người sử dụng ẩn các hình xăm hoặc mực vô hình để truyền thông điệp mật Ngày nay nhờ có máy tính và công nghệ mạng công việc truyền thông tin mật trở nên dễ dàng và hiệu quả hơn
Trong đồ án này chúng em tìm hiểu về kỹ thuật ẩn thông tin trong ảnh số, với việc áp dụng các thuật toán giấu tin trong ảnh nhị phân từ đó nâng cấp lên với ảnh màu, với một số định dạng ảnh đang sử dụng phổ biến hiện nay Bằng việc nâng cấp thuật toán đã có sẵn để tăng tính bảo mật và tăng thêm lượng thông tin được giấu, dựa vào thuật toán để hiện thực ứng dụng hoàn chỉnh chạy trên môi trường Window
Trang 7MỤC LỤC
DANH MỤC TỪ VIẾT TẮT 3
DANH MỤC CÁC HÌNH VẼ 3
DANH MỤC CÁC BẢNG BIỂU 4
DANH MỤC CÁC BIỂU ĐỒ 4
Chương 1.GIỚI THIỆU 5
1.1 Giới thiệu đề tài 5
1.2 Nội dung đề tài 6
1.3 Giới hạn đề tài 6
1.4 Cấu trúc luận văn 6
Chương 2.CƠ SỞ LÝ THUYẾT 7
2.1 Tổng quan về giấu tin trong ảnh 7
2.1.1 Giới thiệu chung về giấu tin trong ảnh 7
2.1.2 Một số ứng dụng giấu tin trong ảnh 8
2.1.3 Một số đặc điểm của việc giấu tin trong ảnh 9
2.1.4 Sự khác nhau giấu tin trong ảnh màu và ảnh đen trắng 10
2.2 Các phương pháp bảo vệ thông tin 12
2.2.1 Phương pháp bảo vệ thông thường 12
2.2.2 Phương pháp bảo vệ vật lý 12
2.2.3 Phương pháp bảo vệ dùng phần mềm 12
2.3 Đánh giá độ an toàn bảo mật thông tin 12
2.3.1 Đánh giá 12
2.3.2 An toàn phần mềm 13
2.3.3 Sự phát triển công nghệ và các ảnh hưởng 13
2.4 Các định dạng ảnh thường dùng 13
2.4.1 Định dạng ảnh JPG 13
2.4.2 Định dạng ảnh PNG 14
2.4.3 Định dạng ảnh GIF 15
2.4.4 Định dạng ảnh BMP 16
2.5 Phương pháp đánh giá 17
2.6 Các kỹ thuật giấu tin trong ảnh 18
2.6.1 Kỹ thuật Injection 18
Trang 82.6.2 Kỹ thuật Substitution 18
2.6.3 Kỹ thuật Generation 19
2.7 Kỹ thuật giấu tin trong ảnh sử dụng LSB 19
2.7.1 Giới thiệu 19
2.7.2 Các khái niệm cơ bản 19
2.7.3 Thuật toán LSB 21
2.7.4 Thuật toán CPT 22
2.7.5 Ứng dụng thuật toán trong ảnh màu 24
Chương 3.PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG 27
3.1 Môi trường làm việc 27
3.2 Thuật toán đề xuất 27
3.3 Loại ảnh được sử dụng vào giấu tin và phương pháp thực hiên: 29
3.4 Tổ chức và hiện thực chương trình 30
3.4.1 Thiết kế bộ mã hóa và giải mã cho dữ liệu giấu 32
3.4.2 Thiết kế chương trình giấu tin vào ảnh và tách tin từ ảnh 32
Chương 4.HIỆN THỰC HỆ THỐNG 37
4.1 Giao diện chính của chương trình 37
4.2 Các chức năng chính của chương trình 37
4.2.1 Chức năng giấu tin 37
4.2.2 Chức năng tách tin 41
4.3 Kết quả thực nghiệm 44
Chương 5.KẾT LUẬN 50
5.1 Kết quả đạt được 50
5.2 Ưu và nhược điểm 50
5.3 Hướng mở rộng và phát triển trong tương lai 51
TÀI LIỆU THAM KHẢO 52
Trang 9DANH MỤC TỪ VIẾT TẮT
LSB least significant bits Các bit có trọng số thấp
PSNR peak signal-to-noise ratio Tỉ số tín hiệu cực đại trên nhiễu MSE mean squared error Sai số trung bình
GIF Graphics Interchange
Format
Định dạng ảnh đồ họa GIF
JPEG Joint Photographic Expert
Group
Ảnh nén JPEG
Hsiang-Kuang Pan, Yu-Chee Tseng
Thuật toán giấu tin trong ảnh nhị phân
Wu-Lee M.Y.WU,J.H.LEE Một thuật toán giấu tin trong
ảnh nhị phân
Hình 2.2 Ảnh màu sau khi giấu tin rất khó phát hiện sự thay đổi
Hình 2.3 Ảnh đen trắng sau khi giấu cùng một lượng thông tin như ảnh màu nhưng
chất lượng kém hơn (rất nhiều chấm đen lạ)
Hình 2.4: Thuật toán LSB
Hình 2.5: So sánh ảnh thuật toán LSB
Hình 2.6: So sánh hình thay đổi kênh màu xanh
Hình 2.7: Thuật toán LSB trong ảnh màu
Hình 3.1: Sơ đồ gửi tin
Hình 3.2: Sơ đồ người nhận tin
Hình 3.3: Sơ đồ giấu thông tin
Hình 3.4: Sơ đồ giải mã tin
Hình 4.1: Giao diện chính chương trình
Hình 4.2: Chức năng mã hóa
Hình 4.3: Chức năng giấu file dạng text
Hình 4.4: Chức năng giấu file hình ảnh
Hình 4.5: Giao diện mở file hình ảnh
Hình 4.6: Chức năng giấu file âm thanh
Hình 4.7: Màn hình mở file âm thanh
Hình 4.8: Chức năng giấu file dạng Video
Hình 4.9: Màn hình mở file Video
Hình 4.10: Giao diện chức năng giải mã
Hình 4.11: Giao diện giải mã thông tin dạng text
Trang 10Hình 4.12: Giao diện giải mã thông tin dạng hình ảnh
Hình 4.13: Giao diện giải mã thông tin dạng âm thanh
Hình 4.14: Giao diện giải mã thông tin dạng Video
Hình 4.15: Giao diện chức năng lưu tin đã giấu
Hình 4.16: Ảnh trước và sau khi giấu tin
Hình 4.17: Thuộc tính của ảnh trước và sau khi giấu
DANH MỤC CÁC BẢNG BIỂU
Bảng 2.1: Bảng so sánh ảnh màu và ảnh đen trắng
Bảng 2.2: Cấu trúc định dạng ảnh BMP
Bảng 4.1: Giấu tin dạng text
Bảng 4.2: Thống kê giấu tin dạng imge
Bảng 4.3: Thống kê giấu tin dạng audio
Bảng 4.4: Thống kê giấu tin dạng Video
DANH MỤC CÁC BIỂU ĐỒ
Biểu đồ 4.1: So sánh chỉ số PSNR sau khi giấu tin dạng Text giải thuật LSB và giải
thuật đã đề xuất
Biểu đồ 4.2: So sánh chỉ số PSNR sau khi giấu tin dạng Image giải thuật LSB và
giải thuật đã đề xuất
Biểu đồ 4.3: So sánh chỉ số PSNR sau khi giấu tin dạng Audio giải thuật LSB và
giải thuật đã đề xuất
Biểu đồ 4.4: So sánh chỉ số PSNR sau khi giấu tin dạng Video giải thuật LSB và
giải thuật đã đề xuất
Trang 11Chương 1.GIỚI THIỆU
1.1 Giới thiệu đề tài
Ngày nay, với sự ra đời và phát triển của mạng Internet Mọi người đều có thể kết nối vào Internet, tìm kiếm thông tin một cách dễ dàng thông qua nhà cung cấp dịch vụ mạng Sự phát triển nhanh chóng của khoa học kỹ thuật trên nhiều lĩnh vực đặc biệt là trong lĩnh vực đa phương tiện (multimedia) làm cho sự sản xuất, quản lý
và phân phối các sản phẩm này: hình ảnh, âm thanh… rất dễ dàng Cùng với sự phổ biến rộng rãi các mạng internet tốc độ cao, làm cho quá trình phân phối chúng trở nên rất nhanh chóng, dễ dàng, đem lại những thuận lợi to lớn thông qua hệ thống thương mại điện tử Với môi trường mở và tiện nghi như thế, các hệ thống mạng hiện đại trở thành phương tiện phân phối tài liệu một cách nhanh chóng và kinh tế Tuy nhiên, việc phân phối một cách phổ biến các tài nguyên trên mạng hiện nay luôn gặp phải vấn nạn sao chép và sử dụng không hợp pháp như: Xâm phạm bản quyền, truy cập trái phép, xuyên tạc, giả mạo thông tin…Đi đôi với sự phát triển của công nghệ máy tính thì tình trạng sử dụng bất hợp pháp các sản phẩm số (tệp tin tài liệu, chương trình, âm thanh và hình ảnh ) ngày càng tăng, do các tệp tin số có thể sao chép dễ dàng giữa các máy tính Dẫn đến tình trạng vi phạm bản quyền số đang xảy ra hàng ngày, hàng giờ trên khắp thế giới Nhằm bảo vệ các sản phẩm số không bị sử dụng trái phép, song song với việc kêu gọi ý thức tự giác thực thi luật bản quyền, các công ty công nghệ lớn trên thế giới đã và đang thực hiện các giải pháp kỹ thuật kiểm soát bản quyền số Một trong những vấn đề được đặt ra là làm sao bảo vệ quyền sở hữu đối với các sản phẩm đa phương tiện này
Đứng trước tình hình đó vấn đề về bảo mật thông tin hiện nay luôn nhận được
sự quan tâm đặc biệt trong nhiều lĩnh vực Thực ra từ trước khi có sự xuất hiện của máy tính, an toàn thông tin đã là đòi hỏi từ rất lâu, có thể cách đây hàng nghìn năm
đã phát triển dưới dạng các mật mã học Từ cách thức bảo mật đơn giản sử dụng chỉ bút và giấy đôi khi là có sự hỗ trợ của cơ khí và vật mang tin có thể là con người, hoặc một vật nào đó có ý nghĩa Ngày này có sự hỗ trợ của máy tính thông minh thì việc bảo mật cho thông tin đã có sự khác biệt hoàn toàn và sự phát triển theo hướng hoàn toàn mới
Hiện nay các thông tin thường được lưu giữ dưới dạng số, và với môi trường mạng như hiện nay thì việc các thông tin bị đánh cắp và sửa đổi có thể xảy ra bất cứ lúc nào Việc đặt ra, giải pháp nào bảo vệ thông tin được coi là hiệu quả trong giai đoạn hiện nay
An toàn thông tin và bảo mật dữ liệu thông thường được sử dụng bằng các phương pháp mã hóa, đây là phương pháp được sử dụng trong nhiều năm qua và như các hệ mật mã có khóa công khai với độ an toàn cao
Tuy nhiên trong giai đoạn hiện nay, sự phát triển của đa phương tiện như ảnh
số, audio, video… với các định dạng khác nhau và vô cùng phong phú, các đa phương tiện rất gần gũi với con người vì vậy ta sẽ dùng chính nó để làm vật mang tin Ngoài ra nếu kết hợp với mã hóa thì thông tin sẽ có thêm một lớp vỏ bọc an toàn
Trang 121.2 Nội dung đề tài
Phần nghiên cứu lý thuyết, ngoài những nghiên cứu chung về steganography
Đề tài này sẽ đi sâu vào nghiên cứu những kỹ thuật steganography dựa trên những bit có trọng số thấp (least significant bit) để giấu tin trên ảnh màu Đây sẽ là nền tảng để phát triển những kỹ thuật khác và ứng dụng vào thực tiễn
Với việc đề xuất thuật toán Wu-Lee áp dụng trên ảnh màu, đảm bảo được độ
an toàn cho thông tin và tránh được độ hao tổn đến ảnh gốc làm môi trường giấu tin, giúp thông tin được che giấu tốt hơn và khó bị phát hiện khi nhìn bằng mắt thường
Từ thuật toán đề xuất xây dựng ứng dụng hoàn chỉnh về việc giấu tin và giải
mã tin, để từ đó làm nền tảng cho việc phát triển các ứng dụng thực tế giúp ích cho các công việc cần thiết
1.3 Giới hạn đề tài
Trong khuôn khổ thời lượng làm luận văn, chúng em chỉ giới hạn trong phạm
vi giấu thông tin vào ảnh màu, cụ thể là ảnh BMP 24 bit
Chỉ tìm hiểu kỹ thuật giấu tin sử dụng các bit có trọng số thấp (LSB), so sánh
và đánh giá các thuật toán thông qua chỉ số PSNR
Hiện thực ứng dụng trên môi trường Window Form thông qua ngôn ngữ C# NET
1.4 Cấu trúc luận văn
Nội dung của luận văn được trình bày bao gồm 5 chương, trong đó 2 chương đầu giới thiệu chung về an toàn thông tin và giấu tin trong ảnh.các chương tiếp sẽ đi sâu vào nghiên cứu các kỹ thuật giấu tin trong ảnh, kỹ thuật giấu tin sử dụng các Bit
có trọng số thấp (least significant bit), và xây dựng hệ thống ứng dụng cụ thể
Chương 1 Giới thiệu về đề tài, các phần cần thực hiện và giới hạn công việc Chương 2 Cơ sở lý thuyết: trình bày về vấn đề an toàn thông tin, và ẩn thông
tin trong ảnh Trình bày các kỹ thuật giấu tin, kỹ thuật giấu tin least significant bit, trong đó giới thiệu các thuật toán đặc trưng và phân tích cụ thể
Chương 3 Phân tích và thiết kế hệ thống: Đề xuất giải thuật cụ thể để phân
tích đánh giá, và xây dựng ứng dụng
Chương 4 Hiện thực hệ thống
Chương 5 Kết luận: là chương cuối cùng nhằm đánh giá kết quả đạt được
cùng với hướng mở rộng trong tương lai
Trang 13Chương 2.CƠ SỞ LÝ THUYẾT
2.1 Tổng quan về giấu tin trong ảnh
2.1.1 Giới thiệu chung về giấu tin trong ảnh
Hiện nay, giấu thông tin trong ảnh là một bộ phận chiếm tỷ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong đa phương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn và hơn nữa giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong các hầu hết các ứng dụng bảo
vệ an toàn thông tin như: nhận thực thông tin, xác định xuyên tạc thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật Chính vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của các cá nhân, tổ chức, trường đại học, và viện nghiên cứu trên thế giới
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi và chẳng ai biết được đằng sau ảnh đó mang những thông tin có ý nghĩa
Và ngày nay, khi ảnh số đã được sử dụng rất phổ biến, thì giấu thông tin trong ảnh
đã đem lại nhiều những ứng dụng quan trọng trên các lĩnh vực trong đời sống xã hội Ví dụ như đối với các nước phát triển, chữ kí tay đã được số hoá và lưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính Nó được dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng
Hay trong một số những ứng dụng về nhận diện như thẻ chứng minh, thẻ căn cước, hộ chiếu Người ta có thể giấu thông tin trên các ảnh thẻ để xác định thông tin thực Ví dụ như hình vẽ bên dưới là một thẻ chứng minh đã được giấu tin trong ảnh Thông tin giấu là số thẻ ‘123456789’ trùng với số đã được in rõ ở trên thẻ ngay phía dưới ảnh
Hình 2.1 Một ảnh thẻ chứng minh đã được giấu tin sử dụng trong công
tác nhận dạng
Phần mềm WinWord của MicroSoft cũng cho phép người dùng lưu trữ chữ kí trong ảnh nhị phân rồi gắn vào vị trí nào đó trong file văn bản để đảm bảo tính an toàn của thông tin Tài liệu sau đó được truyền trực tiếp qua máy fax hoặc lưu truyền trên mạng Theo đó, việc nhận thực chữ kí, xác thực thông tin đã trở thành một vấn đề cực kì quan trọng khi mà việc ăn cắp thông tin hay xuyên tạc thông tin bởi các tin tặc đang trở thành một vấn nạn đối với bất kì quốc gia nào, tổ chức nào Thêm vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật như những thông tin về an ninh, thông tin về bảo hiểm hay các thông tin về tài chính Các thông tin này được số hoá và lưu trữ trong hệ thống máy tính hay trên
Trang 14mạng Chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng Việc nhận thức cũng như phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng, cấp thiết
Một đặc điểm của giấu thông tin trong ảnh nữa đó là thông tin được giấu một cách vô hình Nó như là cách truyền thông tin mật cho nhau mà người khác không thể biết được, bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay đổi đặc biệt đối với ảnh mầu hay ảnh đa cấp xám ần đây báo chí đã đưa tin
vụ việc ngày 11-9 gây chấn động nước Mĩ và toàn thế giới: chính tên trùm khủng bố
quốc tế Osama BinLaDen đã dùng cách thức giấu thông tin trong ảnh để liên lạc với
đồng bọn, và hắn đã qua mặt được cục tình báo trung ương Mỹ C và các cơ quan
an ninh quốc tế Chắc chắn sau vụ việc này, thì việc nghiên cứu các vấn đề liên quan đến giấu thông tin trong ảnh sẽ rất được quan tâm
Từ năm học 1995-1996, Bộ giáo dục và Đào tạo đã bắt đầu ứng dụng công nghệ thông tin vào công tác bảo mật đề thi tốt nghiệp trung học phổ thông thay cho việc niêm phong, đóng dấu đề thi để chuyển qua theo đường bưu điện
Trong mục này đề cập tới một kỹ thuật đơn giản đáng tin cậy để giấu những thông tin quan trọng nào một ảnh màu bằng cách sử dụng khoá bí mật và một
ma trận trọng số Phương pháp này được chứng minh là có độ an toàn cao, đảm bảo chất lượng ảnh gốc và có tỉ lệ giữa kích thước thông tin giấu được với kích thước ảnh môi trường tương đối so với các phương pháp khác và cho phép giấu được tới bit dữ liệu vào trong mỗi khối ảnh kích thước m*n mà chỉ cần thay đổi nhiều nhất 2 bit trong khối ảnh đó
2.1.2 Một số ứng dụng giấu tin trong ảnh
Một số ứng dụng được triển khai với việc bảo mật thông tin:
Bảo vệ bản quyền tác giả (copyright protection): Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ vân số (digital watermarking) - một dạng của phương pháp giấu tin Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video và cần được lưu thông trên mạng Để bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật
để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm
Nhận thực thông tin hay phát hiện xuyên tạc thông tin (authentication and tamper detection): Một tập các thông tin sẽ được giấu trong phương tiện chứa sau đó được sử dụng để nhận biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không Các thuỷ vân nên được ẩn để tránh được sự tò mò của kẻ thù, hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét Trong các ứng dụng thực tế, người ta mong muốn tìm được
Trang 15vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ bị nén mất dữ liệu) Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững
Giấu vân tay hay dán nhãn (fingerprinting and labeling): Thuỷ vân trong những ứng dụng này đựơc sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân tránh sự xoá giấu vết trong khi phân phối
Điều khiển truy cập (copy control): Các thuỷ vân trong những trường hợp này được sử dụng để điều khiển truy cập đối với các thông tin Các thiết
bị phát hiện ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc ghi Ví dụ như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật Các ứng dụng loại này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc
Chú giải: Các thông tin giấu được trong những trường hợp này càng nhiều càng tốt, việc giải mã để nhận được thông tin cũng không cần phương tiện chứa gốc ban đầu Các yêu cầu mạnh về chống tấn công của kẻ thù không cần thiết lắm thay vào đó là thông tin giấu phải được giấu kín (có thể sử dụng trong truyền thông tin mật)
2.1.3 Một số đặc điểm của việc giấu tin trong ảnh
Hiện nay giấu thông tin trong ảnh là kỹ thuật còn tương đối mới và đang
có xu hướng phát triển rất nhanh
Một kỹ thuật giấu tin trong ảnh được đánh giá dựa trên một số đặc điểm sau:
- Tính vô hình của thông tin được giấu trong ảnh
- Số lượng thông tin được giấu
- Tính an toàn và bảo mật của thông tin
- Chất lượng của ảnh sau khi giấu thông tin bên trong
Tính vô hình của thông tin
Khái niệm này dựa trên đặc điểm của hệ thống thị giác của con người Thông tin nhúng là không tri giác được nếu một người với thị giác là bình thường
không phân biệt được ảnh môi trường và ảnh kết quả Trong khi image hiding yêu cầu tính vô hình của thông tin giấu ở mức độ cao thì watermarking lại chỉ yêu cầu ở
một cấp độ nhất định Chẳng hạn như người ta áp dụng watermarking cho việc gắn một biểu tượng mờ vào một chương trình truyền hình để bảo vệ bản quyền
Tính bảo mật
Thuật toán nhúng tin được coi là có tính bảo mật nếu thông tin được nhúng không bị tìm ra khi bị tấn công một cách có chủ đích trên cơ sở những hiểu biết đầy đủ về thuật toán nhúng tin và có bộ giải mã (trừ khoá bí mật), hơn nữa còn
có được ảnh có mang thông tin (ảnh kết quả) Đối với ảnh image hiding đây là một
yêu cầu rất quan trọng Chẳng hạn đối với thuật toán dò tin trong ảnh đen trắng kích
Trang 16thước m*n, độ phức tạp vẫn còn lên tới 2m*n phép tính (O(2m*n)) khi đã biết ma trận trọng số dùng trong quá trình giấu tin
Tỷ lệ giấu tin
Lượng thông tin giấu so với kích thước ảnh môi trường cũng là một vấn đề cần quan tâm trong một thuật toán giấu tin Rõ ràng là có thể chỉ giấu một bit thông tin vào mỗi ảnh mà không cần lo lắng về độ nhiễu của ảnh nhưng như vậy sẽ rất kém hiệu quả khi mà thông tin cần giấu có kích thước được tính bằng KB Các thuật toán đều cố gắng đạt được mục đích làm thế nào giấu được nhiều thông tin nhất mà không gây ra nhiễu đáng kể
Yêu cầu cuối cùng là thuật toán phải cho phép lấy lại được thông tin đã giấu trong ảnh mà không có ảnh môi trường Điều này là một thuận lợi khi ảnh môi trường là duy nhất nhưng lại làm giới hạn khả năng ứng dụng của kỹ thuật giấu tin
Để thực hiện việc giấu tin trong ảnh, trước hết ta phải xử lý được ảnh tức là phải số hoá ảnh Quá trình số hoá các dạng ảnh khác nhau thì không như nhau Có nhiều loại ảnh đã được chuẩn hoá như: JPE , PCX, BMP, Trong đồ án này chỉ
sử dụng ảnh *.BMP
2.1.4 Sự khác nhau giấu tin trong ảnh màu và ảnh đen trắng
Khởi nguồn của giấu thông tin trong ảnh là thông tin được giấu trong các
ảnh màu hoặc ảnh xám, trong đó mỗi pixel ảnh mang nhiều giá trị, được biểu diễn bằng nhiều bit Với ảnh đó thì việc thay đổi một giá trị nhỏ ở một pixel thì chất
lượng ảnh gần như không thay đổi, và khả năng bị phát hiện rất thấp dưới con mắt người bình thường Do đó hệ thống thị giác của con người cũng đóng một vai trò quan trọng trong việc bảo đảm tính không nhìn thấy thông tin được giấu trên ảnh Với những ảnh mà mỗi điểm ảnh chỉ mang một giới hạn nhỏ các giá trị thì việc giấu thông tin trong ảnh đảm bảo tính vô hình của thông tin che giấu là một công việc khó khăn hơn nhiều Đặc biệt với ảnh đen trắng, mỗi điểm ảnh chỉ mang một trong hai giá trị trắng hoặc đen Vậy thì khi thay đổi giá trị một pixel từ đen thành trắng hoặc ngược lại thì rất dễ bị phát hiện Một số thuật toán khác thì giấu chất lượng ảnh tốt hơn nhưng lượng thông tin giấu được bít và quá đơn giản không đảm bảo được độ an toàn thông tin Bảng sau sẽ liệt kê những khác nhau cơ bản giữa giấu thông tin trong ảnh đen trắng và ảnh màu
Sự khác nhau giữa giấu thông tin trong ảnh đen trắng và ảnh màu:
Trang 17Giấu thông tin trong ảnh đen trắng Giấu thông tin trong ảnh màu hoặc
ảnh xám
Thông tin giấu ít hơn đối ảnh Thông tin giấu nhiều hơn
Có cùng kích cỡ với ảnh
Khả năng bị phát hiện phương tiện có
giấu thông tin cao hơn ảnh màu
Khả năng bị phát hiện thấp
Độ an toàn thông tin thấp do dễ bị phát
hiện có thông tin chứa thông tin bên
trong
Độ an toàn cao
Các thuật toán giấu ít, phức tạp Nhiều thuật toán và có nhiều hướng
mở rộng phát triển Như áp dụng giải thuật di truyền
Bảng 2.1: Bảng so sánh ảnh màu và ảnh đen trắng
Hình 2.2 Ảnh màu sau khi giấu tin rất khó phát hiện sự thay đổi
Hình 2.3 Ảnh đen trắng sau khi giấu cùng một lượng thông tin như ảnh màu nhưng
chất lượng kém hơn (rất nhiều chấm đen lạ)
Trang 182.2 Các phương pháp bảo vệ thông tin
2.2.1 Phương pháp bảo vệ thông thường
Đây là phương pháp hành chính để bảo vệ thông tin, thông tin được đăng ký
và được bảo vệ bởi các cơ quan hành chính nhưng thông tin chỉ được bảo vệ hạn hẹp trong một số lĩnh vực nhất định Chẳng hạn, thông tin về hồ sơ của cán bộ tình báo sẽ được đảm bảo chỉ cấp trên quản lý anh ta mới được biết, và đảm bảo thông
tin được bí mật tuyệt đối và không được truyền đến bất kỳ ai
2.2.2 Phương pháp bảo vệ vật lý
Đây là phương pháp bảo vệ thông tin dùng các biện pháp kỹ thuật vật lý nhằm đảm bảo thông tin bí mật, chống xem trộm và không bị sửa đổi Chẳng hạn dùng thư có niêm phong khi niêm phong bị gỡ ra thì nó đã bị xem trộm Hoặc dùng khóa bảo vệ tủ tài liệu Hoặc dùng hộp mật mã bên trong có thông tin viết trên giấy mềm bọc quanh chai dấm Nếu một người không biết mật mã mà cố tình mở ra, chai dấm sẽ vỡ và phá hủy toàn bộ thông tin bên trong…
2.2.3 Phương pháp bảo vệ dùng phần mềm
Đây là phương pháp được quan tâm nhất bởi môi trường truyền tin hiện nay
là môi trường mạng, đây là môi trường dễ xâm nhập nhất, đồng thời dữ liệu dễ xảy
ra sự cố nhất Biện pháp bảo vệ dùng phần mềm vừa đáp ứng được các nhu cầu của
an toàn thông tin, vừa tỏ ra rất có hiệu quả đặc biệt trong môi trường mạng
Biện pháp bảo vệ thông tin sử dụng phần mềm thực ra là dùng các thuật toán
mã hóa, hay dùng một thông tin khác làm vỏ bảo vệ hoặc kết hợp cả hai Trong đó phương pháp thứ hai dùng một thông tin khác làm vỏ bảo vệ chính là sử dụng dữ liệu đa phương tiện như hình ảnh, audio, video,… để làm lớp vỏ bọc cho thông tin giấu trong đó, đồng thời kết hợp với những phương pháp mã hóa để thông tin được bảo vệ an toàn hơn Đây cũng là vấn đề được chú trọng trình bày trong báo cáo này
2.3 Đánh giá độ an toàn bảo mật thông tin
2.3.1 Đánh giá
Bảo vệ an toàn thông tin dữ liệu là một chủ đề khó đánh giá được như thế nào là tối ưu, nó căn cứ vào rất nhiều yếu tố như kinh tế, độ phức tạp của hệ thống, mục đích sử dụng thông tin,… Một hệ thống được chấp nhận là đảm bảo an toàn nếu như nhu cầu an toàn thông tin dữ liệu bên nhận và bên gửi được thỏa mãn
Phải dự kiến được trước các tình huống xảy ra, để có thể có những biện pháp khắc phục nhanh chóng kịp thời, hạn chế tối đa những tác hại khi sự cố xảy ra
Các phương pháp bảo vệ phụ thuộc vào chính chủ sở hữu thông tin đó và hệ thống bảo vệ đó cũng chỉ có tính tương đối
Không có một phương pháp bảo vệ nào hiệu quả tuyệt đối với mọi trường hợp, tùy theo mục đích sử dụng, mức độ quan trọng của thông tin mà ta có những biện pháp bảo vệ tương ứng, phù hợp
Trang 192.3.2 An toàn phần mềm
Phần mềm là yếu tố đảm bảo an toàn dữ liệu đầu tiên, phần mềm quy định phần cứng hỗ trợ cho nó để có khả năng bảo vệ hiệu quả nhất thông tin dữ liệu người dùng
2.3.3 Sự phát triển công nghệ và các ảnh hưởng
Công nghệ thông tin đang ngày càng phát triển chóng, đồng thời cũng gia tăng các nguy cơ xâm nhập thông tin dữ liệu vào các hệ thống thông tin Với kẻ tấn công, tùy theo mục đích mà có những cách thức xâm nhập ngày càng tinh vi hơn, đòi hỏi yêu cầu bảo vệ cần được cải tiến và phải hiệu quả hơn
Các công nghệ bảo mật mới cần được nghiên cứu và ứng dụng vào trong thực tế để kịp đáp ứng nhu cầu bảo vệ an toàn thông tin
2.4 Các định dạng ảnh thường dùng
2.4.1 Định dạng ảnh JPG
Phương pháp nén ảnh JPEG (tiếng Anh, viết tắt cho Joint Photographic Experts Group) là một trong những phương pháp nén ảnh hiệu quả, có tỷ lệ nén ảnh tới vài chục lần Tuy nhiên ảnh sau khi giải nén sẽ khác với ảnh ban đầu Chất lượng ảnh bị suy giảm sau khi giải nén Sự suy giảm này tăng dần theo hệ số nén Tuy nhiên sự mất mát thông tin này là có thể chấp nhận được và việc loại bỏ những thông tin không cần thiết được dựa trên những nghiên cứu về hệ nhãn thị của mắt người
Phần mở rộng của các file JPE thường có dạng jpeg, jfif, jpg, JPG, hay JPE; dạng jpg là dạng được dùng phổ biến nhất
Mức độ nhạy cảm của mắt người
Trong không gian màu YUV, nhãn thị của con người rất nhạy cảm với thành phần Y và kém nhạy cảm với hai loại U và V Phương pháp nén JPE đã nắm bắt phát hiện này để tách những thông tin thừa của ảnh Hệ thống nén thành phần Y của ảnh với mức độ suy giảm ít hơn so với U, V, bởi người ta ít nhận thấy sự thay đổi của U và V so với Y
Mã hóa
Công đoạn chính là chia nhỏ bức ảnh thành nhiều vùng nhỏ (thông thường là những vùng 8x8 pixel) rồi sử dụng biến đổi cosin rời rạc để biến đổi những vùng thể hiện này thành dạng ma trận có 64 hệ số thể hiện "thực trạng" các pixel Điều quan trọng là ở đây hệ số đầu tiên có khả năng thể hiện "thực trạng" cao nhất, khả năng đó giảm rất nhanh với các hệ số khác Nói cách khác thì lượng thông tin của
64 pixels tập trung chủ yếu ở một số hệ số ma trận theo biến đổi trên Trong giai đoạn này có sự mất mát thông tin, bởi không có biến đổi ngược chính xác Nhưng lượng thông tin bị mất này chưa đáng kể so với giai đoạn tiếp theo Ma trận nhận được sau biến đổi cosin rời rạc được lược bớt sự khác nhau giữa các hệ số Đây chính là lúc mất nhiều thông tin vì người ta sẽ vứt bỏ những thay đổi nhỏ của các hệ
số Như thế khi bung ảnh đã nén ta sẽ có được những tham số khác của các pixel Các biến đổi trên áp dụng cho thành phần U và V của ảnh với mức độ cao hơn so với Y (mất nhiều thông tin của U và V hơn) Sau đó thì áp dụng phương pháp mã
Trang 20hóa của Hoffman: Phân tích dãy số, các phần tử lặp lại nhiều được mã hóa bằng ký hiệu ngắn (marker) Khi bung ảnh người ta chỉ việc làm lại các bước trên theo quá trình ngược lại cùng với các biến đổi ngược
2.4.2 Định dạng ảnh PNG
PNG (từ viết tắt trong tiếng nh của Portable Network Graphics: là một
dạng hình ảnh sử dụng phương pháp nén dữ liệu mới - không làm mất đi dữ liệu gốc PN được tạo ra nhằm cải thiện và thay thế định dạng ảnh F với một định dạng hình ảnh không đòi hỏi phải có giấy phép sáng chế khi sử dụng PN được hỗ trợ bởi thư viện tham chiếu libpng, một thư viện nền tảng độc lập bao gồm các hàm của C để quản lý các hình ảnh PN
Những tập tin PN thường có phần mở rộng là PN và đã được gán kiểu chuẩn M ME là image/png (được công nhận vào ngày 14 tháng 10 năm 1996)
1999, sau khi hãng Unisys huỷ bỏ giấy phép của họ đối với các lập trình viên phần mềm miễn phí, và phi thương mại
Phiên bản 1.0 của đặc tả PN được phát hành vào ngày 1 tháng 7 năm
1996, và sau đó xuất hiện vơi tư cách RFC 2083 Nó được tổ chức W3C khuyến nghị vào ngày 1 tháng 10 năm 1996
Phiên bản 1.1, với một số thay đổi nhỏ và thêm vào 3 thành phần mới, được phát hành vào ngày 31 tháng 12 năm 1998
Phiên bản 1.2, thêm vào một thành phần mở rộng, được phát hành vào ngày 11 tháng 8 năm 1999
PN giờ đây là một chuẩn quốc tế ( SO/ EC 15948:2003), và cũng được công bố như một khuyến nghị của W3C vào ngày 10 tháng 11 năm 2003 Phiên bản hiện tại của PN chỉ khác chút ít so với phiên bản 1.2 và không có thêm thành phần mới nào
Thông tin kỹ thuật
Phần đầu của tập tin
Một tập tin PN bao gồm 8-byte kí hiệu (89 50 4E 47 0D 0 1 0 ) được viết trong hệ thống có cơ số 16, chứa các chữ "PN " và 2 dấu xuống dòng [1], ở giữa là sắp xếp theo số lượng của các thành phần, mỗi thành phần đều chứa thông tin về hình ảnh Cấu trúc dựa trên các thành phần được thiết kế cho phép định dạng
PN có thể tương thích với các phiên bản cũ khi sử dụng.Các "thành phần" trong
Trang 21tập tin PN là cấu trúc như một chuỗi các thành phần, mỗi thành phần chứa kích thước, kiểu, dữ liệu, và mã sửa lỗi CRC ngay trong nó.Chuỗi được gán tên bằng 4 chữ cái phân biệt chữ hoa chữ thường Sự phân biệt này giúp bộ giải mã phát hiện bản chất của chuỗi khi nó không nhận dạng được
Với chữ cái đầu, viết hoa thể hiện chuỗi này là thiết yếu, nếu không thì ít cần thiết hơn ancillary Chuỗi thiết yếu chứa thông tin cần thiết để đọc được tệp và nếu
bộ giải mã không nhận dạng được chuỗi thiết yếu, việc đọc tệp phải được hủy
2.4.3 Định dạng ảnh GIF
GIF (viết tắt của Graphics Interchange Format; trong tiếng nh nghĩa là
"Định dạng Trao đổi Hình ảnh") là một định dạng tập tin hình ảnh bitmap cho các hình ảnh dùng ít hơn 256 màu sắc khác nhau và các hoạt hình dùng ít hơn 256 màu cho mỗi khung hình F là định dạng nén dữ liệu đặc biệt hữu ích cho việc truyền hình ảnh qua đường truyền lưu lượng nhỏ Định dạng này được CompuServe cho ra đời vào năm 1987 và nhanh chóng được dùng rộng rãi trên World Wide Web cho đến nay.Tập tin GIF dùng nén dữ liệu bảo toàn trong đó kích thước tập tin có thể được giảm mà không làm giảm chất lượng hình ảnh, cho những hình ảnh có ít hơn
256 màu Số lượng tối đa 256 màu làm cho định dạng này không phù hợp cho các hình chụp (thường có nhiều màu sắc), tuy nhiên các kiểu nén dữ liệu bảo toàn cho hình chụp nhiều màu cũng có kích thước quá lớn đối với truyền dữ liệu trên amngj hiện nay Định dạng JPEG là nén dữ liệu thất thoát có thể được dùng cho các ảnh chụp, nhưng lại làm giảm chất lượng cho các bức vẽ ít màu, tạo nên những chỗ nhòe thay cho các đường sắc nét, đồng thời độ nén cũng thấp cho các hình vẽ ít màu Như vậy, F thường được dùng cho sơ đồ, hình vẽ nút bấm và các hình ít màu, còn JPE được dùng cho ảnh chụp
Định dạng F đã được đăng ký sở hữu trí tuệ bởi Unisys, và những ai muốn viết chương trình để tạo ra hoặc hiển thị tập tin GIF phải trả tiền bản quyền Tiêu chuẩn định dạng PN đã ra đời để thay thế GIF, giảm các hạn chế luật pháp và hạn chế công nghệ Nay giấy phép sở hữu trí tuệ của Unisys đã hết hạn, nhưng PN vẫn được ưa chuộng do có nhiều tính năng kỹ thuật vượt trội, và đã trở thành định dạng phổ biến thứ 3 trên mạng
Sử dụng
Kích thước tập tin hình ảnh là một vấn đề quan trọng cho tốc độ truyền tin trên mạng, ngay cả với mạng băng thông rộng GIF là một giải pháp tốt cho hình ảnh trên mạng, cho các hoạt hình nhỏ và ngắn Đa phần các biểu trưng và các hình ảnh nhỏ trong thiết kế trang mạng ở định dạng F hay PN vì các định dạng này hoạt động tốt cho hình ảnh chứa các mảng lớn có cùng màu sắc hoặc có chi tiết lặp lại JPEG không thể nén các mảng màu lớn với đường nét chuyển màu sắc nét
JPE được dùng cho ảnh chụp có chứa tới 16 triệu màu sắc Những hình ảnh không được nén như Windows bitmap được dùng trong trường hợp tốc độ xử lý ảnh quan trọng hơn là kích thước tập tin, vì các ảnh không nén được xử lý nhanh hơn
Màu
Trang 22Định dạng GIF dựa vào các bảng màu: một bảng chứa tối đa 256 màu khác nhau cho biết các màu được dùng trong hình Một trong số các màu trong bảng màu
có thể được đặt là trong suốt
Định dạng thay thế
Định dạng PN được thiết kế để thay GIF, cho hình ảnh tĩnh PN nén tốt hơn và có nhiều tính năng kỹ thuật hay hơn F Tất cả tính năng của GIF, trừ nén hoạt hình, đều được hỗ trợ bởi PNG Các trình duyệt mạng hiện đại đều hỗ trợ PNG.MNG, một định dạng gần với PN để hỗ trợ hoạt hình đã đạt phiên bản 1.0 vào năm 2001 nhưng hiện chưa có mấy trình duyệt hỗ trợ định dạng này Năm
2004, định dạng PN được gợi ý để tăng thêm tính năng hỗ trợ hoạt hình, đồng thời vẫn tương thích với các phần mềm chỉ hiểu định dạng PNG
2.4.4 Định dạng ảnh BMP
Ảnh BMP (Bitmap) được phát triển bởi Microsoft Corporation, được lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển thị dữ liệu không phụ thuộc vào khung chỉ định màu trên bất kì phần cứng nào Tên file mở rộng mặc định của một
file ảnh Bitmap là BMP Ảnh BMP được sử dụng trên Microsoft Windows và các
ứng dụng chạy trên Windows từ version 3.0 trở lên
Mỗi file ảnh Bitmap gồm 3 phần:
11-14 Byte bắt đầu vùng dữ liệu Offset của byte bắt đầu vùng
39-42 Độ phân giải ngang Tính bằng pixel / metter
Trang 23- BitmapData: Phần này nằm ngay sau phần palette màu của ảnh BMP
Đây là phần chứa giá trị màu của điểm ảnh trong BMP Các dòng ảnh được lưu từ dưới lên trên, các điểm ảnh được lưu trữ từ dưới lên trên từ trái sang phải Giá trị của mỗi điểm ảnh là một chỉ số trỏ tới phần tử màu tương ứng của Palette màu
Thành phần BitCount của cấu trúc BitmapHeader cho biết số bit dành cho
mỗi điểm ảnh và số lượng màu lớn nhất của ảnh BitCount có thể nhận các giá trị sau:
- Giá trị 1: Bimap là ảnh đen trắng, mỗi bit biểu diễn một điểm ảnh Nếu bit mang giá trị 0 thì điểm ảnh là điểm đen, bit mang giá trị 1 điểm ảnh là điểm ảnh trắng
- Giá trị 4: Bitmap là ảnh 16 màu, mỗi điểm ảnh được biểu diễn bởi 4 bit
- Giá trị 8: là ảnh Bitmap 256 màu, mỗi điểm ảnh dược biểu diễn bởi 1 byte
- Giá trị 16: là ảnh Bitmap high color, mỗi dãy 2 byte liên tiếp trong
bitmap biểu diễn cường độ tương đối của màu đỏ, xanh lá cây, xanh lơ của một điểm ảnh
- Giá trị 24: Bitmap là ảnh true color (24 bit màu), mỗi dãy 3 byte liên tiếp
trong bitmap biểu diễn cường độ tương đối của màu đỏ, xanh lá cây, xanh
lơ (R B) của một điểm ảnh
Thành phần ColorUsed của cấu trúc BitmapHeader xác định số lượng màu của palette màu thực sự được sử dụng để hiển thị bitmap Nếu thành phần này được đặt là 0, bitmap sử dụng số màu lớn nhất tương ứng với giá trị của BitCount
PSNR được sử dụng để đo chất lượng tín hiệu khôi phục của các thuật toán nén có mất mát dữ liêu (lossy compression) (ví dụ: dùng trong nén ảnh) Tín hiệu trong trường hợp này là dữ liệu gốc, và nhiễu là các lỗi xuất hiện khi nén Khi so sánh các thuật toán nén thường dựa vào sự cảm nhận gần chính xác của con người đối với dữ liệu được khôi phục, chính vì thế trong một số trường hợp dữ liệu được khôi phục của thuật toán này dường như có chất lượng tốt hơn những cái khác, mặc
dù nó có giá trị PSNR thấp hơn (thông thường PSNR càng cao thì chất lượng dữ
Trang 24liệu được khôi phục càng tốt) Vì vậy khi so sánh kết quả của 2 thuật toán cần phải dựa trên codecs giống nhau và nội dung của dữ liệu cũng phải giống nhau
Cách đơn giản nhất là định nghĩa thông qua sai số trung bình - MSE(mean squared error) được dùng cho ảnh 2 chiều có kích thước x*y trong đó và B là ảnh
gốc và ảnh được khôi phục tương ứng
Công thức tính như sau:
(
) ∑ ∑ | |
ra nghi ngờ
Nếu ứng dụng kỹ thuật này vào sử dụng trong giấu tin trong ảnh thì chỉ có thể giấu tin với số lượng có hạn nhất định tùy thuộc vào kích thước của file chứa gốc
2.6.2 Kỹ thuật Substitution
Kỹ thuật này sử dụng việc thay thế các thông tin ít quan trọng trong việc quyết định nội dung của file gốc, và dữ liệu được thay vào những bit đó ít gây sự thay đổi lớn đến chất lượng file chứa gốc
Ưu điểm của kỹ thuật này là file chứa gốc sau khi giấu tin thì kích thước không thay đổi
Nhược điểm của phương pháp này là làm giảm chất lượng của file chứa gốc ban đầu, và số lượng tin giấu bị hạn chế do phụ thuộc vào số bit ít quan trọng của file chứa gốc
Và trong khuôn khổ luận văn này, chúng em sẽ áp dụng kỹ thuật này trong việc nghiên cứu
Trang 252.6.3 Kỹ thuật Generation
Không giống như hai kỹ thuật trên, kỹ thuật này không phụ thuộc vào file chứa gốc tồn tại, kỹ thuật này sẽ tạo ra một file chứa với mục đích duy nhất là để giấu tin Hai phương pháp trên người ta có thể so sánh đối chiếu hai file để đưa ra kết luận, nhưng với kỹ thuật này thì không phải lo lắng điều đó bởi vì chỉ có một file chứa gốc duy nhất và cụng là file chứa tin
Tuy nhiên để áp dụng kỹ thuật này rất phức tạp, phụ thuộc vào rất nhiều yếu
tố để có thể tạo ra file chứa gốc như yêu cầu
2.7 Kỹ thuật giấu tin trong ảnh sử dụng LSB
2.7.2 Các khái niệm cơ bản
Ảnh nhị phân và ma trận nhị phân
Trước hết ta quan tâm đến các đối tượng chính là các ảnh nhị phân hay ảnh một bit màu Đó là những bức ảnh mà mỗi điểm ảnh chỉ là đen hoặc trắng, được qui định bởi 1 bit Nếu bit mang giá trị 0 thì điểm ảnh là điểm đen, nếu là 1 thì điểm ảnh
là điểm trắng Do đó, để biểu diễn một điểm ảnh đen trắng ta có thể dùng một ma trận nhị phân, là ma trận mà mỗi phần tử chỉ nhận một trong hai gía trị là 0 hoặc 1
Khoá bí mật
Khoá bí mật K có thể:
- Có độ dài không thay đổi
- Có độ dài biến thiên
Một ma trận w kích thước m*n được gọi là ma trận cấp r nếu mỗi phần tử của tập hợp { 1,2, ,2r-1} xuất hiện trong w ít nhất một lần và các phần tử của w chỉ nhận giá trị trong tập hợp {1,2, ,2r-1} với n, m, r là các số tự nhiên thoả mãn 2r-1 m*n
Từ những định nghĩa ta nhận thấy với mỗi m,n,r thoả mãn 2r-1 m*n sẽ có biểu thức: khả năng chọn w
Trang 26 Ví dụ:
- Với m = n = 2, r = 2 ta sẽ có 128 khả năng chọn w
- Với m = n = 4, r = 4 ta sẽ có 2.326.692.130.963.200 khả năng lựa chọn w Con số này đủ lớn để làm giảm nguy cơ thông tin bị giải mã bởi những kẻ phá hoại
Phép đảo bit
Phép đảo bit là một phép biến đổi trên các bit nhị phân Đảo bit b tương đương với phép biến đổi thay b bởi (1 – b)mod2, tức là nếu ban đầu b nhận giá trị 0 thì sau khi đảo thì nó nhận giá trị 1 và ngược lại, nếu ban đầu b có giá trị 1 thì sau khi đảo nó sẽ mang giá trị 0
Định nghĩa 1: Phép hoặc loại trừ :
: là phép toán trên hai ma trận nhị phân xác định như sau:
AB =C C[i,j]=A[i,j] B[i,j]
Trang 27Trong đó: C[i,j] = [i,j] * B[i,j]
Ví dụ 2:
Giả sử có Fi , K, W như sau:
,
,
Thực hiện phép toán ta được:
Tiếp theo thực hiện phép với W ta được:
Và cuối cùng tính tổng
2.7.3 Thuật toán LSB
Phương pháp này sẽ thay thế tuần tự từng bit của thông điệp cần ẩn bằng một bit ít có ý nghĩa nhất của 1 byte ảnh gốc.Ví dụ giấu bit 0 vào vị trí thứ 0 của byte gốc là vị trí có trọng số thấp nhất
giấu
0
Hình 2.4: Thuật toán LSB
Các bước thực hiện như sau:
Giấu tin (Encode):
o Biến đổi thông điệp cần giấu thành dãy các bit
o Đọc lần lượt từng byte từ ảnh đầu vào
o Với 1 byte vừa đọc thay thế bit có trọng số thấp nhất bằng 1 bit của thông điệp
Giải mã tin (Decode):
o Đọc từng byte từ ảnh có chứa tin gốc
o Với mỗi byte này trích ra 1 bit có vị trí thấp nhất
o Chuyển dãy bit vừa nhận được thành thông điệp ban đầu Vậy có thể sử dụng phương pháp này cho giấu một byte file ẩn vào 8 byte chứa gốc Từ trên có thể thấy được lợi thế khi sử dụng cách này, đó chính là lúc nào cũng có nhiều nhất 50% số bit trùng nhau giữa tin cần giấu vào file chứa gốc do đó file chứa gốc ít bị ảnh hưởng lớn khi có tin giấu thêm vào trong file chứa gốc đó.Ví
dụ 2 tấm hình đã được giấu tin sử dụng phương pháp LSB:
Trang 28Thuật toán được mô tả như sau:
Với khối ảnh như Fi, ma trận trọng số W, khoá K, ta cần giấu r bit thông tin
b1,b2,…br vào Fi bằng cách đảo nhiều lần 2 bit của Fi Mục đích của chúng ta là biến đổi Fi thành Fi’ sao cho nó thoả mãn yêu cầu sau:
- Trường hợp 2: Nếu W[i, k]= 2r- w và T[j, k]=1 Khi đó đảo bit Fi[j,k]
sẽ làm T[j, k] =0 do đó Sum sẽ giảm đi 2r-w, tức tăng lên w theo mod 2r Qui ước rằng với mọi w’ w(mod 2r) trong đó w=1,2,3, .,2r-1, ta có Sw’ = Sw
Bước 4: Kí hiệu d=(b1,b2,…,br ) - SUM(FiK) W(mod 2r).Ta cần thực hiện việc đảo bit trên Fi để được Fi’ sao cho tổng Sum tính được ở bước 2 khi thay Fi bởi Fi’ sẽ tăng lên d
- Nếu d = 0, không cần thay đổi Fi
- Nếu d ≠0:
o Chọn h bất kỳ thuộc tập {0, 1, 2, , 2r-1} sao cho Sh.dvàS(-(h-1).d)
o Chọn (j,k) bất kì thuộc Sh.d và đảo bit Fi [j,k] (nếu là 0 thì đổi thành 1 và ngược lai đổi 1 thành 0)
Trang 29o Chọn (j,k) bất kì thuộc S(-(h-1).d)và đảo bit Fi(j,k)
Rõ ràng là để tăng Sum lên d, ta có thể chọn 2 tập khác trống Sh.d và
S(-(h-1).d) Thật vậy, hai tập này chứa các vị trí chứa các bit trong khối Fimà ta có thể đảo để tăng Sum lên h.d và (-(h-1).d) một cách tương ứng, kết quả cuối cùng là Sum
sẽ tăng lên h.d + (-(h-1).d)=d
Tương tự như các tập Sw ta cũng có thể coi tập S0 là tập chứa các vị trí mà khi dảo các bit có vị trí này trên Fi thì ta tăng Sum lên 0 Kết quả này cũng đạt được nếu ta không đảo bất kì bit nào trên Fi Vì vậy ta có thể coi So là tập trống và khi nói “đảo một bit có vị trí thuộc tập S0” có nghĩa là không cần làm gì cả
Ví dụ: Cho F, K, W như sau: