1. Trang chủ
  2. » Luận Văn - Báo Cáo

nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin

81 303 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 81
Dung lượng 1,78 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Theo nhiều nghiên cứu, một trong phương pháp được sử dụng và tỏ ra có hiệu quả cho việc bảo đảm bí mật với những thông điệp cần trao đổi là giấu thông điệp vào những phương tiện chứa khá

Trang 2

LUẬN VĂN THẠC SĨ: NGÀNH KHOA HỌC MÁY TÍNH

NGƯỜI HƯỚNG DẪN KHOA HỌC

PGS TS NGÔ QUỐC TẠO

Thái Nguyên - 2011

Trang 3

LỜI CẢM ƠN

Luận văn được thực hiện tại trường Đại học Công nghệ Thông tin và Truyền Thông – Đại học Thái Nguyên dưới sự hướng dẫn của PGS TS Ngô Quốc Tạo

Trước hết tôi xin bày tỏ lòng biết ơn sâu sắc tới thầy Ngô Quốc Tạo, người

đã có những định hướng, những kiến thức quý báu, những lời động viên và chỉ bảo giúp tôi vượt qua những khó khăn để tôi hoàn thành tốt luận văn của mình

Tôi xin được bày tỏ lòng cảm ơn và sự kính trọng của mình đến các thầy cô giáo Trường Đại học Công nghệ Thông tin và Truyền Thông, Đại học Thái Nguyên, đặc biệt là các thầy cô giáo đã giảng dạy và giúp đỡ tôi trong suốt quá trình học tập tại trường

Tôi cũng đặc biệt cảm ơn tới bạn bè lớp Cao học K8, các đồng nghiệp tại Trường Đại học Sư phạm Kỹ thuật Nam Định, đã luôn động viên, giúp đỡ tôi trong quá trình học tập và công tác, để tôi hoàn thành nhiệm vụ được giao

Nhân dịp này, tôi cũng xin gửi lời cảm ơn đến gia đình, người thân, đã tạo điều kiện giúp đỡ, động viên, trợ giúp tôi về tinh thần trong suốt quá trình học tập

Thái Nguyên, tháng 9 năm 2011

Tác giả

Đặng Thị Hiền

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan luận văn “Nghiên cứu phương pháp giấu tin không làm

mất thông tin trong ảnh chứa tin” này là công trình nghiên cứu của riêng tôi Các số

liệu sử dụng trong luận văn là trung thực Các kết quả nghiên cứu được trình bày trong luận văn chưa từng được công bố tại bất kỳ công trình nghiên cứu nào khác

Đặng Thị Hiền

Trang 5

MỤC LỤC

LỜI CẢM ƠN i

LỜI CAM ĐOAN ii

MỤC LỤC iii

DANH MỤC CÁC HÌNH VẼ vii

MỞ ĐẦU 1

1 Lý do lựa chọn đề tài 1

2 Mục tiêu nghiên cứu 2

3 Phạm vi nghiên cứu 2

4 Phương pháp nghiên cứu 2

5 Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài 3

6 Cấu trúc của luận văn 3

CHƯƠNG 1 TỔNG QUAN VỀ GIẤU TIN 5

1.1 Tổng quan về giấu tin 5

1.1.1 Khái niệm về giấu tin 5

1.1.2 Vài nét về lịch sử giấu tin 5

1.1.3 Mô hình kỹ thuật giấu tin 6

1.1.4 Các ứng dụng của kỹ thuật giấu tin 7

1.1.5 Giấu tin trong dữ liệu đa phương tiện 9

1.1.5.1 Giấu tin trong ảnh 9

1.1.5.2 Giấu tin trong audio 9

1.1.5.3 Giấu tin trong video 10

1.1.5.4 Giấu tin trong văn bản 11

1.1.6 Giấu tin trong ảnh những đặc trưng và tính chất 11

1.1.6.1 Phương tiện chứa có dữ liệu tri giác tĩnh 11

1.1.6.2 Kỹ thuật giấu tin lợi dụng tính chất hệ thống thị giác của con người 12

1.1.6.3 Đảm bảo chất lượng ảnh sau khi giấu tin 12

1.1.6.4 Thông tin trong ảnh sẽ bị biến đổi nếu có bất cứ biến đổi nào trên ảnh 13 1.1.6.5 Vai trò của ảnh gốc khi giải tin 13

Trang 6

1.1.7 Phương pháp giấu tin 13

1.2 Các phạm trù trong giấu tin thuận nghịch [19] 15

1.3 Giấu tin có khả năng khôi phục phương tiện giấu tin 16

1.3.1 Những thuật toán giấu tin thuận nghịch xác thực không bền vững 16

1.3.2 Những thuật toán giấu tin thuận nghịch khả năng nhúng dữ liệu cao 17

1.3.2.1 Lược đồ RS 17

1.3.2.2 Lược đồ mở rộng sai khác 18

1.3.2.3 Biến đổi Wavelet số nguyên dựa trên lược đồ 19

1.3.3 Những thuật toán giấu tin thuận nghịch về bán xác thực không bền vững 22

1.3.3.1 Lược đồ dựa trên Patchwork sử dụng bổ sung Modulo-256 23

1.3.3.2 Lược đồ dựa trên Patchwork không sử dụng bổ sung Modulo-256 24

CHƯƠNG 2: CÁC PHƯƠNG PHÁP GIẤU TIN CÓ KHẢ NĂNG KHÔI PHỤC VỎ MANG TIN 26

2.1 Đọc dữ liệu và ghép ảnh bitmap 26

2.2 Các hướng tiếp cận của kỹ thuật giấu tin trong ảnh 27

2.2.1 Tiếp cận trên miền không gian ảnh 27

2.2.2 Tiếp cận trên miền tần số ảnh 28

2.3 Các phép biến đổi từ miền không gian ảnh sang miền tần số 29

2.3.1 Phép biến đổi Fourier rời rạc 29

2.3.2 Phép biến đổi Cosin rời rạc 29

2.3.3 Phép biến đổi sóng nhỏ - Descrete Wavelet Transform (DWT) 31

2.4 Các phương pháp giấu tin thuận nghịch 33

2.4.1 Phương pháp giấu thuận nghịch dựa trên biến đổi sóng kỹ thuật số Haar (HDWT) 33

2.4.1.1 Biến đổi wavelet rời rạc Haar 33

2.4.1.2 Phương pháp giấu tin 35

2.4.2 Phương pháp giấu tin khôi phục dữ liệu cho hình ảnh chất lượng cao sử dụng thay đổi của sai số dự đoán [43] 43

2.4.2.1 Kỹ thuật dịch chuyển biểu đồ Histogram 43

Trang 7

2.4.2.2 Phương pháp đưa ra 45

2.4.3 Phương pháp giấu thuận nghịch HKC 55

2.4.4 Phương pháp giấu tin dựa trên sự khác biệt 56

CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH 61

3.1 Sơ đồ chương trình 61

3.2 Giấu tin theo phương pháp HDWT 61

3.3 Chương trình và kết quả thực nghiệm 63

3.3.1 Chương trình 63

a Giao diện nhúng dữ liệu 63

b Giao diện trích dữ liệu 64

3.3.2 Kết quả thực nghiệm 66

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 67

Trang 8

DANH MỤC CÁC KÝ HIỆU VÀ MỤC VIẾT TẮT

Trang 9

DANH MỤC CÁC HÌNH VẼ

Hình 1.1 Sơ đồ quá trình giấu tin 7

Hình 1.2 Sơ đồ quá trình giải mã 7

Hình 1.3 So sánh kết quả hình ảnh lena (trái) và ảnh Babara (phải) 21

Hình 1.4 (a) Bản gốc ảnh y tế, (b) ảnh stego với độ nhiễu trắng và nhiễu đen nhiều bit thông tin 746 được nhúng vào hình ảnh của 512x512 với một PSNR của ảnh-stego so với ảnh gốc thấp hơn 10dB 24

Hình 2.1 Năng lượng phân bố của ảnh Lena qua phép biến đổi DCT 30

Hình 2.2 Phân chia 3 miền tần số của phép biến đổi DCT, (a) Miền tần số thấp, (b) miền tần số ở giữa, (c) miền tần số cao 31

Hình 2.3 Cấu trúc phân tích và ảnh nhận được qua phép biến đổi sóng nhỏ hai chiều 32

Hình 2.4 Phân tích một khối của HDWT mức 1 (a) khối 10x10 vào ảnh ''Lena" (b) Các hệ số của dải tần số LL, HL, LH, và HH của khối trong (a) 34

Hình 2.5 Các HHS, HHI, và HHD của các hệ số từ HH trong hình 1b 35

Hình 2.6 Các giá trị điểm ảnh của một ảnh 16x16 35

Hình 2.7 HDWT dựa trên ảnh miền tần số của fc trong hình 3 36

Hình 2.8 Các dải tần HH, HHS, HHI, và HHD của fhc 36

Hình 2.9 Dải tần HH’ sau khi cất giấu dữ liệu bí mật trong HH 36

Hình 2.10 Ảnh giấu tin fst 38

Hình 2.11 Biểu đồ sai số dự đoán và biểu đồ của các điểm ảnh trong miền không gian cho ảnh Lena và Baboon 47

Hình 2.12 Ngữ cảnh dự đoán điểm x 47

Hình 2.13 Sơ đồ của quy trình nhúng 49

Hình 2.14 Ví dụ về các bit bí mật ẩn (a) hình ảnh gốc, (b) khởi tạo ma trận I’, và (c) - (f) kết quả xử lý pixel trong ma trận I’ 50

Hình 2.15 Biểu đồ quy trình trích rút và khôi phục ảnh 53

Hình 2.16 Thí dụ về trích rút dữ liệu bí mật và khôi phục ảnh gốc (a) Ảnh stego, (b) Ma trận khởi tạo I’, (c)-(f) các kết quả của phân tử xử lý trong ma trận I’ 54

Trang 10

Hình 2.17 (a) Biểu đồ tần số ảnh Lena gốc, (b) Biểu đồ tần số ảnh giấu tin sử dụng

HKC 55

Hình 2.18 - Lược đồ quá trình giấu tin 57

Hình 2.19 - Lược đồ quá trình tách tin 59

Hình 3.1 Sơ đồ chương trình 61

Hình 3.2 Giao diện nhúng tin 63

Hình 3.3 Giao diện trích rút dữ liệu 64

Hình 3.4 Giao diện so sánh giữa ảnh gốc và ảnh sau khi phục hồi thông tin 65

Hình 3.5 Ảnh gốc và ảnh sau khi nhúng tin 66

Trang 11

MỞ ĐẦU

1 Lý do lựa chọn đề tài

Ngày nay, trong sự phát triển rộng rãi của công nghệ thông tin nói chung, mạng máy tính nói riêng, nhu cầu trao đổi thông tin ngày càng lớn Tuy nhiên, lượng thông tin truyền thông càng nhiều thì nguy cơ truy nhập trái phép đến dữ liệu trong quá trình phân phối càng cao

Vấn đề an toàn cho thông tin trong quá trình trao đổi và phân phối được xem xét theo hai khía cạnh: bảo vệ những thông tin bí mật và bảo vệ những thông tin rõ như văn bản, bức ảnh, đoạn phim…

Đảm bảo bí mật cho một thông điệp truyền đi người ta thường tiến hành mã hóa thông điệp bằng một quy tắc nào đó đã được thỏa thuận trước giữa người gửi và người nhận Theo hướng này, các kỹ thuật mã hóa dữ liệu sử dụng hệ mã hóa công khai đã được hình thành và phát triển mạnh từ những năm 70 của thế kỉ XX Ngày nay, kĩ thuật này vẫn tiếp tục được nghiên cứu và phát triển Tuy nhiên, phương thức này thể hiện rõ thông điệp đã được mã hóa trong quá trình trao đổi nên thường gây sự chú ý của những người lạ về tầm quan trọng của nó

Theo nhiều nghiên cứu, một trong phương pháp được sử dụng và tỏ ra có hiệu quả cho việc bảo đảm bí mật với những thông điệp cần trao đổi là giấu thông điệp vào những phương tiện chứa khác nhau, có thể kết hợp với các phương pháp mã hóa truyền thống, rồi truyền các phương tiện chứa bao gồm cả thông điệp Phía người nhận thực hiện quá trình tách và giải mã để lấy lại thông điệp bí mật Phương tiện chứa được dùng phổ biến là các bức ảnh Vấn đề đặt ra khi giấu thông điệp vào các bức ảnh là làm thế nào để các bức ảnh sau khi chứa thông điệp giấu không có những điểm bất thường gây sự chú ý của những người ngoài cuộc Nghiên cứu đưa

ra các kỹ thuật giấu thông tin mật trong ảnh sao cho vẫn giữ được chất lượng ảnh sau khi đã giấu thông tin và đảm bảo an toàn cho thông tin giấu là một lĩnh vực có ý nghĩa và cần được tiếp tục nghiên cứu

Việc bảo vệ bản quyền những sản phẩm số cũng đang được khoa học quan tâm Trong đó, thủy vân là một trong các kỹ thuật đáp ứng được yêu cầu này

Trang 12

Nghiên cứu bảo vệ các bức ảnh nhằm mục đích bảo vệ bản quyền tác giả của bức ảnh, phát hiện hiện tượng xuyên tạc bức ảnh, xác định tính chân thực của bức ảnh… Đáp ứng mỗi mục đích, có những định hướng nghiên cứu và kỹ thuật đảm bảo khác nhau Trong đó, thủy vân ẩn trên ảnh nhằm mục đích bảo vệ quyền tác giả bức ảnh được quan tâm nghiên cứu và phát triển Kỹ thuật thủy vân ẩn nhằm bảo vệ quyền

sở hữu ảnh cho phép nhúng một lượng thông tin số vào trong ảnh, đảm bảo thông tin về ảnh không thay đổi đáng kể về chất lượng, đồng thời thông tin nhúng tồn tại bền vững cùng ảnh Với kỹ thuật này, khó có thể phát hiện trong bức ảnh có thông tin nhúng, khi không biết các thông tin về khóa

Với mục đích phát triển các kỹ thuật giấu thông tin nhằm bảo vệ các thông tin mật trong quá trình trao đổi, tôi chọn thực hiện đề tài luận văn: “Nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin” Kết quả của đề tài khi triển khai thực tế sẽ góp phần tăng thêm độ an toàn cho các thông điệp được giấu trong ảnh khi trao đổi, tăng khả năng chứng minh quyền sở hữu

2 Mục tiêu nghiên cứu

Luận văn nghiên cứu hệ thống lý thuyết liên quan đến việc giấu tin trong ảnh Các dữ liệu sử dụng trong giấu tin có thể là hình ảnh, các file audio, video hay text Cụ thể trong luận văn là nghiên cứu về giấu tin trong ảnh Bitmap Do dữ liệu

ẩn có thể xảy ra biến dạng sau khi được trích xuất, chính vì vậy mà luận văn tập trung nghiên cứu vào tính hồi phục dữ liệu ẩn cho hình ảnh chất lượng cao

3 Phạm vi nghiên cứu

- Tìm hiểu tổng quan về giấu tin

- Tìm hiểu các phương tiện chứa tin: ảnh, audio, video, text

- Nghiên cứu một số phương pháp giấu tin trong ảnh

- Nghiên cứu phương pháp giấu tin thuận nghịch dựa trên HDWT

4 Phương pháp nghiên cứu

Trong luận văn sử dụng phương pháp nghiên cứu tài liệu liên quan đến việc giấu tin và kế thừa kết quả nghiên cứu của một số luận văn, đề tài nghiên cứu khoa học

Trang 13

Trên cơ sở nghiên cứu lý thuyết cơ bản giấu tin và phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin cùng với các thuật toán trong ảnh sẽ tiến hành cài đặt chương trình

5 Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài

Giấu tin (DataHiding) là phương pháp đã và đang được nghiên cứu và ứng dụng rất mạnh mẽ ở nhiều nước trên thế giới đó là phương pháp nhúng tin trong các phương tiện khác Đây là phương pháp mới và phức tạp nó đang được xem như một công nghệ chìa khoá cho vấn đề bảo vệ bản quyền, nhận thức thông tin và điều khiển truy cập ứng dụng trong an toàn và bảo mật thông tin

Dữ liệu ẩn là một kỹ thuật để đảm bảo thông tin đầy hứa hẹn, tuy nhiên dữ liệu

ẩn cũng có một số biến dạng có thể xảy ra và gây mất mát thông tin Với kỹ thuật phổ biến nhất hiện nay là watermarking hoặc trong miền DCT hoặc lỗi cắt ngắn diễn ra trong quá trình nhúng dữ liệu, kết quả là chưa có phương pháp tối ưu để khôi phục lại dữ liệu như dữ liệu gốc

Trong hình ảnh viễn thám và quân sự thì độ chính xác cao là cần thiết, trong một số nghiên cứu khoa học dữ liệu thử nghiệm rất đắt phải đảm bảo được, còn trong ứng dụng như thực thi pháp luật, hệ thống hình ảnh y tế … mong muốn phải đúng với dữ liệu gốc để xem xét về mặt pháp lý tránh những lệch lạc thông tin gây

ra kiện tụng Do vậy mà việc phục hồi dữ liệu sau khi giấu tin để đảm bảo tính chính xác là rất có ý nghĩa khoa học và thực tiễn

6 Cấu trúc của luận văn

Ngoài phần mở đầu và phần kết luận, luận văn được trình bày thành ba chương như sau:

Chương 1: Tổng quan về giấu tin

1.1 Tổng quan về giấu tin

1.2 Các phạm trù giấu tin

1.3 Giấu tin có khả năng khôi phục vật giấu tin

Chương 2: Các phương pháp giấu tin có khả năng khôi phục vỏ mang tin

2.1 Đọc dữ liệu và ghép ảnh Bitmap

Trang 14

2.2 Các hướng tiếp cận của kỹ thuật giấu tin trong ảnh

2.3 Các phép biến đổi từ miền không gian sang miền tần số

2.4 Các phương pháp giấu tin

2.4.1 Phương pháp giấu thuận nghịch dựa trên biến đổi sóng kỹ thuật

số Haar (HDWT)

2.4.2 Phương pháp giấu tin khôi phục dữ liệu cho hình ảnh chất lượng

cao sử dụng biến đổi, các lỗi dự báo

2.4.3 Phương pháp giấu thuận nghịch HKC

2.4.4 Phương pháp giấu dựa trên sự khác biệt của cặp giá trị điểm ảnh

Chương 3: Xây dựng chương trình

3.1 Sơ đồ chương trình

3.2 Giấu tin theo phương pháp HDWT

3.3 Kết quả

Một số thuật ngữ

Cover Image (Cover - Ảnh gốc): được lựa chọn để giấu (hoặc bao che) thông

tin, đôi khi ảnh gốc được gọi là ảnh môi trường

Stego Image (Stego - Ảnh giấu tin mật): Ảnh gốc sau khi đã được giấu tin

mật vào đó

Message (Thông điệp): thông điệp có thể có nhiều dạng như văn bản, hình

ảnh và thường được biểu diễn dưới dạng nhị phân

Pixel (điểm ảnh): miền dữ liệu của một ảnh là một tập hợp các điểm ảnh Mỗi

dạng ảnh khác nhau thì giá trị pixel khác nhau Với ảnh bitmap 8-bít thì giá trị của mỗi pixel tương ứng 256 mầu khác nhau, với ảnh bitmap 24-bít thì mỗi pixel biểu diễn bởi 3 kênh mầu RGB, mỗi kênh biểu thị bởi 8 bít mầu khác nhau

Embedding Ratio (Tỉ lệ nhúng): là tỉ lệ nhúng thực tế so với tỷ lệ nhúng lớn

nhất có thể Trong một số trường hợp, tỷ lệ nhúng là số bít thông điệp có thể nhúng

so với số pixel của ảnh

Trang 15

CHƯƠNG 1 TỔNG QUAN VỀ GIẤU TIN 1.1 Tổng quan về giấu tin

1.1.1 Khái niệm về giấu tin

Giấu thông tin là một kỹ thuật nhúng (giấu) một lượng thông tin số nào đó vào một đối tượng dữ liệu số khác

Kỹ thuật giấu thông tin nhằm hai mục đích: một là bảo mật cho dữ liệu được đem giấu, hai là bảo vệ cho chính đối tượng giấu tin ở trong Hai mục đích khác nhau này dẫn đến hai hướng kỹ thuật chủ yếu của giấu tin Hướng thứ nhất là giấu tin mật, nhằm tập trung vào các kỹ thuật giấu tin sao cho người khác khó phát hiện được một đối tượng có giấu tin bên trong hay không Hướng thứ hai là thủy vân số, hướng thủy vân số có miền ứng dụng lớn hơn nên được quan tâm nghiên cứu nhiều hơn và thực tế đã có rất nhiều những kỹ thuật được đề xuất

1.1.2 Vài nét về lịch sử giấu tin

Từ Steganography bắt nguồn từ tiếng Hy Lạp và được sử dụng cho tới ngày nay, nó có ý nghĩa là tài liệu được phủ (covered writting) Các câu chuyện kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ Có lẽ những ghi chép sớm nhất

về kỹ thuật giấu thông tin (thông tin được hiểu theo nghĩa nguyên thủy của nó) thuộc về sử gia Hy Lạp Herodotus Khi bạo chúa Hy Lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ năm trước Công nguyên, ông ta đã gửi một thông báo

bí mật cho con rể của mình là Aristagoras ở Miletus Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ ấy Khi tóc của người nô lệ này mọc đủ dài người nô lệ được gửi tới Miletus

Một câu chuyện khác về thời Hy Lạp cổ đại cũng do Herodotus ghi lại Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong Demeratus, một người Hy Lạp, cần thông báo cho Sparta rằng Xerxes định xâm chiếm Hy Lạp

Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại các viên thuốc bằng một lớp sáp mới Những viên thuốc mang tin mật đã ngụy trang được để cùng với các viên thuốc thông thường khác lọt qua mọi sự kiểm tra một cách dễ dàng

Trang 16

Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong một thời gian dài Người Romans cổ đã biết sử dụng những chất rắn có sẵn như nước quả, nước tiểu và sữa để ghi các thông báo bí mật những hàng văn tự thông thường Khi được hơ nóng, những thứ mực không nhìn thấy này trở nên sẫm mầu và có thể đọc

dễ dàng Mực không màu cũng được sử dụng rất gần đây, như trong thời gian chiến tranh thế giới thứ II

Ý tưởng về che giấu thông tin đã có từ hàng nghìn năm về trước nhưng kỹ thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo Mãi cho tới vài thập niên gần đây, giấu thông tin mới nhận được sự quan tâm của các nhà nghiên cứu với rất nhiều các công trình nghiên cứu

Do sự bùng nổ nhanh chóng của công nghệ thông tin, người ta cũng số hoá lĩnh vực giấu tin mật phục vụ cho cuộc sống hiện đại Các phương tiện giấu tin được tập trung nhiều vào các dữ liệu đa phương tiện đặc biệt là ảnh số (Cover image) Mặc dù mục đích ban đầu của nó dùng để tạo ra các dấu thuỷ vân (Watermarking) trong ảnh phục vụ cho mục đích bảo vệ bản quyền sản phẩm, chống xuyên tạc thông tin, nhưng đã nhanh chóng trở thành phương pháp hữu ích

sử dụng trao đổi thông tin mật

1.1.3 Mô hình kỹ thuật giấu tin

Mô hình của kỹ thuật giấu tin cơ bản được mô tả trong các Hình 1.1 và Hình 1.2 Trong đó, Hình 1.1 biểu diễn quá trình giấu tin cơ bản Phương tiện chứa bao gồm các đối tượng được dùng làm môi trường để giấu tin như văn bản, audio, video, ảnh… Thông tin cần giấu là một lượng thông tin mang một ý nghĩa nào đó tùy thuộc vào mục đích của người sử dụng Thông tin sẽ được giấu vào trong phương tiện chứa nhờ một bộ nhúng Bộ nhúng là những chương trình theo những thuật toán để giấu tin và được thực hiện với một khóa bí mật giống như các hệ mã mật cổ điển Sau khi giấu tin ta thu được phương tiện chứa đã giấu và được phân phối trên các môi trường khác nhau

Trang 17

Hình 1.1 Sơ đồ quá trình giấu tin Quá trình giải mã được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khóa của quá trình nhúng Kết quả thu được gồm phương tiện chứa gốc và thông tin đã giấu Tùy trường hợp, thông tin nhận được có thể cần

xử lí, kiểm định so sánh với thông tin giấu ban đầu

Hình 1.2 Sơ đồ quá trình giải mã

1.1.4 Các ứng dụng của kỹ thuật giấu tin

Giấu tin mật: Thông tin được giấu trong những trường hợp này cần được

bảo mật trước các đối thủ Việc giải mã để nhận được thông tin cũng không cần dữ liệu môi trường gốc Đối với các thuật toán giấu tin mật chúng ta không chú trọng

Phương tiện chứa đã được giấu tin

Phương tiện chứa

đã được giấu tin

Trang 18

đến việc bảo vệ thông tin mật trước sự tấn công của các đối thủ mà thay vào đó các thuật toán quan tâm đến tính ẩn và tính an toàn đối với dữ liệu cần giấu Do đó, các thuật toán giấu tin có độ bảo mật cao sẽ được sử dụng trong các ứng dụng giấu tin mật

Bảo vệ bản quyền tác giả: Đây là ứng dụng cơ bản nhất của kỹ thuật thuỷ

vân số Một thông tin nào đó mang ý nghĩa bản quyền được sở hữu bởi tác giả gọi là thuỷ vân, thông tin này sẽ được nhúng vào trong các sản phẩm multimedia, và đó là minh chứng cho bản quyền của tác giả nhằm bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái Yêu cầu kỹ thuật đối với ứng dụng này là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, khi muốn bỏ thuỷ vân này mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm

Xác thực thông tin: Một tập các thông tin sẽ được giấu trong dữ liệu nguồn

và thông tin sẽ được sử dụng để nhận biết xem dữ liệu nguồn có bị thay đổi hay không Với kiểu ứng dụng này các thuỷ vân nên được ẩn để tránh được sự tò mò của đối phương, hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao và thuỷ vân không cần bền vững

Giấu vân tay hay dán nhãn: Thuỷ vân số trong những ứng dụng này được

sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví dụ như các vân khác nhau sẽ được nhúng vào các bản sao khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng này thì yêu cầu là đảm bảo

độ an toàn cao cho các thuỷ vân tránh sự xoá giấu vết trong khi phân phối

Kiểm soát sao chép: Các thuỷ vân trong những trường hợp này được sử

dụng để kiểm soát việc sao chép thông tin Các thiết bị phát hiện ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc/ghi Ví dụ như hệ thống quản lí sao chép DVD đã được sử dụng ở Nhật Các ứng dụng loại này yêu cầu thuỷ vân phải được

Trang 19

đảm bảo an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc

1.1.5 Giấu tin trong dữ liệu đa phương tiện

1.1.5.1 Giấu tin trong ảnh

Hiện nay, giấu thông tin trong ảnh là một bộ phận chiếm tỉ lệ lớn nhất trong các chương trình ứng dụng, các phần mềm, hệ thống giấu tin trong dữ liệu đa phương tiện bởi lượng thông tin trao đổi bằng hình ảnh là rất lớn Hơn nữa, giấu thông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong hầu hết các ứng dụng bảo vệ an toàn thông tin như: nhận thức thông tin, xác định xuyên tạc thông tin, bảo

vệ bản quyền tác giả, điều khiển truy cập, giấu thông tin mật,… Vì thế mà vấn đề này đã nhận được sự quan tâm rất lớn của các cá nhân, tổ chức, trường đại học, và các viện nghiên cứu trên thế giới

Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thay đổi

và ít ai biết được bên trong bức ảnh đó mang những thông tin có ý nghĩa khác Và ngày nay, khi ảnh số đã được sử dụng rất phổ biến, giấu thông tin trong ảnh đã đem lại rất nhiều những ứng dụng quan trọng trên nhiều lĩnh vực trong đời sống xã hội

Ví dụ tại các nước phát triển, chữ ký tay đã được số hóa và lưu trữ sử dụng như là

hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nó được dùng để nhận thức trong các thẻ tín dụng của người tiêu dùng Thêm vào đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật, chúng rất dễ bị lấy cắp và bị thay đổi bởi các phần mềm chuyên dụng Việc nhận thức chúng cũng như phát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng và cấp thiết Một đặc điểm của giấu thông tin trong ảnh

đó là thông tin được giấu trong ảnh một cách vô hình, nó như là một cách truyền thông tin mật cho nhau mà người khác không thể biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như không thay đổi, đặc biệt đối với ảnh mầu hay ảnh đa mức xám

1.1.5.2 Giấu tin trong audio

Giấu thông tin trong audio mang những đặc điểm riêng khác với giấu thông tin trong các đối tượng đa phương tiện khác Một trong những yêu cầu cơ bản của giấu

Trang 20

tin là đảm bảo tính chất ẩn của thông tin được giấu đồng thời không làm ảnh hưởng nhiều đến chất lượng của dữ liệu gốc Để đảm bảo yêu cầu này, kỹ thuật giấu thông tin trong ảnh phụ thuộc vào hệ thống thị giác của con người, còn kỹ thuật giấu thông tin trong audio lại phụ thuộc vào hệ thống thính giác Và một vấn đề khó khăn ở đây là hệ thống thính giác của con người nghe được các tín hiệu ở các dải tần rộng và công suất lớn nên đã gây khó khăn đối với các phương pháp giấu tin trong audio Nhưng hệ thống thính giác lại kém trong việc phát hiện sự khác biệt của các giải tần và công suất Điều này có nghĩa là các âm thanh to, cao tần có thể che giấu được các âm thanh nhỏ thấp một cách dễ dàng Các mô hình phân tích tâm

lý đã chỉ ra điểm yếu trên và thông tin này sẽ giúp ích cho việc chọn các audio thích hợp cho việc giấu tin Vấn đề khó khăn thứ hai cho việc giấu thông tin trong audio

là kênh truyền tin Kênh truyền hay băng thông chậm sẽ ảnh hưởng đến chất lượng thông tin sau khi giấu Các phương pháp giấu thông tin trong audio đều lợi dụng điểm yếu trong hệ thống thính giác của con người

1.1.5.3 Giấu tin trong video

Cũng giống như giấu tin trong ảnh hay trong audio, giấu tin trong video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như kiểm soát sao chép thông tin, nhận thức thông tin và bảo vệ bản quyền tác giả Ta có thể lấy một

ví dụ là các hệ thống chương trình trả tiền xem theo đoạn phim đã xem Một phương pháp giấu tin trong video được đưa ra bởi Cox [7] là phương pháp phân bố đều Ý tưởng cơ bản của phương pháp là phân phối thông tin giấu dàn trải theo tần

số của dữ liệu chứa gốc Nhiều nhà nghiên cứu đã dùng những hàm cosin riêng và các hệ số truyền sóng riêng để giấu tin Trong các thuật toán khởi nguồn thì thường các kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào video Như phương pháp của Swanson [8] đã sử dụng cách giấu theo khối, phương pháp này đã giấu được hai bit vào khối 8x8

Kỹ thuật giấu thông tin bằng video áp dụng cả đặc điểm thị giác và thính giác của con người

Trang 21

Kỹ thuật giấu tin đang được áp dụng cho nhiều loại đối tượng chứ không chỉ riêng dữ liệu đa phương tiện như ảnh, audio hay video Gần đây, đã có một số nghiên cứu giấu tin trong văn bản text, cơ sở dữ liệu quan hệ và cơ sở dữ liệu XML, cho phép mở ra những hướng nghiên cứu mới

1.1.5.4 Giấu tin trong văn bản

Trong trao đổi thông tin qua hệ thống máy tính, văn bản chiếm một tỷ lệ rất lớn so với các loại phương tiện chứa khác Tuy vậy, giấu tin trong văn bản lại chưa được quan tâm nghiên cứu nhiều Các nghiên cứu về giấu tin trong văn bản được chia theo hai hướng, thứ nhất văn bản được sử dụng để giấu tin là những văn bản được chụp lại và lưu trên máy như một bức ảnh nhị phân Theo hướng này, các kỹ thuật giấu tin được thực hiện như kỹ thuật giấu tin trong ảnh Hướng thứ hai, phương tiện chứa sử dụng cho quá trình giấu tin được lưu dưới dạng văn bản Theo hướng này, các kỹ thuật giấu tin cũng tiến hành như giấu tin trong ảnh bằng cách thay đổi một số ký tự tại một số vị trí trên văn bản mà không làm ảnh hưởng nhiều đến nội dung văn bản gốc

1.1.6 Giấu tin trong ảnh những đặc trưng và tính chất

Giấu tin trong ảnh chiếm vị trí chủ yếu trong các kỹ thuật giấu tin, vì vậy các

kỹ thuật giấu tin phần lớn cũng tập trung vào các kỹ thuật giấu tin trong ảnh Các phương tiện chứa khác nhau thì cũng sẽ có các kỹ thuật giấu khác nhau Đối tượng ảnh là một đối tượng dữ liệu tĩnh có nghĩa là dữ liệu tri giác không biến đổi theo thời gian Dữ liệu ảnh có nhiều định dạng, mỗi định dạng có những tính chất khác nhau nên các kỹ thuật giấu tin trong ảnh thường chú ý những đặc trưng và các chất

cơ bản sau đây:

1.1.6.1 Phương tiện chứa có dữ liệu tri giác tĩnh

Dữ liệu gốc ở đây là dữ liệu của ảnh tĩnh, dù có giấu thông tin vào trong ảnh hay không, khi ta xem ảnh bằng thị giác dữ liệu ảnh không thay đổi theo thời gian Điều này khác với dữ liệu audio hay video, vì khi ta nghe hay xem thì dữ liệu gốc sẽ thay đổi liên tục với tri giác của con người theo các đoạn hay các bài, các ảnh… Sự

Trang 22

khác biệt này ảnh hưởng lớn đối với các kỹ thuật giấu thông tin trong ảnh với kỹ thuật giấu thông tin trong audio hay video

Kỹ thuật giấu tin phụ thuộc vào các loại ảnh khác nhau Chẳng hạn, đối với ảnh đen trắng, ảnh xám hay ảnh màu ta cũng có những kỹ thuật riêng do các loại ảnh có những đặc trưng khác nhau

1.1.6.2 Kỹ thuật giấu tin lợi dụng tính chất hệ thống thị giác của con người

Giấu tin trong ảnh ít nhiều cũng gây ra những thay đổi trên dữ liệu ảnh gốc

Dữ liệu ảnh được quan sát bằng hệ thống thị giác của con người nên các kỹ thuật giấu tin phải đảm bảo một yêu cầu cơ bản là những thay đổi trên ảnh phải rất nhỏ, sao cho bằng mắt thường khó nhận ra được sự thay đổi đó, vì có như thế mới đảm bảo được độ an toàn cho thông tin giấu Rất nhiều các kỹ thuật đã lợi dụng các tính chất của hệ thống thị giác để giấu tin chẳng hạn như mắt người cảm nhận về sự biến đổi về độ chói kém hơn sự biến đổi về mầu hay cảm nhận của mắt về mầu xanh da trời là kém nhất trong ba màu cơ bản

Giấu tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay đổi kích thước ảnh Các thuật toán thực hiện công việc giấu thông tin sẽ được thực hiện trên dữ liệu của ảnh Dữ liệu ảnh bao gồm cả phần header, bảng màu (có thể có) và dữ liệu ảnh Khi giấu thông tin, các phương pháp giấu đều biến đổi các giá trị của các bit trong

dữ liệu ảnh chứ không thêm vào hay bớt đi dữ liệu ảnh Do vậy mà kích thước ảnh trước hay sau khi giấu thông tin là như nhau

1.1.6.3 Đảm bảo chất lượng ảnh sau khi giấu tin

Đây là một yêu cầu quan trọng đối với giấu tin trong ảnh Sau khi giấu tin bên trong, ảnh phải đảm bảo được yêu cầu không bị biến đổi để có thể bị phát hiện dễ dàng so với ảnh gốc Yêu cầu này dường như là khá đơn giản đối với ảnh mầu hoặc ảnh xám bởi mỗi một điểm ảnh được biểu diễn bởi nhiều bit, nhiều giá trị và khi ta thay đổi một giá trị nhỏ nào đó thì chất lượng ảnh thay đổi không đáng kể, thông tin giấu khó bị phát hiện, nhưng đối với ảnh đen trắng thì việc giấu thông tin phức tạp hơn nhiều, vì đối với ảnh đen trắng mỗi điểm ảnh chỉ là trắng hoặc đen, và nếu ta

Trang 23

biến đổi một bit từ đen sang trắng mà không khéo thì sẽ rất dễ bị phát hiện Do đó, yêu cầu đối với các thuật toán giấu thông tin trong ảnh mầu hay ảnh xám và giấu thông tin trong ảnh đen trắng là khác nhau Trong khi đối với ảnh màu thì các thuật toán chú trọng vào việc giấu được càng nhiều thông tin càng tốt, các thuật toán áp dụng cho ảnh đen trắng lại tập trung vào việc làm thế nào để thông tin giấu khó bị phát hiện nhất

1.1.6.4 Thông tin trong ảnh sẽ bị biến đổi nếu có bất cứ biến đổi nào trên ảnh

Vì phương pháp giấu tin trong ảnh dựa trên việc điều chỉnh các giá trị của các bit theo một qui tắc nào đó và khi giải mã sẽ theo các giá trị đó để tìm được thông tin Theo đó, nếu một phép biến đổi nào đó trên ảnh làm thay đổi giá trị của các bit thì sẽ làm cho thông tin giấu bị sai lệch Nhờ đặc điểm này mà giấu thông tin trong ảnh có tác dụng nhận thức và phát hiện xuyên tạc thông tin

1.1.6.5 Vai trò của ảnh gốc khi giải tin

Các kỹ thuật giấu tin phải xác định rõ ràng quá trình lọc ảnh để lấy thông tin giấu cần hay không cần đến ảnh gốc Đa số các kỹ thuật giấu tin mật thường không cần đến ảnh gốc khi giải mã Thông tin được giấu trong ảnh sẽ được mang cùng với

dữ liệu ảnh, khi giải mã chỉ cần ảnh đã mang thông tin giấu mà không cần dùng đến ảnh gốc để so sánh đối chiếu Nhưng trong một vài lĩnh vực như y học, quân đội hoặc nghiên cứu thực nghiệm vật lý phân tử năng lượng,…đòi hỏi không những tách đúng thông điệp mà còn khôi phục đúng ảnh gốc ban đầu

1.1.7 Phương pháp giấu tin

Kỹ thuật giấu tin đầu tiên được sử dụng phổ biến nhất đối với hầu hết các kiểu giấu tin mật là kỹ thuật giấu LSB (LSB replacement - thay thế LSB), trong đó các bit LSB của ảnh cover được thay thế bằng các bit thông điệp mật để tạo ra ảnh stego Nó có ưu điểm là cho phép chứa lượng thông tin lớn, vô hình về trực quan, các điểm ảnh cover có giá trị chẵn không thay đổi hoặc tăng lên 1 trong khi các giá trị lẻ lùi lại 1 hoặc giữ nguyên Kỹ thuật thay thế LSB cũng được biết đến như là phép nhúng  1( embledding): nếu bit thông điệp không trùng khớp với bit LSB của điểm ảnh thì “1” được chèn vào điểm ảnh hoặc điểm ảnh tăng giảm 1 đơn vị

Trang 24

Mặt khác để tránh mất mát thông điệp trên miền không gian điểm ảnh bằng một số phép hình thái học (co, giãn, dịch chuyển, nén, ) người ta nghiên cứu kỹ thuật giấu tin trong các miền khác nhau: miền biến đổi tần số rời rạc cosine [11, 12,

13, 14], miền biến đổi wavelet [15], dựa trên chỉ số mầu của ảnh GIF [26], miền giá trị sai khác (difference image) [16, 17]

Đa số các kỹ thuật giấu trên là kỹ thuật giấu không thuận nghịch, sau khi tách thông điệp chúng ta không thể khôi phục lại ảnh cover ban đầu Để đảm bảo an toàn thông tin, trong một số trường hợp người ta phải huỷ các vật mang tin (stego) sau khi tách thông điệp Tuy nhiên một số lĩnh vực như trong y học, quân sự, nghiên cứu năng lượng hoặc hệ thống thông tin vệ tinh, đòi hỏi phải lưu trữ lại ảnh gốc

Vì vậy kỹ thuật giấu tin thuận nghịch ra đời

Giấu tin thuận nghịch là kỹ thuật giấu thông điệp sau khi khôi phục thông điệp

ta có thể khôi phục lại ảnh gốc ban đầu

Năm 1999, Honsiger và các cộng sự giới thiệu kỹ thuật giấu tin thuận nghịch đầu tiên [18], mở ra một hướng mới trong lĩnh vực giấu tin Tiếp đó một loạt các kỹ thuật giấu tin thuận nghịch khác được công bố: kỹ thuật DE (Difference Expansion) đây là kỹ thuật giấu tin dựa trên mở rộng sai khác của ảnh Sau đó (2008) Shaowei Weng và đồng nghiệp đưa ra kỹ thuật DE cải tiến[17]

Năm 2003, Ni và các cộng sự đưa ra kỹ thuật thuận nghịch NSAS [19], là kỹ thuật đầu tiên dựa trên dịch chuyển biểu đồ tần số Sau đó một loạt các kỹ thuật giấu tin thuận nghịch khác cũng dựa trên dịch chuyển tần số như: kỹ thuật DIH dựa trên dịch chuyển biểu đồ tần số giá trị sai khác [20] (2004), HKC [21, 22] (cải tiến kỹ thuật NSAS) (2006, 2008), kỹ thuật IWH [15] (2006) dựa trên dịch chuyển biểu đồ các hệ số wavelet

Hiện nay vẫn có hai xu hướng giấu tin song song và tồn tại: Kỹ thuật giấu tin không thuận nghịch và kỹ thuật giấu tin thuận nghịch Tuỳ vào mục đích sử dụng cụ thể mà người ta sử dụng kỹ thuật giấu nào cho phù hợp Trong luận văn này, tác giả chỉ tập trung tìm hiểu và khai thác một số phương pháp giấu tin thuận nghịch hiện nay

Trang 25

1.2 Các phạm trù trong giấu tin thuận nghịch [19]

Gần đây có nhiều phương pháp giấu đầy triển vọng được đề xuất để đảm bảo thông tin Do khả năng giấu dữ liệu, một số biến dạng vĩnh viễn có thể xảy ra và kết quả là các phương tiện gốc (cover) không thể khôi phục được chính xác ngay cả sau khi dữ liệu ẩn được trích ra

Theo phân loại các thuật toán nén dữ liệu thì các dạng của thuật toán giấu tin

có thể xem như là giấu dữ liệu có mất mát thông tin Hãy xem xét ba lớp chính của thuật toán giấu tin: một là với kỹ thuật watermarking sử dụng trải phổ là phổ biến nhất, hoặc trong miền DCT hoặc khối 8x8 miền DCT, lỗi làm tròn (roundoff) và / hoặc lỗi chặt cụt có thể xảy ra trong quá trình nhúng dữ liệu Kết quả là, không có cách nào để khôi phục phương tiện chứa tin (stego media) trở lại ban đầu Hai là phương pháp nhúng bit-plane (LSB) bít có trọng số thấp, các bit dữ liệu bị nhúng chuyển thành các bit trong LSB và các bit thay thế là không nhớ Với lớp thứ ba của

kỹ thuật watermarking được sử dụng nhiều gọi là lượng tử hóa chỉ số điều chế (QIM) [28], lỗi lượng tử hóa làm cho giấu dữ liệu mất đi

Trong các ứng dụng như pháp luật, hệ thống ảnh y tế, thì việc mong muốn phương tiện chứa tin có thể khôi phục lại với ảnh gốc để xem xét về mặt pháp lý hoặc trong ảnh viễn thám và quân sự luôn đòi hỏi độ chính xác cao Chính vì vậy

mà tính thuận nghịch của phương pháp giấu tin được sử dụng

Những thuật toán giấu tin thuận nghịch có thể được chia thành ba loại: thứ nhất những thuật toán giấu tin thuận nghịch xác thực không bền vững (fragile

authentication), thứ 2 những thuật toán giấu tin thuận nghịch có khả năng nhúng cao (high data embedding capacity) và thứ 3 những thuật toán giấu tin thuận nghịch xác thực bán không bền vững (semi-fragile authentication) Có thể liệt kê các phương pháp giấu thuận nghịch của các tác giả như sau:

1 Barton sáng chế của Mỹ số 5.646.997 (97) (1)

2 Honsinger và các cộng sự US Patent số 6.278.791 B1 (01) (1)

3 Phương pháp của Fridrich và các cộng sự (SPIE01) (1)

4 Phương pháp của de Vleeschouwer và các cộng sự (MMSP01) (3)

Trang 26

5 Phương pháp của Goljan và các cộng sự (IHW01) (2)

6 Phương pháp của Xuân và các cộng sự (MMSP02) (2)

7 Phương pháp Ni và các cộng sự (ISCAS03) (2)

8 Phương pháp của Celik và các cộng sự (ICIP02) (2)

9 Phương pháp của Tian (CSVT03) (2)

10 Phương pháp của Yang và các cộng sự (SPIE04) (2)

11 Phương pháp của Thodi & Rodríguez (SWSIAI04) (2)

12 Phương pháp Ni và các cộng sự (ICME04) (3)

13 Phương pháp của Zou và các cộng sự (MMSP04) (3)

14 Phương pháp của Xuân và các cộng sự (MMSP04) (2)

15.Phương pháp của Xuân và các cộng sự (IWDW04) (2)

1.3 Giấu tin có khả năng khôi phục phương tiện giấu tin

1.3.1 Những thuật toán giấu tin thuận nghịch xác thực không bền vững

Một số thuật toán giấu tin thuận nghịch đầu tiên phát triển ở giai đoạn đầu thuộc về thể loại này Vì xác thực không bền vững không có nhiều dữ liệu được nhúng trong môi trường trung tính nên khả năng nhúng trong thể loại này là không lớn, bình thường giữa 1k đến 2k bit Đối với một ảnh kích thước 512 × 512 màu xám, khả năng này tương đương với một tỷ lệ giấu dữ liệu từ 0,0038 bit/pixel (bpp) tới 0,0076 bpp

Trong thể loại này thì sáng chế của Honsinger và các cộng sự vào năm 2001 [18] là điển hình Kỹ thuật giấu dữ liệu thuận nghịch cho loại xác thực không bền vững sử dụng phương pháp thêm modulo-256 thực hiện trong lĩnh vực ảnh không gian Trong khi nhúng, Iw = (I + W) mod 256, trong đó Iw là ảnh đánh dấu, I là ảnh gốc, W là tải trọng xuất phát từ hàm băm của ảnh gốc Đối với bên chứng thực, W được trích rút từ ảnh đánh dấu bằng cách trừ đi tải trọng từ ảnh được đánh dấu, như vậy ảnh gốc thuận nghịch bằng cách sử dụng thêm modulo-256, vấn đề vượt ngưỡng được tránh Ở đây, hiện tượng vượt ngưỡng được giải thích là giá trị xám hoặc vượt quá giới hạn phạm vi của nó (vượt ngưỡng trên) hoặc thấp hơn giới hạn dưới của nó (vượt ngưỡng dưới)

Trang 27

Ví dụ, cho một ảnh màu xám 8-bit, màu xám trong phạm vi từ 0-255 Việc vượt ngưỡng khi vượt quá mức 255, trong khi tràn dưới ở mức thấp hơn 0 Trường hợp này sẽ phá hủy tính thuận nghịch Vì vậy vấn đề này thường là một vấn đề quan trọng trong giấu tin nghịch đảo Mặt khác sử dụng thêm modulo-256 có thể khắc phục được vượt ngưỡng Mặc dù ảnh stego có thể bị nhiễu

1.3.2 Những thuật toán giấu tin thuận nghịch khả năng nhúng dữ liệu cao

Tất cả các kỹ thuật giấu tin thuận nghịch trong loại đầu tiên nhằm mục đích xác thực không bền vững, thay vì giấu lượng lớn dữ liệu Kết quả là, số lượng dữ liệu giấu được giới hạn hơn và có thể không thích hợp cho các ứng dụng như là thông tin liên lạc bí mật và hệ thống dữ liệu y tế Do đó, Goljan và các cộng sự [29] trình bày kỹ thuật giấu dữ liệu thuận nghịch đầu tiên, được gọi là lược đồ RS, lược

đồ này phù hợp với mục đích có khả năng nhúng dữ liệu cao Sau đó, Tian [15] đã phát triển sự sai khác lược đồ mở rộng, đó là cải tiến lớn đặc tính của giấu dữ liệu thuận nghịch trong điều kiện của PSNP dựa vào khả năng nhúng dữ liệu của các ảnh

đã đánh dấu lưu ý tới các ảnh gốc Gần đây, Xuân và các cộng sự [30, 31] đã phát triển lược đồ giấu tin thuận nghịch dựa trên biến đổi wavelet số nguyên

1.3.2.1 Lƣợc đồ RS

Cơ chế của lược đồ này được mô tả như sau: Các điểm ảnh trong ảnh được nhóm lại thành các khối không chồng chéo lên nhau, mỗi khối gồm có một số điểm ảnh lân cận Ví dụ, Khối nằm ngang gồm có bốn điểm ảnh liên tiếp Một chức năng chọn lọc đó có thể giữ được độ phẳng của các nhóm được thiết lập để phân chia các khối thành ba loại khác nhau: số khối khác thường, số khối thông thường và khối không hợp lệ Một thao tác nghịch đảo F được áp dụng cho các nhóm Thao tác có thể vẽ một khối từ một loại này tới loại khác như F(R) = S, F(S) = R, và F(U) = U

Vì nghịch đảo khối nên khi áp dụng thao tác vào một khối làm tăng gấp đôi khối gốc Vì thế thao tác nghịch đảo này được gọi là lật (flipping) F Ví dụ về thao tác lật

F có thể là hoán vị giữa 0 và 1, 2 và 3, 3 và 4, Điều này tương đương với đảo các bit có trọng số thấp (LSB) Một ví dụ khác là các hoán vị giữa 0 và 2, 1 và 3, 4 và 6, , tức là, flipping LSB lần hai Vậy rõ ràng là phép lật sau mạnh hơn trước Các

Trang 28

nguyên tắc để đạt được việc nhúng dữ liệu thuận nghịch trong đó có một sự chêch lệch giữa số khối thông thường và số khối ít đối với hầu hết các hình ảnh Hay nói cách khác có một sự dư thừa và một số khoảng trống có thể được tạo ra bằng cách nén không mất mát thông tin Cùng với một số tệp chương trình có thể đạt được tính thuận nghịch

Các thuật toán đưa ra như sau:

Đầu tiên quét từng khối hình ảnh, hình thành vector RS tương ứng, một khối R bằng nhị phân 1 và một khối S bằng nhị phân 0 với các nhóm U đơn giản được bỏ qua Sau đó, thuật toán nén véctơ RS được lấy làm khởi đầu cho việc sử dụng file trong xây dựng lại hình ảnh ban đầu Bằng cách chỉ định nhị phân 1 và 0 đến khối R

và S tương ứng, một bit có thể được phân lớp vào mỗi khối R hoặc S Nếu bit được nhúng phù hợp với loại của một khối được xem xét, thao tác flipping F được áp dụng cho khối để chống lại sự đối xứng Việc nhúng dữ liệu bao gồm các bít đầu tiên và tín hiệu mờ watermark Trong khai phá dữ liệu, thuật toán quét các hình ảnh được đánh dấu theo cách giống như trong việc nhúng dữ liệu, từ kết quả véctơ RS, việc nhúng dữ liệu có thể được trích rút Phần đầu sẽ dùng để tái tạo lại ảnh gốc, trong khi phần còn lại là các trọng số

Số lượng dữ liệu nhúng bởi kỹ thuật này không đủ lớn cho một số ứng dụng như truyền tin bí mật Phạm vi nhúng được đánh giá từ 0,022 bpp đến 0,17 bpp khi

độ dài nhúng là sáu và PSNR của ảnh được đánh dấu so với ảnh gốc là khoảng 36,06 dB [10]

1.3.2.2 Lƣợc đồ mở rộng sai khác

Tian trình bày một thuật toán nhúng dữ liệu thuận nghịch có khả năng nhúng cao [32] Trong thuật toán này, hai kỹ thuật được sử dụng, tức là sự mở rộng sai khác và nhúng bít có trọng số thấp mở rộng, để đạt được khả năng nhúng cao, trong khi sự biến dạng thấp

Ý tưởng chính của kỹ thuật này được mô tả dưới đây:

Trang 29

Cho một cặp giá trị pixel x và y, đầu tiên thuật toán tính trung bình số nguyên

l và hiệu của x và y Ở đó h = x - y Sau đó h dịch sang trái 1 bít và nhúng bít b thêm vào LSB

Điều này tương đương với h' = 2.h + b, trong đó h’ là sự khác biệt mở rộng Cuối cùng giá trị mới x và y, kí hiệu là x' và y', được tính toán dựa trên giá trị chênh lệch h’ mới và giá trị trung bình ban đầu l Bằng cách này, thu được các ảnh stego

Để tránh tràn, thuật toán chỉ nhúng dữ liệu vào các cặp điểm ảnh mà không dẫn đến vấn đề tràn Do đó, dung lượng của ảnh bị nén ít hao tổn và nhúng

Lưu ý rằng, ở trên đã đề cập mối quan hệ giữa các cặp số nguyên x và y so với các cặp số nguyên l và h được thực hiện theo cách sau đây

trong đó các phép toán cơ bản được sử dụng Theo phép biến đổi số nguyên Haar, nó có thể nghịch đảo giữa hai cặp số nguyên Rõ ràng, việc chuyển đổi thuận nghịch giữa số nguyên tránh lỗi chẵn - lẻ Điều này cùng với các dữ liệu đã được đề cập ở trên có thể đảm bảo được tính thuận nghịch Việc này đã được báo cáo trong [32] có khả năng nhúng đạt được bằng phương pháp mở rộng là cao hơn nhiều so với thực hiện bằng cách nhúng trong [29] vì mỗi cặp điểm ảnh bằng trực tiếp có thể nhúng một bít, trong khi mỗi khối của các điểm ảnh có thể nhúng một bít

1.3.2.3 Biến đổi Wavelet số nguyên dựa trên lƣợc đồ

Xuân và các cộng sự đề xuất ba thuật toán giấu dữ tin thuận nghịch dựa trên biến đổi wavelet số nguyên (IWT) [30,33,34] Ba thuật toán có ba đặc điểm chung Đầu tiên là chúng thực hiện trong miền IWT IWT được coi như là một WT được biết đến là tín hiệu tương quan tốt trong miền chuyển đổi

Đặc trưng của nó bao gồm những đặc điểm chung phù hợp với hệ thống thị giác của con người (HVS) WT có thể được thực hiện có hiệu quả bằng cách sử dụng lược đồ lật ngược (lifting) IWT có thể đảm bảo việc biến đổi wavelet trước khả năng nghịch đảo Vì những lý do này, IWT đã và đang được sử dụng trong JPEG 2000 cho việc nén không làm giảm chất lượng Điều này được chỉ ra trong

Trang 30

thuật toán Xuân và các cộng sự là IWT có một vai trò quan trọng trong giấu tin thuận nghịch

Đặc điểm thứ hai là các thuật toán này đều chứa một giai đoạn tiền xử lý, chỉnh sửa biểu đồ, để tránh vượt ngưỡng Tức là, một chương trình đã được phát triển để thu nhỏ các biểu đồ về phía trung tâm, để lại hai đầu trống rỗng Do đó, nguyên nhân gây nhiễu bởi biến đổi của hệ số IWT được chọn sẽ không gây vượt ngưỡng Để có thể nghịch đảo được, các thông số biểu đồ (histogram) thay đổi cần phải được nhúng vào phần đầu overhead Bởi vì hiệu quả của chương trình sửa đổi [35], bít đầu không lớn

Đặc điểm thứ ba là ba thuật toán nhúng dữ liệu trong hệ số IWT dải tần số cao Điều này là do việc sửa đổi các hệ số trong các dải băng này sẽ không thể nhận thấy nếu độ lớn của việc thay đổi là không cao

Thuật toán đầu tiên [33, 35] nén một vài bit-planes giữa của hệ số IWT trong dải tần số cao để tạo ra không gian giấu dữ liệu Khi đường chéo giữa 1 và 0 trong các bit của hệ số IWT tần số cao trở nên lớn hơn trong miền không gian, phương pháp này đạt được khả năng nhúng cao hơn [36], đó là bản sao của thuật toán này trong miền không gian

Trang 31

Hình 1.3 So sánh kết quả hình ảnh lena (trái) và ảnh Babara (phải) Thuật toán thứ hai [30] sử dụng phương pháp quang phổ mở rộng để ẩn dữ liệu trong hệ số IWT trong dải tần số cao Những bit giả được dùng để chỉ những hệ

số không được lựa chọn cho nhúng dữ liệu, do đó lưu trữ dữ liệu ở overhead Kết quả là, phương pháp này hiệu quả hơn các lược đồ nén LSB được mô tả ở trên Thuật toán thứ ba [34] sử dụng kỹ thuật nén – giãn (companding) cho nhúng

dữ liệu, kỹ thuật này được phát minh bởi Xuân Dựa trên các nghiên cứu về phân bố thống kê của hệ số IWT trong dải băng tần số cao

Việc thực hiện của ba thuật toán này, áp dụng cho hai hình ảnh điển hình thử nghiệm: Lena và Babara, được thể hiện trong hình 1.3 trong điều kiện của khả năng nhúng dữ liệu so với PSNR Rõ ràng là IWT dựa trên các thuật toán companding thực hiện tốt nhất Điều này có thể được giải thích từ một nghiên cứu về số lượng

độ lớn mà các IWT được lựa chọn hệ số tần số cao đã bị thay đổi và bao nhiêu tần

số cần thiết để nhúng một bit trong dữ liệu được nhúng bởi ba thuật toán này Điều này có thể được giải thích là thuật toán companding gây ra những thay đổi ít nhất trong các hệ số IWT được lựa chọn trong giữa ba thuật toán, theo sau bởi các thuật toán trải phổ mở rộng, trong khi cả hai thuật toán là: trải phổ và nén – giãn

Trang 32

(companding) có thể nhúng hầu hết một bit trong một hệ số tần số cao IWT Lưu ý rằng cả hai thuật toán IWT dựa trên thuật toán nén - giãn và trải phổ thực hiện thuật toán mở rộng bên ngoài khác nhau

1.3.3 Những thuật toán giấu tin thuận nghịch về bán xác thực không bền vững

Về mặt đa phương tiện, việc xác thực nội dung có ý nghĩa nhiều hơn xác thực đại diện Đó là nguyên nhân được gọi là bán xác thực không bền vững, cho phép một số thay đổi ngẫu nhiên, hay nói cách khác nén trong một mức độ hợp lý, trong khi tiếp đó, được gọi là xác thực không bền vững, không cho phép bất kỳ sự thay đổi xảy ra với phương tiện chứa tin (stego-media), bao gồm cả nén

Ví dụ, khi một ảnh nén JPEG với chất lượng cao, nội dung của ảnh này được xem là không thay đổi theo cảm nhận thông thường Do đó, nó tạo cảm giác phù hợp với ảnh nén này là xác thực Vì mục đích là xác thực không bền vững, chúng ta cần một thuật toán giấu dữ liệu thuận nghịch mạnh để nén, có thể gọi là giấu dữ liệu thuận nghịch bán bền vững hoặc giấu thuận nghịch mạnh Điều này có thể được minh họa như sau Ảnh JPEG2000 chứng thực mới được đề xuất, cả hai xác thực không bền vững và bán xác thực không bền vững đều được đưa ra Trong phạm vi bán xác thực không bền vững, cả hai trường hợp nén mất dữ liệu và không mất dữ liệu đều được xem xét

Trong luận văn này, một số tính năng tương ứng với một hình ảnh tỉ lệ nén được định trước là dấu hiệu nhận biết đầu tiên Bằng cách "tương ứng" nó có nghĩa

là các tính năng này sẽ giữ nguyên độ dài nén khi áp dụng cho hình ảnh với tỷ lệ nén xác định trước Các tính năng của chữ ký số được nhúng nghịch đảo trong hình ảnh Sau đó, trong giai đoạn xác minh, nếu những ảnh đánh dấu không bị thay đổi

gì cả, chữ ký ẩn có thể được trích và ảnh gốc có thể được phục hồi

Việc kết hợp giữa chữ ký lấy ra và chữ ký tạo ra từ ảnh được khôi phục (từ trái qua) đưa ra ảnh xác thực Nếu ảnh đánh dấu được nén với tỉ lệ nén thấp so với ảnh định trước, ảnh gốc không thể phục hồi do áp dụng nén mất dữ liệu, nhưng chữ ký

ẩn vẫn có thể được phục hồi mà không bị lỗi và xác minh ảnh nén là xác thực Rõ

Trang 33

ràng, nếu ảnh đánh dấu nén với tỉ lệ cao hơn quy định trước sẽ làm cho ảnh không xác thực Bất kỳ tác động có hại sẽ làm cho ảnh bị tác động không xác thực do kết quả giữa chữ ký trích ra và chữ ký được tạo ra từ các ảnh đã nhận sau khi trích dữ liệu ẩn không khớp nhau Nhìn chung, giấu dữ liệu không mất thông tin có thể được

sử dụng trong môi trường mất dữ liệu

1.3.3.1 Lƣợc đồ dựa trên Patchwork sử dụng bổ sung Modulo-256

Theo De Vleeschouwer và các cộng sự [37] đề xuất một thuật toán giấu dữ liệu hồi phục dựa trên lý thuyết chắp vá (patchwork) [38], có độ bền cao chống lại nén mất dữ liệu với JPEG Đây chỉ là thuật toán giấu tin thuận nghịch mạnh hiện có chống nén JPEG Trong thuật toán này, mỗi bit ẩn được liên kết với một nhóm điểm ảnh Mỗi nhóm là giả ngẫu nhiên chia thành hai tập con số lượng điểm ảnh tương đương nhau và gọi là vùng A và B Các biểu đồ của từng vùng được ánh xạ vào một vòng tròn theo cách sau Mỗi điểm trên vòng tròn được lập chỉ số bởi độ sáng tương ứng, và số lượng điểm ảnh giả định cường độ sáng sẽ là trọng điểm Một điểm ảnh

có thể xác định trung tâm khối của từng vùng Quan sát thấy rằng trong hầu hết trường hợp các vectơ chỉ từ trung tâm vòng tròn tới trung tâm khối của vùng A và B

là gần nhau (gần như bằng nhau) cho mỗi điểm ảnh bởi vì các điểm ảnh của vùng A

và B được đánh giá cao với hầu hết các ảnh

Xem xét một nhóm, quay hai vectơ theo hai hướng đối diện bởi một số lượng nhỏ, quay vector của vùng A ngược chiều kim đồng hồ và quay vector của vùng B theo chiều kim đồng hồ cho phép nhúng số nhị phân 1, trong khi quay vector của vùng A theo chiều kim đồng hồ, và vector của vùng B ngược chiều kim đồng hồ nhúng số nhị phân 0 Đối với các giá trị điểm ảnh, quay vector cho phù hợp với sự thay đổi về độ sáng Trong khai phá dữ liệu, các góc của vectơ trung tâm phù hợp

cả hai vùng A và vùng B so với chiều ngang là tính toán thứ nhất, và sự khác biệt giữa hai góc độ được xác định sau đó Một sự khác biệt rõ ràng miêu tả cho số nhị phân 1, trong khi đó phủ định 0

Một trong những yếu tố chính của thuật toán này nó được dựa trên lý thuyết chắp vá (patchwork) Đó là, trong từng vùng, hướng của vector trung tâm được xác

Trang 34

định bằng tất cả các điểm ảnh trong vùng này Do đó, thuật toán mạnh để nén ảnh tới phạm vi chắc chắn Một yếu tố chủ yếu khác của thuật toán này nằm ở chỗ nó sử dụng bổ sung modulo-256 để tránh vượt ngưỡng, vì thế mà nó có thể nghịch đảo

Do đó, thuật toán này sẽ chịu ảnh hưởng của nhiễu (nhiễu trắng và nhiễu đen) Trong những ảnh stego y tế, các nhiễu trắng và nhiễu đen là rõ ràng

Các PSNR của ảnh stego so với ảnh gốc là dưới 10 dB khi bit thông tin 746 được nhúng vào ảnh 512x512 Không chỉ trong ảnh y tế, mà trong ảnh màu thì hiện tượng nhiễu trắng và nhiễu đen cũng có thể xảy ra Tất cả các thuật toán giấu dữ tin thuận nghịch dựa trên bổ sung 256 modulo để tránh vượt ngưỡng, trong [18] và [37] không thể áp dụng cho nhiều ứng dụng thực tế, và vì thế nên tránh

Hình 1.4 (a) Bản gốc ảnh y tế, (b) ảnh stego với độ nhiễu trắng và nhiễu đen nhiều bit thông tin 746 được nhúng vào hình ảnh của 512x512 với một PSNR của ảnh-

stego so với ảnh gốc thấp hơn 10dB

1.3.3.2 Lƣợc đồ dựa trên Patchwork không sử dụng bổ sung Modulo-256

Nhận thấy rằng bổ sung modulo-256 mặc dù có thể tránh được vượt ngưỡng

và do đó đạt được sự thuận nghịch, gây ra ảnh stego bị nhiễu trắng và nhiễu đen, Ni

và các cộng sự đã phát triển một lược đồ giấu tin thuận nghịch mới mà không sử dụng thêm modulo-256 [39] Lược đồ dựa trên lý thuyết chắp vá (patchwork) để đạt được bán xác thực không bền vững trong giấu tin Cụ thể, lược đồ xác định số lượng thống kê trong một khối những điểm ảnh mạnh để thay đổi giá trị điểm ảnh trong khối, và điều khiển nó để nhúng một bít vào khối Cùng với các biện pháp bổ

Trang 35

sung bao gồm sửa lỗi mã hóa và hoán vị, vì thế mà nó thu được bán xác thực không bền vững

Sử dụng một chiến lược mới trong nhúng dữ liệu đạt được tính thuận nghịch Nghĩa là, lược đồ phân loại một khối các điểm ảnh thành bốn loại khác nhau theo sự phân bố của các giá trị điểm ảnh màu xám trong khối Đối với các khối trong các loại khác nhau, mỗi chiến lược nhúng khác được sử dụng

Thuật toán giấu tin thuận nghịch bán xác thực không bền vững mới này đã đạt được hiệu suất cao hơn so thuật toán giấu tin thuận nghịch bán xác thực không bền vững sử dụng bổ sung thêm modulo-256 Phương pháp đã được áp dụng cho tất cả tám ảnh y tế thử nghiệm, trong đó có thể hiện trong hình 1.4 (a), để nhúng cùng một lượng dữ liệu (bit thông tin 746 trong các ảnh 512x512) Trong tất cả các ảnh stego, không có lỗi nhiễu đen và nhiễu trắng ở tất cả PSNR của tất cả tám hình ảnh y tế thì đều ở mức trên 40dB, cho thấy rằng một sự cải thiện đáng kể chất lượng của ảnh stego

Tổng kết chương 1

Chương 1 trình bày tổng quan về kỹ thuật giấu tin, các khái niệm cơ bản về giấu tin, tìm hiểu kiến trúc mô hình giấu tin, các phương tiện để giấu tin và các ứng dụng của việc giấu tin Ngoài ra còn tìm hiểu các phạm trù giấu tin thuận nghịch,

phân loại thuật toán giấu tin thuận nghịch và đưa ra một số thuật toán đặc trưng của

mỗi loại

Trang 36

CHƯƠNG 2: CÁC PHƯƠNG PHÁP GIẤU TIN CÓ KHẢ NĂNG KHÔI

PHỤC VỎ MANG TIN 2.1 Đọc dữ liệu và ghép ảnh bitmap

Ảnh BMP (Bitmap Picture) được phát triển bởi Microsoft Corporation, được lưu trữ dưới dạng độc lập thiết bị cho phép Windows hiển thị dữ liệu không phụ thuộc vào khung chỉ định màu trên bất kỳ phần cứng nào Tên file mở rộng mặc định của một file ảnh Bitmap là BMP Ảnh BMP được sử dụng trên Microsoft Windows và các ứng dụng chạy trên Windows từ version 3.0 trở lên

Mỗi file ảnh BMP gồm ba phần:

Bitmapheader (54 Byte) Bảng màu (có thể có hoặc không) Thông tin ảnh (Bitmap Data) Trong phần Bitmapheader của ảnh bitmap, thành phần biCount cho biết số bit dành cho mỗi điểm ảnh và số lượng màu lớn nhất của ảnh Bicount có thể nhận các giá trị sau:

 1: Bitmap là ảnh đen trắng, mỗi bit biểu diễn một điểm ảnh Nếu bit mang giá trị 0 thì điểm ảnh là đen, bit mang giá trị 1 thì điểm ảnh là điểm trắng

 4: Bitmap là ảnh 16 màu, mỗi điểm ảnh được biểu diễn bởi 4 bit

 8: Bitmap là ảnh 256 màu, mỗi điểm ảnh được biểu diễn bởi 1 byte

 16: Bitmap là ảnh Highcolor, mỗi dãy 2 byte liên tiếp trong bitmap biểu diễn cường độ tương đối của màu đỏ, xanh lá cây, xanh lơ của một điểm ảnh

 24: Bitmap là ảnh Truecolor, mỗi dãy 3 byte liên tiếp trong bitmap biểu diễn cường độ tương đối của màu đỏ, xanh lá cây, xanh lơ (Red, Green, Blue) của một điểm ảnh

Nếu thông số này bằng 24, tức dùng 3 byte để biểu diễn một điểm ảnh thì file ảnh bitmap khi đó sẽ không có bảng màu Nếu thành phần này có giá trị nhỏ hơn hoặc bằng 8, khi đó file ảnh là ảnh 256 màu hoặc ảnh đa cấp xám, hoặc là đen trắng

Trang 37

Palette màu (bảng màu của ảnh): là những ảnh có thành phần biCount nhỏ hơn hoặc bằng 8 bit màu mới có Palette màu Kích thước bảng màu sẽ là 2biCount

BitmapData: phần này nằm ngay sau phần Palette màu của ảnh BMP Đây là phần chứa giá trị màu của điểm ảnh trong BMP Các dòng ảnh được lưu từ dưới lên trên, các điểm ảnh được lưu trữ từ trái sang phải Các giá trị của mỗi điểm ảnh là một chỉ số trỏ tới phần tử mầu tương ứng của Palette màu

Như vậy để đọc được dữ liệu ảnh, ta phải đọc header ảnh, sau đó căn cứ vào thành phần biCount để xem ảnh có bảng màu hay không, nếu có thì đọc bảng màu, không thì ta bỏ qua Dữ liệu ảnh được đọc và lưu vào mảng hai chiều có kích thước bằng header.With * header.Height

Các thao tác xử lý trên không gian ảnh thường được thực hiện trên các khối con của phần dữ liệu ảnh, các khối này thông thường là có kích thước bằng nhau và không có khối nào bị chồng bởi khối khác Việc chia các khối được hiểu là chia ma trận lớn thành các ma trận con trong ma trận dữ liệu ảnh

Các thao tác xử lý trên không gian ảnh xử lý trực tiếp các giá trị của ma trận này Do ma trận này chứa giá trị độc lập, rời rạc của từng điểm ảnh nên các phương pháp thủy vân thực hiện trong miền không gian ảnh thường không bền vững trước các tấn công thông thường

Sau khi xử lý xong, ta thực hiện ghi lại ảnh theo qui trình ngược lại gồm các bước: ghi lại header, ghi lại bảng màu nếu có, sau đó ghi dữ liệu ẩn

2.2 Các hướng tiếp cận của kỹ thuật giấu tin trong ảnh

2.2.1 Tiếp cận trên miền không gian ảnh

Miền không gian ảnh là miền dữ liệu ảnh gốc, tác động lên miền không gian ảnh chính là tác động lên các điểm ảnh, thay đổi giá trị trực tiếp của điểm ảnh Đây

là hướng tiếp cận tự nhiên bởi vì khi nói đến việc giấu tin trong ảnh người ta thường nghĩ ngay đến việc thay đổi giá trị các điểm ảnh nguồn, một phương pháp phổ biến của hướng tiếp cận này là phương pháp tác động đến bit ít quan trọng của mỗi điểm ảnh

Trang 38

Tuy nhiên, phương pháp này cũng có nhiều hạn chế, chẳng hạn như không đảm bảo được tính bền vững của thông tin giấu đối với các thao tác biến đổi như quay ảnh hoặc nén ảnh Jpeg Điều này là dễ hiểu vì các thao tác nói trên cũng loại

bỏ hoặc làm sai lệch các bit ít quan trọng nhất của mỗi điểm ảnh

2.2.2 Tiếp cận trên miền tần số ảnh

Hướng tiếp cận dựa trên miền không gian ảnh như đã trình bày ở trên là cách tiến hành khảo sát tín hiệu và hệ thống rời rạc một cách trực tiếp trên miền giá trị rời rạc của các điểm ảnh gọi là trên miền biến số độc lập tự nhiên Nhưng trong nhiều trường hợp, cách khảo sát trực tiếp này gặp phải những khó khăn nhất định hoặc rất phức tạp và hiệu quả không cao

Ngoài phương pháp khảo sát trực tiếp, có thể dùng phương pháp khảo sát gián tiếp thông qua các kỹ thuật biến đổi Các biến đổi này làm nhiệm vụ chuyển miền biến số độc lập sang các miền khác và như vậy tín hiệu và hệ thống rời rạc sẽ được biểu diễn trong các miền mới với các biến số mới Phương pháp biến đổi này cũng giống như phương pháp biến đổi trong phép tính tích phân hay phương pháp đổi hệ toạ độ trong giải tích của toán phổ thông quen thuộc

Mỗi cách biến đổi sẽ có những thuận lợi riêng, tuỳ từng trường hợp mà chúng

ta chọn phép biến đổi nào cho phù hợp Sau khi khảo sát, biến đổi xong các tín hiệu

và hệ thống rời rạc trong miền các biến số mới này, nếu cần thiết có thể dùng cả biến đổi ngược để đưa chúng trở lại miền biến số độc lập

Phương pháp khảo sát gián tiếp sẽ làm đơn giản rất nhiều các công việc gặp phải khi dùng phương pháp khảo sát trực tiếp trong miền biến số độc lập tự nhiên

Hệ thống rời rạc cần khảo sát chính là miền không gian các điểm ảnh Có một số phương pháp biến đổi được sử dụng rất phổ biến như: Fourier, Cosin rời rạc (DCT), Wavelet… Đây là những phép biến đổi được sử dụng nhiều trong các kỹ thuật xử lý ảnh và âm thanh Trong giấu tin, đặc biệt trong kỹ thuật thuỷ vân tiếp cận theo miền tần số, các phép biến đổi từ miền biến số tự nhiên của ảnh sang miền tần số như biến đổi Fourier, biến đổi cosin rời rạc, Wavelet được sử dụng phổ biến

Trang 39

2.3 Các phép biến đổi từ miền không gian ảnh sang miền tần số

2.3.1 Phép biến đổi Fourier rời rạc

Phép biến đổi Fourier rời rạc (Discrete Fourier Transform – DFT) là một công

cụ toán học được dùng để chuyển cách biểu diễn tín hiệu và hệ thống rời rạc sang miền tần số rời rạc Thực chất của cách biểu diễn này là lấy từng điểm rời rạc trên vòng tròn đơn vị trong mặt phẳng Z để biểu diễn Việc biểu diễn trong miền tần số rời rạc đặc biệt hiệu quả khi xuất hiện các thuật toán tính toán nhanh DFT ta gọi là phép biến đổi Fourier nhanh (Fast Fourier Transform – FFT)

Biến đổi Fourier rời rạc của một bức ảnh u(m,n) được định nghĩa như sau:

ln 1

0 1

0

) , ( )

,

N

m N

n

km

N W n m u l

0

ln

) , (

1 ) , (

N

k N

l

N km

N W W l k N

n m

Với 0<=m,n<=N-1

2.3.2 Phép biến đổi Cosin rời rạc

Biến đổi cosin rời rạc (Discrete Cosine Transform – DCT) được đưa ra bởi Ahmed và các đồng nghiệp [40],[41] vào năm 1974 Từ đó cho đến nay, nó được sử dụng rất phổ biến trong nhiều kỹ thuật xử lý ảnh số nói riêng và xử lý tín hiệu số nói chung Trong các kỹ thuật thủy vân ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DTC cũng được sử dụng rất nhiều

Định nghĩa biến đổi cosin rời rạc hai chiều

Biến đổi DCT hai chiều tổng quát là biến đổi trên khối hai chiều bất kỳ MxN, trong đó các khối kích thước 8x8,16x16 được sử dụng nhiều nhất

Phép biến đổi DCT 8x8 được định nghĩa như sau:

16

)12(cos(

)16

)12(cos(

),(4

)()(),(

7

0 7

u v

u I

I(u,v) được gọi là hệ số DCT và là số thực

Còn biến đổi ngược IDCT được định nghĩa như sau:

Trang 40

) 16

) 1 2 ( cos(

) 16

) 1 2 ( cos(

) , ( 4

) ( ) ( )

,

(

7

0 7

Đặc điểm của phép biến đổi DCT ảnh hai chiều:

- Thể hiện đặc tính nội dung về tần số của thông tin ảnh Hệ số góc trên là lớn

và đặc trưng cho giá trị trung bình thành phần một chiều gọi là hệ số DC, còn các hệ

số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần số cao theo hướng ngang và theo hướng thẳng đứng gọi là hệ số AC

- Bản thân biến đổi DCT không nén được dữ liệu vì cũng sinh ra 64 hệ số

- Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo hướng đường chéo Tương ứng theo các hướng đó, các hệ số biến đổi DCT cũng lớn

Hình 2.1 Năng lượng phân bố của ảnh Lena qua phép biến đổi DCT Tóm lại, DCT làm giảm độ tương quan không gian của thông tin trong khối ảnh Điều đó, cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn Hơn nữa, các hệ số DCT chứa thông tin về nội dung tần số không gian của thông tin trong khối Nhờ các đặc tính tần số không gian của

hệ thống nhìn của mắt người, các hệ số DCT có thể được mã hóa phù hợp, chỉ các

hệ số DCT quan trọng nhất mới được mã hóa để truyền đi

Khối hệ số DCT có thể chia thành ba miền, miền tần số thấp, chứa các thông tin quan trọng ảnh hưởng đến tri giác, miền tần số giữa, và miền tần số cao Các thông tin trong miền tần số cao thường không mang tính tri giác cao, khi nén JPEG

Ngày đăng: 17/09/2014, 18:30

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[2]. Lương Mạnh Bá, Nguyễn Thanh Thủy (1999), “Nhập môn xử lý ảnh số”, NXB Khoa học và Kỹ thuật, Hà Nội Sách, tạp chí
Tiêu đề: Nhập môn xử lý ảnh số
Tác giả: Lương Mạnh Bá, Nguyễn Thanh Thủy
Nhà XB: NXB Khoa học và Kỹ thuật
Năm: 1999
[3]. Đỗ Năng Toàn, Phạm Việt Bình (2008), “Giáo trình môn học Xử lý ảnh” NXB Khoa học và Kỹ thuật Sách, tạp chí
Tiêu đề: Giáo trình môn học Xử lý ảnh
Tác giả: Đỗ Năng Toàn, Phạm Việt Bình
Nhà XB: NXB Khoa học và Kỹ thuật
Năm: 2008
[4]. Hồ Vũ Ba Đình, Nguyễn Xuân Huy, Nguyễn Hồng Hải (2003), “Xây dựng phương pháp giấu thông tin bền vững trong cơ sở dữ liệu không gian”, Kỷ yếu hội thảo Quốc gia: Một số vấn đề chọn lọc của CNTT, Thái Nguyên, 29-31/08/2003, NXB Khoa học Kỹ thuật Hà Nội, 2005, tr. 83-88 Sách, tạp chí
Tiêu đề: Xây dựng phương pháp giấu thông tin bền vững trong cơ sở dữ liệu không gian
Tác giả: Hồ Vũ Ba Đình, Nguyễn Xuân Huy, Nguyễn Hồng Hải
Nhà XB: NXB Khoa học Kỹ thuật Hà Nội
Năm: 2005
[5]. Hồ Thị Hương Thơm, Hồ Văn Canh , Trịnh Nhật Tiến (2010), “Phát hiện ảnh giấu tin sử dụng kỹ thuật giấu thuận nghịch dựa trên dịch chuyển Histogram”, Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Công nghệ 26 (2010) 261-267Tiếng anh Sách, tạp chí
Tiêu đề: Phát hiện ảnh giấu tin sử dụng kỹ thuật giấu thuận nghịch dựa trên dịch chuyển Histogram
Tác giả: Hồ Thị Hương Thơm, Hồ Văn Canh, Trịnh Nhật Tiến
Nhà XB: Tạp chí Khoa học ĐHQGHN, Khoa học Tự nhiên và Công nghệ
Năm: 2010
[7]. I. J. Cox, J. Kilian, T. Leighton, and T. Shamoon, “Secure spread spectrum watermarking for multimedia,” in IEEE Trans. on Image Processing, vol. 6. No. 12, pp. 1673-1687, Dec. 1997 Sách, tạp chí
Tiêu đề: Secure spread spectrum watermarking for multimedia,” in "IEEE Trans. on Image Processing
[8]. Swanson M. D., Kobayashi M., and Tewfik A. H.(1998), Multimedia Data - Embledding and Watermarking Techonologies, Proceeding of IEEE, Vol. 86, No. 6, 1064 - 1087 Sách, tạp chí
Tiêu đề: Proceeding of IEEE
Tác giả: Swanson M. D., Kobayashi M., and Tewfik A. H
Năm: 1998
[9]. R. van Schyndel, A. Tirkel, and C. Osborne (1994), “A digital watermark”, In Proceedings of ICIP, volume 2, Austin, TX, 1994, pp.86 - 90 Sách, tạp chí
Tiêu đề: A digital watermark”, " In Proceedings of ICIP
Tác giả: R. van Schyndel, A. Tirkel, and C. Osborne
Năm: 1994
[10]. Xiaolong Li, Bin Yang, Daofang Cheng and Tieyong Zeng (2009) “A Generalization of LSB Matching”, IEEE signal processing letters, Vol. 16, No. 2, February 2009, pp. 69 -72 Sách, tạp chí
Tiêu đề: A Generalization of LSB Matching
[12]. A. Westfeld and A. Pfitzmann (1999), “Attacks on steganographic systems”, In Lecture notes in computer science: 3rd International Workshop on Information Hiding, 1999 Sách, tạp chí
Tiêu đề: Attacks on steganographic systems”, "In Lecture notes in computer science
Tác giả: A. Westfeld and A. Pfitzmann
Năm: 1999
[13]. N. Provos (2001), “Defending Against Statistical Steganalysis”, 10 th USENIX Security Symposium, Washington, DC, 2001 Sách, tạp chí
Tiêu đề: Defending Against Statistical Steganalysis
Tác giả: N. Provos
Năm: 2001
[14]. Ho Thi Huong Thom, Ho Van Canh, Trinh Nhat Tien (2009), “Novel Algorithms to Steganalysis of Uncompressed and Compressed Images”, Processings of KSE 2009non Knowledge and Systems Engineering, College of Technology, IEEE Computer Society, Vietnam National University, Hanoi, 2009, pp 87 -92 Sách, tạp chí
Tiêu đề: Novel Algorithms to Steganalysis of Uncompressed and Compressed Images”, "Processings of KSE 2009non Knowledge and Systems Engineering, College of Technology, IEEE Computer Society
Tác giả: Ho Thi Huong Thom, Ho Van Canh, Trinh Nhat Tien
Năm: 2009
[16]. J. Tian (2002), “Reversible Watermarking by Difference Expansion”, In Proc. of Workshop on Multimedia and Securiy, December 2002, pp. 19 -22 Sách, tạp chí
Tiêu đề: Reversible Watermarking by Difference Expansion
Tác giả: J. Tian
Năm: 2002
[17]. Shaowei Weng, Yao Zhao (2008), “A novel reversible data hiding scheme”, International Journal of Invovative Computing, Information and Control, Vol. 4, No. 3, Feb. 2008, pp. 351 - 358 Sách, tạp chí
Tiêu đề: A novel reversible data hiding scheme”, "International Journal of Invovative Computing, Information and Control
Tác giả: Shaowei Weng, Yao Zhao
Năm: 2008
[18]. C. W. Honsiger, P. Jones, M. Rabbani, and J. C. Stoffel (1999), “ Lossless recovery of an original image containing embedded data”, US Patent application, Docket no: 77102/E-D Sách, tạp chí
Tiêu đề: Lossless recovery of an original image containing embedded data
Tác giả: C. W. Honsiger, P. Jones, M. Rabbani, J. C. Stoffel
Nhà XB: US Patent application
Năm: 1999
[19]. Ni, Z., Shi, Y., Ansari, N., Su, W. (2003) : Reversible data hiding. Proc. ISCAS 2003, pp. 912 - 915 Sách, tạp chí
Tiêu đề: Proc. "ISCAS 2003
[20]. Sang - Kwang Lee, Young - Ho Suh, and Yo -Sung Ho (2004), Lossless Data Hiding Based on Histogram Moddification of Difference images, Advances in Multimedia Information Processing - PCM 2004, November/December, 2004, pp.340-347 Sách, tạp chí
Tiêu đề: Lossless Data Hiding Based on Histogram Moddification of Difference images
Tác giả: Sang - Kwang Lee, Young - Ho Suh, Yo -Sung Ho
Nhà XB: Advances in Multimedia Information Processing - PCM 2004
Năm: 2004
[21]. J.H. Hwang, J. W. Kim, and J. U. Choi (2006), “A reversible Watermarking Based on Histogram Shifting”, IWDW 2006, LNCS 4283, pp. 361-384 Sách, tạp chí
Tiêu đề: A reversible Watermarking Based on Histogram Shifting
Tác giả: J.H. Hwang, J. W. Kim, and J. U. Choi
Năm: 2006
[22]. Wen-Chung Kuo, Dong-Jin Jiang, Yu-Chih Huang (2008), “A Reversible Data Hiding Scheme Based on Block Devision”, Vol. 1, CISP., pp.365-369 Sách, tạp chí
Tiêu đề: A Reversible Data Hiding Scheme Based on Block Devision
Tác giả: Wen-Chung Kuo, Dong-Jin Jiang, Yu-Chih Huang
Năm: 2008
[23]. Guorong Xuan, Yun Q. Shi, Peiqi Chai, Xuefeng Tong, Jianzhong Teng, Jue Li (2008), “ Reversible Binary Image Data Hiding By Run - Length Histogram Modification”, The 19 th International Conference on Pattern Recognition (ICPR 2008), December 8-11, 2008, Tampa, Florida, USA, pp. 1-4 Sách, tạp chí
Tiêu đề: Reversible Binary Image Data Hiding By Run - Length Histogram Modification
Tác giả: Guorong Xuan, Yun Q. Shi, Peiqi Chai, Xuefeng Tong, Jianzhong Teng, Jue Li
Nhà XB: The 19th International Conference on Pattern Recognition (ICPR 2008)
Năm: 2008
[24]. D. Coltuc and J. M. Chassery (2007) “Very fast watermarking by reversible contrast mapping”, IEEE Signal Processing Lett., vol. 14, no. 4, pp. 255-258 Sách, tạp chí
Tiêu đề: Very fast watermarking by reversible contrast mapping

HÌNH ẢNH LIÊN QUAN

Hình 1.2. Sơ đồ quá trình giải mã - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 1.2. Sơ đồ quá trình giải mã (Trang 17)
Hình 1.3. So sánh kết quả hình ảnh lena (trái) và ảnh Babara (phải).  Thuật toán thứ hai [30] sử dụng phương pháp quang  phổ  mở rộng  để  ẩn  dữ  liệu trong hệ số IWT trong dải tần số cao - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 1.3. So sánh kết quả hình ảnh lena (trái) và ảnh Babara (phải). Thuật toán thứ hai [30] sử dụng phương pháp quang phổ mở rộng để ẩn dữ liệu trong hệ số IWT trong dải tần số cao (Trang 31)
Hình 2.5. Các HHS, HHI, và HHD của các hệ số từ HH trong hình 2.4b. - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.5. Các HHS, HHI, và HHD của các hệ số từ HH trong hình 2.4b (Trang 45)
Hình 2.8. Các dải tần HH, HHS, HHI, và HHD của f hc . - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.8. Các dải tần HH, HHS, HHI, và HHD của f hc (Trang 46)
Hình 2.11. Biểu đồ sai số dự đoán và biểu đồ của các điểm ảnh trong miền - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.11. Biểu đồ sai số dự đoán và biểu đồ của các điểm ảnh trong miền (Trang 57)
Hình 2.13. Sơ đồ của quy trình nhúng. - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.13. Sơ đồ của quy trình nhúng (Trang 59)
Hình 2.14. Ví dụ về các bit bí mật ẩn. (a) hình ảnh gốc, (b) khởi tạo ma trận - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.14. Ví dụ về các bit bí mật ẩn. (a) hình ảnh gốc, (b) khởi tạo ma trận (Trang 60)
Hình 2.15. Biểu đồ quy trình trích rút và khôi phục ảnh - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.15. Biểu đồ quy trình trích rút và khôi phục ảnh (Trang 63)
Hình 2.18. - Lược đồ quá trình giấu tin [6]. - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.18. Lược đồ quá trình giấu tin [6] (Trang 67)
Hình 2.19. - Lược đồ quá trình tách tin [6]. - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 2.19. Lược đồ quá trình tách tin [6] (Trang 69)
3.1. Sơ đồ chương trình - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
3.1. Sơ đồ chương trình (Trang 71)
Hình 3.2. Giao diện nhúng tin - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 3.2. Giao diện nhúng tin (Trang 73)
Hình 3.3. Giao diện trích rút dữ liệu - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 3.3. Giao diện trích rút dữ liệu (Trang 74)
Hình 3.4. Giao diện so sánh giữa ảnh gốc và ảnh sau khi phục hồi thông tin - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 3.4. Giao diện so sánh giữa ảnh gốc và ảnh sau khi phục hồi thông tin (Trang 75)
Hình 3.5. Ảnh gốc và ảnh sau khi nhúng tin  Hình 3.5 a, c là ảnh gốc, hình 3.5 b, d là ảnh sau khi nhúng dữ liệu “Trường Đại học  Công nghệ Thông tin và Truyền Thông” - nghiên cứu phương pháp giấu tin không làm mất thông tin trong ảnh chứa tin
Hình 3.5. Ảnh gốc và ảnh sau khi nhúng tin Hình 3.5 a, c là ảnh gốc, hình 3.5 b, d là ảnh sau khi nhúng dữ liệu “Trường Đại học Công nghệ Thông tin và Truyền Thông” (Trang 76)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w