Giấu thông tin bền vững sử dụng kỹ thuật trải phổ trong cơ sở dữ liệu không gian Tóm tắt Bài báo đề xuất một thuật toán watermarking số cho các dữ liệu không gian bằng cách sử dụng kỹ thuật trải phổ Một bit watermark được nhúng vào bằng cách thay đổi một tính chẵn lẻ của vetơ nhiễu giả ngẫu nhiên Thuật toán được thành lập cho điện kháng mạnh mẽ chống lại nhiễu ngẫu nhiên tăng cường , chuyển đổi tương tự và chènloại bỏ đỉnh, và, đến một mức độ nào, cắt xén Cùng một kết quả thử nghiệm được trình.
Trang 1Giấu thông tin bền vững sử dụng kỹ thuật
trải phổ trong cơ sở dữ liệu không gian
Tóm tắt: Bài báo đề xuất một thuật toán watermarking số cho các dữ liệu
không gian bằng cách sử dụng kỹ thuật trải phổ Một bit watermark được nhúng vào bằng cách thay đổi một tính chẵn lẻ của vetơ nhiễu giả ngẫu nhiên Thuật toán được thành lập cho điện kháng mạnh mẽ chống lại nhiễu ngẫu nhiên tăng cường , chuyển đổi tương tự và chèn/loại bỏ đỉnh, và, đến một mức độ nào, cắt xén Cùng một kết quả thử nghiệm được trình bày chi tiết để minh họa tính khả thi của phương pháp
I ĐẶT VẤN ĐỀ
Nhiều phương pháp giấu thông tin đang được nghiên cứu, mỗi phương pháp có những ưu điểm, nhược điểm và ứng dụng khác nhau Phương pháp sử dụng các bít trọng số nhỏ [4,6] đơn giản tuy nhiên thông tin giấu không bền vững trước nhiều hình thức tấn công Phương pháp sử dụng các hệ số biến đổi (chẳng hạn biến đổi từ miền không gian sang miền tần số như DCT [3], wavelet [2], DFT [5] ) nói chung có tính bền vững cao, tuy nhiên khá phức tạp trong cài đặt và khó kiểm soát chất lượng dữ liệu sử dụng làm môi trường giấu thông tin Phương pháp gán và sử dụng thuộc tính chẵn lẻ [9] có một số ưu điểm như đơn giản trong cài đặt, dễ kiểm soát chất lượng môi trường giấu tin, có độ bền vững cao trước nhiều hình thức tấn công Phương pháp này có hiệu quả cao khi áp dụng cho môi trường giấu tin không chịu nén tổn hao, có cho phép sai số, là môi trường đang được áp dụng rất rộng rãi hiện nay (các ảnh bitmap, các thiết kế kỹ thuật, bản đồ số 2 chiều, 3 chiều ) Trong bài này chúng tôi trình bày một phương pháp mới, có sử dụng kỹ thuật trải phổ để giấu thông tin trong cơ sở dữ liệu không gian với mục đích tăng cường độ bền vững và độ mật của tin giấu Mục II giới thiệu khái niệm về thông tin trải phổ, ứng dụng kỹ thuật trải phổ trong giấu thông tin Mục III trình bày khái niệm dữ liệu không gian, thuộc tính chẵn lẻ và khả năng mang tin giấu của dữ liệu không gian Mục IV trình bày phương pháp giấu thông tin trải phổ trong mô hình dữ liệu không gian Mục V minh họa một số kết quả thử nghiệm trên môi trường bản đồ số 2D
II KỸ THUẬT THÔNG TIN TRẢI PHỔ
Trải phổ được biết đến trong kỹ thuật thông tin liên lạc như một phương thức truyền tin Đặc điểm của hệ thống truyền thông trải phổ là độ rộng phổ của tín hiệu bị "trải" ra, lớn hơn nhiều lần so với tốc độ bit của thông tin cần truyền
Độ dư thừa của băng thông được sử dụng như một tiềm năng cho các phương
Trang 2pháp lập mã tự sửa sai, dẫn đến khả năng chống nhiễu cao của hệ thống thông tin trải phổ so với các phương pháp truyền tin khác Một thành phần quan trọng trong
kỹ thuật truyền tin trải phổ chính là chuỗi giả ngẫu nhiên Vì chuỗi này mang đặc trưng của nhiễu nên tín hiệu trải phổ có ưu thế về độbảo mật Các ưu điểm trên được khai thác trong các hệ thống truyền tin trong môi trường có nhiễu và đòi hỏi tính bảo mật cao của thông tin, đặc biệt trong các hệ thống đa truy nhập như điện thoại di động, mạng truyền dữ liệu không dây Ưu thế này đã được một số tác giả khai thác trong kỹ thuật giấu thông tin trong môi trường dữ liệu multimedia [1] Vấn đề cơ bản cần giải quyết trong kỹ thuật truyền thông trải phổ là tính đồng
bộ Quá trình giải điều chế tương quan sẽ không còn ý nghĩa nếu tín hiệu thu đượcvà chuỗi giả nhiễu không đồng bộ với nhau Mô hình dữ liệu không gian và phương pháp giấu tin đơn giản sử dụng thuộc tính chẵn lẻ đã được đề xuất trong [9] và được tóm tắt trong mục III
III MÔ HÌNH DỮ LIỆU KHÔNG GIAN .
1.Khái niệm về dữ liệu không gian
Quy ước sử dụng các ký tự có gạch ngang trên và hai ký hiệu ζ i và ξ i
(không có dấu gạch ngang trên) là các vectơ Chỉ số dưới ký hiệu thứ tự các phần
tử của một tập hợp, chỉ số trên (nếu có) ký hiệu các thành phần của vectơ
Ta quy ước gọi cơ sở dữ liệu (CSDL) mà trong đó mỗi bản ghi là một vectơ
ξ thuộc không gian n chiều R(n) (ξ R (n) ) là cơ sở dữ liệu không gian Về mặt hình học, mỗi vectơ này được biểu diễn thông qua một “điểm” thuộc không gian R(n) với ξ1 ∈R(n) , ξ2 ∈R(n) và δ∈R, δ≥0, ta xây dựng một δ-quan hệ như sau:quan hệ như sau:
Khi đó, δ mang ý nghĩa của sai số cho phép
Ký hiệu(r) ≡ (ξ m ,ξ M ) ≡ (ξ m ,ξ M = ξ m + r) là một “khối hộp” n-quan hệ như sau:chiều được giới hạn bởi điểm “dưới trái” ξ m (x1
m , x m2 , x m n ) và điểm “trên phải” ξ M (x1
M , x M2 , x M n ) , Ta nói đỉnh ξi ∈ (ξm , ξM) nếu {} ∀j ∈(1…n), xj
m ≤ xj
i ≤ xj
M Giả thiết khối hộp này có chứa D đỉnh (hay “node”) -quan hệ như sau: là các bản ghi thuộc cơ sở dữ liệu không gian Mục đích của chúng ta là xây dựng phương pháp giấu một bit thông
tin vào khối hộp ξ m ,ξ M nói trên, với giả thiết r j ≥ δ với mọi j {1 n}.
Chia không gian thành các “khối hộp đơn vị” như sau:
Chọn giá trị R ∈ σ , σ = f(K), (f là một hàm có biến phụ thuộc khoá K),
σ≤ δ Với mọi , ξi ∈R(n) xây dựng vetor
j i i
x
với mọi j ∈ (1…n)tức là ,
Trang 3ξi ∈Z(n) hay ξi thuộc không gian vector với các tọa độ nguyên, nói cách khác, ζ i là
ảnh của ξ i khi ánh xạ ξ i vào không gian vectơ tọa độ nguyên
Ký hiệu ξ (không có chỉ số) như tập hợp mọi vectơ thuộc không gian vectơ tọa độ thực và ζ (không có chỉ số) như tập hợp mọi vectơ thuộc không gian vectơ
tọa độ nguyên Để tránh sử dụng quá nhiều ký hiệu, ta cũng quy ước dùng các cụm
từ "vectơ ζ " hay "ζ " để chỉ một vectơ tọa độ nguyên và "không gian ζ " để chỉ
không gian tọa độ nguyên n-quan hệ như sau:chiều
Tạo một phân hoạch của không gian ζ :
ζ = U{ζ c ,ζ l }, trong đó:
Nhận xét: Tính chẵn lẻ của ζ thay đổi khi có một tọa độ nào đó thay đổi một đơn
vị -quan hệ như sau: hay một bước σ Trường hợp tổng quát, tính chẵn lẻ của ζ thay đổi khi ζ thay đổi từ ζ1 sang ζ2 nếu tổng số bước thay đổi của mọi tọa độ của ζ là:
Không gian ζ được chia thành các khối n-quan hệ như sau:chiều chẵn lẻ xen kẽ nhau (theo
mọi chiều của không gian) Ta gọi mỗi khối này là một khối chẵn lẻ đơn vị, hay khối hộp đơn vị, ký hiệu là (σ)
Ta quy định viết ξ i {ζ l } (tương ứngξ i {ζ c }), và hiểu rằng ξ i thuộc tập {ζ l }
(tương ứng, ξ i thuộc tập {ζ c }), với bước σ Bằng cách này, ta đã gán cho ξ i một
thuộc tính chẵn lẻ ứng với một đơn vị (hay một bước) σ
2 Thủ tục thay đổi tính chẵn lẻ trên không gian vectơ với các tọa độ nguyênζ
Ta có nhận xét sau:
Trang 4Thủ tục này thay đổi tính chẵn lẻ của ξ i trong khi vẫn giữ cho ξ i ∈ (v) và được sử dụng trong thuật toán giấu thông tin trình bày dưới đây
IV KỸ THUẬT GIẤU THÔNG TIN TRẢI PHỔ TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN
1 Giấu thông tin
1) Ký hiệu thông tin cần giấu là b, b {0,1}; Không sợ nhầm lẫn, sử dụng ký hiệu D
= {i i =1 D} là tập các chỉ số của {ξ }; V={ξ i }ξ i ξ m ,ξ M , i D (V là tập không có thứ tự các vectơ ξ thuộc khối r , được sử dụng làm môi trường chứa tin giấu) Giả thiết ξ i ∈V có phân phối chuẩn, độc lập thống kê Chọn giá trị θ R thoả điều kiện:
Chọn các cạnh của khối ( ξm, ξM ), sao cho mỗi cạnh có chứa số nguyên lần các đoạn θ :
Khi đó có thể chia khối hộp ( ξm, ξM ) thành
1
n j j
siêu khối vuông có kích thước θ
Ký hiệu siêu khối vuông này là θ và tập {( θij) }, i=1 n, j= 1 kj là tập có thứ tự các siêu khối (θ) thuộc ® Điều kiện của l trong (2) đảm bảo cho mỗi siêu khối (θ) có chứa ln siêu khối chẵn lẻ đơn vị σ Như vậy trong mỗi siêu khối (r) có chứa κ khối vuông (θ) và h = κ ln khối đơn vị (σ)
2) Dùng khoá giấu tin làm mầm (seed) để sinh một vectơ giả ngẫu nhiên w ∈{±
Trang 51}(k) , k/ θ ∈ N+ , κ sẽ được sử dụng với vai trò của hệ số trải phổ ở bước 3.
3) Thông tin cần giấu b được "trải phổ" thông qua phép biến đổi wm ← b*wr :
Dễ thấy wm∈{± 1}(k) , mỗi bit thông tin đã được trải thành k bit
4) Xây dựng vectơ θ có quan hệ 1/1 với wm : θ ↔ wm như sau:
Bằng cách này ta đã gán cho mỗi thành phần θ k một giá trị của w m k ,
nói cách khác: ∈{± 1}(k)
5) Với ∀ θ ∈ r , tạo phân hoạch {( θ)} = {( θ)+} ∪{( θ)-quan hệ như sau:}.Trong đó ( θ) ∈{( θ)+} nếu:
6)Với ∀ (θj) ∈ (r), ∀ξi ∈(θj) biến đổi vector ξi ∈V như sau: nếu
Tín hiệu watermark được thành lập qua các bước 1, 2 và 3 Bước 5, 6 thực hiện giấu 1 bit thông tin vào khối (ξm ,ξM )
2.Khôi phục thông tin
Tại thời điểm khôi phục thông tin, ta đã có (ξm ,ξM ), khoá K, các tham số r, θ ,k 1)Thực hiện như bước 2 của thuật toán giấu tin ta nhận được wr∈{± 1}(k) 2) Gọi J= {j |j = 1…k} là tập chỉ số cho các thành phần của wr
3) Thực hiện như bước 5 của thuật toán giấu tin, ta
nhận được phân hoạch:
Trang 64) Xây dựng vector ∈{± 1}(k) như sau:
Trong đó zlc ( ,wr) là tích vô hướng (tương quan tuyến tính) của và
w , nó nhận giá trị -quan hệ như sau:1 nếu b=0 và nhận giá trị +1 nếu b=1 nếu không có tấn công Khi có tấn công [9], tức là các ξi bị dịch chuyển
ngẫu nhiên trong phạm vi :
Ta có thể viết: ← 0 + Theo cách xây dựng trong các bước 2,3,4 của thuật toán giấu tin và giả thiết về tấn công [9], , , là các biến ngẫu nhiên, có phân bố chuẩn, độc lập thống kê Theo lý thuyết xác suất ta có:
Trang 7Từ đây ta nhận được kết quả: ∃T ≥ 0 để:
Vấn đề xác định ngưỡng T và lỗi bit vượt quá khuôn khổ bài báo này, sẽ được trình bày trong bài viết tiếp theo
V KẾT QUẢ CÀI ĐẶT VÀ THỬ NGHIỆM
Thuật toán giấu thông tin trong cơ sở dữ liệu không gian sử dụng thuộc tính chẵn lẻ theo phương pháp kiểm soát độ chênh lệch số lượng các bít chẵn lẻ đã được trình bày trong [9] Trong bài này thuật toán giấu tin vào dữ liệu không gian
có sử dụng kỹ thuật trải phổ được đề cập với mục tiêu tăng cường độ mật của bản tin giấu đồng thời vẫn giữ được tính bền vững trước các tấn công Thuật toán được cài đặt và thử nghiệm trên CSDL bản đồ số tỷ lệ 1:50.000 (2D) với giả thiết các tọa độ kinh và vĩ độ được phép sai số độ dài ∆=0.025km, sai số tọa độ
cho phép ∆λ, ∆ϕ được tính theo công thức (1) và (2) đã trình bày trong [9] Lấy δ
= α.min {∆λ,∆ϕ}=α.∆ϕ với α là hệ số quyết định khả năng che giấu
(undetectability) của thông tin Thực nghiệm được tiến hành trên 10.000 mẫu giấu bit 0; 10.000 mẫu giấu bit 1 và 10.000 mẫu không giấu thông tin Điều kiện tấn công: α=0.1; δ=1.59*10-quan hệ như sau:5
Hình 1: Kết quả thử nghiệm trên mẫu bản đồ số tỷ lệ 1:50.000 kích thước (0.01x0.01) 0
Bước 2 trong thuật toán giấu tin nhằm đảm bảo tính bảo mật, bước 3 đảm bảo khả năng tự sửa sai khi môi trường giấu tin bị tấn công, các bước 4 và 5 cho phép đồng bộ quá trình giấu và hồi phục thông tin -quan hệ như sau: một trong những vấn đề khó khăn và quan trọng cần giải quyết trong kỹ thuật truyền tin trải phổ Khi kích
Trang 8thước khối tăng lên (số đỉnh khoảng 1000) lỗi bit sẽ giảm đáng kể Hình 1 trình
bày kết quả thử nghiệm với khối không gian kích thước (0.01x0.01) độ (khoảng 1km2 trên bản đồ phẳng tỷ lệ 1:50.000), có chứa 909 đỉnh, số mẫu thử nghiệm là 10.000 Kết quả cho thấy lỗi bít trung bình không quá ba phần vạn (0.027%) cho
cả 3 trường hợp (không giấu, giấu bit 0 và giấu bit 1)
KẾT LUẬN
Phương pháp và các kết quả thử nghiệm đã được trình bày trong bài này cho thấy giấu thông tin bền vững sử dụng kỹ thuật thông tin trải phổ trong dữ liệu không gian là phương pháp khả thi Kết quả bài báo có thể tiếp tục được phát triển cho các ứng dụng giấu thông tin trong môi trường dữ liệu không gian nói riêng cũng như các ứng dụng giấu tin trong môi trường dữ liệu số nói chung
TÀI LIỆU THAM KHẢO
[1] I.J.COX ET AL., Secure Spread Spectrum
Watermarking of Images, Audio and Video, Proc IEEE International Conf on
Image Processing, ICIP-quan hệ như sau:96, Vol.3, pp 243-quan hệ như sau:246
[2] D KUNDUR, D HATZINAKOS, A Robust Digital Image Watermarking Method using Wavelet-Based Fusion, Toronto, Ontario, Canada M5S 3G4 [3] DICKINSON B., TAO B., Adaptive Watermarking in DCT Domain, Proc
of IEEE International Conf on Acoustics Speech and Signal Processing,
ICASSP-quan hệ như sau:97, Vol.4, pp.1985-quan hệ như sau:2988, 1997
[4] MARTIN KUTTER, FREDRIC JORDAN, FRANK BOSSEN, Digital Signature of Color Images using Amplitude Modulation, 1015 Lausanne
Switzerland, năm 2000
[5] M RAMKUMAR, ALI N AKANSU, A Robust Data Hiding Scheme for Images Using DFT, New Jersey Institute of Technology, Newark, NJ 07102 [6] R Z WANG, C F LIN, AND J C LIN Image Hiding by LSB
Substitution and Genetic Algorithm,
Proceedings of International Symposium on Multimedia Information
Processing, Chung-quan hệ như sau:Li, Taiwan, R.O.C, December 1998, 671-quan hệ như sau:683
[7] VŨ BA ĐÌNH, NGUYỄN XUÂN HUY, ĐÀO THANH TĨNH, Đánh giá
Trang 9khả năng giấu dữ liệu trong bản đồ số, Tạp chí Tin học và Điều khiển học, số
4/2000, 347-quan hệ như sau:353
[8] VŨ BA ĐÌNH, NGUYỄN XUÂN HUY, ĐÀO THANH TĨNH, Kỹ thuật giấu dữ liệu trong bản đồ số, Chuyên san Bưu chính Viễn thông, số 8/2002,
85-quan hệ như sau:92
[9] VŨ BA ĐÌNH, Giấu thông tin trong cơ sở dữ liệu không gian, Tạp chí
nghiên cứu khoa học kỹ thuật và công nghệ Quân sự, số 4, 30-quan hệ như sau:37