VIỆN ĐÀO TẠO SAU ĐẠI HỌC TIỂU LUẬN KỸ THUẬT TRẢI PHỔ VÀ ỨNG DỤNG THUẬT TRẢI PHỔ TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN Giảng viên hướng dẫn : PGS.TS NGUYỄN HỮU TRUNG Học viên : NGUYỄN NGỌC
Trang 1VIỆN ĐÀO TẠO SAU ĐẠI HỌC
TIỂU LUẬN
KỸ THUẬT TRẢI PHỔ VÀ ỨNG DỤNG
THUẬT TRẢI PHỔ TRONG CƠ SỞ DỮ LIỆU
KHÔNG GIAN
Giảng viên hướng dẫn : PGS.TS NGUYỄN HỮU TRUNG Học viên : NGUYỄN NGỌC ANH
MSHV : CB111487
Trang 2Abstract: This paper proposes a digital watermarking
algorithm for space data using spread spectrum technic A
watermark bit is embedded by changing a parity of the
pseudo-random noise vector The algorithm is established
for robust resistance against additive random noise,
similarity transformation, and vertex insertion/removal,
and, to some extent, cropping Same experimental results
are expounded in order to illustrate practicability of the
method
I ĐẶT VẤN ĐỀ
Nhiều phương pháp giấu thông tin đang được
nghiên cứu, mỗi phương pháp có những ưu điểm,
nhược điểm và ứng dụng khác nhau Phương pháp sử
dụng các bít trọng số nhỏ [4,6] đơn giản tuy nhiên
thông tin giấu không bền vững trước nhiều hình thức
tấn công Phương pháp sử dụng các hệ số biến đổi
(chẳng hạn biến đổi từ miền không gian sang miền tần
số như DCT [3], wavelet [2], DFT [5] ) nói chung có
tính bền vững cao, tuy nhiên khá phức tạp trong cài
đặt và khó kiểm soát chất lượng dữ liệu sử dụng làm
môi trường giấu thông tin Phương pháp gán và sử
dụng thuộc tính chẵn lẻ [9] có một số ưu điểm như
đơn giản trong cài đặt, dễ kiểm soát chất lượng môi
trường giấu tin, có độ bền vững cao trước nhiều hình
thức tấn công Phương pháp này có hiệu quả cao khi
áp dụng cho môi trường giấu tin không chịu nén tổn
hao, có cho phép sai số, là môi trường đang được áp
dụng rất rộng rãi hiện nay (các ảnh bitmap, các thiết
kế kỹ thuật, bản đồ số 2 chiều, 3 chiều ) Trong bài này chúng tôi trình bày một phương pháp mới, có sử dụng kỹ thuật trải phổ để giấu thông tin trong cơ sở
dữ liệu không gian với mục đích tăng cường độ bền vững và độ mật của tin giấu Mục II giới thiệu khái niệm về thông tin trải phổ, ứng dụng kỹ thuật trải phổ trong giấu thông tin Mục III trình bày khái niệm dữ liệu không gian, thuộc tính chẵn lẻ và khả năng mang tin giấu của dữ liệu không gian Mục IV trình bày phương pháp giấu thông tin trải phổ trong mô hình dữ liệu không gian Mục V minh họa một số kết quả thử nghiệm trên môi trường bản đồ số 2D
II KỸ THUẬT THÔNG TIN TRẢI PHỔ
Trải phổ được biết đến trong kỹ thuật thông tin liên lạc như một phương thức truyền tin Đặc điểm của hệ thống truyền thông trải phổ là độ rộng phổ của tín hiệu bị "trải" ra, lớn hơn nhiều lần so với tốc độ bit của thông tin cần truyền Độ dư thừa của băng thông được sử dụng như một tiềm năng cho các phương pháp lập mã tự sửa sai, dẫn đến khả năng chống nhiễu cao của hệ thống thông tin trải phổ so với các phương pháp truyền tin khác Một thành phần quan trọng trong kỹ thuật truyền tin trải phổ chính là chuỗi giả ngẫu nhiên Vì chuỗi này mang đặc trưng của nhiễu nên tín hiệu trải phổ có ưu thế về độ bảo mật Các ưu điểm trên được khai thác trong các hệ thống truyền tin trong môi trường có nhiễu và đòi hỏi tính bảo mật cao
Giấu thông tin bền vững sử dụng kỹ thuật trải phổ trong cơ sở dữ liệu không gian
A Robust Watermarking Algorthm for Space Data Using
Spread Spectrum Technic
Trang 3của thông tin, đặc biệt trong các hệ thống đa truy nhập
như điện thoại di động, mạng truyền dữ liệu không
dây Ưu thế này đã được một số tác giả khai thác
trong kỹ thuật giấu thông tin trong môi trường dữ liệu
multimedia [1] Vấn đề cơ bản cần giải quyết trong kỹ
thuật truyền thông trải phổ là tính đồng bộ Quá trình
giải điều chế tương quan sẽ không còn ý nghĩa nếu tín
hiệu thu được và chuỗi giả nhiễu không đồng bộ với
nhau Mô hình dữ liệu không gian và phương pháp
giấu tin đơn giản sử dụng thuộc tính chẵn lẻ đã được
đề xuất trong [9] và được tóm tắt trong mục III
III MÔ HÌNH DỮ LIỆU KHÔNG GIAN
1 Khái niệm về dữ liệu không gian
Quy ước sử dụng các ký tự có gạch ngang trên và
hai ký hiệu ζi và ξi (không có dấu gạch ngang trên)
là các vectơ Chỉ số dưới ký hiệu thứ tự các phần tử
của một tập hợp, chỉ số trên (nếu có) ký hiệu các
thành phần của vectơ
Ta quy ước gọi cơ sở dữ liệu (CSDL) mà trong đó
mỗi bản ghi là một vectơ ξ thuộc không gian n chiều
R(n) (ξ∈R (n)) là cơ sở dữ liệu không gian Về mặt
hình học, mỗi vectơ này được biểu diễn thông qua
một "điểm" thuộc không gian R( )n Vớiξ1∈R(n),
)
(
2∈R n
ξ và δ∈R, δ≥0, ta xây dựng một δ-quan hệ
(⇔ ) như sau: δ
⎭
⎬
⎫
⎩
⎨
⎧
1 ξ
ξ δ ⇔ {∀i= n;ξ1i−ξ2i ≤δ}
Khi đó δ mang ý nghĩa của sai số cho phép
Ký hiệu r ≡ ξm,ξM ≡ ξm,ξM =ξm+r là một
“khối hộp” n-chiều được giới hạn bởi điểm “dưới trái”
)
,
,
m
m
m
M M M
M x x x
trong đó x M j =x m j +r j Ta nói đỉnh ξi∈ ξm,ξM
M
j i
j
x
n
thuộc cơ sở dữ liệu không gian Mục đích của chúng
ta là xây dựng phương pháp giấu một bit thông tin vào khối hộp ξm, ξM nói trên, với giả thiết r j ≥δ với
mọi j∈{1 n}
Chia không gian thành các “khối hộp đơn vị” như sau:
Chọn giá trị σ∈R, σ = f (K), (f là một hàm có biến phụ thuộc khoá K), σ ≤ Với mọi δ (n)
i∈R
ξ xây dựng vectơ
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎥
⎥
⎦
⎥
⎢
⎢
⎣
⎢
= σ
i x với mọi j∈{1 n}- tức là
)
(n
i∈Z
ζ hay ζi thuộc không gian vectơ với các tọa
độ nguyên, nói cách khác, ζi là ảnh của ξi khi ánh
xạ ξi vào không gian vectơ tọa độ nguyên
Ký hiệu ξ(không có chỉ số) như tập hợp mọi vectơ thuộc không gian vectơ tọa độ thực và ζ (không có chỉ số) như tập hợp mọi vectơ thuộc không gian vectơ tọa độ nguyên Để tránh sử dụng quá nhiều ký hiệu, ta cũng quy ước dùng các cụm từ "vectơ ζ " hay "ζ " để chỉ một vectơ tọa độ nguyên và "không gian ζ " để chỉ không gian tọa độ nguyên n-chiều
{ζc ζl}
ζ =U , , trong đó:
- ζ∈{ }ζc nếu ∑
= ⎟⎟⎠
⎞
⎜
⎜
⎝
⎛
⎥
⎥
⎦
⎥
⎢
⎢
⎣
⎢
n j
j
x
1 σ là số chẵn;
- ζ∈{ }ζl nếu ∑
= ⎟⎟⎠
⎞
⎜
⎜
⎝
⎛
⎥
⎥
⎦
⎥
⎢
⎢
⎣
⎢
n j
j
x
1 σ là số lẻ
Nhận xét: Tính chẵn lẻ của ζ thay đổi khi có một tọa độ nào đó thay đổi một đơn vị - hay một bước σ Trường hợp tổng quát, tính chẵn lẻ của ζ thay đổi khi ζ thay đổi từ ζ sang 1 ζ nếu tổng số bước thay 2 đổi của mọi tọa độ của ζ là:
Trang 4⎟
⎠
⎞
⎜
⎜
⎜
⎝
⎛
⎥
⎥
⎥
⎦
⎥
⎢
⎢
⎢
⎣
=
j
j
x
1
1 2
σ là một số lẻ (1) Không gian ζ được chia thành các khối n-chiều
chẵn lẻ xen kẽ nhau (theo mọi chiều của không gian)
Ta gọi mỗi khối này là một khối chẵn lẻ đơn vị, hay
khối hộp đơn vị, ký hiệu là σ
Ta quy định viết ξi∈{ } ζl (tương ứngξi∈{ } ζc ),
và hiểu rằng ξi thuộc tập { } ζl (tương ứng, ξi thuộc
tập { } ζc ), với bước σ Bằng cách này, ta đã gán cho
i
ξ một thuộc tính chẵn lẻ ứng với một đơn vị (hay
một bước) σ
2 Thủ tục thay đổi tính chẵn lẻ trên không gian
vectơ với các tọa độ nguyênζ
Ta có nhận xét sau:
{ }
{ } )
¸ , min
=
:
¸ Î
,
¸
Í
n j σ
x σ
x σ
x
σ
x
n k
v
ξ
j j k
k
i
Thủ tục Parity_Change(ξi, v )
If (⎣ ⎦ ⎣ ⎦k
M
k
i k
i x x
Else: ←( k+σ)
i k
i x
x
Thủ tục này thay đổi tính chẵn lẻ của ξi trong khi
vẫn giữ cho ξi∈ v và được sử dụng trong thuật
toán giấu thông tin trình bày dưới đây
IV KỸ THUẬT GIẤU THÔNG TIN TRẢI PHỔ
TRONG CƠ SỞ DỮ LIỆU KHÔNG GIAN
1 Giấu thông tin
1) Ký hiệu thông tin cần giấu là b, b∈{ }0,1 ; Không
sợ nhầm lẫn, sử dụng ký hiệu D={i= D} là tập các
chỉ số của { }ξ ; V={ }ξi ξi∈ξm,ξM , i∈D (V là tập
không có thứ tự các vectơ ξ thuộc khối r , được sử
dụng làm môi trường chứa tin giấu) Giả thiết ξi∈V
có phân phối chuẩn, độc lập thống kê Chọn giá trị
R
∈
θ thoả điều kiện:
σ θ σ
θ =l ;l∈N+; ≥2 (2)
Chọn các cạnh của khối ξm,ξM sao cho mỗi cạnh
có chứa số nguyên lần các đoạn θ:
+
∈
=
=
θ
Khi đó ta có thể chia siêu khối hộp ξm,ξM thành
∏
=
= n
j
j
k
1
κ siêu khối vuông có kích thước θ
Ký hiệu siêu khối vuông này là θ và tập
ij , i = n , j = k
khối θ thuộc r Điều kiện của l trong (2) đảm bảo cho mỗi siêu khối θ có chứa l nsiêu khối chẵn
lẻ đơn vị σ Như vậy trong mỗi siêu khối r có chứa κkhối vuông θ và h=κ.l n khối đơn vị σ 2) Dùng khoá giấu tin làm mầm (seed) để sinh một vectơ giả ngẫu nhiên w r∈{ }±1( )κ , ∈ N+,
θ
κ κsẽ được sử dụng với vai trò của hệ số trải phổ ở bước 3 3) Thông tin cần giấu b được "trải phổ" thông qua phép biến đổi w m ←b∗w r:
r
m w
w = nếu (b=1) (4)
r
w =− nếu (b=0) (5)
Dễ thấy w m∈{ }±1( )κ , mỗi bit thông tin đã được
"trải" thành κ bit
4) Xây dựng vectơ θ có quan hệ 1/1 với w m:
m w
↔
m ij k
k j n i
Bằng cách này ta đã gán cho mỗi thành phần
Trang 5θ một giá trị của w m k , nói cách khác: θ ∈{ }±1( )κ
5) Với ∀ θ ∈ r , tạo phân hoạch
{ }
⎭⎬
⎫
⎩⎨
∪
⎭⎬
⎫
⎩⎨
θi =1 và θ ∈{ }θ − nếu θi =−1
6) Với ∀θj ∈ r ,∀ξi∈ θj , biến đổi vector
V
i∈
ξ như sau: If
{ }l j i { }c
i
⎭⎬
⎫
⎩⎨
∈
∨
∈
∧
⎭⎬
⎫
⎩⎨
∈
: Parity_Change(ξi, θj ) (6)
Tín hiệu watermark được thành lập qua các bước 1,
2 và 3 Bước 5, 6 thực hiện giấu 1 bit thông tin vào
khối ξm,ξM
2 Khôi phục thông tin
Tại thời điểm khôi phục thông tin, ta đã có
M
ξ , , khoá K, các tham số r,θ,κ
1) Thực hiện như bước 2 của thuật toán giấu tin ta
nhận được w r∈{ }±1( )κ
2) Gọi J = { j j = κ } là tập chỉ số cho các thành
phần của wr
3) Thực hiện như bước 5 của thuật toán giấu tin, ta
nhận được phân hoạch:
{ } { } ⎭⎬⎫
⎩⎨
∪
1
−
=
i
4) Xây dựng vectơ θ ∈{ }±1( )κ như sau:
1
∈
{ } i { }c i { } i { }l
i
iξ ∈ θ ∧ξ ∈ ζ ∨ξ ∈ θ ∧ξ ∈ ζ
θj =−1 nếu
{ } i { }l i { } i { }c
i
iξ ∈ θ ∧ξ ∈ ζ ∨ξ ∈ θ ∧ξ ∈ ζ
=
=
κ
θ κ
θ
1
1 1 ,
j
j j r
r
Trong đó z lc( θ,w r) là tích vô hướng (tương quan tuyến tính) của θ và w, nó nhận giá trị -1 nếu b=0
và nhận giá trị +1 nếu b=1 nếu không có tấn công Khi có tấn công [9], tức là cácξi bị dịch chuyển ngẫu nhiên trong phạm vi τ :
i i
ξ ← + ↔
δ τ τ ξ
ξi j ← i j+ i j; i j ≤ ;i∈{1,2, D};j∈{1,2, n}
Ta có thể viết: θ ←θ0+τ Theo cách xây dựng
θ trong các bước 2,3,4 của thuật toán giấu tin và giả thiết về tấn công [9], τ,θ là các biến ngẫu nhiên, có phân bố chuẩn, độc lập thống kê Theo lý thuyết xác suất ta có:
⎠
⎞
⎜
⎝
⎛ +
= +
=
κ
σ θ
κ τ
θ κ
θ,w 1( 0.w w ) 1( 0.w ) N 0,
Từ đây ta nhận được kết quả: ∃T≥0 để:
( r)
z θ, >T:b=1; (7a)
( ,w )<−T:b=0
( ,w ) T:
z
Vấn đề xác định ngưỡng T và lỗi bit vượt quá
khuôn khổ bài báo này, sẽ được trình bày trong bài
viết tiếp theo
V KẾT QUẢ CÀI ĐẶT VÀ THỬ NGHIỆM
Thuật toán giấu thông tin trong cơ sở dữ liệu không gian sử dụng thuộc tính chẵn lẻ theo phương pháp kiểm soát độ chênh lệch số lượng các bít chẵn lẻ đã được trình bày trong [9] Trong bài này thuật toán giấu tin vào dữ liệu không gian có sử dụng kỹ thuật trải phổ được đề cập với mục tiêu tăng cường độ mật của bản tin giấu đồng thời vẫn giữ được tính bền vững trước các tấn công Thuật toán được cài đặt và thử nghiệm trên CSDL bản đồ số tỷ lệ 1:50.000 (2D) với giả thiết các tọa độ kinh và vĩ độ được phép sai số độ dài ∆=0.025km, sai số tọa độ cho phép ∆λ, ∆ϕ được
Trang 6tính theo công thức (1) và (2) đã trình bày trong [9]
Lấy δ = α min { ∆ λ , ∆ ϕ } = α ∆ ϕ với α là hệ số
quyết định khả năng che giấu (undetectability) của
thông tin Thực nghiệm được tiến hành trên 10.000
mẫu giấu bit 0; 10.000 mẫu giấu bit 1 và 10.000 mẫu
không giấu thông tin Điều kiện tấn công: α=0.1;
δ=1.59*10-5
Hình 1: Kết quả thử nghiệm trên mẫu bản đồ số
tỷ lệ 1:50.000 kích thước (0.01x0.01) 0
Bước 2 trong thuật toán giấu tin nhằm đảm bảo tính
bảo mật, bước 3 đảm bảo khả năng tự sửa sai khi môi
trường giấu tin bị tấn công, các bước 4 và 5 cho phép
đồng bộ quá trình giấu và hồi phục thông tin - một
trong những vấn đề khó khăn và quan trọng cần giải
quyết trong kỹ thuật truyền tin trải phổ Khi kích
thước khối tăng lên (số đỉnh khoảng 1000) lỗi bit sẽ
giảm đáng kể Hình 1 trình bày kết quả thử nghiệm
với khối không gian kích thước (0.01x0.01) độ
(khoảng 1km2 trên bản đồ phẳng tỷ lệ 1:50.000), có
chứa 909 đỉnh, số mẫu thử nghiệm là 10.000 Kết quả
cho thấy lỗi bít trung bình không quá ba phần vạn
(0.027%) cho cả 3 trường hợp (không giấu, giấu bit 0
và giấu bit 1)
VI KẾT LUẬN
Phương pháp và các kết quả thử nghiệm đã được
trình bày trong bài này cho thấy giấu thông tin bền
vững sử dụng kỹ thuật thông tin trải phổ trong dữ liệu
không gian là phương pháp khả thi Kết quả bài báo
có thể tiếp tục được phát triển cho các ứng dụng giấu thông tin trong môi trường dữ liệu không gian nói riêng cũng như các ứng dụng giấu tin trong môi trường dữ liệu số nói chung
TÀI LIỆU THAM KHẢO
[1] I.J.COX ET AL., Secure Spread Spectrum
Watermarking of Images, Audio and Video, Proc
IEEE International Conf on Image Processing,
ICIP-96, Vol.3, pp 243-246
[2] D KUNDUR, D HATZINAKOS, A Robust Digital
Image Watermarking Method using Wavelet-Based Fusion, Toronto, Ontario, Canada M5S 3G4
[3] DICKINSON B., TAO B., Adaptive Watermarking in
DCT Domain, Proc of IEEE International Conf on
Acoustics Speech and Signal Processing, ICASSP-97, Vol.4, pp.1985-2988, 1997
[4] MARTIN KUTTER, FREDRIC JORDAN, FRANK
BOSSEN, Digital Signature of Color Images using
Amplitude Modulation, 1015 Lausanne Switzerland,
năm 2000
[5] M RAMKUMAR, ALI N AKANSU, A Robust Data
Hiding Scheme for Images Using DFT, New Jersey
Institute of Technology, Newark, NJ 07102
[6] R Z WANG, C F LIN, AND J C LIN Image
Hiding by LSB Substitution and Genetic Algorithm,
Proceedings of International Symposium on Multimedia Information Processing, Chung-Li, Taiwan, R.O.C, December 1998, 671-683
[7] VŨ BA ĐÌNH, NGUYỄN XUÂN HUY, ĐÀO
THANH TĨNH, Đánh giá khả năng giấu dữ liệu trong
bản đồ số, Tạp chí Tin học và Điều khiển học, số
4/2000, 347-353
[8] VŨ BA ĐÌNH, NGUYỄN XUÂN HUY, ĐÀO
THANH TĨNH, Kỹ thuật giấu dữ liệu trong bản đồ
số, Chuyên san Bưu chính Viễn thông, số 8/2002,
85-92
[9] VŨ BA ĐÌNH, Giấu thông tin trong cơ sở dữ liệu
không gian, Tạp chí nghiên cứu khoa học kỹ thuật và
công nghệ Quân sự, số 4, 30-37