Ẩn dữ liệu trên âm thanh số
Trang 1TR NG I H C KHOA H C T NHIÊN TP H CHÍ MINH
KHOA CÔNG NGH THÔNG TIN
KHÓA LU N T T NGHI P
N D LI U TRÊN
ÂM THANH S
Giáo viên h ng d n: Ti n s Lê Hoài B c
Sinh viên th c hi n: L u Khoa MSSV: 0112099
Lê Th Hoàng Ngân MSSV: 0112060
Thành ph H Chí Minh 7/2005
Trang 2c l c
C L C
Ch ng 1 M U 13
1.1 Nhu c u n d li u hi n nay 14
1.2 c tiêu c a tài 15
1.3 Yêu c u 16
1.4 Môi tr ng cài t 16
1.5 c c lu n v n 16
Ch ng 2 T NG QUAN 18
Ch ng 3 C S LÝ THUY T 20
3.1 NG QUAN N D LI U 21
3.1.1 nh ngh a 21
3.1.2 Các i t ng 22
3.1.3 Mô hình t ng quát c a bài toán 23
3.1.4 Các yêu c u trong m t bài toán n d li u 25
3.1.5 Phân lo i 27
3.2 NG QUAN V STEGANOGRAPHY 32
3.2.1 Mô hình bài toán 32
3.2.2 ch s phát tri n 33
3.2.3 Phân lo i 34
3.3 NG QUAN V WATERMARKING S 43
3.3.1 nh ngh a 43
3.3.2 ch s phát tri n 44
3.3.3 Phân lo i 45
3.3.4 Các yêu c u trong m t bài toán Watermarking 49
3.3.5 ng d ng c a Watermarking 50
3.4 N D LI U TRÊN AUDIO 51
3.4.1 Gi i thi u 51
3.4.2 Phân lo i 52
3.5 LÝ TÍN HI U S 65
3.5.1 i c ng v tín hi u và nhi u 65
3.5.2 y m u và khôi ph c tín hi u 69
3.5.3 Phân tích Fourier 73
3.6 LÝ THUY T TR I PH 86
3.6.1 Gi i thi u chung 86
3.6.2 l c l ch s phát tri n 87
3.6.3 c m c a tr i ph 89
3.6.4 t ph công su t 93
3.6.5 Chu i gi ng u nhiên 95
3.6.6 u ch s d ch pha BPSK 99
Trang 3c l c
3.6.7 nh h ng c a nhi u tr ng trong truy n thông 102
3.6.8 nh h ng c a nhi u Jammer trong truy n thông 103
3.6.9 Các h th ng tr i chu i tr c ti p 106
Ch ng 4 CH NG TRÌNH TH C HI N 121
4.1 WATERMARKING TRÊN AUDIO B NG PH NG PHÁP TR I PH T H P MÔ HÌNH THÍNH GIÁC 122
4.1.1 Gi i thi u 122
4.1.2 Mô hình thính giác 122
4.1.3 Quá trình t o và nhúng Watermark 131
4.1.4 Quá trình rút trích 146
4.2 WATERMARKING TRÊN ÂM THANH S B NG PH NG PHÁP NG T HÓA CH M C 151
4.2.1 Mô hình bài toán 151
4.2.2 Ph ng pháp u ch bit th p t ng quát 152
4.2.3 Ph ng pháp l ng t hóa ch m c 153
Ch ng 5 SO SÁNH ÁNH GIÁ 163
5.1 Gi i thi u 164
5.2 Ki m tra tính trong su t 164
5.3 Ki m tra tính b n v ng 165
5.3.1 Chuy n i nh d ng file 165
5.3.2 Bi n i t n s l y m u 167
5.3.3 Bi n i s l ng bit m u 167
5.3.4 Bi n i biên 167
5.3.5 c thông cao 167
5.3.6 Thêm nhi u Gauss 167
5.3.7 d li u ki m tra 169
Trang 4Danh sách hình v
DANH SÁCH HÌNH V
Hình 1 Mô hình ân d li u trên nh 21
Hình 2 Mô hình t ng quan quá trình nhúng 24
Hình 3 Mô hình t ng quan quá trình trích .24
Hình 4 M i t ng quan gi a ba tiêu chí 26
Hình 5 Phân lo i n d li u theo Chen.LongJi 28
Hình 6 Phân lo i n d li u theo De Vlccschouwer 29
Hình 7 Phân lo i n d li u theo B.Pflizmann 29
Hình 8 Bài toán ng i tù 32
Hình 9 Phân lo i Steganography theo B.Pflizmann 34
Hình 10 n d li u theo Linguistic Steganography 35
Hình 11 Phân lo i theo Neil F.Johnson và Stefan C.Katzenbeisser 35
Hình 12 Watermark trên gi y c nh t c tìm th y 44
Hình 13 Phân lo i Watermarking theo B.Pflizmann 45
Hình 14 Nhúng logo vào nh 46
Hình 15 Nhúng logo vào ti n gi y 46
Hình 16 Nhúng logo vào nh 46
Hình 17 Phân lo i Watermarking theo kh n ng ch ng ch u t n công .47
Hình 18 Phân lo i theo c tính rút .48
Hình 19 Mô hình rút trích Nonblind Watermarking 48
Hình 20 Mô hình rút trích Semiblind Watermarking 49
Hình 21 Mô hình rút trích Semiblind Watermarking 49
Hình 22 Phân lo i trên s c n thi t c a khóa .49
Hình 23 Phân lo i Watermarking trên Audio 52
Hình 24 Ý t ng c a ph ng pháp tr i ph truy n th ng .55
Hình 25 Ti n x lý tín hi u âm thanh Watermark .56
Hình 26 n d li u theo ph ng pháp echo .62
Trang 5Danh sách hình v
Hình 27 u ch nh t l th i gian trong Watermarking .64
Hình 28 Hình v minh ho cho sóng c a m t tín hi u .65
Hình 29 Nhi u phân b u 66
Hình 30 Nhi u phân b Guassian .66
Hình 31 Các lo i sóng c a tín hi u .67
Hình 32 Bi u di n tín hi u theo to c c 68
Hình 33 Liên h p ph c c a tín hi u x(t) 68
Hình 34 Mô hình l y m u 69
Hình 35 y m u tín hi u v i các chu k khác nhau 70
Hình 36 ch ng l p ph 71
Hình 37 ch l y m u lý t ng t n s fs 72
Hình 38 Ph c a tín hi u khi dùng ti n l c lý t ng .72
Hình 39 Ti n l c ch ng bi t danh th c t 72
Hình 40 th ng l y m u quá m c và tiêu h y 73
Hình 41 Các d ng tri n khai c a tín hi u 77
Hình 42 n ph biên c a tín hi u 78
Hình 43 Thành ph n o, thành ph n th c và t n ph c a tín hi u .79
Hình 44 Ph c a sóng vuông .81
Hình 45 áp ng xung .84
Hình 46 Ph n th c, ph n o, góc pha, l n c a áp ng xung t n s 85
Hình 47 a s WinTool 86
Hình 48 Mô hình h th ng thông tin tr i ph 88
Hình 49 Tín hi u liên t c t o t ng quan x(t), v(t) 90
Hình 50 Tín hi u t ng quan Rxv c a hai tín hi u li n t c 91
Hình 51 Tín hi u r i r c t o t ng quan x(t), v(t) 91
Hình 52 Tín hi u t ng quan Rxv c a hai tín hi u r i r c .92
Hình 53 Tín hi u t t ng quan .92
Hình 54 Tín hi u x(t) và tín hi u t t ng quan 94
Trang 6Danh sách hình v
Hình 55 t công su t ph c a tín hi u 95
Hình 56 ch thanh ghi d ch c s 2 .96
Hình 57 Tín hi u PN 97
Hình 58 Hàm t ng t c a chu i PN 98
Hình 59 Ph tín hi u BPSK 100
Hình 60 ch gi i u bi n BPSK 102
Hình 61 th ng truy n thông tr i ph cô b n 103
Hình 62 t Jammer toàn ph n b ng thông 105
Hình 63 t Jammer m t ph n b ng thông 105
Hình 64 Ph c a tín hi u BPSK 107
Hình 65 Ph c a tín hi u BPSK sau khi tr i 108
Hình 66 u bi n BPSK truy n th ng 109
Hình 67 u bi n BPSK c i ti n 109
Hình 68 u bi n BPSK c i ti n v i N=7 109
Hình 69 DS/BPSK không mã hoá v i t n công c a nhi u Jammer 110
Hình 70 So sánh giá tr c a xác su t l i Pb v i Eb/NJ 113
Hình 71 Công su t nhi u c nh ρ =1 và tr ng h p ρ ρ= * 114
Hình 72 Các tín hi u tr c khi tr i 115
Hình 73 Các tín hi u sau khi tr i 116
Hình 74 th ng l p mã DS/BPSK 116
Hình 75 Mô hình gi l p h thính giác ng i 123
Hình 76 ng cong c a ng ng ng y trang 124
Hình 77 Liên h gi a t n s và Bark hai d ng: tuy n tính (a) và logarithm (b) 124
Hình 78 ng cong ng ng ng y trang theo n v Barks 125
Hình 79 Công su t ph và n ng l ng critical band 126
Hình 80 Các ng tr i ph c a tín hi u nhi u trong b ng thông h p 126
Hình 81 Hàm tr i 127
Hình 82 ng l ng trên m i critical band 127
Trang 7Danh sách hình v
Hình 83 Ng ng ng y trang thô Traw 129
Hình 84 Ng ng ng y trang ã chu n hóa và ng ng nghe 129
Hình 85 ng h p thu t toán t o và nhúng Watermark 132
Hình 86 ng h p quá trình t o ng ng chu n hoá 132
Hình 87 th ng t o Watermark 133
Hình 88 Các tham s c a h th ng baseband 135
Hình 89 Các tham s c a h th ng passband 135
Hình 90 th ng passband v i t n s gi i h n trong LF và HF 136
Hình 91 Các tín hi u trên mi n th i gian 137
Hình 92 Các n audio và wateramark 137
Hình 93 Tín hi u s(t) và c a s Hamming w(t) 139
Hình 94 Tín hi u sau khi qua c s Hamming sw(t) 139
Hình 95 Bi u di n l n c a Sw(j ) 140
Hình 96 ng l ng trên m i critical band Spz(z) 140
Hình 97 ng l ng trên m i critical band 141
Hình 98 Hàm tr i B(z) 141
Hình 99 ng l ng tr i trên m i critical band Smz(z) 141
Hình 100 Ng ng ng y trang thô Traw(z) 143
Hình 101 Ng ng ng y trang ã c chu n hoá Tnorm(z) 143
Hình 102 Tín hi u Xwnew(j ) tr c khi c t 144
Hình 103 Tín hi u Xwnew(j ) tr c sau c t v i A = 0.4 145
Hình 104 Công su t ph tín hi u Swnew(j ) v i ng ng ng y trang cu i 145
Hình 105 Công su t ph tín hi u Xfinal(j ) v i ng ng ng y trang cu i 146
Hình 106 Công su t ph tín hi u OUT(j )) v i ng ng ng y trang cu i 146
Hình 107 Sóng c a det(t) 149
Hình 108 Gi i tr i tín hi u Watermark 150
Hình 109 Mô hình bài toán 151
Hình 110 ng t hóa x v i giá tr l ng t có b c l ng t /2 153
Trang 8Danh sách hình v
Hình 111 Hai hàm chung b nh danh m 154
Hình 112 ng t hóa ch m c QIM ng v i N = 2 và R = ½ 155
Hình 113 Mô hình không gian nhúng c a LBM 157
Hình 114 Nhúng m t bit b ng hàm nhúng m t chi u theo LBM 157
Hình 115 Nhúng m t bit b ng hàm nhúng m t chi u theo LBM 157
Hình 116 Gi i thu t nhúng Watermark theo ph ng pháp u ch dither 160
Hình 117 Gi i mã theo ph ng pháp u ch dither 161
Hình 118 u bi n Dither v i kích th c l ng t gi ng nhau 162
Hình 119 u ch STDM 162
Hình 120 Phép chuy n sang nh d ng CDA 165
Trang 9Danh sách các b ng
DANH SÁCH CÁC B NG
ng 1 Tình hình th t thu các n c ông Nam Á [1] 14
ng 2 ng tính toán m t 38
ng 3 Phân tích các n ch y c a tín hi u PN 98
ng 4 Th ng kê k t qu rút trích Watermark khi ch a b t n công 168
ng 5 Th ng kê k t qu rút trích Watermark khi ã b t n công 168
Trang 10Thu t ng
THU T NG
HAS Human Auditory System: h thính giác c a ng i
HVS Human Visuality System: h th giác c a ng i
STDM Spread Transform Dither Modulation: u ch tr i bi n i Dither
DM Dither Modulation: u ch dither
dB Decibel
DFT Discrete Fourier Transform: Bi n i Fourier r i r c
FIR Finite Duration Inpulse: áp ng xung lâu h u h n
FFT Fast Fourier Transform: Bi n i Fourier nhanh
IIR Infinite Duration Inpulse: áp ng xung lâu vô h n
PDF Probability Distribution Function: Hàm m t xác su t
PSD Power Spectrial Density: M t ph công su t
BPSK Binary Phase Shift Keying: u ch khoá chuy n pha c s hai
CDMA Code Divesion Multiple Access: a thâm nh p phân chia theo mã
DS Direct Sequence: Chu i tr c ti p
DS/SS Direct Sequence/ Spread Spectrum: Tr i ph chu i tr c ti p
PDF Probability Density Function: Hàm m t xác su t
PSD Probability Spectral Density: M t công su t
PN Pseudo Noise: Gi t p âm
QPSK Quandrature Phase Shift Keying: u ch khóa chuy n pha vuông góc.SNR Signal to Noise Ratio: T s tín hi u trên t p âm
SS Spread Spectrum: Tr i Ph
Robust Tính b n v ng
Fragile Tính d v
Blind Watermarking Watermarking không c n tín hi u g c
Nonblind Watermarking Watermarking c n d li u g c
FingerPrinting In d u vân tay
Trang 11ng ti p c n
Tìm hi u nh ng khái ni m c b n v n d li u
Các mô hình phân lo i cho bài toán n d li u
Xác nh các yêu c u c a bài toán n d li u
Phân tích các khía c nh có trong Steganography
Phân tích các khía c nh có trong Watermarking
Các c m có trong Watermarking trên âm thanh s Nghiên c u ki n th c x lý tín hi u s
Nghiên c u k thu t tr i ph trong công ngh truy n thông CMDA
Xây d ng ng d ng Watermarking trên âm thanh s v i hai thu t toán:
• Thu t toán 1: S d ng mô hình thính giác k t h p k thu t công ngh tr i
ph ng d ng này c hoàn t t thông qua ba giai n chính:
o Giai n 1: Xây d ng mô hình thính giác
ü li u nh p: Tín hi u ch a
ü li u xu t: Ng ng nghe t ng ng
ü lý: Chia tín hi u thành nhi u n, xác nh giá tr n ng l ng
critical band trên t ng n, ng ng ng y trang c t o ra b ng cách
t h p các giá tr trên và hàm tr i
o Giai n 2: T o Watermark thông qua k t h p ng ng nghe
ü li u nh p: Thông tin m t
ü li u xu t: Watermark
Trang 12• Thu t toán 2: u bi n ch m c l ng t Ph n này s ti n hành nghiên c u
và cài t trên hai ph ng pháp là u ch dither và STDM
Ph ng pháp u ch dither
Ph ng pháp STDM
Trang 13Ch ng 1 - M U
Trang 14Ch ng 1 - M U
1.1 Nhu c u n d li u hi n nay
phát tri n m nh m c a Internet cùng v i cu c cách m ng thông tin s ã
em l i nh ng b c phát tri n v t b c trong xã h i, vai trò c a nó ã v t ra kh i
ph m vi kinh t và d n i vào cu c s ng nh m t nhu c u thi t y u Truy n thông b ng
n r ng cùng v i các nh d ng d li u s phong phú hi n nay ã m ra nhi u c h i
và không ít thách th c Các thi t b s (camera s , CD, MP3, DVD, ) ngày càng hi n
i và giá thành ngày m t r , u này cho phép ng i dùng có th d dàng t o, ch nh
a hay trao i d li u a truy n thông
Bên c nh nh ng tác d ng tích c c, ta c ng không th ph nh n nh ng v n n n
y sinh trong th c t : gi m o, n c p tác ph m, s d ng các tác ph m không b nquy n, Các thao tác này c th c hi n r t d dàng trên d ng d li u a truy nthông s thông qua Internet hay các thi t b s Theo s li u th ng kê c a hi p h i b nquy n th gi i - International Intellectual Property Alliance (IIPA) [1], vào n m 1998,
i M , ngành công nghi p nh ng ã b th t thu 1.3 t ô la và ngành công nghi p
nh c và thu âm ã b m t 1.7 t ô la và con s này m i n m m t gia t ng
ng 1 Tình hình th t thu các n c ông Nam Á [1]
Trang 15Ch ng 1 - M U
Tr c tình tr ng này, r t nhi u gi i pháp khác nhau c a ra N u ch s
ng các k thu t b o v n gi n nh nhúng thông tin b n quy n vào vùng khônggian còn tr ng c a ph n header thì hoàn toàn không kh quan, do thông tin này r t d thay i hay xoá b i v i các ph ng pháp mã hoá b ng khoá m t, thì có th antoàn h n Tuy nhiên trong tình hình hi n nay thì hi u qu c a chúng em l i không cao
i l khoá có th b , nh t là trong nh ng n m g n ây trình khoá a cáchacker ngày càng phá tri n, v n ch là th i gian [2] N u không xét kh n ng c a cáchacker thì mã hoá c ng không ph i là gi i pháp t t B i vì m t khách hàng ch c n trphí b n quy n m t l n cho tác gi , sau ó h có th gi mã, ti n hành sao chép, t o ranhi u b n sao, và phân ph i m t cách tho mái [3] B o v quy n s h u trí tu i v icác s n ph m a truy n thông hi n nay ang là bài toán khó mà c th gi i ang ph i
i m t, và ang trên ng tìm l i gi i
Trong tình hình ó, n d li u s ra i nh m t c u cánh C ch ho t ng
a ph ng pháp này là nhúng m t d u hi u s mang thông tin v quy n s h u vàotrong tín hi u g c này, sao cho không th c m nh n c thay i trên tín hi u g c ó.Thông tin n có th là m t n v n b n, m t nh nh , m t logo, ho c m t tín hi u âmthanh, Hi n nay, có r t nhi u h ng phát tri n khác nhau, và ng v i m i h ng
ng có r t nhi u ph ng pháp khác nhau, tu thu c vào m c ích s d ng
1.2 c tiêu c a tài
So v i các lo i truy n thông s d ng tín hi u t ng t tr c ây nh b ngcatset, b ng video, nh, thì l i ích c a truy n thông s ngày nay mang l i l n h n
t nhi u: dung l ng l n, mang chuy n d dàng, thao tác x lý n gi n Tuy nhiên
ây c ng chính là m h n n vi ph m b n quy n t n công Trong các ph ng ti n
gi i trí s ang t n t i n c ta hi n nay nh game, hình nh, phim, thì có l âmthanh c xem là m t hình th c gi i trí thông d ng và g n g i nh t
Do ó chúng em ã m nh d n t p trung th c hi n tài n d li u trên âmthanh s nh m nghiên c u, tìm hi u, ánh giá và phân lo i các k thu t hi n có trong
Trang 16Ch ng 1 - M U
th gi i n d li u y ti m n ng và thách th c này Trên c s nh ng ki n th c ã có,chúng em ti n hành xây d ng ng d ng Watermarking trên âm thanh s T l i khuyên
a nh ng chuyên gia u ngành trong l nh v c này, chúng em ti n hành nghiên c u,xây d ng m t vài ng d ng có th ph c v th c t v i hi u qu cao
1.3 Yêu c u
m rõ các khía c nh có trong n d li u, c bi t i sâu vào nghiên c u hai
ng phát tri n chính là Steganography và Watermarking
Phân tích u khuy t m c a các ph ng pháp hi n có
Nghiên c u các ki n th c v x lý tín hi u s Nghiên c u k thu t Tr i Ph trong công ngh truy n thông CDMA
Nghiên c u cách th c xây d ng mô hình thính giác
Ch ng 3: C S LÝ THUY T N i dung bao g m:
• NG QUAN N D LI U: Cung c p các ki n th c n n t ng giúp ng i
c có c cái nhìn khái quát v v n nghiên c u
• NG QUAN V STEGANOGRAPHY: Nghiên c u v các khía c nh cótrong Steganography
Trang 17• WATERMARKING TRÊN AUDIO B NG PH NG PHÁP TR I PH
T H P MÔ HÌNH THÍNH GIÁC: Xây d ng mô hình gi l p h thínhgiác ng i và xu t ph ng pháp Watermarking trên ý t ng c a lý thuy t
Trang 18Ch ng 2 - T NG QUAN
Trang 19Ch ng 2 - T NG QUAN
Theo các ghi chép tìm c hi n nay cho th y, n d li u không ph i là m t l nh
c nghiên c u m i m Tuy nhiên vai trò c a nó ch m i c bi t n r ng rãi trong
nh ng n m g n ây Cho t i th i m hi n t i, n d li u nói chung và Watermarkingnói riêng v n ang trên ng phát tri n và t ng b c hoàn thi n V i ch ng ngphát tri n không dài nh ng nó ã c s quan tâm c a khá nhi u t ch c cùng nhi unhà nghiên c u Bên c nh nh ng thành công áng c ghi nh n, chúng ta c ng không
th ph nh n nh ng khuy t m mà l nh v c khoa h c non tr này m c ph i
Nói t i thành công, u tiên chúng ta ph i k n s tham gia ngày m t ông
o c a các nhà nghiên c u và các t ch c khoa h c u này c th hi n qua s
ng các t ch c, các nhà nghiên c u khoa h c, các bài báo, t p chí và s n ph m ang
có trong th tr ng [Xem tham kh o ph n ph l c trang 170], ti p n là các ng
ng trong th c t và nh ng l i ích không nh mà nó em l i c bi t trong ngànhcông nghi p gi i trí
Do ang trên con ng hoàn thi n, nên l nh v c nghiên c u này còn t n t i
t s thi u sót:
• Khuy t m c a h u h t các công trình nghiên c u hi n nay là ch a có m tcông trình nghiên c u nào t c s hoàn thi n, ngh a là ch a có m tthu t toán nào c coi là t i u có th áp ng c t t c các yêu c u
t ra, c ng nh ch a có m t thu t toán nào m nh ch ng l i t t c các
n công c a tác nhân th ba
• c dù hi n nay, các h ng nghiên c u ang chuy n d n sang l nh v c âmthanh, nh ng s l ng công trình nghiên c u (tính t i th i m hi n t i)Watermarking trên âm thanh còn quá ít so v i Watermarking trên nh
Trang 20Ch ng 3 - C S LÝ THUY T
Trang 21Hình 1 Mô hình ân d li u trên nh.
• Trên v n b n
Gi s i t ng ch a là n v n b n có n i dung nh sau:
Apparently neutral s protest is thoroughly discounted and ignored Isman hard hit Blockade issue affects for pretext embargo on by-products, ejecting suets and vegetable oils.
Và thông p c n chuy n tài là Pershing sails for NY June 1
Trang 22o Kích th c: ây là m t trong các y u t chính c n ph i c xem xét
tr c khi quy t nh s d ng ph ng pháp nào Tu thu c vào yêu c u b o m t
và l nh v c ng d ng mà kích th c c a nó s khác nhau
3.1.2.2 i t ng ch a
c m
Là i t ng dùng ch a thông p m t i t ng này còn c g i làCover <data type>, tu thu c vào lo i d li u mà nó s có các tên khác nhau Ví d :Cover Image, Cover Audio, Cover Text,
Trang 23o Ch t l ng: B thay i so v i i t ng g c Tuy nhiên m c thay i
tu thu c vào yêu c u và m c ích và ph ng pháp ti n hành
o Kích th c: Chi u dài c a khoá tu thu c vào các thu t toán t o khoá
o c yêu c u: Tu thu c vào thu t toán n thông tin mà khoá này có
th ch dùng trong m t giai n mã hoá, hay có th dùng trong c hai giai n
mã hoá và gi i mã
3.1.3.Mô hình t ng quát c a bài toán
Mô hình chung cho bài toán n d li u bao g m hai quá trình: quá trình nhúng
và quá trình rút trích.Tùy theo quan ni m và k thu t ti n hành (Steganography hayWatermarking) mà ký hi u có th khác, nhìn chung m t mô hình t ng quát có th mô
nh sau:
Trang 24Công th c cho mô hình nhúng: I+M+K I
th ng s d ng m t ho c nhi u khóa K, tu vào m c ng d ng
u vào: i t ng Stego (I’), Cover (I), khoá (K), thông tin m t (M).
u ra: Xác nh n s t n t i c a thông tin m t M.
Trang 25Công th c chung: I’ + K N i dung W.
3.1.4.Các yêu c u trong m t bài toán n d li u
3.1.4.1 Tính b n v ng (tính m nh m )
Th hi n kh n ng ít thay i tr c các t n công bên ngoài nh : thay i tính
ch t (thay i t n s l y m u, s bit l y m u, thay i l n biên ) i v i tín
hi u âm thanh, các phép bi n i affine (d ch, quay, t l ), thay i ch t l ng nh(thay i h màu) i v i tín hi u nh, chuy n i nh d ng d li u (JPG BMP,GIF PCX,WAV PM3, MPG AVI ) Hi n nay ch a có ph ng pháp nào có
th m b o c tính ch t này m t cách tuy t i
i t ng ng d ng c th , m c yêu c u c a tính ch t này th hi n khác nhau
Ví d :Trong watermaking d v ch c n thay i nh trên i t ng ch a c ng có thlàm cho i t ng thông tin m t b hu Thông th ng thì m c yêu c u tính ch tnày trong các ng d ng Watermarking cao h n các ng d ng n d li u khác
3.1.4.2 Kh n ng không b phát hi n
Tính ch t này th hi n kh n ng khó b phát hi n, ngh a là khó xác nh m t
i t ng có ch a thông tin m t hay không nâng cao kh n ng này, h u h t các
ph ng pháp n d li u d a trên c m c a hai h tri giác ng i: h th giác (HVS)
và h thính giác (HAS) ây là hai c quan ch y u c dùng ánh giá ch t l ng
a m t tín hi u
Kh n ng khó b phát hi n tín hi u m t ph thu c vào hai y u t sau:
• thu t nhúng: D li u c nhúng ph i phù h p v i i t ng ch a và
Trang 26Ch ng 3 - C S LÝ THUY T
trong l nh v c n d li u, ng i th c hi n ph i có ki n th c v các lo i nh
ng t p tin Vì có th v i cùng m t thông tin m t nh ng nó s r t khó bphát trên i t ng A, nh ng l i quá d th y khi nhúng vào i t ng B
• Kinh nghi m c a k t n công: n u nh k t n công có nhi u kinh nghi m thì
kh n ng phát hi n ra m t i t ng ch a có ch a thông tin m t là khôngquá khó
3.1.4.3 Kh n ng l u tr
Kh n ng này th hi n l ng thông tin c a thông p m t có th nhúng trong
i t ng ch a Do tính b o m t nên kh n ng l u tr luôn b h n ch Do ó trong
tr ng h p mu n n m t thông tin có kích th c t ng i l n, ta th ng chia nh rathành nhi u ph n và th c hi n nhúng t ng ph n
Trong th c t , khi quy t nh ch n ph ng pháp nhúng nào, ta th ng l y batiêu chí trên làm c s Tu thu c vào t ng ng d ng mà ng i ta s u tiên cho tiêuchu n nào h n Có th minh h a tiêu chí trên nh sau:
Hình 4 M i t ng quan gi a ba tiêu chí.
Ngoài ra, nâng cao hi u qu , ng i ta còn xem xét m t s yêu c u khác
3.1.4.4 Kh n ng vô hình
Tu theo m c ích s d ng, m c yêu c u v tính ch t này khác nhau
• ng d ng Steganography: thông tin m t c d u ph i tuy t i bí m t, khi
ó tiêu chí này c chú ý nhi u
Trang 27Ch ng 3 - C S LÝ THUY T
• ng d ng Watermarking: trong m t s ng d ng, ng i dùng có th c(th y) thông tin Watermark nh ng không ch nh s a c, ho c có nh ng
ng d ng thông tin Watermark c gi bí m t
3.1.4.5 Tính ch c ch n
Tính ch t này khá quan tr ng trong khi ch ng nh n b n quy n, xác th c, Trong th c t tiêu chí này c t n ng trong các k thu t gán nhãn th i gian
3.1.4.6 Tính b o m t
Có nhi u c p b o m t khác nhau, nh ng nhìn chung có hai c p chính:
• Ng i dùng hoàn toàn không bi t s t n t i c a thông tin m t
• Ng i dùng bi t có thông tin m t, nh ng ph i có khoá khi truy c p
Trang 28Ch xác nh n có/không
m nh n thông tin m t
Thu t toán Nhúng/Trích
Riêng t (Private) Bán riêng t (Semi-Private) Bán công khai (Semi-Public) Công khai (Public)
n v ng (Robust)
v (Fragile) Bán d v (Semi-Fragile)
Thu t toán Nhúng/Trích
n d li u
Hình 5 Phân lo i n d li u theo Chen.LongJi.
3.1.5.2 Phân lo i theo De Vlccschouwer
Mô hình
Mô hình này do De Vlccschouwer xu t, và c xem là mô hình phân lo i
ph bi n [7]
Trang 29Ch ng 3 - C S LÝ THUY T
Hình 6 Phân lo i n d li u theo De Vlccschouwer.
3.1.5.3 Phân lo i theo B.Pflizmann
Trang 30Ch ng 3 - C S LÝ THUY T
Phân tích
• Covert channels
Ph ng pháp này do Lampson xu t, và th ng c s d ng trong h th ng
o m t a t ng nh : các h th ng máy tính trong quân s , các ng liên l c nàykhông dành cho vi c truy n thông n thu n Do nh ng kênh truy n này th ng b các
ch ng trình dò thám truy c p l y c p thông tin, nên v n t ra là làm th nào
n ch các ch ng trình này
• Anonymity
Là ph ng pháp dùng gi u n i dung meta c a thông p nh thông tin v
ng i g i và ng i nh n thông p Chaum a ra khái ni m nhà phân ph i b u
ph m n c danh hay khái ni m m gi l trình (onion routing) do Goldschlag,Reed và Syverson xu t Ý t ng nh sau: ng i c a m t thông p có th blàm m b ng m t t p các nhà phân ph i b u ph m hay m t t p các b nh tuy n óngvai trò là các tr m trung gian, và v i u ki n các tr m trung gian này không thông
ng, c u k t v i nhau Tuy nhiên k t qu c a quá trình m hoá này ph thu c r tnhi u vào v n bên nào s b m hoá (bên g i, bên nh n, hay c hai bên) Ngàynay i v i các ng d ng Web thì quá trình m hóa t p trung bên nh n, trong khi
ng i s d ng email l i quan tâm t i s m hoá bên g i
ch vi t c che d (covered writing), và th ng c hi u là m t ph ng pháp
u thông tin này trong m t thông tin khác M t vài các ng d ng khác ã c s
ng tr c ây nh là vi c d u thông tin m t vào trong các bài báo thông qua hình
th c s d ng m c in vô hình g i cho các p viên ho c là s d ng k thu t t o
ti ng vang (echo) a thông tin vào trong các m u audio
Trang 31Ch ng 3 - C S LÝ THUY T
• Watermarking
i th c nh tranh v i Steganography trong l nh v c n thông tin làWatermarking Trong h th ng Watermarking, thông tin Watermark không nh t thi t là
ph i n, u này còn tu thu c vào lo i ng d ng và m c ích s d ng Watermark s
u hình (nhìn th y c) c b t ngu n t Watermark trên gi y xu t hi n t th k
th 13 Các ng d ng c a Watermark h u hình th ng xu t hi n trong các logo c acông ty hay d i d ng các ch ký
• Robust Copyright Marking
Trái ng c v i Fragile Watermarking, trong Robust Copyright Watermarking,thông tin m t r t khó b phá hu u này có ngh a là n u k t n công oán bi t ctrong d li u có thông tin m t thì vi c phá hu thông tin này c ng r t khó và m t khiphá c nó thì toàn b d li u ch a còn l i c ng s không còn giá tr ng d ng d ngnày th ng r i vào các tr ng h p b o v b n quy n h p pháp
• FingerPrinting
FingerPrinting ngh a là Watermarking vào i t ng ch a các thông tin xu t x ,thông tin xác nh n khách hàng ng d ng này dùng dò v t khách hành và các b nsao Fingerprinting th ng c dùng xây d ng các ng d ng xác nh tính h ppháp c a các b n sao d li u c phân ph i riêng l Ph ng pháp này r t h u íchkhi c n truy tìm hay theo dõi ng c các b n sao d li u c pháp hành, t ng t nh serial c a các ph n m m Ngoài ra nó còn giúp ch ng l i các d ng t n công d i
ng thông ng gi a nh ng ng i dùng v i nhau, các Watermark c thi t k nh m
ch ng l i thông ng, c u k t
• Visible Watermarking
tên g i ta có th bi t c ây là nh ng m u quan sát gi ng nh kí hi u logo
c chèn vào nh, t ng t các Watermark c dùng trên gi y Các Watermark nhìn
th y c áp d ng ch y u trong nh và video, ví d nh ánh d u ký hi u hình nhtrong c s d li u hình, hay dùng trong Web ch ng l i vi c th ng m i hóa hình nh
Trang 32Ch ng 3 - C S LÝ THUY T
3.2 NG QUAN V STEGANOGRAPHY
3.2.1.Mô hình bài toán
Mô hình kinh n s d ng giao ti p n c Simmons gi i thi u u tiên b ngbài toán mang tên bài toán ng i tù [9] Hai nhân v t Alice và Bob do ph m t i nên
ã b b t, và b giam trong hai phòng khác nhau H lên k ho ch v t ng c, nh ngkhông may, m i s liên l c gi a h u do m t nhân v t cai ng c mang tên Wendy
ki m soát N u bà ta có nghi ng nào trong vi c liên l c gi a h , thì ngay l p t c bà ta giam h vào phòng bi t giam, m i thông tin liên l c gi a h s b c t, và k ho ch
a h s b phá s n Do ó, h ph i tìm cách trao i thông tin ng m bà qu n ng ckhó tính không nghi ng H thi t l p m t kênh truy n ng m Gi i pháp c a h a ra
là n n i dung thông tin c n trao i vào m t thông tin bình th ng khác Ví d , Bob
m t b c tranh m t con bò xanh ang n m trên cánh ng c và g i b c tranh ó choAlice, và dùng màu s c c a b c tranh th hi n n i dung trao i Nh ng Wendy skhông nghi ng gì v b c tranh và màu s c c a nó
Trong bài vi t này ta gi s trong phòng giam c a Alice và Bob u có máytính, và có th trao i thông p cho nhau b ng nhi u nh d ng khác nhau (v n b n,
nh s , âm thanh s , )
Hình 8 Bài toán ng i tù.
ho ch v t ng c g p m t s khó kh n: n u Wendy thay i thông p màBod g i cho Alice Ví d , bà ta thay i màu c a con bò thành màu , khi ó n i dungthông p mu n truy n t i s b sai, d n n hành ng sai N u hi m c h n, bà ta
có th gi m o thông p và g i nó b ng kênh truy n ng m
Trang 33i dung mu n trao i C ng i g i l n ng i nh n ph i óng vai trò c a ng i ch
ng, b ng l n k t n công
Các ghi chép u tiên v Steganography ã c ghi m t nhà s h c Hy L p làHerodotus ghi chép l i M t trong nh ng câu chuy n k n i ti ng khi nói t i l nh v cnày là câu chuy n k v tên b o chúa Histiaeus Trong su t th k th 5 tr c công
nguyên (486-425 B.C), tên này b vua Darius giam c m t i nhà tù Susa Trong th i
gian này ông ta ã c g ng liên l c v i con r c a mình là Aristagoras th c hi n
c âm m u này thì Histiaeus ã c o u m t tên nô l và x m lên ó n i thông p
n chuy n và khi tóc m c lên thì anh này c a t i Aristagoras Ph ng pháp này
n c các p viên c s d ng vào u th k 20 [13]
Gi i pháp nhúng thông tin m t vào các b c nh c khám phá và phát tri n
u tiên vào nh ng n m 1860, do m t nhi p nh gia ng i Pháp tên Dragon th c hi n.Trong th i k di n ra cu c chi n Pháp-Ph (1870-1871), n c Pháp b bao vây, trao
i thông tin v i bên ngoài ng i ta ã d u thông tin m t vào trong các n phim nh(microfilm ) r i nh b câu a tin Các phim siêu hi n vi (microscopic) c dùng nhúng thông tin và d u vào trong các b ph n nh : tai, m i hay móng tay, móng chân
ng c s d ng trong su t th i k chi n tranh Nga-Nh t (1905) Trong th i kchi n tranh th gi i th I, tài li u c trao i gi a các p viên c d u d i cácsiêu d u ch m (microdot)
Trang 34Theo B.Pflizmann, các h ng phát tri n trong Steganography c phân chia:
Hình 9 Phân lo i Steganography theo B.Pflizmann.
Các ph ng pháp thu c lo i visual semagrams th ng s d ng các th c th v t
lý, n i dung thông p m t th ng c th hi n qua ý ngh a c a các i t ng này
Trang 35Ch ng 3 - C S LÝ THUY T
Ví d : s d ng v trí c a các quân c trên bàn c ho c v m t con ng i trong các t
th khác nhau và m i t th ng v i m t ý nh a riêng nh hình v [20]
Hình 10 n d li u theo Linguistic Steganography
Trong khi ó, các ph ng pháp trong nhóm text semagrams n i dung thông tin
t c n ch a thông qua các hi n th c a v n b n M t s k thu t thu c lo i này
có th áp d ng cho c v n b n vi t tay và v n b n in Ví d thay i kho ng cách gi acác ký t [21]
Ngoài ra, các ph ng pháp thu c phân nhóm jargon code th ng nhúng n idung thông p vào trong nh ng tín hi u có công su t l n, và nh th thông tin n skhông b phát hi n [22]
3.2.3.2 Phân lo i theo Neil F.Johnson và Stefan C.Katzenbeisser
Mô hình
Phân lo i d a trên s thay i c a i t ng ch a sau khi nhúng thông tin m t
Hình 11 Phân lo i theo Neil F.Johnson và Stefan C.Katzenbeisser
Phân tích
• th ng thay th
o Gi i thi u chung
Hi n nay s l ng các ph ng pháp trong h th ng này khá nhi u, và th ng
n gi n Nguyên t c c b n c a các ph ng pháp này là a các bit thông tin c a
Trang 36Ch ng 3 - C S LÝ THUY T
thông p n vào trong các thành ph n ít quan tr ng nh t c a i t ng ch a Ng i
nh n ch l y c n i dung thông khi bi t c v trí các bit ã nhúng S khác nhau
a các ph ng pháp c xây d ng trong h th ng này c ng nh s khác bi t v tínhrobust c a các ph ng pháp chính là s khác nhau trong cách th c ch n v trí nhúng.Sau ây là ph n li t kê m t vài ph ng pháp khác nhau
o Thay th bit ít quan tr ng nh t (LSB)
Cài t thu t toán Nhúng:
Trích:
o Hoán v ng u nhiên
ây là thu t toán c i ti n c a thu t toán LSB, trong ó v trí nhúng thông p
t là ng u nhiên trên toàn b i t ng ch a K thu t này d a trên s ng u nhiên
Trang 37Ch ng 3 - C S LÝ THUY T
nên không có gì m b o r ng chu i bit c a thông p c nhúng theo th th và
nh th thì khó t n công, ngh a là t ng kh n ng ch ng t n công
Do v trí c nh ng u nhi n nên s d n t i tr ng h p m t v trí phát sinh s
xu t hi n hai l n Xác su t ng c xác nh theo công th c:
( )[ ( ) 1]
1 exp
2 ( )
l m l m p
Ph ng pháp này ch áp d ng cho nh, do Kurak xu t vào 1992 [26]
Image downloading là m t tr ng h p c bi t c a h th ng thay th , trong ó
nh óng vai trò v a là i t ng ch a v a là thông p m t
i m t nh ch a (cover imge) và m t nh m t (secret image) cùng chi u a
ra, bên phía g i s thay th b n bit ít quan tr ng nh t c a i t ng ch a b ng b n bitquan tr ng nh t c a secret image Sau ó, bên nh n l y ti p b n bit ít quan tr ng nh t secret image và nh th là bên nh n có c t t c các bit c a secret image
Ph ng pháp này c ng d ng trong các h thông b o m t a t ng Trong ócác ch th là các ti n trình và ng i dùng, còn các khách th là các t p tin, CSDL, ,
và chúng c k t h p v i m t m c b o m t nào ó
o Nhúng vào các vùng ch a
Thay vì nhúng m t bit thông tin vào m t ph n t c a i t ng ch a, ta nhúng
t bit thông tin vào m t vùng c a i t ng ch a làm c u này, ta chia i
ng ch a thành nhi u vùng nh , thông tin m t bit trong vùng ch a I c xác nh:
( )[ ( ) 1]
1 exp
2 ( )
l m l m p
l c
Trang 38Ch ng 3 - C S LÝ THUY T
o ng t hoá (quantization) và dithering
ng l ng c a m i pixel c d oán theo n ng l ng c a các pixel lân c n
và có th là hàm tuy n tính hay không tuy n tính khác bi t gi a các pixel c th
hi n thông qua công th c:∆ =i Q x( i −x i−1).
nhúng bit th i c a thông p m t vào trong tín hi u ch a, ta s tính i N u
nó không phù h p v i ng tính toán bí m , thì i s thay th j g n nh t mà t i v
trí này bit k t h p b ng v i bit thông p m t ng tính toán bí m c t o theo
khoá k nh m ch nh cách k t h p gi a các bit trong thông p v i i t ng ch a
ng 2 B ng tính toán m t.
(Xem thêm ph n 3.8)
o n d ng ph n không gian d th a trong h th ng máy tính.
Ph ng pháp này t n d ng vùng không gian không s d ng trong máy l uthông tin Ví d nh d i HDH Windows 95, các a c nh d ng theo FAT 16không nén, và kích th c c a các cluster là 32 KB có ngh a là n u nh m t t p tin ph i
u ít nh t 32 KB N u nh t p tin ch có 1KB thì nó c ng ph i thêm vào 31 KB tr ng
có th ch a trong vùng 32 KB và nh th thì chúng ta hoàn toàn có th l u thông tinvào các vùng tr ng này Ngoài ra các kho ng tr ng khác c ng không c dùng nhheader file c a nh hay âm thanh c ng có th c t n d ng l u thông tin
Trang 39Ch ng 3 - C S LÝ THUY T
Các ph ng pháp bi n i trên mi n c ti n hành b ng cách d u thông tin
t vào trong các vùng quan tr ng c a i t ng ch a nh vùng nén, vùng xén,
Vi c này s làm t ng tính b n v ng c a thông p n tr c các thao tác x lý, ng
th i không gây nghi ng vì ít nh y c m v i h th ng giác quan c a ng i Các ph ngpháp c s d ng trong các phép bi n i trên mi n bao g m: phép bi n i Cosin r i
u th c hi n trên m t mi n bi n i nào ó
Các ph ng pháp bi n i theo mi n d u thông p vào trong các vùng có ýngh a, sao cho các vùng ó có th b n v ng h n so v i LSB tr c các t n công nh :nén, xén, và m t vài phép x lý khác Tuy nhiên, song song v i tính b n v ng ó,
ph ng pháp này c ng ph i m b o tính vô hình Có r t nhi u ph ng pháp bi n i
mi n, trong ó có m t s ph ng pháp s d ng phép bi n i Cosine r i r c (DCT)[27-29] nhúng thông tin vào i t ng ch a, m t s khác thì s d ng các phép bi n
i Wavelet Các phép bi n i này có th áp d ng trên toàn b i t ng ch a[27],
hay t ng block nh riêng l Tuy nhiên, ph i có s cân b ng gi a s l ng thông tin
c nhúng vào nh và b n v ng c a nó
Tr c khi tìm hi u m t s ph ng pháp, ta cùng xem l i các phép bi n iCosine và Fourier, ph ng pháp này có th dùng ánh x m t tính hi u sang mi n t n Phép bi n i Fourier r i r c (DFT) c a m t dãy s có chi u dài N c nh ngh a:
1
0
2 ( ) { } ( ) exp( )
Trang 40Ch ng 3 - C S LÝ THUY T
1 1
0
2 ( ) { } ( ) exp( )
N n
Nh trong ph n gi i thi u, h thính giác ng i (HAS) r t nh y c m trong mi n
th i gian nên r t d phát hi n ra nh ng thay i nh n 1/10 tri u Tuy th Moore [33]
ng ã ch ng minh c r ng HAS l i ít nh y v i các thay i pha, và c tính này ã
c khai thác trong các h th ng nén âm thanh s Trong mã hoá pha, m i d li u c coi là m t d ch pha (phase shift) trong ph
pha c a tín hi u sóng mang Xét tín hi u sóng mang c, c c chia thành N ph n nh ,
i ph n c i (n) có chi u dài là l(m).Áp d ng phép bi n i Fourier
l n tín hi u c khai tri n d i d ng Fourier: