Theo thông tin thu vân watermark information .... Thu t toán nhúng thu vân ..... Information hiding Steganography Watermarking Robust Copyright marking Fragile marking Thu vân “d v ” Imp
Trang 1H và tên tác gi
V V N HUY
Tên đ tài
TH Y VÂN C S D LI U QUAN H D A TRÊN K THU T T I U HOÁ ÁP D NG
GI I THU T DI TRUY N
LU N V N TH C S NGÀNH KHOA H C MÁY TÍNH
Thái Nguyên - 2009
Trang 2H và tên tác gi
V V N HUY
Tên đ tài
TH Y VÂN C S D LI U QUAN H D A TRÊN K THU T T I U HOÁ ÁP D NG
Trang 3Tôi xin cam đoan lu n v n “Th y vân c s d li u quan h d a trên k
thu t t i u hoá áp d ng gi i thu t di truy n” này là công trình nghiên c u
c a riêng tôi Các s li u s d ng trong lu n v n là trung th c Các k t qu nghiên c u đ c trình bày trong lu n v n ch a t ng đ c công b t i b t k công trình nào khác
V V n Huy
Trang 4hoàn thành lu n v n này, tr c tiên tôi xin chân thành c m n s
ch b o t n tình c a TS Bùi Th H ng, ng i đã nhi t tình ch b o góp ý giúp tôi hoàn thành lu n v n này
Tôi xin chân thành c m n Khoa Công ngh thông tin – i h c Thái Nguyên, Vi n Công ngh thông tin đã t o đi u ki n giúp tôi hoàn thành lu n
v n này
Tôi xin chân thành c m n b n Võ Phúc Nguyên – Gv Khoa i n T
- H K thu t công nghi p Thái Nguyên đã tr giúp tôi r t nhi u trong quá trình hoàn thành lu n v n này
L i sau cùng tôi xin chân thành c m n nh ng ng i thân trong gia đình cùng các b n đ ng nghi p đã đ ng viên tôi hoàn thành lu n v n này
V V n Huy
Trang 5M C L C
M C L C 1
DANH M C CÁC THU T NG 3
DANH M C CÁC HÌNH V 4
DANH M C CÁC B NG BI U 5
M U 6
1 Lý do l a ch n đ tài 6
2 M c tiêu nghiên c u 7
3 Ph m vi nghiên c u 7
4 Ph ng pháp nghiên c u 7
5 Ý ngh a khoa h c và ý ngh a th c ti n c a đ tài 8
6 C u trúc c a lu n v n 8
CH NG 1 – T NG QUAN V THU VÂN VÀ GI I THU T DI TRUY N 9
1.1 C b n v k thu t gi u tin 10
1.1.1 Khái ni m v gi u tin 10
1.1.2 Phân lo i các k thu t gi u tin 10
1.1.3 M c đích c a gi u tin 12
1.1.4 Môi tr ng gi u tin 12
1.2 C b n v thu vân 14
1.2.1 Khái ni m thu vân 14
1.2.2 M t s v n đ có liên quan đ n thu vân 16
1.2.3 Khái ni m thu vân c s d li u 17
1.3 M t s ng d ng c a thu vân 18
1.3.1 B o v b n quy n tác gi (copyright protection) 18
1.3.2 Phát hi n xuyên t c thông tin (authentication and tamper detection) 18
1.3.3 L y d u vân tay hay dán nhãn (fingerprinting and labeling) 19
1.3.4 i u khi n thi t b (Device control) 19
1.3.5 Theo dõi quá trình s d ng (Tracking) 19
1.3.6 Theo dõi truy n thông (Broadcast Monitoring) 19
1.3.7 Truy n tin bí m t (Concealed Communication) 20
1.4 Gi i thu t di truy n 20
CH NG 2 – TH C TR NG NGHIÊN C U THU VÂN C S D LI U QUAN H 22 2.1 Tình hình nghiên c u trong n c 22
2.2 Tình hình nghiên c u trên th gi i 22
Trang 62.2.2 Theo ki u bi n d ng (Distortion) 23
2.2.3 Theo đ nh y (Sensitivity) 24
2.2.4 Theo thông tin thu vân (watermark information) 25
2.2.5 Tính ki m tra đ c 26
2.2.6 Theo c u trúc d li u (Data structure) 27
CH NG 3 – N I DUNG VÀ CÁC K T QU NGHIÊN C U 29
3.1 Phân ho ch d li u 29
3.2 Nhúng thu vân 33
3.2.1 Mã hoá bit đ n 34
3.2.2 Áp d ng gi i thu t di truy n gi i bài toán t i u 38
3.2.3 Thu t toán nhúng thu vân 41
3.2.4 ánh giá ng ng gi i mã 42
3.3 Gi i mã thu vân 46
3.4 K t qu th c nghi m 48
K T LU N VÀ KI N NGH 52
PH L C 54
TÀI LI U THAM KH O 57
Trang 7DANH M C CÁC THU T NG
MSB (Most significant bit): Bit ý ngh a nh t
LSB (Least significant bit): Bit ít ý ngh a nh t
MAC (Message Authentication Code) : Mã xác th c thông đi p
GA (Genetic Algorithms): Gi i thu t di truy n
Trang 8DANH M C CÁC HÌNH V
Hình 1.1 1 M t cách phân lo i k thu t gi u tin 11 Hình 3 1 Cách phân ho ch b d li u 32 Hình 3 2 Th ng kê phân b t p Xmax, Xmin và cách l y ng ng T* 45
Trang 9DANH M C CÁC B NG BI U
B ng 1 Danh m c các ký hi u 30
B ng 2 Th ng kê các t n công v i s l n t n công là 20 51
Trang 10Ngày nay, các ng d ng và các s n ph m s trong đó bao g m c các
c s d li u quan h đ c phát tri n và phân ph i r ng kh p trong môi
tr ng Internet, vì v y vi c ch ng minh quy n s h u đ i v i các s n ph m này sau khi chuy n giao là m t v n đ r t c n thi t Vi c th c thi quy n s
h u d li u là m t yêu c u quan tr ng đòi h i các gi i pháp đ ng b , bao g m các khía c nh v k thu t, v t ch c, và c lu t pháp M c dù v n ch a có
đ c nh ng gi i pháp toàn di n nh v y nh ng trong các n m g n đây, các k thu t thu vân đã đóng m t vai trò quy t đ nh nh m gi i quy t v n đ v quy n s h u này
Hi n nay, m i ch có m t vài cách ti p c n đ i v i bài toán thu vân d
li u quan h đ c đ xu t Tuy nhiên, nh ng k thu t này không b n v ng
tr c các t n công thông th ng và các t n công gây h i, vì v y c n có m t
k thu t th y vân c s d li u quan h có đ b n v ng cao h n nh t là đ i
v i các t n công xoá, s a, và chèn các b n ghi
Lu n v n “th y vân c s d li u quan h d a trên k thu t t i u hoá áp d ng gi i thu t di truy n” trình bày k thu t thu vân c s d li u
Trang 11d a vào k thu t t i u hoá K thu t này ph i đ m b o b n v ng tr c các
t n công thêm, b t và thay đ i giá tr c a các b trong quan h
2 M c tiêu nghiên c u
M c tiêu chính c a lu n v n là đi sâu nghiên c u k thu t t i u hoá đ
mã hoá và gi i mã thu vân Trong đó t p trung nghiên c u k thu t phân
ho ch d li u không ph thu c vào các b đ c đánh d u đ đ nh v các phân
ho ch; nghiên c u cách gi i bài toán t i u b ng gi i thu t di truy n v i các ràng bu c trên thu c tính đ c ch n đ ti n hành th y vân, và nghiên c u k thu t phát hi n th y vân d a vào m t ng ng t i u
3 Ph m vi nghiên c u
Ph m vi nghiên c u c a đ tài là đi sâu nghiên c u v m t lý thuy t c a thu vân và áp d ng cho c s d li u quan h
Nghiên c u v c ch mã hoá và gi i mã thu vân c s d li u quan
h d a trên k thu t t i u hoá áp d ng thu t toán di truy n
đ xu t nh m hoàn thành m c tiêu nghiên c u c a lu n v n
C th trong lu n v n này, tác gi l y thông tin tiêu th đi n làm c s
d li u ph c v cho nghiên c u; nghiên c u v lý thuy t thu vân; nghiên c u
v cách gi i bài toán t i u hoá b ng gi i thu t di truy n; s d ng ph n m m Matlab đ l p trình ki m ch ng lý thuy t
Trang 125 Ý ngh a khoa h c và ý ngh a th c ti n c a đ tài
a ra c s khoa h c c a vi c áp d ng k thu t t i u hoá đ mã hoá
và gi i mã thu vân trong đó s d ng gi i thu t di truy n đ gi i quy t bài toán t i u hoá
K t qu nghiên c u c a đ tài r t có ý ngh a trong vi c ch ng minh quy n s h u đ i v i các s n ph m s hoá, đ c bi t là trong c s d li u quan h sau khi đã phân ph i ho c chuy n giao ng th i vi c ch ng minh quy n s h u này c ng là m t v n đ r t quan tr ng trong môi tr ng ng
d ng d a trên Internet nh m phát tán và truy n t i thông tin
6 C u trúc c a lu n v n
Ngoài ph n m đ u và ph n k t lu n, lu n v n đ c trình bày thành ba
ch ng nh sau:
- Ch ng 1 T ng quan v thu vân và gi i thu t di truy n
Ch ng này ch y u trình bày v các thông tin c b n c a k thu t
gi u tin, các khái ni m c b n v thu vân và ng d ng th c ti n c a thu vân, s l c v gi i thu t di truy n
- Ch ng 2 Th c tr ng nghiên c u v thu vân c s d li u quan h
Ch ng này ch y u trình bày v th c tr ng nghiên c u v thu vân
c s d li u quan h trong n c và trên th gi i
- Ch ng 3 N i dung và các k t qu nghiên c u
Ch ng này đi sâu mô t chi ti t lý thuy t các b c ti n hành thí nghi m áp d ng k thu t t i u hoá cho mã hoá và gi i mã thu vân s
Trang 13CH NG 1 – T NG QUAN V THU VÂN VÀ
đ i M ng Internet toàn c u đã bi n thành m t xã h i o n i di n ra quá trình trao đ i thông tin trong m i l nh v c c a đ i s ng Và chính trong môi tr ng
m và ti n nghi nh th xu t hi n nh ng v n n n, tiêu c c đang r t c n đ n các gi i pháp h u hi u cho các v n đ an toàn thông tin nh n n n c p b n quy n, n n xuyên t c thông tin, truy nh p thông tin trái phép, sao chép b t
h p pháp các s n ph m trí tu s v.v
Gi i pháp cho nh ng v n đ trên đã đ c bi t đ n và áp d ng đó là gi i
pháp gi u tin (DataHiding), đ c nghiên c u phát tri n trong kho ng h n
ch c n m g n đây Trong đó thu vân (watermark) là m t thành ph n c a
ph ng pháp gi u tin
Gi u thông tin bao g m hai k thu t chính là thu n (watermarking)
và gi u tin bí m t (steganograph) đang đ c quan tâm nghiên c u và phát tri n Các thành t u đ t đ c trong l nh v c nghiên c u này đã b t đ u đ c
áp d ng hi u qu cho m c đích b o v b n quy n, ch ng sao chép, phân tán
Trang 14Nhi u ph ng pháp gi u thông tin khác nhau đã đ c đ xu t, m i ph ng pháp có nh ng u đi m, nh c đi m riêng và thích h p cho m t nhóm các
ng d ng
1.1 C b n v k thu t gi u tin
1.1.1 Khái ni m v gi u tin
yêu c u c b n c a gi u tin là đ m b o tính ch t n c a thông tin đ c gi u
1.1.2 Phân lo i các k thu t gi u tin
Do k thu t gi u thông tin s m i đ c hình thành trong th i gian g n đây nên xu h ng phát tri n ch a n đ nh Nhi u ph ng pháp m i, theo nhi u khía c nh khác nhau đang đ c đ xu t, vì v y đã t n t i nhi u cách phân lo i r t khác nhau
D a trên vi c th ng kê các công trình đã công b trên các t p chí, cùng
v i thông tin v tên và tóm t t n i dung c a các công trình đã công b trên Internet, ng i ta chia l nh v c gi u tin ra làm hai h ng l n, đó là watermarking và steganography
Steganography quan tâm t i ng d ng che gi u các b n tin đòi h i đ
bí m t cao và dung l ng l n
Trang 15Watermark (th y vân) quan tâm nhi u đ n ng d ng gi u các m u tin
ng n nh ng đòi h i đ b n v ng l n c a thông tin c n gi u (tr c các bi n
đ i thông th ng c a t p d li u môi tr ng)
Hình 1.1 1 M t cách phân lo i k thu t gi u tin
i v i t ng h ng l n trên, quá trình phân lo i theo các tiêu chí khác nhau d a theo nh h ng các tác đ ng t bên ngoài, ng i ta có th chia watermark thành hai lo i, m t lo i b n v ng v i các tác đ ng sao chép trái phép, lo i th hai l i c n tính ch t hoàn toàn đ i l p: d b phá hu tr c các tác đ ng nói trên C ng có th chia watermark theo đ c tính, m t lo i c n
đ c che gi u đ ch có m t s ng i ti p xúc v i nó có th th y đ c thông tin, lo i th hai đ i l p, c n đ c m i ng i nhìn th y
Information hiding
Steganography
Watermarking
Robust Copyright marking
Fragile marking
Thu vân “d v ”
Imperceptible Watermarking Thu vân n
Visible Watermarking Thu vân hi n
Trang 161.1.3 M c đích c a gi u tin
B o m t thông tin b ng gi u tin có hai khía c nh M t là b o m t cho
d li u đem gi u (embedded data), ch ng h n nh gi u tin m t: thông tin
m t đ c gi u k trong m t đ i t ng khác sao cho ng i khác không phát
hi n đ c (steganography) Hai là b o m t chính đ i t ng đ c dùng đ
gi u d li u vào (host data), ch ng h n nh ng d ng b o v b n quy n, phát
hi n xuyên t c thông tin (watermarking)
1.1.4 Môi tr ng gi u tin
K thu t gi u tin đã đ c nghiên c u và áp d ng trong nhi u môi
tr ng d li u khác nhau nh trong d li u đa ph ng ti n (text, image, audio, video), trong s n ph m ph n m m và g n đây là nh ng nghiên c u trên môi tr ng c s d li u quan h Trong các môi tr ng d li u đó thì d li u
đa ph ng ti n là môi tr ng chi m t l ch y u trong các k thu t gi u tin
a Gi u tin trong nh
Gi u thông tin trong nh, hi n nay, là m t b ph n chi m t l l n nh t trong các ch ng trình ng d ng, các ph n m m, h th ng gi u tin trong đa
ph ng ti n b i l ng thông tin đ c trao đ i b ng nh là r t l n và h n n a
gi u thông tin trong nh c ng đóng vai trò h t s c quan tr ng trong các h u
h t các ng d ng b o v an toàn thông tin nh : nh n th c thông tin, xác đ nh xuyên t c thông tin, b o v b n quy n tác gi , đi u khi n truy c p, gi u thông tin m t Vì v y v n đ gi u tin trong nh này đang đ c quan tâm r t l n c a các nhà nghiên c u
Thông tin s đ c gi u cùng v i d li u nh nh ng ch t l ng nh ít b thay đ i và không th nh n bi t đ c b ng th giác c a con ng i, nó ch có
th b phát hi n b i “th giác máy” Ngày nay, khi nh s đã đ c s d ng r t
ph bi n, thì gi u thông tin trong nh đã đem l i r t nhi u nh ng ng d ng
Trang 17quan tr ng trên nhi u l nh v c trong đ i s ng xã h i thì vi c nh n th c ch kí
s , xác th c thông tin đã tr thành m t v n đ c c kì quan tr ng khi mà vi c
n c p thông tin hay xuyên t c thông tin b i các tin t c đang tr thành m t
v n n n đ i v i b t kì qu c gia nào, t ch c nào M t đ c đi m c a gi u thông tin trong nh đó là thông tin đ c gi u trong nh m t cách vô hình, nó
nh là m t cách mà truy n thông tin m t cho nhau mà ng i khác không th
bi t đ c b i sau khi gi u thông tin thì ch t l ng nh g n nh không thay
đ i đ c bi t đ i v i nh m u hay nh xám
b Gi u tin trong audio
Gi u thông tin trong audio mang nh ng đ c đi m riêng khác v i gi u thông tin trong các đ i t ng đa ph ng ti n khác M t trong nh ng yêu c u
c b n c a gi u tin là đ m b o tính ch t n c a thông tin đ c gi u đ ng th i không làm nh h ng đ n ch t l ng c a d li u g c đ m b o yêu c u này, k thu t gi u thông tin trong nh ph thu c vào h th ng th giác c a con
ng i - HVS (Human Vision System) còn k thu t gi u thông tin trong audio
l i ph thu c vào h th ng thính giác HAS (Human Auditory System) Và
m t v n đ khó kh n đây là h th ng thính giác c a con ng i nghe đ c các tín hi u các gi i t n r ng và công su t l n nên đã gây khó d đ i v i các
ph ng pháp gi u tin trong audio Nh ng th t may là HAS l i kém trong vi c phát hi n s khác bi t các d i t n và công su t đi u này có ngh a là các âm thanh to, cao t n có th che gi u đ c các âm thanh nh th p m t cách d dàng Các mô hình phân tích tâm lí đã ch ra đi m y u trên và thông tin này s giúp ích cho vi c ch n các audio thích h p cho vi c gi u tin
V n đ khó kh n th hai đ i v i gi u thông tin trong audio là kênh truy n tin Kênh truy n hay b ng thông ch m s nh h ng đ n ch t l ng thông tin sau khi gi u Gi u thông tin trong audio đòi h i yêu c u r t cao v
Trang 18tính đ ng b và tính an toàn c a thông tin Các ph ng pháp gi u thông tin trong audio đ u l i d ng đi m y u trong h th ng thính giác c a con ng i
c Gi u thông tin trong video
C ng gi ng nh gi u thông tin trong nh hay trong audio, gi u tin trong video c ng đ c quan tâm và đ c phát tri n m nh m cho nhi u ng d ng
nh đi u khi n truy c p thông tin, nh n th c thông tin và b o v b n quy n tác gi Các k thu t gi u tin trong video c ng đ c phát tri n m nh m và
c ng theo hai khuynh h ng là thu vân s và datahiding M t ph ng pháp
gi u tin trong video đ c đ a ra b i Cox là ph ng pháp phân b đ u Ý
t ng c b n c a ph ng pháp là phân ph i thông tin gi u dàn tr i theo t n s
c a d li u ch a g c M t s nhà nghiên c u khác đã dùng nh ng hàm Cosin riêng và các h s truy n sóng riêng đ gi u tin Trong các thu t toán kh i ngu n thì th ng các k thu t cho phép gi u các nh vào trong video nh ng
th i gian g n đây các k thu t cho phép gi u c âm thanh và hình nh vào video
Gi u tin là m t công ngh m i r t ph c t p, nó đang đ c các nhà khoa
h c t p trung nghiên c u nhi u n c trên th gi i Tuy nhiên, nh ng k t
qu th c nghi m cho th y đ th c s ng d ng th c t thì l nh v c này c n
ph i có thêm th i gian đ nghiên c u và th m đ nh
1.2 C b n v thu vân
1.2.1 Khái ni m thu vân
Thu vân s (digital watermarking) là quá trình chèn thông tin vào d
li u s đ m b o không th c m nh n đ c b ng các giác quan c a con ng i
nh ng l i d dàng phát hi n b i các thu t toán c a máy tính M t d u thu
vân (watermark) mà m t m u thông tin trong su t và không th nhìn th y
Trang 19đ c b ng các giác quan đ c chèn vào m t v trí thích h p trong d li u s
b ng cách s d ng m t thu t toán đ c bi t
Tu thu c vào m c đích và ng d ng mà các yêu c u c a h th ng watermarking đ c đ t ra V i các h th ng th c t , h th ng thu vân đòi h i các yêu c u sau:
+ Tính không nh n th y đ c (Imperceptibility): Các đi u ch nh
gây ra do nhúng watermark ph i th p h n ng ng c m th c a con ng i, ngh a là các m u dùng trong nhúng watermark ch đ c phép thay đ i r t nh trong gi i h n cho phép
+ Tính b n v ng (Robustness): ây là m t yêu c u nòng c t c a watermarking Tùy vào t ng lo i ng d ng mà tính b n v ng này b ng đ c nhìn nh n d i nhi u quan đi m khác nhau, n u nh đ i v i các ng d ng dùng đ b o v quy n s h u thì watermark c n ph i b n v ng qua m t s các hành đ ng c p nh t n i dung c a d li u N u nh đ i v i ng d ng đ ch ng làm gi ho c ch ng l i s thay đ i trên d li u thì đòi h i watermark ph i hu
b khi có các tác v này x y ra
+ Tính không chia tách đ c (Inseparability): Sau khi d li u đ c
nhúng watermark thì yêu c u là ph i r t khó ho c không th tách thành 2 ph n riêng bi t nh lúc đ u
+ B o m t (Security): Sau khi đã nhúng watermark vào d li u, thì yêu c u là ch cho phép nh ng user có quy n m i ch nh s a và phát hi n đ c watermark đi u này đ c th c hi n nh vào key dùng làm khoá trong gi i
thu t nhúng watermark vào d li u và gi i thu t phát hi n ra watermark trong
d li u
+ Tìm l i watermark: Có th c n ho c không c n đ n d li u g c v n
có th tìm l i đ c thu vân đã nhúng
Trang 20+ Trích watermark hay ki m ch ng: Cho phép ki m tra s t n t i
c a watermark trong d li u đã nhúng
1.2.2 M t s v n đ có liên quan đ n thu vân
Visible watermarks – th y vân hi n, gi ng nh tên g i, nó là nh ng
m u thông tin, t ng t nh nh ng logo đ c chèn vào nh ho c video K thu t này ch y u áp d ng cho nh đ đánh d u các nh trong c s d li u
nh ho c ng n ch n s mua bán trên web có s d ng nh ng nh này K thu t
k t h p thu vân v i nh g c dùng cách thay đ i đ sáng c a nh g c b ng cách dùng m t hàm thu vân v i m t khoá bí m t Khoá bí m t này xác đ nh giá tr gi ng u nhiên dùng cho vi c đi u ch nh đ sáng, m c đích là đ gây khó kh n h n cho các t n công xoá b d u n i này
khái ni m là b n v ng v i các t n công Ngay c n u s t n t i c a thông tin
n là b l thì k thu t này c ng s gây ra s khó kh n cho k t n công n u không bi t đ c khoá bí m t Lý do c a s b n v ng này đó là ph ng th c thu vân có th nhúng nhi u l n các thông tin nh và d li u c n b o v h n
là ph ng th c steganographic Trên th c t thì steganographic và watermarking không ph i là hai ph ng th c có ph n b sung cho nhau nhi u
h n là đ i l p nhau
Fingerprinting và labeling (l y d u vân tay và gán nhãn) là các thu t
ng bi u th các ng d ng đ c bi t c a thu vân, chúng gi ng nh nh ng thông tin c a t o hoá ho c nh ng đ c tr ng đ c nhúng vào các đ i t ng Fingerprinting có ngh a là quá trình thu vân v i các thông tin đ c nhúng
ho c là mã duy nh t xác đ nh tác gi ho c xác đ nh d li u g c ho c mã duy
nh t bên c nh các chu i mã có ch a các đ c tr ng d li u
Trang 21Bitstream watermarking (th y vân dòng bit) đôi khi đ c s d ng cho nén d li u thu vân ví d nh video Thu t ng nhúng các k hi u thay
th cho watermarking đ c các n ph m tr c đây s d ng, nh ng nó không
đ c ti p t c s d ng n a, và t đó d n đ n s hi u nh m gi a mã hoá và thu vân Mã hoá (cryptographic) ph c v cho m c đích xác đ nh quy n tác
gi Chúng đ c s d ng đ nh n d ng b t k thay đ i nào trong d li u đã
đ c đánh d u và xác th c ng i g i Tuy nhiên thu vân ch đ c s d ng
đ xác th c trong các ng d ng đ c bi t và th ng đ c thi t k cho vi c
ch ng l i các thay đ i và ch nh s a
Fragile watermarks (Thu vân d v ) là các thu vân có s r t h n
ch v m t b n v ng đ i v i d li u Chúng đ c áp d ng đ nh n d ng các thay đ i c a d li u đã thu vân h n là gìn gi thông tin, n u có các t n công
nh m xoá b thu vân thì vi c này c ng s phá hu luôn c d li u g c
1.2.3 Khái ni m thu vân c s d li u
Thu vân c s d li u là k thu t cho phép ng i ch d li u có th nhúng m t thu vân n vào d li u M t thu vân th ng mô t nh ng thông tin có th đ c dùng đ ch ng minh quy n s h u d li u, ch ng h n nh là tên ch s h u, ngu n g c, ho c ng i ti p nh n n i dung này Vi c nhúng thông tin an toàn đòi h i thu vân đ c nhúng trong d li u không th b làm
gi m o ho c b t y xoá m t cách d dàng Nhúng n có ngh a là thu vân không th nhìn th y đ c trong d li u H n th n a, vi c phát hi n thu vân
đ c th c hi n theo ph ng pháp “mù”, t c là không đòi h i d li u g c c ng
nh thu vân g c ng th i, khi nhúng thu vân vào d li u c n ph i đ m b o các thay đ i trên d li u là trong gi i h n cho phép c a t ng ng d ng c th
Trang 221.3 M t s ng d ng c a thu vân
1.3.1 B o v b n quy n tác gi (copyright protection)
ây là ng d ng c b n nh t c a k thu t thu vân s M t thông tin nào đó mang ý ngh a quy n s h u tác gi (ng i ta g i nó là thu vân - watermark) s đ c nhúng vào trong các s n ph m, thu vân đó ch m t mình
ng i ch s h u h p pháp các s n ph m đó có và đ c dùng làm minh
ch ng cho b n quy n s n ph m Gi s có m t thành ph m d li u d ng đa
ph ng ti n nh nh, âm thanh, video c n đ c l u thông trên m ng b o
v các s n ph m ch ng l i hành vi l y c p ho c làm nhái c n ph i có m t k thu t đ “dán tem b n quy n” vào s n ph m này Vi c dán tem hay chính là
vi c nhúng thu vân c n ph i đ m b o không đ l i m t nh h ng l n nào
đ n vi c c m nh n s n ph m Yêu c u k thu t đ i v i ng d ng này là thu vân ph i t n t i b n v ng cùng v i s n ph m, mu n b thu vân này mà không đ c phép c a ng i ch s h u thì ch còn cách là phá hu s n ph m
1.3.2 Phát hi n xuyên t c thông tin (authentication and tamper detection)
M t t p thông tin s đ c gi u trong ph ng ti n ch a, sau đó đ c s
d ng đ nh n bi t xem d li u trên ph ng ti n g c có b thay đ i hay không Các thu vân nên đ c n đ tránh s tò mò c a đ i ph ng, h n n a vi c làm gi các thu vân h p l hay xuyên t c thông tin ngu n c ng c n xem xét Trong các ng d ng th c t , ng i ta mong mu n tìm đ c v trí b xuyên t c
c ng nh phân bi t đ c các thay đ i (ví d nh phân bi t xem m t đ i t ng
đa ph ng ti n ch a thông tin gi u đã b thay đ i, xuyên t c n i dung hay là
ch b nén m t d li u) Yêu c u chung đ i v i ng d ng này là kh n ng gi u thông tin cao và thu vân không c n b n v ng
Trang 231.3.3 L y d u vân tay hay dán nhãn (fingerprinting and labeling)
Thu vân trong nh ng ng d ng này đ c s d ng đ nh n di n ng i
g i hay ng i nh n m t thông tin nào đó Ví d nh các vân khác nhau s
đ c nhúng vào các b n copy khác nhau c a thông tin g c tr c khi chuy n cho nhi u ng i V i nh ng ng d ng này thì yêu c u là đ m b o đ an toàn cao cho các thu vân, tránh kh n ng xoá d u v t trong khi phân ph i
1.3.4 i u khi n thi t b (Device control)
Các thi t b phát hi n thu vân ( đây s d ng ph ng pháp phát hi n thu vân đã gi u mà không c n thông tin g c) đ c g n s n vào trong các h
th ng đ c ghi, tùy thu c vào vi c có th y vân hay không đ đi u khi n (cho phép/c m) truy c p Ví d nh h th ng qu n lí sao chép DVD đã đ c ng
d ng Nh t Nhà s n xu t s trang b cho các ph ng ti n dùng đ nhân b n (nh CD writer…) kh n ng phát hi n xem digital media có ch a watermarks hay không, n u có thì s t ch i không nhân b n
1.3.5 Theo dõi quá trình s d ng (Tracking)
Digital watermarking có th đ c dùng đ theo dõi quá trình s d ng
c a các digital media M i b n sao c a s n ph m đ c ch a b ng m t watermark duy nh t dùng đ xác đ nh user là ai N u có s nhân b n b t h p pháp, ta có th truy ra ng i vi ph m nh vào watermark đ c ch a bên trong các ph ng ti n này
1.3.6 Theo dõi truy n thông (Broadcast Monitoring)
Các công ty truy n thông và qu ng cáo có th dùng k thu t digital watermarking đ qu n lý xem có bao nhiêu khách hàng đã dùng d ch v mà
h cung c p
Trang 241.3.7 Truy n tin bí m t (Concealed Communication)
B i vì digital watermarking là m t d ng đ c bi t c a vi c che d u d
li u (steganography) nên ng i ta có th dùng đ truy n các thông tin bí m t
1.4 Gi i thu t di truy n
Gi i thu t di truy n (GA - Genetic Algorithms) là k thu t giúp gi i
quy t bài toán b ng cách mô ph ng theo s ti n hoá c a con ng i hay c a sinh v t nói chung (d a trên thuy t ti n hoá muôn loài c a Darwin) trong đi u
ki n luôn thay đ i c a môi tr ng s ng Thu t toán di truy n là m t h ng
ti p c n tính toán g n đúng, ngh a là m c tiêu c a thu t toán di truy n không
nh m đ a ra l i gi i chính xác t i u mà là đ a ra l i gi i t ng đ i t i u
Gi i thu t di truy n là m t k thu t c a khoa h c máy tính nh m tìm ki m
gi i pháp thích h p cho các bài toán t i u t h p (combinatorial optimization) Gi i thu t di truy n là m t phân ngành c a gi i thu t ti n hoá
v n d ng các nguyên lý c a ti n hoá nh di truy n, đ t bi n, ch n l c t nhiên, và lai ghép
Gi i thu t di truy n th ng đ c ng d ng nh m s d ng ngôn ng máy tính đ mô ph ng quá trình ti n hoá c a m t t p h p nh ng đ i di n tr u
t ng (g i là nh ng nhi m s c th ) c a các gi i pháp có th ch p nh n đ c (g i là nh ng cá th ) cho bài toán t i u hoá T p h p này s ti n tri n theo
h ng ch n l c nh ng gi i pháp t t h n Tìm ki m gi thuy t thích h p b t
đ u v i m t qu n th , hay m t t p h p có ch n l c ban đ u c a các gi thuy t Các cá th c a qu n th hi n t i kh i ngu n cho qu n th th h k
ti p b ng các ho t đ ng lai ghép và đ t bi n ng u nhiên – đ c l y m u sau các quá trình ti n hoá gi ng nh ti n hoá sinh h c m i b c, các gi thuy t trong qu n th hi n t i đ c c l ng liên h v i đ i l ng thích nghi đã cho, v i các gi thuy t phù h p nh t đ c ch n theo xác su t là các h t gi ng
Trang 25cho vi c s n sinh th h k ti p Thu t gi i di truy n đã đ c ng d ng m t cách thành công và đ c phát tri n r ng rãi trong nhi u l nh v c
Gi i thu t di truy n (GA) cung c p m t ph ng pháp h c đ c thúc đ y
b i s t ng t v i s ti n hoá sinh h c Thay vì tìm ki m các gi thuy t t
Trang 26CH NG 2 – TH C TR NG NGHIÊN C U THU VÂN C S D LI U QUAN H
2 Tình hình nghiên c u trên th gi i
Cho đ n nay, các nhà khoa h c Vi t Nam đã có m t s công trình đã
đ c công b trong đó có áp d ng k thu t thu vân, trong đó ch y u t p trung vào các l nh v c nh thu vân audio, thu vân video, thu vân nh Các công trình nghiên c u v thu vân c s d li u v n còn h n ch và đang
đ c ti p t c nghiên c u tuy nhiên v n ch a nhi u v s l ng các công trình Các công trình v thu vân s s d li u thông th ng nghiên c u theo m t
s h ng nh sau:
Ph ng pháp s d ng các bít tr ng s nh [1,2] LSB khá đ n gi n cho
vi c cài đ t, tuy nhiên thông tin gi u không b n v ng tr c nhi u hình th c
t n công Ph ng pháp này thích h p cho m c đích gi u thông tin m t
Ph ng pháp gán và s d ng thu c tính ch n l [3,4] có m t s u
đi m nh đ n gi n trong cài đ t, d ki m soát ch t l ng môi tr ng gi u tin,
có đ b n v ng cao tr c nhi u hình th c t n công Ph ng pháp này có hi u
qu cao khi áp d ng cho môi tr ng gi u tin không ch u nén t n hao, có cho phép sai s
2.2 Tình hình nghiên c u trên th gi i
C n c vào các công trình nghiên c u, các bài báo đã công b , có th phân chia thu vân c s d li u theo các d ng nh sau:
Trang 272.2.1 Theo ki u d li u (Data type)
a) Thu vân d li u ki u s (watermarking numerical data) có các nghiên c u
c a R Agrawaland J Kiernan: Watermarking Relational Databases VLDB,
2002
Gi thi t c b n c a nghiên c u này là ch p nh n m t l ng thay đ i
v i các s nh ξ bit ít ý ngh a nh t c a các giá tr d li u ki u s
Ý t ng c b n là ph i đ m b o r ng các v trí bit nhúng đó có ch a các giá tr đ c tr ng đ có th xác đ nh đ c b i khoá bí m t K
nh n d ng l i thu vân đã nhúng, ng i ta đã ti n hành so sánh các giá tr đánh d u đ c tính toán v i các giá tr bit đã l u trong c s d li u Thu vân đ c nh n d ng n u t l ph n tr m trùng l p l n h n m t ng ng
T nào đó cho tr c
b) Watermarking categorical data có các nghiên c u c a
+ R Sion: Proving ownership over categorical data ICDE 2004 + E Bertino, B.C Ooi, Y.Yang, and R Deng: Privacy and ownership preserving of outsourced medical data ICDE 2005
Ý t ng c b n c a các nghiên c u này là: đ i v i m i nhóm thu c tính
X nào đó, thay đ i m t s giá tr c a thu c tính này thành các giá tr khác sao cho các thay đ i này là ch p nh n đ c Các thay đ i này s tu thu c vào
t ng ng d ng c th
2.2.2 Theo ki u bi n d ng (Distortion)
Ba nhà khoa h c Y Li, H Guo, và S Jajodia công b công trình
“Tamper Detection and Localization for Categorical Data Using Fragile Watermarks”, DRM 2004
Ý t ng c b n c a nghiên c u này là: T t c các b đ c phân ho ch
Trang 28vân (watermark) khác đ c nhúng vào m i nhóm, vì v y b t k m t thay đ i nào trên d li u đ u có th đ c nh n d ng và đ nh v v i đ chính xác cao
t i c p nhóm
2.2.3 Theo đ nh y (Sensitivity)
H th ng thu vân có th đ c phân thành hai d ng là b n v ng và d
b phá hu thông qua đ nh y c a chúng đ i v i các t n công c s d li u + Thu vân b n v ng (Robust watermarks) đ c s d ng cho b o v
b n quy n, ch ng mình quy n s h u, ho c ch ng l i s sao chép l u
+ Thu vân d b phá hu (Fragile watermarks) đ c s d ng đ đ nh
Thu vân đ c tính toán b ng cách b m t t c các b thành các nhóm
B t k thay đ i nào t i d li u đ u có th đ c nh n d ng chi ti t đ n
m c nhóm d li u v i t l thành công/l i là 1 2lng!
Trang 29*) Các tác gi H Guo, Y Li, A Liu, và S Jajodia v i công trình “A Fragile Watermarking Scheme for Detecting Malicious Modifications of Database Relations” IS 2006
óng góp c a công trình này là c i thi n đ chính xác khi xác đ nh v trí làm gi trong d li u
2.2.4 Theo thông tin thu vân (watermark information)
a) Nhúng m t bit đ n nhi u bit
R Sion, M Atallah, và S Prabhakar v i công trình “Rights Protection for Relational Data” SIGMOD 2003
Thu vân m t t p các s th c b ng cách thay đ i các phân ph i c a nó
Ph ng pháp này đ c th c hi n b ng cách:
+ S p x p các giá tr thông qua khoá đ c b m c a t p các bit ý ngh a
nh t c a các giá tr đã đ c chu n hoá
+ Phân ho ch chúng thành các t p con không giao nhau
+ Nhúng m t bit thu vân vào m t t p con b ng cách th c hi n các thay đ i r t nh , nh v y các đ u ra trong phân ph i là nh h n (ho c l n
h n) m t ng ng nh (ho c l n) nào đó
b) Nhúng t nhi u bit đ n c m t d u vân tay
Y Li, V Swarup, và S Jajodia v i công trình “Fingerprinting Relational Databases: Schemes and Specialties” TDSC 2005 c đi m c a
ph ng pháp là:
+ nh danh đ i t ng s d ng d li u
+ Nhi u bit fingerprint đ c s d ng đ xác đ nh đ i t ng ng i dùng nào là k gian l n
Trang 30c) Nhúng m t thu vân đ n nhi u thu vân
Y Li, H Guo, và S Wang công b công trình nghiên c u “A Multi-Bit Watermark for Relational Data” JDM 2007
Công trình này gi i quy t đ c các gi thi t đ t ra nh sau:
+ K gi m o c tình chèn thêm thu vân khác n a vào d li u đã đ c thu vân
+ M t nhóm ng i dùng mu n nhúng thu vân riêng c a m i ng i vào d li u và xác minh l i quy n s h u c a h m t cách đ c l p
Gi i pháp c a nghiên c u này đ a ra là: M r ng nghiên c u c a Agrawal và Kiernan là nhúng nhi u thu vân khác nhau W1, W2, W3,… vào
+ Ng i ch s h u d li u s d ng m t khoá công khai đ th c hi n
m t thu vân công khai Vì v y b t k ai c ng có th s d ng các khoá công khai này đ nh n d ng thu vân đã nhúng
Gi i pháp c a tác gi đ a ra là:
+ Công khai khoá
+ Thu vân (công khai): Khoá chính, bit ý ngh a nh t đ c ch n (most significant bit)
+ D u xác th c: S hi u ch s h u (owner ID), khoá thu vân (key), hàm b m, th i đi m t o d li u, tính pháp lý, thu c l nh v c nào
Trang 312.2.6 Theo c u trúc d li u (Data structure)
a) S d ng khoá chính o (Virtual primary key)
Y Li, V Swarupand S Jajodia v i công trình “Constructing a Virtual Primary Key for Fingerprinting Relational Data” DRM 2003
Gi i quy t v n đ đ t ra là: Nhi u l c đ thu vân đ u d a vào s t n
t i c a khoá chính, đi u này t n t i m t s nh c đi m nh sau:
+ Không th áp d ng thu vân tr c ti p v i nh ng quan h mà không
+ Nh c đi m c a ph ng pháp này là làm t ng g p đôi nguy c th t
b i khi nh n d ng l i thu vân đã nhúng b i vì, khi tao ra thêm m t khoá chính o, m t s bit thu vân s đ c nhúng ít l n h n các bit khác vào d
li u i u này làm gia t ng kh n ng th t b i trong nh n d ng thu vân n u b
t n công
b) X lý d li u theo kh i (Data cube)
J Guo, Y Li, R Deng, và K Chen công b công trình “Rights Protection for Data Cubes” ISC 2006