Định nghĩa: Qua nghiên cứu các phương pháp giấu tin, ta có thể định nghĩa nó nhưsau: Giấu thông tin là kỹ thuật nhúng embedding một lượng thông tin số nào đó vào trong một đối tượng dữ
Trang 1MỤC LỤC
Trang
Trang phụ bìa
Lời cam đoan
Mục lục i
Danh mục các ký hiệu, chữ viết tắt iv
Danh mục các bảng v
Danh mục các hình (hình vẽ, hình chụp, đồ thị) iv
MỞ ĐẦU: 1
1 ĐẶT VẤN ĐỀ 1
2 MỤC ĐÍCH CỦA LUẬN VĂN 2
3 BỐ CỤC LUẬN VĂN 3
NỘI DUNG
CHƯƠNG 1: TỔNG QUAN VỀ GIẤU TIN 4
1.1 Các khái niệm cơ bản về giấu tin 4
1.1.1 Định nghĩa: 4
1.1.2 Phân loại các kỹ thuật giấu tin 5
1.1.3 Vài nét về lịch sử giấu tin 9
1.1.4 Các yêu cầu đối với giấu tin cho ảnh 10
1.1.5 Mô hình kỹ thuật giấu tin 12
1.1.6 Các ứng dụng của kỹ thuật giấu tin 13
1.1.7 Các kiểu đánh dấu ẩn 15
1.2 Giấu tin trong ảnh những đặc trưng và tính chất 15
1.2.1 Giấu tin trong ảnh 15
1.2.2 Những đặc trưng và tính chất 16
Trang 21.2.3 Các phương pháp giấu tin 19
1.3 Kết luận chương 21
CHƯƠNG 2: GIẤU TIN TRONG BẢN ĐỒ VÉC TƠ 23
2.1 Bản đồ 23
2.2 Thủy vân bản đồ véc tơ 25
2.3 Đặc điểm riêng của thủy vân bản đồ Véc tơ 27
2.3.1 Dữ liệu bản đồ véc tơ 27
2.3.2 Độ chính xác của bản đồ véc tơ 28
2.3.3 Các khả năng giấu tin 29
2.3.3.1 Giấu tin hình học 29
2.3.3.2 Giấu tin vào đỉnh 30
2.3.3.3 Sắp xếp đối tượng 30
2.3.3.4 Giảm nhiễu 30
2.4 Thuật toán thủy vân 31
2.4.1 Thuật toán trong miền không gian 31
2.4.2 Thuật toán trong miền biến đổi (miền tần số) 36
2.4.2.1 Miền DFT : 37
2.4.2.2 Miền DWT : 39
2.4.2.3 Miền DCT 41
2.4.3 Thuật toán nhận được từ mô hình ba chiều 41
2.6 Kết luận chương 42
CHƯƠNG 3: THUẬT TOÁN GIẤU VÀ TÁCH TIN TRONG BẢN ĐỒ
VÉC TƠ 43
3.1 Giấu tin trong ảnh đen trắng 43
3.1.1 Thuật toán giấu tin cơ sở 43
Trang 3a Tiền xử lí 43
b Quá trình thực hiện giấu tin 43
3.1.2 Thuật toán trích tin 45
a Tiền xử lí: 45
b Quá trình trích tin: 45
3.2 Biến đổi Fourier 45
a Biến đổi Fourier 45
b Biến đổi Fourier liên tục 47
c Biến đổi Fourier rời 49
3.2.1 Những biến đổi Fourier trong véc tơ 51
3.3 Kết luận chương 51
CHƯƠNG 4: CHƯƠNG TRÌNH THỬ NGHIỆM 52
4.1 Mô tả bài toán thử nghiệm 52
4.2 Định dạng cấu trúc tệp Shapefile 53
4.2.1 Tổ chức dữ liệu khuôn mẫu của Shapefile 54
4.2.2 Quy ước về tên tệp 54
4.2.3 Kiểu dữ liệu 55
4.2.4 Cấu trúc của Main file 55
4.2.5 Cấu trúc của tệp chỉ số (Index file) 64
4.2.6 Cấu trúc của tệp chứa cơ sở dữ liệu 65
4.3 Quy trình giấu thông tin 65
a Phân tích thuật toán 65
b Giấu thông tin 66
4.4 Quy trình tách thông tin 69
4.5 Kết luận chương 70
Trang 4KẾT LUẬN 71
Trang 5DANH MỤC CÁC BẢNG
Bảng 1 Mô tả Header của tệp chính 64
Bảng 2 Mô tả Header của mỗi bản ghi 66
Bảng 3 Nội dung của bảng điểm 67
Bảng 4 Nội dung của bảng ghi đa điểm 67
Bảng 5 Nội dung của bản ghi đường 69
Bảng 6 Nội dung của bản ghi vùng 71
Bảng 7 Mô tả bản ghi của tệp chỉ số 72
Trang 6DANH MỤC CÁC HÌNH VẼ
Tên hình Ý nghĩa
Hình 1.1 Phân loại các kỹ thuật giấu tin (Fabien A.P Petitcolaset al.,
1999) Hình 1.2 Quá trình giấu tin và tách tin.
Hình 2.1 Các lớp bản đồ phân lớp đối tượng
Hình 2.2 Thế giới thực và bản đồ vectơ
Hình 4.1 Cấu trúc của tệp chính
Hình 4.2 Cấu trúc của tệp chỉ số.
Hình 4.3 Mô tả một bản đồ vector đơn giản
Hình 4.4 Giao diện chương trình DEMO
Trang 7DANH MỤC CÁC CHỮ VIẾT TẮT
Chữ
viết tắt
DCT Discrete Cosine Transform Biến đổi Cosin rời rạc
IDCT Invert Discrete Cosine Transform Biến đổi ngược DCT
DFT Discrete Fourier Transform Biến đổi Forier rời rạc
IDFT Invert Discrete Fourier
Transform
Biến đổi ngược DFT.
DWT Discrete Wavelet Transform Biến đổi Wavelet rời rạc
Intrinsic Steganography Giấu tin có xử lý
ấn
IDWT Invert Discrete Wavelet
Transform
Biến đổi ngược DWT
FFT Fast fourier transfer Biến đổi Fourier nhanh
GIS Geographic Information System Hệ thống thông tin địa lý PRNS Pseudo random number sequence Dãy số giả ngẫu nhiên
MỞ ĐẦU:
Trang 81 ĐẶT VẤN ĐỀ
Ngày nay, với sự ra đời và phát triển của mạng Internet Mọi người đều cóthể kết nối vào Internet, tìm kiếm thông tin một cách dễ dàng thông qua nhàcung cấp dịch vụ mạng
Sự phát triển nhanh chóng của khoa học kỹ thuật trên nhiều lĩnh vực đặcbiệt là trong lĩnh vực đa phương tiện (multimedia) làm cho sự sản xuất, quản lý
và phân phối các sản phẩm này: hình ảnh, âm thanh… rất dễ dàng Cùng với sựphổ biến rộng rãi các mạng internet tốc độ cao làm cho quá trình phân phốichúng trở nên rất nhanh chóng, dễ dàng, đem lại những thuận lợi to lớn thôngqua hệ thống thương mại điện tử
Với môi trường mở và tiện nghi như thế, các hệ thống mạng hiện đại trởthành phương tiện phân phối tài liệu một cách nhanh chóng và kinh tế Tuynhiên, việc phân phối một cách phổ biến các tài nguyên trên mạng hiện nay luôngặp phải vấn nạn sao chép và sử dụng không hợp pháp như: Xâm phạm bảnquyền, truy cập trái phép, xuyên tạc, giả mạo thông tin…
Đi đôi với sự phát triển của công nghệ máy tính thì tình trạng sử dụng bấthợp pháp các sản phẩm số (tệp tin tài liệu, chương trình, âm thanh và hình ảnh )ngày càng tăng, do các tệp tin số có thể sao chép dễ dàng giữa các máy tính Dẫnđến tình trạng vi phạm bản quyền số đang xảy ra hàng ngày, hàng giờ trên khắpthế giới Nhằm bảo vệ các sản phẩm số không bị sử dụng trái phép, song songvới việc kêu gọi ý thức tự giác thực thi luật bản quyền, các công ty công nghệlớn trên thế giới đã và đang thực hiện các giải pháp kỹ thuật kiểm soát bản quyền
số Một trong những vấn đề được đặt ra là làm sao bảo vệ quyền sở hữu đối vớicác sản phẩm đa phương tiện này
Trang 9Đứng trước tình hình đó vấn đề về bảo mật thông tin hiện nay luôn nhậnđược sự quan tâm đặc biệt trong nhiều lĩnh vực Từ xa xưa đã có nhiều cách đểbảo mật thông tin, một trong những phương pháp dùng rất sớm để bảo vệ quyền
sở hữu đối với nội dung của các sản phẩm đa phương tiện là mã hoá Nội dungcủa sản phẩm đó được mã hoá và gửi cho người sử dụng Người sử dụng chỉ đọcđược các thông tin này khi nhận được khoá để giải mã đi kèm Phương pháp mãhoá trên chỉ hiệu quả trong việc truyền thông tin nhưng không hiệu quả trongviệc bảo vệ quyền sở hữu Sau khi người sử dụng đã giải mã được thì sẽ nhânbản và phân phối lại sản phẩm đó Ngày nay phương pháp giấu thông tin trongcác sản phẩm đa phương tiện được dùng phổ biến vì ngoài vấn đề bảo mật cònbảo vệ bản quyền, chống nhân bản bất hợp pháp, chống truy cập trái phép, chốngxuyên tạc, chống giả mạo thông tin…
Giải pháp bảo mật thông tin được sử dụng phổ biến nhất là dùng các hệmật mã [1], [3] Với giải pháp này, thông tin ban đầu sẽ được mã hóa thành bảnmật mã mang những giá trị “vô nghĩa” Chính điều này làm nảy sinh nghi ngờ vàngười sử dụng tìm mọi cách thám mã Ngược lại, nếu đem thông tin giấu vàotrong một đối tượng khác, một bức ảnh F chẳng hạn, sẽ thu được một ảnh F’ hầunhư không sai khác với F khi nhìn bằng mắt thường Đây là ý tưởng của phươngpháp giấu tin (data hiding) trong môi trường ảnh, giấu tin mật [5], [6], đánh dấubản quyền [7], [8], và nhiều ứng dụng khác …
2 MỤC ĐÍCH CỦA LUẬN VĂN
Giấu tin là một lĩnh vực rộng lớn, trong luận văn này nghiên cứu các kỹthuật giấu tin trong ảnh rồi áp dụng cho bản đồ, một trong những vấn đề đượcứng dụng khá rộng rãi Để thực hiện việc giấu tin trong bản đồ, ý tưởng cơ bản làbiến đổi một số thuộc tính của các điểm trên bản đồ theo một số thuật toán nhất
Trang 10định, nhằm đảm bảo rằng dữ liệu bản đồ, về mặt thị giác, không sai khác là mấy
so với bản đồ gốc, đồng thời, sau khi nhận được bản đồ đích, sử dụng quy trìnhgiải mã với các khóa phù hợp, ta có thể trích được thông tin cần dấu
Nội dung của luận văn này tập trung nghiên cứu các phương pháp giấu tintrong ảnh bitmap, ảnh vector, các phương pháp thủy vân số [14], [15], một sốphương pháp giấu tin dựa vào các phép biến đổi DCT, DFT, DWT
3 BỐ CỤC LUẬN VĂN
Luận văn gồm trang, được trình bày trong 3 chương, có phần mở đầu,phần kết luận, phần mục lục, phần tài liệu tham khảo Các nội dung cơ bản củaluận văn được trình bày theo cấu trúc như sau:
Chương 1: Tổng quan về giấu tin
Trình bày tổng quan về giấu tin, phân tích các yêu cầu đối với giấu tin choảnh, trình bày một số loại hình giấu tin và các yêu cầu đối với giấu tin trong ảnh.Bên cạnh đó trình bày một số mô hình giấu tin và các ứng dụng của chúng,những đặc trưng và tính chất của giấu tin trong ảnh Ngoài ra, một nội dung rấtquan trọng trong chương này đó là các phương pháp giấu tin và các thuật toángiấu tin
Chương 2 : Các kỹ thuật giấu tin trong ảnh
Tập trung phân tích, đánh giá các thuật toán giấu tin trong ảnh, kỹ thuậtbiến đổi Fourier Biến đổi Fourier trong ảnh vector, các thuật toán giấu và táchthông tin trong ảnh vector
Chương 3: Xây dựng chương trình
Trình bày cấu trúc bản đồ dạng shapefile và biến đổi DFT, xây dựng thuật toánnhúng tách watermark
Trang 11CHƯƠNG 1: TỔNG QUAN VỀ GIẤU TIN
1.3 Các khái niệm cơ bản về giấu tin
1.3.1 Định nghĩa:
Qua nghiên cứu các phương pháp giấu tin, ta có thể định nghĩa nó nhưsau:
Giấu thông tin là kỹ thuật nhúng (embedding) một lượng thông tin số nào
đó vào trong một đối tượng dữ liệu số khác.[18]
Trong khuôn khổ của luận văn, các thuật ngữ “giấu tin”, “giấu thông tin”
và “giấu dữ liệu”; thuật ngữ “đánh dấu ẩn”,”thủy vân số” và “thủy vân”; Tương
tự ta cũng có “mã” và “mã đánh dấu bản quyền”được xem đồng nghĩa Mộttrong những yêu cầu cơ bản của giấu tin là đảm bảo tính chất ẩn của thông tinđược giấu đồng thời không làm ảnh hưởng đến chất lượng của dữ liệu gốc
Sự khác biệt chủ yếu giữa mã hoá thông tin và giấu thông tin là mã hoálàm cho các thông tin hiện rõ là nó có được mã hoá hay không tức là giấu đi ýnghĩa của thông tin còn, còn với giấu thông tin thì người ta sẽ khó biết được là
có thông tin giấu bên trong tức là giấu đi sự hiện diện của thông tin Về bản chấtgiấu tin gần với nén dữ liệu hơn Tóm lại giấu tin và mã hóa có mối quan hệ mậtthiết với nhau, cùng xây dựng một hệ thống an toàn và bảo mật thông tin
Kỹ thuật giấu thông tin nhằm mục đích đảm bảo an toàn và bảo mật thôngtin ở hai khía cạnh Một là bảo mật cho giữ liệu được đem giấu (embeddeddata), chẳng hạn như giấu tin mật: thông tin mật được giấu kỹ trong một đốitượng khác sao cho người khác không phát hiện được (steganography), hai làbảo mật cho chính đối tượng được dùng để giấu tin (host data), chẳng hạn nhưứng dụng bảo vệ bản quyền, phát hiện xuyên tạc thông tin (watermarking) Hai
Trang 12khía cạnh khác nhau này dẫn đến hai khuynh hướng kỹ thuật chủ yếu của giấutin Khuynh hướng thứ nhất là giấu tin mật (Steganography) Khuynh hướng nàytập trung vào các kỹ thuật giấu tin sao cho thông tin giấu được nhiều và quantrọng là người khác khó phát hiện được một đối tượng có bị giấu tin bên tronghay không Khuynh hướng thứ hai là thuỷ vân số (watermarking) Khuynhhướng thuỷ vân số đánh giấu vào đối tượng nhằm khẳng định bản quyền sở hữuhay phát hiện xuyên tạc thông tin Thuỷ vân số có miền ứng dụng lớn hơn nênđược quan tâm nghiên cứu nhiều hơn và thực tế đã có nhiều những kỹ thuật dànhcho khuynh hướng này.
1.3.2 Phân loại các kỹ thuật giấu tin
Do kỹ thuật giấu thông tin số mới được hình thành trong thời gian gần đâynên xu hướng phát triển chưa ổn định Nhiều phương pháp mới, theo nhiều khíacạnh khác nhau đang và chắc chắn sẽ được đề xuất, bởi vậy một định nghĩachính xác, một sự đánh giá phân loại rõ ràng chưa thể có được Sơ đồ phân loạitrên được Fabien A P Petitcolas đề xuất năm 1999
Có thể chia lĩnh vực giấu tin thành hai hướng lớn là thủy vân số và giấu tinmật [18] Giấu tin mật quan tâm đến các ứng dụng sao cho người khác khó pháthiện nhất việc có tin được giấu và nếu có phát hiệ tin được giấu thì việc giải tincũng khó thực hiện nhất
Phạm vi ứng dụng của thủy vân đa dạng hơn, tùy theo mục đích của hệthủy vân mà người ta lại chia thành các hướng nhỏ như thủy vân dễ vỡ và thủyvân bền vững
Trang 13Hình 1.1 Phân loại các kỹ thuật giấu tin ( Fabien A.P Petitcolaset al., 1999)
Sơ đồ phân loại này như một bức tranh khái quát về ứng dụng và kỹthuật giấu thông tin Dựa trên việc thống kê sắp xếp khoảng 100 công trình đãcông bố trên một số tạp chí, cùng với thông tin về tên và tóm tắt nội dung củakhoảng 200 công trình đã công bố trên Internet, có thể chia lĩnh vực giấu tin ralàm hai hướng lớn, đó là watermarking và steganography
Steganography (giấu tin, viết phủ) là lĩnh vực nghiên cứu việc nhúng các
mẩu tin mật vào một môi trường phủ Trong quá trình giấu tin để tăng bảo mật
có thể người ta dùng một khoá viết mật khi đó người ta nói về IntrinsicSteganography (dấu tin có xử lý) Khi đó để giải mã người dùng cũng phải cókhoá viết mật đó Chú ý rằng khoá này không phải là khoá dùng để lập mật mã
Giấu thông tin
Trang 14mẩu tin, ví dụ nó có thể là khoá để sinh ra hàm băm phục vụ rải tin vào môitrường phủ Ngược lại nếu không dùng khoá viết mật thì người ta chỉ dấu tin đơnthuần vào môi trường phủ thì khi đó người ta nói về Pure Steganography (dấutin đơn thuần).
Watermarking (thuỷ ấn) là kỹ thuật nhúng một biểu tượng vào trong ảnh
môi trường để xác định quyền sở hữu ảnh môi trường, chống sự giả mạo vàxuyên tạc thông tin Kích thước của biểu tượng thường nhỏ (từ vài bit tới vàinghìn bit) Kỹ thuật này cho phép đảm bảo nguyên vẹn biểu tượng khi ảnh môitrường bị biến đổi bởi các phép thao tác như lọc (filtering), nén mất dữ liệu(lossy compression), hay các biến đổi hình học, Tuy nhiên việc đảm bảonguyên vẹn biểu tượng không kể đến khi có sự tấn công dựa trên việc hiểu rõthuật toán và có bộ giải mã trong tay Thông tin giấu là một định danh duy nhất,
ví dụ định danh người dùng thì khi đó người ta gọi là Fingerprinting (nhận dạngvân tay, điểm chỉ)
Nếu như watermark (thủy vân, thủy ấn) quan tâm nhiều đến ứng dụnggiấu các mẩu tin ngắn nhưng đòi hỏi độ bền vững lớn của thông tin cần giấu(trước các biến đổi thông thường của tệp dữ liệu môi trường) thì steganographylại quan tâm tới ứng dụng che giấu các bản tin đòi hỏi độ bí mật và dung lượngcàng lớn càng tốt Đối với từng hướng lớn này, quá trình phân loại theo các tiêuchí khác có thể tiếp tục được thực hiện, ví dụ dựa theo ảnh hưởng các tác động
từ bên ngoài có thể chia watermark thành hai loại, một loại bền vững với cáctác động sao chép trái phép, loại thứ hai lại cần tính chất hoàn toàn đối lập: dễ
bị phá huỷ trước các tác động nói trên Cũng có thể chia watermark theo đặctính, một loại cần được che giấu để chỉ có một số người tiếp xúc với nó có thểthấy được thông tin, loại thứ hai đối lập, cần được mọi người nhìn thấy
Trang 15Xét về tính chất thuỷ ấn giống giấu tin ở chỗ tìm cách nhúng thông tin mậtvào một môi trường Nhưng về bản chất thì thuỷ ấn có những nét khác ở một sốđiểm:
• Mục tiêu của thuỷ ấn là nhúng thông tin không lớn thường là biểu tượng,chữ ký hay các đánh dấu khác vào môi trường phủ nhằm phục vụ việc xácnhận bản quyền
• Khác với giấu tin ở chỗ giấu tin sau đó cần tách lại tin còn thuỷ ấn tìmcách biến tin giấu thành một thuộc tính của vật mang
• Chỉ tiêu quan trọng nhất của một thuỷ ấn là tính bền vững, của giấu tin làdung lượng
Điểm khác nữa giữa thuỷ ấn và giấu tin là thuỷ ấn có thể vô hình hoặc hữu hìnhtrên ảnh mang
Kỹ thuật giấu tin được áp dụng cho các loại dữ liệu ảnh, audio, vidio.Chức năng của giấu tin trong ảnh sẽ khác nhau tuỳ theo các hình thức xâm phạm
Ảnh bị sửa đổi: nội dung của ảnh bị xuyên tạc Trong trường hợp này giấutin có tác dụng phân biệt ảnh bản quyền với ảnh bị sửa đổi nội dung Áp dụng
Trang 16các bước tách tin giống nhau với các ảnh khác nhau, ta sẽ tách được dấu bảnquyền đã được đăng ký trước đối với ảnh bị xuyên tạc.
Hầu hết giấu tin được gắn cho ảnh là giấu không nhìn thấy nhưng trênthực tế tồn tại một loại giấu tin có thể nhìn thấy, chúng không trong suốt hoàntoàn.Tuy nhiên nội dung của luận văn này tôi chỉ đề cập tới loại giấu tin khôngnhìn thấy
1.3.3 Vài nét về lịch sử giấu tin
Các kỹ thuật giấu tin đã được đề xuất và sử dụng từ xa xưa, và sau này đãđược phát triển ứng dụng cho nhiều lĩnh vực Từ Steganography bắt nguồn từHi-Lạp với ý nghĩa là tài liệu được phủ (covered writing) Các câu chuyện kể về
kỹ thuật giấu thông tin được truyền qua nhiều thế hệ Có lẽ những ghi chép sớmnhất về kỹ thuật giấu thông tin (thông tin được hiểu theo nghĩa nguyên thủy củanó) thuộc về sử gia Hy-Lạp Herodotus Khi bạo chúa Hy-Lạp Histiaeus bị vuaDarius bắt giữ ở Susa vào thế kỷ thứ năm trước Công nguyên, ông ta đã gửi mộtthông báo bí mật cho con rể của mình là Aristagoras ở Miletus Histiaeus đã cạotrọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ
ấy Khi tóc của người nô lệ này mọc đủ dài người nô lệ được gửi tới Miletus
Một câu chuyện khác về thời Hy-Lạp cổ đại cũng do Herodotus ghi lại.Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong.Demeratus, một người Hy-Lạp, cần thông báo cho Sparta rằng Xerxes định xâmchiếm Hy-Lạp Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các viênthuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại các viênthuốc bằng một lớp sáp mới Những viên thuốc được để ngỏ và lọt qua mọi sựkiểm tra một cách dễ dàng
Trang 17Mực không màu là phương tiện hữu hiệu cho bảo mật thông tin trong mộtthời gian dài Người Romans cổ đã biết sử dụng những chất sẵn có như nướcquả, nước tiểu và sữa để viết các thông báo bí mật giữa những hàng văn tự thôngthường Khi bị hơ nóng, những thứ mực không nhìn thấy này trở nên sẫm màu
và có thể đọc dễ dàng
Ý tưởng về che giấu thông tin đã có từ hàng nghìn năm về trước nhưng kỹthuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo Mãicho tới vài thập niên gần đây, giấu thông tin mới nhận được sự quan tâm của cácnhà nghiên cứu và các viện công nghệ thông tin với hàng loạt công trình nghiêncứu giá trị Cuộc cách mạng số hoá thông tin và sự phát triển nhanh chóng củamạng truyền thông là nguyên nhân chính dẫn đến sự thay đổi này Những phiênbản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, cộng với sự lưuthông phân phối trên mạng của các dữ liệu đa phương tiện đã sinh ra nhiều vấn
đề nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc tráiphép
1.3.4 Các yêu cầu đối với giấu tin cho ảnh
Mục đích của giấu tin cho ảnh là bảo vệ bản quyền cho chủ sỡ hữu ảnh.Những yêu cầu cơ bản đối với giấu tin cho ảnh là:
• Tính ẩn của giấu tin được chèn vào ảnh: Sự hiện diện của giấu tin trongảnh không làm ảnh hưởng tới chất lượng của ảnh đã chèn tin
• Tính bền của giấu tin: Cho phép các tin có thể tồn tại được qua các phépbiến đổi ảnh, biến dạng hình học hay các hình thức tấn công cố ý khác
• Tính an toàn: không thể xoá được tin ra khỏi ảnh trừ khi ảnh được biến đổitới mức không còn mang thông tin
Trang 18Tính ẩn của tin là một yêu cầu rất quan trọng của phương pháp giấu tin.Nếu tính ẩn của tin không được đảm bảo thì không những nó làm ảnh hưởng tớichất lượng của ảnh mà còn dễ dàng tạo điều kiện cho các hình thức tấn côngnhằm loại bỏ tin ra khỏi ảnh Với ảnh được đánh dấu một cách lý tưởng, ảnh cóbản quyền và ảnh gốc sẽ không thể phân biệt được bằng mắt thường Như vậygiá trị của bức ảnh sẽ không bị thay đổi và việc các tin như vậy sẽ là rào cản lớncho những kẻ phá hoại trong việc cố gắng xoá hoặc sửa đổi các thông tin về bảnquyền ảnh Trên thực tế khi chèn tin vào ảnh thì ảnh kết quả và ảnh gốc sẽ cónhững sai khác, để không thể nhận ra được những thay đổi về nội dung dữ liệunày, người ta thường khai thác các đặc điểm về khả năng cảm thụ của mắt người.
Tính bền của giấu tin liên quan đến việc tách tin từ ảnh có bản quyền mộtảnh sau khi được đánh dấu có thể được đem ra xử lý để phục vụ cho các mụcđích khác nhau như nén ảnh, biến đổi hình học, lọc ảnh cải thiện ảnh , các biếnđổi cố tình để xoá dấu tin ra khỏi ảnh,…v.v Vấn đề được đặt ra liệu sau khi ảnh
bị xử lý ta còn có thể tách được lượng tin ra khỏi ảnh không và tách được thìchất lượng của tin có đảm bảo tin cậy không như ta đã biết khi chèn một dấu ẩnvào ảnh thì trước hết phải đảm bảo tính ẩn của nó, nói cách khác thông tin vềdấu ẩn có năng lượng rất nhỏ so với thông tin ảnh Mặt khác để tăng tính bền chodấu ẩn ta phải tăng năng lượng của thông tin dấu ẩn được chèn vào ảnh điều nàyđối nghịch với yêu cầu của tính ẩn Do vậy việc đảm bảo sự tồn tại của dấu ẩntrong ảnh cũng giống như việc đảm bảo truyền tín hiệu có năng lượng nhỏ trongmôi trường có nhiễu lớn Đây là cơ sở để áp dụng các phương pháp xử lí tín hiệu
số trong chèn dấu ẩn
Trong trường hợp một ảnh được chèn nhiều ký hiệu bản quyền thì các kýhiệu này phải đảm bảo có thể phân biệt được Tuy nhiên việc tăng số lượng các
Trang 19dấu ẩn cũng đồng nghĩa với việc tăng lượng của các thông tin được chèn vào ảnh
do đó tính ẩn của ảnh cũng bị ảnh hưởng theo chiều hướng giảm Tóm lại cácyêu cầu đặt ra đối với đánh dấu ẩn cho ảnh có chiều hướng xung đột nhau, nếuthoả mãn tốt yêu cầu này thì không đáp ứng được yêu cầu kia và ngược lại Qua
đó ta có kết luận rằng không thể có mô hình đánh dấu ẩn nào cho ảnh một cách
lí tưởng Để có được một phương pháp đánh dấu ẩn ảnh hợp lý, người ta thườngđưa ra hệ số cân đối và tuỳ theo những yêu cầu cụ thể, hệ số cân đối này sẽ đượcchọn thích hợp
1.3.5 Mô hình kỹ thuật giấu tin
Hệ thống giấu tin nói chung bao gồm 2 phần chính: chèn tin và tách tin (Hình1.2) Giai đoạn chèn tin, các thông tin khoá (công khai hoặc bí mật) và dấu tinđược chèn vào ảnh gốc để được ảnh có bản quyền Giai đoạn tách tin, dữ liệukhoá (bí mật) và hoặc ảnh gốc (ảnh không chèn tin) sẽ làm dữ liệu cơ sở để táchtin từ ảnh có bản quyền
a) Chèn tin
Mẫu tin mật
Khóa k
Trang 20b) Tách tin Hình 1.2 Quá trình giấu tin và tách tin.
• Mẩu tin mật: có thể là văn bản hoặc tệp ảnh hay bất kỳ một tệp nhị phân
nào, vì quá trình xử lý chúng ta đều chuyển chúng thành chuỗi các bit
• Ảnh phủ hay ảnh gốc: ảnh được dùng để làm môi trường nhúng tin mật.
• Khoá K: khoá viết mật tham gia vào quá trình giấu tin, tăng tính bảo mật
• Ảnh bản quyền: là ảnh sau khi đã nhúng tin mật vào đó
Khoá k trong hệ đánh dấu trên là để đảm bảo tính bí mật của dấu tinchống lại các hình thức khai thác quy luật về ký hiệu được chèn vào ảnh Đây làhình thức bảo vệ an toàn cho ảnh bản quyền đối với mọi hình thức tấn công cố ýnhằm xoá dấu tin ra khỏi ảnh
1.3.6 Các ứng dụng của kỹ thuật giấu tin
Bảo vệ bản quyền tác giả: Đây là ứng dụng cơ bản nhất của kỹ thuật thủy
vân số Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả gọi là thủy vân
sẽ được nhúng vào trong các sản phẩm, thủy vân đó chỉ một mình chủ sở hữuhợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sảnphẩm Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âmthanh, video và cần được lưu thông trên mạng Để bảo vệ các sản phẩm chống lạicác hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “ dán tem bản
Trang 21quyền ” vào sản phẩm này Việc dán tem hay chính là việc nhúng thủy vân cầnphải đảm bảo không để lại một ảnh hưởng đáng kể nào đến việc cảm nhận sảnphẩm Yêu cầu kỹ thuật đối với ứng dụng này là thủy vân phải tồn tại bền vữngcùng với sản phẩm, muốn bỏ thủy vân này mà không được phép của người chủ
sở hữu thì chí có cách là phá hủy sản phẩm[18]
Xác thực thông tin hay phát hiện xuyên tạc thông tin: Một tập các thông
tin sẽ được giấu trong phương tiện chứa sau đó được sử dụng để nhận biết xem
dữ liệu trên phương tiện gốc đó có bị thay đổi không Các thủy vân nên được ẩn
để tránh sự tò mò của kẻ thù, hơn nữa việc làm giả các thủy vân hợp lệ hayxuyên tạc thông tin nguồn cũng cần được xem xét Trong các ứng dụng thực tếngười ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được cácthay đổi Yêu cầu chung đối với ứng dụng này là khả năng giấu thông tin cao vàthủy vân không cần bền vững[18]
Giấu vân tay hay dán nhãn: Thủy vân trong những ứng dụng này được sử
dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví dụ cácvân khác nhau sẽ được nhúng vào các bản sao khác nhau của thông tin gốc trướckhi chuyển cho nhiều người [2] Với ứng dụng này thì yêu cầu là đảm bảo độ antoàn cao cho các thủy vân tránh sự xóa dấu vết trong khi phân phối
Kiểm soát sao chép: Các thủy vân trong trường hợp này được sử dụng để
kiểm soát sao chép đối với các thông tin Các thiết bị phát ra thủy vân thườngđược gắn sẵn vào trong các hệ thống đọc/ghi Ví dụ như hệ thống quản lý saochép DVD đã được ứng dụng ở Nhật Các ứng dụng loại này cũng yêu cầu thủyvân phải được đảm bảo an toàn và cũng sử dụng phương pháp phát hiện thủy vân
đã giấu mà không cần thông tin gốc
Trang 22Giấu tin mật: Các thông tin giấu được trong trường hợp này càng nhiều
càng tốt, việc giải mã để nhận được thông tin cũng không cần phương tiện chứaban đầu Các yêu cầu mạnh về chống tấn công của kẻ thù không cần thiết lắmthay vào đó là thông tin giấu phải đảm bảo tính ẩn
1.3.7 Các kiểu đánh dấu ẩn
Kỹ thuật đánh dấu ẩn có thể chia thành các loại khác nhau theo cácphương pháp khác nhau Kỹ thuật đánh dấu ẩn (Watermarking) có thể chia thành
4 loại theo kiểu tài liệu (dữ liệu) sẽ được nhúng như sau:
• Đánh dấu ẩn trong văn bản (Text )
• Đánh dấu ẩn trong ảnh (Image)
• Đánh dấu ẩn trong âm thanh (Audio )
• Đánh dấu ẩn trong Video
Trong trường hợp hình ảnh, có vài phương thức đánh dấu ẩn trong miềnkhông gian Có thể dùng đánh dấu ẩn trong miền tần số thay cho đánh dấu ẩntrong miền không gian
• Đánh dấu ẩn nhìn thấy
• Đánh dấu ẩn bền vững –vô hình
• Đánh dấu ẩn dễ vỡ -vô hình
1.4 Giấu tin trong ảnh những đặc trưng và tính chất
1.4.1 Giấu tin trong ảnh
Giấu tin trong ảnh, hiện nay, là một bộ phận chiếm tỷ lệ lớn nhất trong cácchương trình ứng dụng, các phần mềm, hệ thống giấu tin trong dữ liệu đaphương tiện bởi lượng thông tin được trao đổi bằng ảnh là rất lớn Hơn nữa, giấuthông tin trong ảnh cũng đóng vai trò hết sức quan trọng trong hầu hết các ứngdụng bảo vệ an toàn thông tin như: nhận thức thông tin, xác định xuyên tạc thông
Trang 23tin, bảo vệ bản quyền tác giả, điều khiển truy nhập, giấu thông tin mật … Vì thế
mà vấn đề này đã nhận được sự quan tâm rất lớn của các cá nhân, tổ chức,trường đại học, và viện nghiên cứu trên thế giới
Thông tin sẽ được giấu cùng với dữ liệu ảnh nhưng chất lượng ảnh ít thayđổi và ít ai biết được bên trong bức ảnh đó mang những thông tin có ý nghĩakhác Và ngày nay, khi ảnh số đã được sử dụng phổ biến, thì giấu thông tin đãđem lại rất nhiều những ứng dụng quan trọng trong trên nhiều lĩnh vực trong đờisống xã hội Ví dụ như đối với các nước phát triển, chữ ký tay đã được số hóa vàlưu trữ sử dụng như là hồ sơ cá nhân của các dịch vụ ngân hàng và tài chính, nóđược dùng để nhận thực trong các thẻ tín dụng của người tiêu dùng Thêm vào
đó, lại có rất nhiều loại thông tin quan trọng cần được bảo mật, chúng rất dễ bịlấy cắp và bị thay đổi bởi các phần mềm chuyên dụng Việc nhận thực cũng nhưphát hiện thông tin xuyên tạc đã trở nên vô cùng quan trọng và cấp thiết Mộtđặc điểm của giấu thông tin trong ảnh đó là thông tin được giấu trong ảnh mộtcách vô hình, nó như là một cách truyền thông tin mật cho nhau mà người kháckhông thể biết được bởi sau khi giấu thông tin thì chất lượng ảnh gần như khôngthay đổi, đặc biệt đối với ảnh mầu hay ảnh đa mức xám
1.4.2 Những đặc trưng và tính chất
Giấu tin trong chiếm vị trí chủ yếu trong các kỹ thuật giấu tin, vì vậy màcác kỹ thuật giấu tin phần lớn cũng tập trung vào các kỹ thuật giấu tin trong ảnh.Các phương tiện chứa khác nhau thì cũng sẽ có các kỹ thuật giấu khác nhau Đốitượng ảnh là một đối tượng dữ liệu tĩnh có nghĩa là dữ liệu tri giác không biếnđổi theo thời gian Dữ liệu ảnh có nhiều định dạng, mỗi định dạng có những tínhchất khác nhau nên các kỹ thuật giấu tin trong ảnh thường chú ý những đặc trưng
và các tính chất cơ bản sau đây:
Trang 24*) Phương tiện có chứa dữ liệu tri giác tĩnh
Dữ liệu gốc ở đây là dữ liệu tĩnh, dù đã giấu thông tin vào trong ảnh haychưa thì khi ta xem ảnh bằng thị giác, dữ liệu ảnh không thay đổi theo thời gian,điều này khác với dữ liệu âm thanh và dữ liệu băng hình vì khi ta nghe hay xemthì dữ liệu gốc sẽ thay đổi liên tục với tri giác của con người theo các đoạn, cácbài hay các cảnh… [18]
*) Kỹ thuật giấu phụ thuộc ảnh
Kỹ thuật giấu tin phụ thuộc vào các loại ảnh khác nhau Chẳng hạn đối vớiảnh đen trắng, ảnh xám hay ảnh màu ta cũng có những kỹ thuật riêng cho từngloại ảnh có những đặc trưng khác nhau
*) Kỹ thuật giấu tin lợi dụng tính chất hệ thống thị giác của con người
Giấu tin trong ảnh ít nhiều cũng gây ra những thay đổi trên dữ liệu ảnhgốc Dữ liệu ảnh được quan sát bằng hệ thống thị giác của con người nên các kỹthuật giấu tin phải đảm bảo một yêu cầu cơ bản là những thay đổi trên ảnh phảirất nhỏ sao cho bằng mắt thường khó nhận ra được sự thay đổi đó vì có như thếthì mới đảm bảo được độ an toàn cho thông tin giấu Rất nhiều các kỹ thuật đãlợi dụng các tính chất của hệ thống thị giác để giấu tin chẳng hạn như mắt ngườicảm nhận về sự biến đổi về độ chói kém hơn sự biến đổi về màu hay cảm nhậncủa mắt về màu xanh da trời kém nhất trong ba màu cơ bản
*) Giấu thông tin trong ảnh tác động lên dữ liệu ảnh nhưng không thay đổi kích thước ảnh
Các thuật toán thực hiện công việc giấu thông tin sẽ được thực hiện trên
dữ liệu của ảnh Dữ liệu ảnh bao gồm phần header, bảng màu (có thể có) và dữliệu ảnh Do vậy mà kích thước ảnh trước hay sau khi giấu thông tin là như nhau
Trang 25*) Đảm bảo chất lượng sau khi giấu tin
Đây là một yêu cầu quan trọng đối với giấu tin trong ảnh Sau khi giấu tinbên trong, ảnh phải đảm bảo được yêu cầu không bị biến đổi để có thể bị pháthiện dễ dàng so với ảnh gốc Yêu cầu này dường như khá đơn giản đối với ảnhmàu hoặc ảnh xám bởi mỗi điểm ảnh được biểu diễn bởi nhiều bit, nhiều giá trị
và khi ta thay đổi một giá trị nhỏ nào đó thì chất lượng ảnh thay đổi không đáng
kể, thông tin giấu khó bị phát hiện, nhưng đối với ảnh đen trắng mỗi điểm ảnhchỉ là đen hoặc trắng, và nếu ta biến đổi một bit từ trắng thành đen và ngược lại
mà không khéo thì sẽ rất dễ bị phát hiện Do đó, yêu cầu đối với các thuật toángiấu thông tin trong ảnh màu hay ảnh xám và giấu thông tin trong ảnh đen trắng
là khác nhau Trong khi đối với ảnh màu thì các thuật toán chú trọng vào việclàm sao giấu được càng nhiều thông tin càng tốt thì các thuật toán áp dụng choảnh đen trắng lại tập trung vào việc làm thế nào để thông tin giấu khó bị pháthiện nhất [17], [12], [13]
*) Thông tin trong ảnh sẽ bị biến đổi nếu có bất cứ biến đổi nào trên ảnh
Vì phương pháp giấu thông tin trong ảnh dựa trên việc điều chỉnh các giátrị của các bit theo một quy tắc nào đó và khi giải mã sẽ theo các giá trị đó để tìmđược thông tin giấu Theo đó, nếu một phép biến đổi nào đó trên ảnh làm thayđổi giá trị của các bit thì sẽ làm cho thông tin giấu bị sai lệch Nhờ đặc điểm này
mà giấu thông tin trong ảnh có tác dụng nhận thực và phát hiện xuyên tạc thôngtin[16]
*) Vai trò của ảnh gốc khi giải tin
Các kỹ thuật giấu tin phải xác định rõ ràng quá trình lọc ảnh để lấy thôngtin giấu cần đến ảnh gốc hay không cần Đa số các kỹ thuật giấu tin mật thìthường không cần ảnh gốc để giải mã Thông tin được giấu trong ảnh sẽ được
Trang 26mang cùng vơi dữ liệu ảnh, khi giải mã chỉ cần ảnh đã mang thông tin giấu màkhông cần dùng đến ảnh gốc để so sánh đối chiếu.
1.4.3 Các phương pháp giấu tin
Các phương pháp giấu tin trong ảnh hiện nay đều thuộc vào một trong banhóm:
Giấu tin trong miền quan sát Ví dụ: Nhúng vào các bít có trọng số thấp(Least Significant Bit)
Các phương pháp dựa vào kỹ thuật biến đổi ảnh, ví dụ biến đổi từ miềnkhông gian sang miền tần số
Các phương pháp sử dụng mặt nạ giác quan
Nhóm phương pháp nhúng thông tin vào các bít có trọng số thấp của ảnhhay được áp dụng trên các ảnh bitmap không nén, các ảnh dùng bảng mầu
Ý tưởng chính của phương pháp này là lấy từng bít của mẩu tin mật rồi rải
nó lên ảnh mang, thay đổi bít có trọng số thấp của ảnh bằng các bít của mẫu tinmật vì khi thay đổi các bit có trọng số thấp thì không ảnh hưởng đến chất lượngảnh, và mắt người không cảm nhận được
Nhóm phương pháp dựa trên các phép biến đổi ảnh lợi dụng việc biến đổiảnh từ miền biểu diễn này sang miền biểu diễn khác để giấu các bít tin Một ví
dụ của hệ thống sử dụng phương pháp này là "Jpeg-Jsteg", phần mềm nàynhúng thông tin bằng cách điều chế các hệ số của phép biến đổi Cosin rời rạctheo các bít tin cần giấu và sự làm tròn lỗi khi lượng hoá Một số các phươngpháp khác thuộc nhóm này sử dụng ảnh như mô hình vật lý với các dải phổ thểhiện mức năng lượng Khi đó giấu tin giống như việc điều chế một tín hiệu dảihẹp vào một dải tần rộng (ảnh phủ)
Trang 27Nhóm phương pháp dùng mặt nạ giác quan dựa trên nguyên lý đánh lừa hệthống giác quan của con người "Mặt nạ" ở đây ám chỉ hiện tượng mắt ngườikhông cảm nhận được một tín hiệu nếu nó ở bên cạnh một tính hiệu nhất địnhnào đó.
Nếu phân chia các phương pháp theo định dạng ảnh thì có hai nhóm chính:
*) Nhóm phương pháp phụ thuộc định dạng ảnh: đặc điểm của nhóm này làthông tin giấu dễ bị "tổn thương" bởi các phép biến đổi ảnh Trong nhóm này lạichia ra theo dạng ảnh, có các phương pháp cho
• Ảnh dựa vào bảng mầu
• Ảnh JPEG
*) Các phương pháp độc lập với định dạng ảnh: đặc trưng của các phương phápnhóm này là lợi dụng vào việc biến đổi ảnh để giấu tin vào trong đó, ví dụ giấuvào các hệ số biến đổi Như vậy có bao nhiêu phép biến đổi ảnh thì cũng có thể
có bấy nhiêu phương pháp giấu ảnh Các phép biến đổi như:
• Phương pháp biến đổi theo miền không gian (spacial domain)
• Phương pháp biến đổi theo miền tần số (DCT, DFT, Wavelet)
• Các biến đổi hình học
Các phương pháp nhóm thứ hai có nhiều ưu điểm hơn về tính bền vững,nhưng lượng thông tin giấu được sẽ ít hơn và cài đặt cũng sẽ phức tạp hơn Nếuphân các phương pháp theo đặc điểm kỹ thuật có:
*) Phương pháp thay thế
• Thay thế các bit dữ liệu trong bản đồ bit (bit plane)
• Thay thế bảng mầu (palette)
*) Phương pháp xử lý tín hiệu
• Các phương pháp biến đổi ảnh (Transform)
Trang 28• Các kỹ thuật điều chế dải phổ
*) Các phương pháp mã hoá (coding)
• Lượng hoá, dithering
• Mã hoá sửa lỗi
*) Các phương pháp thống kê - kiểm thử giả thuyết
*) Phương pháp sinh mặt nạ - Fractal
1.3 Kết luận chương
Trong chương 1, luận văn đã trình bày đến các nội dung như khái niệm vềgiấu tin, phân loại các kỹ thuật giấu tin, một vài nét về lịch sử giấu tin, giấu tintrong ảnh và một số tính chất của nó Nội dung chương này đã trình bày lý do tạisao phải giấu tin, mục đích giấu tin và các phương pháp giấu tin mật từ ngànxưa
Trong lịch sử loài người đã biết vận dụng sáng tạo trí tuệ của mình để giấunhững thông điệp vô cùng quan trọng, như cạo đầu và xăm chữ lên da đầu, haykhắc chữ lên viên thuốc rồi bọc lại bằng sáp ong …
Ngày nay, khi sự phát triển của Công nghệ Thông tin vô cùng nhanhchóng và mạnh mẽ, loài người lại phải tìm cách bảo vệ những sản phẩm trí tuệcủa mình nói chung và bảo vệ bản quyền những sản phẩm đồ họa vector nóiriêng
Khi giấu tin cho ảnh cần phải thỏa mãn ba yêu cầu đó là tính ẩn của thôngtin được giấu, tính bền và tính an toàn Bên cạnh đó chương này còn trình bày về
mô hình kỹ thuật giấu và tách tin
Kỹ thuật giấu tin được ứng dụng trong rất nhiều lĩnh vực khác nhau như:
“Bảo vệ bản quyền tác giả” đây chính là ứng dụng được sử dụng nhiều nhất và làứng dụng cơ bản nhất của kỹ thuật thủy vân số Ứng dụng thứ hai là “Xác thực
Trang 29thông tin hay phát hiện xuyên tạc” ứng dụng này được dùng để phát hiện nhữngsản phẩm bị đánh cắp bản quyền hay sử dụng sai mục đích hoặc đã bị thay đổinội dung mà không được sự cho phép của tác giả “Giấu vân tay hay dãn nhãn”được dùng để nhận diện người gửi hoặc người nhận “Kiểm soát sao chép” và
“Giấu tin mật” là hai ứng dụng được dùng để quản lý các sản phẩm tránh trườnghợp sao chép trái phép của người sử dụng
Trang 30CHƯƠNG 2: GIẤU TIN TRONG BẢN ĐỒ VÉC TƠ
2.1 Bản đồ
Các đối tượng bản đồ khi tồn tại dưới dạng số được thể hiện và lưu trữ trên các lớp thông tin khác nhau
Bản đồ là một chỉnh thể bao gồm nhiều lớp thông tin chồng xếp lên nhau
để mô tả thế giới thực Thông tin trên bản đồ được phân ra thành 4 lớp cơ bản sau:
Hình 2.1 Các lớp bản đồ phân lớp đối tượng
• Ðối tượng dạng điểm (point): thể hiện các đối tượng chiếm diện tích nhỏnhưng là thông tin rất quan trọng không thể thiếu như: trụ sở cơ quan,các công trình xây dựng, cầu cống
Trang 31• Ðối tượng dạng đường (line): thể hiện các đối tượng không khép kínhình học, chúng có thể là các đường thẳng, các đường gấp khúc và cáccung, ví dụ như đường giao thông, sông, suối
• Ðối tượng dạng vùng (region): thể hiện các đối tượng khép kín hình họcbao phủ một vùng diện tích nhất định, có thể là các polygon, ellipse vàhình chữ nhật, như lãnh thổ địa giới 1 xã, hồ nước, khu rừng
• Ðối tượng dạng chữ (text): thể hiện các đối tượng không phải là địa lýcủa bản đồ như nhãn, tiêu đề, ghi chú
Bản đồ số được mô tả bằng mô hình dữ liệu véc tơ, mô hình này dựa trên
cơ sở các véc tơ hay toạ độ các điểm trong hệ trục toạ độ không gian hai chiềuhoặc ba chiều
Trong mô hình véc tơ các điểm, đoạn thẳng và các vùng được lưu trữ dướidạng tập hợp toạ độ điểm Sử dụng các đường thẳng rời rạc hay các điểm để mô
tả vị trí của đối tượng Các điểm nối với nhau để tạo nên các đối tượng khác nhưđường (line/polyline), vùng hay miền (polygon/area) Các đối tượng rời rạc(đường biên hành chính, sông suối, đường giao thông) được hình thành bằngcách nối các đoạn thẳng rời rạc Vị trí một điểm được biểu diễn bởi một toạ độđiểm, đường thẳng được biểu diễn bởi tập hợp toạ độ điểm, còn các vùng thìđược lưu như một vòng khép kín các cặp toạ độ Các đối tượng điểm, đường vàmiền được sử dụng để thể hiện các thực thể địa lý của thế giới thực Mô hình véc
tơ được hình thành trên cơ sở quan sát đối tượng của thế giới thực
Trong mô hình vectơ, các bệnh viện, trường học… có vị trí là tọa độ thựctrên bề mặt Trái đất và chúng được mô tả bởi điểm dữ liệu Sông ngòi, đườngsá…được đơn giản hóa thành các đối tượng đường gấp khúc (polyline) Các
Trang 32vùng địa lý như ao hồ, các đơn vị hành chính được trừu tượng hóa thành các lớpđường biên, tập hợp các đối tượng miền…(hình 2.1)
Hình 2.2 Thế giới thực và bản đồ vectơ
Cấu trúc mô hình véc tơ hay được sử dụng dụng nhiều nhất để biểu diễn cácthực thể địa lý thành các thực thể của cơ sở dữ liệu là “spaghetti” và “topology”
2.5 Thủy vân bản đồ véc tơ
Sự phát triển nhanh chóng của trao đổi thông tin bằng máy tính và Internet
đã làm cho dữ liệu bị thay đổi hoặc thất lạc thông qua đường mạng Mặt khác, nócũng trở thành yếu tố quyết định trong việc bảo vệ các bản sao số của các tệp đaphương tiện số khác nhau Thủy vân đã được nghiên cứu hơn mười năm trở lạiđây như là một giải pháp thích hợp cho các ấn phẩm khi phát hành Bên cạnhviệc bảo vệ các bản sao, thủy vân cũng có thể được thiết kế cho những mục đíchkhác như giấu đi sự trao đổi thông tin, xác nhận dữ liệu, dấu vân tay … Rấtnhiều kiểu dữ liệu có thể được sử dụng nhằm che dấu dữ liệu của thủy vân như
B.V
sông tỉnh
sông
tỉnh B.V
Thế giới thực
Bản đồ
Trang 33ảnh số, âm thanh, các đoạn phim, văn bản, bảng mã, kiểu 3D, dữ liệu CAD, dữliệu vecto 2D, phần mềm … Những dữ liệu kiểu này, một vài dữ liệu đa phươngtiện tổng quan như ảnh số, âm thanh, các đoạn phim, văn bản, bảng mã, kiểu 3Dđược chú ý nhiều hơn các kiểu khác Trong luận văn này trình bày về cách sửdụng thủy vân cho bản đồ vecto 2D, là dữ liệu quan trọng nhất của hệ thốngthông tin địa lý (GIS).
Bản đồ luôn quy định một vài kiểu dữ liệu cụ thể cho các bản sao củangười sử dụng, nó tạo ra sự an toàn cho các tập hợp dữ liệu được phân bổ để pháthành Đầu tiên, để làm ra được một bản đồ vecto là một quá trình với chi phí cao.Một công cụ có độ chính xác cao là cần thiết cho quá trình đo đất và một sốlượng lớn vật chất, các nguồn tài nguyên trí tuệ thì phụ thuộc vào thông tin địa lýgốc Việc số hóa và vecto hóa thông tin gốc là một công việc khó khăn để thuđược các bản đồ vecto Các bản đồ số trong hệ thống thông tin địa lý thôngthường không thể được sử dụng một cách miễn phí Thêm vào đó, trong một vàitình huống đặc biệt thì nhu cầu bảo mật lớn hơn là cần thiết Ví dụ, những ứngdụng của những bản đồ số quân sự bí mật phụ thuộc vào khả năng chính xác của
dữ liệu bản đồ gốc càng toàn vẹn bao nhiêu thì càng tốt bấy nhiêu Nó cũng làmột trong những lý do chính để bản đồ vecto số không thể thấy được nhữngvùng miền quan trọng, then chốt như trong bản đồ giấy truyền thống So sánhmột cách tổng quát các loại dữ liệu đa phương tiện có một chút liên quan đếncông việc đã được làm trong một vùng của bản đồ vecto thủy vân
Sự hài hòa của những vùng mà được đóng dấu thủy vân, những phươngthức được kích hoạt cho thủy vân bản đồ vecto có thể được xếp hạng như sau:thuật toán trong phạm vi không gian, trong phạm vi DFT, trong phạm vi DWT,trong phạm vi DCT và một vài phương thức lấy được từ thủy vân 3D Khác với
Trang 34những kiểu dữ liệu đa phương tiện tổng quan, thủy vân bản đồ vecto có nhữngđặc điểm khác biệt riêng của nó như cấu trúc dữ liệu đặc biệt, những môi trườngứng dụng của dữ liệu bản đồ.
2.6 Đặc điểm riêng của thủy vân bản đồ Vecto
Để đánh dấu thủy vân cho bản đồ vecto số, một loại các đặc điểm riêngnên được quan tâm Tình trạng của những đặc trưng này chính là những vấn đềthen chốt để có được cấu trúc dữ liệu đặc biệt và môi trường ứng dụng của bản
đồ vecto số Kết quả là có sự khác biệt rõ nét giữa thủy vân đa phương tiện nóichung và thủy vân bản đồ vecto số nói riêng ỏ rất nhiều phương thức giấu vàtách dữ liệu, tiêu chuẩn của việc ước lượng chất lượng dữ liệu, phương thức cóthể giấu tin …
Tập hợp dữ liệu mô tả thuộc tính của đối tượng bản đồ như tên, loại, vàmột vài thông tin khác Hiển nhiên, những thông tin được ghi lại bởi tập hợp dữliệu rất quan trọng và không thể thay đổi tùy tiện, tương tự cho những dữ liệuđược thêm vào đã kể ra ở trên Tất cả các thuật toán thủy vân đã được đề xuất,không gian để đóng dấu thủy vân được quy định bởi không gian dữ liệu như tọa
độ của các đỉnh Một bản đồ vecto bất kỳ đều có một dung sai rõ ràng, chúng
Trang 35đưa ra độ rộng tối đa cho sự làm méo tọa độ cho phép Làm méo tọa độ dứtkhoát phải nhỏ hơn dung sai thì sẽ không làm suy giảm đi chất lượng của bản đồ.Dung sai rõ của dữ liệu bản đồ vecto dịch chuyển như là “Mô hình che phủ trựcquan” bên trong ảnh thủy vân số đưa ra một chút dư thừa cho việc giấu thông tinthường lệ
2.6.2 Độ chính xác của bản đồ véc tơ
Nguồn gốc chung của thủy vân số là sự xắp xếp có hệ thống là sự đưa vàonhững mẩu tin ẩn có thể không làm ảnh hưởng đến chất lượng của dữ liệu Trongthế giới thủy vân độ chính xác giới hạn thường được sử dụng để đo chất lượngcủa dữ liệu Tuy nhiên, tùy theo các kiểu dữ liệu khác nhau và cách sử dụngriêng của chúng, độ chính xác giới hạn có thể có những ý nghĩa khác Đối vớiảnh số, các đoạn phim, âm thanh, và các tập hợp dữ liệu đa phương tiện khác,người sử dụng hướng vào dữ liệu là các cảm nhận thông qua những bộ phận giácquan của con người Trong giác quan này, mắt người có thể được dùng để đo độchính xác của ảnh Nếu như mắt người không thể phân biệt được hai ảnh, hai ảnh
đó có thể được coi như có giá trị sử dụng như nhau, cụ thể là có độ chính xáccao Nói chung, một vài thông số chính xác như PSNR hoặc MSE … được dùng
để đo sự khác biệt của 2 tập hợp dữ liệu
Tuy nhiên để đánh giá chất lượng của dữ liệu ảnh vecto, con người khôngthể cảm nhận được và PSNR cũng không thể là đơn vị đo thích hợp Đầu tiên,người sử dụng hướng vào ảnh vecto không phải là các bộ phận giác quan của conngười mà là máy tính Trong một tỷ lệ đặc trưng, thậm chí hai bản đồ số khágiống nhau khi nhìn bằng mắt thì vẫn tồn tại những tọa độ khác nhau giữa haibản đồ đó có thể vượt quá sự dung sai Thứ hai, giới hạn PSNR chủ yếu là phảnhồi lại năng lượng của các lỗi Nó sẽ thích hợp hơn để đánh giá ảnh, nhưng
Trang 36ngược lại đối với ảnh vecto bởi vì thậm chí cả với một PSNR cao của bản đồvecto không thể đảm bảo chính xác những đỉnh lỗi thì có giá trị nhỏ trong dungsai của bản đồ
Thêm vào đó, khi chúng ta đánh giá độ chính xác của bản đồ vecto mộtvài nhân tố có thể được lấy ra như độ nét và hình dạng của các đối tượng bản đồ,
để đánh dấu thủy vân cho bản đồ số thực sự là một công việc hết sức vất vả.PSNR không thể khôi phục lại sự bóp méo chi tiết về độ nét của hai bản đồ vecto
đó Trong một lĩnh vực khác, một bản đồ với độ chính xác thấp cũng có thể cóPSNR cao Cho đến tận bây giờ vẫn chưa có đơn vị đo phù hợp cho độ chính xáccủa bản đồ vecto
2.6.3 Các khả năng giấu tin
Một sự giấu tin thành công có nghĩa là thủy vân có thể được gỡ bỏ trongkhi tính hợp pháp của dữ liệu bao phủ vẫn được bảo vệ Không gian dữ liệu củabản đồ vecto gần như là dữ liệu điểm trôi với sự chính xác chắc chắn Do đó,những cách thức và đặc trưng của các khả năng giấu tin bản đồ vecto thủy vân làkhác nhau cho mỗi loại thủy vân đa phương tiện
2.6.3.1 Giấu tin hình học
Một vài phép biến đổi như phép dịch, phép quay … là những khuôn dạngchính của giấu tin hình học Đối với những ảnh thủy vân số giấu tin hình học rấtkhó có thể bảo vệ, bởi những phép biến đổi này luôn có sự thêm vào các giá trịcho điểm ảnh mà không thể xử lý ngược lại được và luôn là nguyên nhân làmmất mát thông tin Tuy nhiên đối với bản đồ vecto, vần đề giấu tin đưa ra ở trêngần như là phép biến đổi tọa độ, nơi mà hầu như thông tin không thể bị mất Vìvậy giấu tin hình học có liên quan đến vấn đề bảo vệ trong việc phối hợp đánhdấu thủy vân cho bản đồ véc tơ
Trang 372.6.3.2 Giấu tin vào đỉnh
Giấu tin đỉnh là giấu tin vào các lớp đỉnh như là thêm các đỉnh vào bản đồhay gỡ bỏ bớt các đỉnh Khi giấu tin, đặc biệt là đối với bản đồ đơn giản hoặc sựcắt xén rất nguy hiểm đối với thủy vân bản đồ véc tơ Mặt khác, các bản đồ đơngiản cũng có cách hoạt động chung bên trong những ứng dụng nhằm tăng tốc độ
xử lý dữ liệu bản đồ Tóm lại khả năng bao quát bản đồ đơn giản là rất quantrọng đối với việc sắp xếp thủy vân thô
2.6.3.3 Sắp xếp đối tượng
Đây là cách giấu tin vào lớp đối tượng, không gian dữ liệu của bản đồ véc
tơ được tạo lập từ rất nhiều tọa độ của các đỉnh thứ tự mô tả các đối tượng bản
đồ Tất cả các đối tượng được lưu trữ trong tệp bản đồ theo một trình tự nhấtđịnh Sự sắp xếp lại các đối tượng trong bản đồ hoặc sự sắp xếp lại các đỉnh bêntrong một đối tượng có thể tạo nên một bản đồ mới mà không làm suy giảm độchính xác của dữ liệu Một vài sự sắp xếp thủy vân quyết định thứ tự của các đốitượng, hoạt động này sẽ là sự giấu tin nguy hiểm
2.6.3.4 Giảm nhiễu
Có hai nguyên nhân chính có thể gây nên hiện tượng nhiễu bên trong bản
đồ véc tơ Đầu tiên là một vài loại công việc hàng ngày Ví dụ như có rất nhiềucác định dạng file thông dụng trong thế giới GIS Những biến đổi nằm trong cáckhuôn dạng này có thể tạo ra dữ liệu bị nhiễu Thứ hai là các hình thức giấu tinhiểm độc Những người giấu tin cố gắng phá hủy dấu thủy vân bằng cách thêmnhiễu vào các tập hợp dữ liệu Giảm nhiễu là sự giấu tin nghiêm túc nhưng lạikhông phải là sự lựa chọn tốt cho những người giấu tin
Trang 382.7 Thuật toán thủy vân
2.7.1 Thuật toán trong miền không gian
Để đánh dấu thủy vân cho một véc tơ trong miền không gian là đưa vàothủy vân một sự thay đổi chính xác cho giá trị tọa độ của các đỉnh Một vài đặctrưng không gian của các đỉnh có thể được dùng để đưa dữ liệu vào Ví dụ mốiquan hệ của các đỉnh, những đặc trưng thống kê của các đỉnh
Ông Sakamoto [4] đã đưa ra ý tưởng cơ sở thủy vân trong thay đổi mốiquan hệ vị trí của các đỉnh Trong ý tưởng này bản đồ bao phủ là sự phân chiađầu tiên bên trong các khối Sau đó một mặt nạ với kích thước đặc trưng đượcđịnh nghĩa cho từng khối riêng biệt Để đưa vào một bit thủy vân, chỉ cần thayđổi các đỉnh bên trong một mặt nạ và tạo ra mối quan hệ vị trí của chúng theomột mô hình cụ thể Ý tưởng này khó có thể đưa vào thủy vân nhiều bit Tuynhiên, thuật toán này là yếu để có thể giấu tin tạp nhiễu Sau đó một thuật toáncải thiện đã được đề xuất bởi Hwan Kang[9]
Đầu tiên một bản đồ gốc được phân vùng thành các khối Trong mỗi khối,
có một mặt nạ với kích thước xác định, không giống như ý tưởng trước, sự lựachọn kích thước cho mặt nạ này là tùy ý Bên trong các mặt nạ, tọa độ của cácđỉnh Đông Nam được nhắc đến như là gốc và tọa độ của các đỉnh khác bên trongmặt nạ sau đó có thể được thay bằng một giá trị mới Sau đó mặt nạ được phânchia bên trong thành các tam giác cao và tam giác thấp bởi các đường chéo nốicác đỉnh Tây Bắc – Đông Nam Để đưa vào một bit ‘1’ Thay đổi tất cả các đỉnhtrong tam giác thấp thành giá trị đối xứng của chúng trong tam giác cao qua cácđường chéo, đó chỉ là sự đảo ngược khi đưa vào các bit ‘0’ Một số điểm mấuchốt của thuật toán này được trình bày như sau:
Trang 39Hai nhân tố làm tăng mạnh độ nhiễu của thuật toán Nhân tố đầu tiên làkhông hạn chế kích thước của mặt nạ Nhân tố thứ hai là phương thức chung củathủy vân và tiêu chuẩn tương ứng sử dụng trong việc tìm các thủ tục Bước đầutiên để sinh ra thủy vân là để lặp lại các bit đã được giấu thông tin của những lầnchắc chắn Tương tự, phần lớn các tiêu chuẩn được sử dụng để tìm ra các thủ tụcthủy vân Chúng tạo ra các thuật toán giấu tin nhiễu.
Ý tưởng bảo mật được đảm bảo bởi hai dãy số ngẫu nhiên giả tạo bằng haikhóa Khóa thứ nhất được sử dụng để mã hóa lại các bit thủy vân Khóa thứ haiđược sử dụng để hoán vị những khối đã được chia tách, mã hóa trật tự của dữliệu được đưa vào
Một ‘PSNR’ được lấy từ giá trị chính xác của ảnh kỹ thuật số được sửdụng để tính toán chất lượng của bản đồ sau khi giấu tin nhiễu
y
d y y x V
V V
Là một ý tưởng thủy vân không tốt để có thể đưa vào nhiều bit thủy vân
Sự thuận lợi lớn của ý tưởng này là độ mạnh để có thể đưa vào các điểm nhiễu
và đơn giản hóa bản đồ Nhược điểm lớn nhất của nó là sự thay đổi các đỉnh là
Trang 40một thủ tục đảo ngược đối với cách tạo ra các lỗi của dữ liệu đưa vào cao hơnkích thước của bản đồ Mặt khác, điều khiển các lỗi là rất khó.
Ohbuchi đã đưa ra rất nhiều thuật toán cho thủy vân bản đồ véc tơ haichiều Trong miền không gian, ý tưởng cơ sở tìm ra sự tương quan đã được đềxuất Một dãy số giả ngẫu nhiên (PRNS) được dùng để cải thiện tính bảo mật,phát hiện sự tin cậy trong ý tưởng Các bản đồ sao chép, đầu tiên được phân chiabên trong các khối hình chữ nhật với số đỉnh chính xác Để tạo ra thủy vân, độdài của thông tin đưa vào là cố định với các số của các khối đã được phân chiabằng cách lặp lại chúng Dãy được lặp lại sau đó được chuyển thành dữ liệulưỡng cực, là thủy vân cuối cùng Mỗi khối bản đồ đều được dùng để dấu một bitthủy vân Đối với một khối xác định thì dữ liệu đưa vào là một thủ tục cộng
α
'
i j i
V là phân biệt tọa độ gốc và tọa độ thủy vân của các đỉnh có trong
khối thứ i, bi là bit thủy vân thứ i và pi là bit thứ i của PRNS, α là đại lượng độlớn Trong thủ tục tách thủy vân bản đồ gốc là cần thiết và cần một PRNS tương
tự để giải mã Những bit thủy vân được tách ra sau khi giải mã và xử lý tích lũy,
có thể được xem như là những thủ tục phát hiện tương quan Để lấy được nhữnggiá trị tích lũy cho sự phát hiện cũng cải thiện tính chính xác của máy dò tìm.Nhược điểm lớn nhất của thuật toán này là nó không phải là thuật toán rõ ràngkhi bản đồ gốc là cần thiết cho sự phát hiện thủy vân và độ mạnh của thuật toán
để quyết định một phạm vi lớn trong bản đồ gốc Tuy nhiên ý tưởng thủy vân đãđược công khai thì không thể sử dụng
Micheal Voigt và Christoph Busch [10] đã đề xuất thuật toán có thể đưavào nhiều bit dữ liệu cơ sở hướng vào hình ảnh độ rộng của dãy và thay đổi sựphát hiện tương quan Một phát biểu quan trọng đó là các đường phát hiện tương