Lý do chọn đề tài Bảo vệ bản quyền, nhận thực thông tin, nhận dạng các đặc trưng duy nhất của dữ liệu quan hệ hiện đang là một nhu cầu cấp thiết và là thách thức mới đối với các kỹ thuậ
Trang 1Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN
LUẬN VĂN THẠC SĨ CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẤN KHOA HỌC: TS BÙI THẾ HỒNG
Thái nguyên - 2010
Trang 2Chương 1 TỔNG QUAN VỀ THUỶ VÂN CSDL QUAN HỆ 1
1.1 Một số khái niệm cơ bản 4
1.1.1 Thuỷ vân là gì ? 6
1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ? 7
1.1.3 Sự cần thiết của các kỹ thuật thuỷ vân CSDL quan hệ 8
1.2 Các yêu cầu cơ bản của thuỷ vân trên cơ sở dữ liệu quan hệ 10
1.2.1 Khả năng có thể phát hiện (Detectability) 11
1.2.2 Tính bền vững (Robustness) 11
1.2.3 Cập nhật phần tăng thêm (Incremental Updatability) 12
1.2.4 Không dễ cảm nhận được (Imperceptibility) 12
1.2.5 Hệ thống mù ( Blind System) 12
1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ 13
1.3.1 Cập nhật thông thường 13
1.3.2 Tấn công có chủ đích 13
1.4 Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ 15
1.4.1 Bảo vệ bản quyền hoặc chứng minh quyền sở hữu 15
1.4.2 Nhận thực thông tin (Authentication) 15
1.5 Các kỹ thuật thủy vân cơ sở dữ liệu quan hệ 16
Chương 2 THỦY VÂN SỬ DỤNG CÁC BIT LSB 17
2.1 Chuẩn bị thuật toán 17
2.1.1 Đặt vấn đề 17
2.1.2 Các bít ít ý nghĩa nhất 18
2.1.3 Mã chứng thực thông điệp 19
Trang 3Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2
2.2.1 Mô hình thuỷ vân 20
2.2.2 Thuật toán nhúng thuỷ vân 20
2.2.3 Thuật toán phát hiện thuỷ vân 24
2.2.4 Một số lưu ý 26
2.2.5 Các quan hệ không có các khóa chính 27
2.3 Phân tích đánh giá thuật toán 28
2.3.1 Xác suất nhị thức tích luỹ 28
2.3.2 Hàm ngưỡng 29
Chương 3 THỦY VÂN SỬ DỤNG CÁC BIT Ý NGHĨA NHẤT 31
4.1 Giới thiệu 31
4.1.1 Mô hình thủy vân 32
4.1.2 Xác định bài toán 32
4.1.3 Lựa chọn các tập hợp con 33
4.2 Nhúng thủy vân 34
4.2.1 Mã hoá bít đơn 34
4.3 Phát hiện thủy vân 37
Chương 4 CÀI ĐẶT THỬ NGHIỆM 39
Kết luận 42
Tài liệu tham khảo 43
Trang 4Lời nói đầu
I Lý do chọn đề tài
Bảo vệ bản quyền, nhận thực thông tin, nhận dạng các đặc trưng duy nhất của dữ liệu quan hệ hiện đang là một nhu cầu cấp thiết và là thách thức mới đối với các kỹ thuật thuỷ vân trên cơ sở dữ liệu quan hệ Việc quản lý bản quyền các dữ liệu quan hệ bằng thuỷ vân đã và đang trở thành một chủ đề quan trọng trong các nghiên cứu về cơ sở dữ liệu Thuỷ vân các dữ liệu quan
hệ có những thách thức kỹ thuật đáng kể và có các ứng dụng thực tế có ý nghĩa xứng đáng được quan tâm thích đáng từ phía cộng đồng những người nghiên cứu cơ sở dữ liệu
Thực sự, qua nghiên cứu và thử nghiệm tôi thấy việc phát triển và cài đặt các kỹ thuật thủy vân cơ sở dữ liệu rất phức tạp và rất khó để thỏa mãn được những yêu cầu khắt khe của lĩnh vực bảo vệ bản quyền đối với loại dữ liệu này Những kết quả được trình bày trong báo cáo này là những tìm hiểu
và nghiên cứu bước đầu của tôi trong lĩnh vực mới này Chắc chắn là trong báo cáo này còn có nhiều khiếm khuyết Tôi mong rằng sẽ nhận được những ý kiến góp ý xác đáng giúp tôi có được kết quả tốt hơn
Trong thời gian tới, tôi hy vọng sẽ có cơ hội tiếp tục thực hiện hướng nghiên cứu mới này và có thể đạt được những kết quả sâu hơn và tốt hơn
II Mục đích nghiên cứu
Tìm hiểu các kỹ thuật thuỷ vân bảo vệ bản quyền cơ sở dữ liệu quan hệ
Cài đặt thử nghiệm thủy vân trên cơ sở dữ liệu quan hệ dựa vào các bit LSB và MSB
Trang 5Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
2
III Nhiệm vụ nghiên cứu
Hiểu rõ cơ sở lý luận và toán học của các kỹ thuật giấu tin và các kỹ thuật thuỷ vân
Phát triển các chương trình cài đặt lược đồ thuỷ vân bảo vệ bản quyền
cơ sở dữ liệu quan hệ
IV Phạm vi nghiên cứu
Nghiên cứu, đánh giá các kỹ thuật thuỷ vân
Các công cụ lập trình và phần mềm dùng để cài đặt các lược đồ nhúng
và giải thuỷ vân
V Phương pháp nghiên cứu
Sưu tầm tìm hiểu các tài liệu, các kết quả nghiên cứu về giấu tin và thuỷ vân
Đánh giá các kỹ thuật thuỷ vân đã biết
Cải tiến, mở rộng các kỹ thuật thuỷ vân đã biết nhằm mục đích thu được kết quả tốt hơn
Cài đặt thử nghiệm trên những cải tiến được đưa ra
VI Nội dung nghiên cứu và bố cục luận văn
Luận văn được chia thành bốn chương:
Chương 1: Tổng quan về thuỷ vân cơ sở dữ liệu quan hệ
1.1 Một số khái niệm cơ bản
1.2 Yêu cầu cơ bản của thuỷ vân cơ sở dữ liệu quan hệ
1.3 Những tấn công trên hệ thuỷ vân cơ sở dữ liệu quan hệ
1.4 Các ứng dụng chủ yếu của thuỷ vân cơ sở dữ liệu quan hệ
1.5 Các kỹ thuật thuỷ vân cơ sở dữ liệu quan hệ
Trang 6Chương 2: Thuỷ vân sử dụng các bit LSB
2.1 Chuẩn bị thuật toán
2.2 Các thuật toán
2.3 Phân tích đánh giá thuật toán
Chương 3: Thuỷ vân sử dụng các bit MSB
3.1 Giới thiệu
3.2 Nhúng thuỷ vân
3.3 Phát hiện thuỷ vân
Chương 4: Cài đặt thử nghiệm
Trang 7Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
4
Chương 1: TỔNG QUAN VỀ THUỶ VÂN CSDL QUAN HỆ
Tính năng an toàn và bảo mật thông tin của kỹ thuật giấu tin được thể hiện ở hai khía cạnh Một là bảo vệ cho dữ liệu đem giấu và hai là bảo vệ cho chính đối tượng được sử dụng để giấu tin Tương ứng với hai khía cạnh đó chúng ta có hai khuynh hướng kỹ thuật rõ ràng đó là giấu tin mật (Steganography) mà chúng ta đã tìm hiểu trong các chương trước) và thuỷ vân
số (Watermarking)
Trong kỹ thuật giấu tin mật, thông tin cần giấu được gọi là thông điệp (Message) còn trong kỹ thuật thuỷ vân số thì được gọi là thuỷ vân (Watermark) Thuỷ vân có thể là một chuỗi các kí tự, hay một hình ảnh, logo nào đó
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin nhắm đến những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, chống xuyên tạc, nhận thực thông tin, điều khiển sao chép v.v…Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại
có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng
có những tính năng khác biệt tương ứng:
Trang 8Hình 1 Phân loại các kỹ thuật thuỷ vân
Các kỹ thuật thuỷ vân trên Hình 1 được phân biệt nhau bởi những đặc trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó Thuỷ vân
“dễ vỡ” (Fragile) là kỹ thuật nhúng thuỷ vân vào trong ảnh sao cho khi phân
bố sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ) Các kỹ thuật thuỷ vân
có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin (Authentication) và phát hiện xuyên tạc thông tin (Tamper detection)
Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ vân hiển Thuỷ vân hiển là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến mà chúng ta thường thấy VTV3, CCTV, TV5…
Robust Copyright marking
Thuỷ vân “dễ vỡ”
Visible Watermarking
Thuỷ vân hiện
Trang 9Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
6
1.1 Một số khái niệm cơ bản
1.1.1 Thuỷ vân là gì ?
Từ “thuỷ vân” có xuất xứ từ kỹ thuật đánh dấu nước thời xưa Đây là
kỹ thuật đánh dấu chìm một hình ảnh, một logo, hay một dữ liệu nào đó lên trên giấy nhằm mục đích trang trí và phân biệt được xuất xứ của sản phẩm
giấy Như vậy, thông tin cần giấu được gọi là thuỷ vân (Watermark)
Thuỷ vân có thể là một chuỗi các ký tự, hay một hình ảnh, logo nào đó Thuỷ vân mô tả thông tin có thể được dùng để chứng minh quyền sở hữu hoặc chống xuyên tạc
Có hai loại thuỷ vân, đó là : thuỷ vân bền vững và thuỷ dễ vỡ
Thuỷ vân bền vững (Robust watermark): là thuỷ vân tồn tại bền vững
cùng với dữ liệu, không dễ dàng bị phá huỷ trước những biến đổi, tấn công lên dữ liệu Các kỹ thuật này thường được dùng trong các ứng dụng bảo vệ bản quyền, chứng minh quyền sở hữu
Thuỷ vân dễ vỡ (Fragile watermark): là thuỷ vân dễ bị biến đổi trước
những biến đổi hay tấn công lên dữ liệu Các kỹ thuật này thường được dùng trong các ứng dụng nhận thực thông tin, đảm bảo tính toàn vẹn dữ liệu
Các kỹ thuật thuỷ vân ngay từ khi mới ra đời đã nhận được sự quan tâm rất lớn của các nhà khoa học Các kỹ thuật thuỷ vân này đã được nghiên cứu và
áp dụng trong nhiều môi trường dữ liệu khác nhau như: dữ liệu đa phương tiện (image, text, audio, video, ), hay các phẩm phần mềm, và gần đây là những nghiên cứu trên môi trường cơ sở dữ liệu quan hệ Trong các môi trường dữ liệu đó thì dữ liệu đa phương tiện (đặc biệtt là image) được nghiên cứu và áp dụng sớm nhất và là môi trường chiếm tỷ lệ chủ yếu Tuy nhiên,
Trang 10hiện nay người ta đang tập trung nghiên cứu các kỹ thuật thuỷ vân trên cơ sở
dữ liệu quan hệ bởi nhu cầu cấp thiết của người chủ cơ sở dữ liệu đó là muốn bảo vệ chúng trước những tấn công bên ngoài,
1.1.2 Thuỷ vân cơ sơ dữ liệu quan hệ là gì ?
Ngày nay, việc sử dụng các cơ sở dữ liệu trong các ứng dụng càng ngày càng tăng lên đang tạo ra một nhu cầu tương tự đối với thủy vân cơ sở dữ liệu Internet hiện đang đưa đến một sức ép rất nặng nề cho những người bảo vệ dữ liệu trong việc tạo ra các dịch vụ (thường được gọi là các dịch vụ web hoặc các tiện ích điện tử) cho phép người sử dụng tìm kiếm và truy cập cơ sở dữ liệu từ xa Mặc dù xu hướng này là hữu ích cho người dùng cuối nhưng nó cũng bộc lộ một mối nguy hiểm cho những nhà cung cấp dữ liệu trước những
kẻ trộm cắp dữ liệu Do đó, những người cung cấp dữ liệu đòi hỏi phải có công nghệ nhận dạng được những bản sao các cơ sở dữ liệu của họ bị đánh cắp
Cho dù có khá nhiều điều có thể học hỏi được từ các kết quả đã đạt được về thủy vân dữ liệu đa phương tiện nhưng cho đến nay vẫn còn rất nhiều thách thức kỹ thuật mới đối với lĩnh vực thủy vân các cơ sở dữ liệu quan hệ bởi vì các dữ liệu quan hệ và các dữ liệu đa phương tiện khác nhau ở khá nhiều khía cạnh quan trọng Chẳng hạn như, các phần khác nhau của một đối tượng đa phương tiện không thể cắt bỏ hoặc thay thế một cách tùy ý mà không gây ra những thay đổi về cảm quan trong đối tượng Ngược lại, việc thêm, bớt và cập nhật các bộ của một bảng quan hệ lại là những phép toán chuẩn trong cơ sở dữ liệu Do những khác nhau này mà các kỹ thuật được phát triển cho các dữ liệu đa phương tiện không thể được sử dụng trực tiếp để thủy vân các quan hệ
Trang 11data error !!! can't not
read
Trang 12data error !!! can't not
read
Trang 13data error !!! can't not
read
Trang 14data error !!! can't not
read
Trang 15data error !!! can't not
read
Trang 17data error !!! can't not
read
Trang 18data error !!! can't not
read
Trang 19data error !!! can't not
read
Trang 20data error !!! can't not
read
Trang 21data error !!! can't not
read
Trang 22data error !!! can't not
read
data error !!! can't not
Trang 23data error !!! can't not
read
data error !!! can't not
read
Trang 24data error !!! can't not
read
data error !!! can't not
Trang 26read
Trang 27data error !!! can't not
read