Công nghệ đa phương tiện phát tiển, cộng với khả năng sao chép mô phỏng dẫn đến việc thực thi quyền sở hữu CSDL là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ về mặt kỹ thuật, t
Trang 2LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Người hướng dẫn khoa học: TS LƯU THỊ BÍCH HƯƠNG
HÀ NỘI - 2018
Trang 3LỜI CẢM ƠN
Trong thời gian làm luận văn, em đã nhận được rất nhiều sự giúp đỡ tận tình của các thầy cô và các tổ chức có liên quan để em hoàn thành đề tài của mình
Em xin chân thành cảm ơn TS Lưu Thị Bích Hương, cô đã hướng dẫn
và giúp đỡ trong suốt quá trình em tìm hiểu, xây dựng và triển khai luận văn này
Em cũng xin gửi lời cảm ơn tới các thầy, cô giáo Trường Đại học Sư phạm Hà Nội 2 và Viện Công nghệ Thông tin – Viện khoa học Việt Nam đã giảng dạy và hướng dẫn em trong 2 năm qua
Cuối cùng em xin cảm ơn gia đình, Ban lãnh đạo khoa cùng các bạn lớp CH20 – KHMT đã động viên, quan tâm và giúp đỡ em trong suốt thời gian hoàn thiện chương trình đào tạo Thạc Sỹ tại trường Đại học Sư phạm Hà Nội
2
Hà Nội, ngày 28 tháng 10 năm 2018
Học viên
Dương Thị Lê
Trang 4LỜI CAM ĐOAN
Tên tôi là: Dương Thị Lê
Học viên lớp: Cao học K20
Chuyên ngành: Khoa học máy tính
Niên khóa: 2016 – 2018
Mã số chuyên ngành: 60 48 01 01
Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này
là trung thực và không trùng lặp với các đề tài khác Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ nguồn gốc
Hà Nội, ngày 2 tháng 11 năm 2018
Học viên
Dương Thị Lê
Trang 5MỤC LỤC
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 4
1.1 Cơ sở dữ liệu 4
1.1.1 Dữ liệu 4
1.1.2 Cách tiếp cận CSDL 8
1.1.3 Khái niệm cơ sở dữ liệu quan hệ 10
1.2 Thủy vân 14
1.2.1 Lịch sử ra đời 14
1.2.2 Khái niệm 15
1.2.3 Phân loại 15
1.2.4 Khóa thủy vân 16
1.2.5 Các yêu cầu của thủy vân 17
1.3 Thủy vân CSDL quan hệ 18
1.3.1 Định nghĩa 18
1.3.2 Sự cần thiết của các kỹ thuật thủy vân CSDL quan hệ 19
1.3.3 Yêu cầu của thủy vân trên CSDL quan hệ 20
1.3.4 Ứng dụng của thủy vân CSDL quan hệ 23
CHƯƠNG 2 CÁC KỸ THUẬT THỦY VÂN CSDL 28
ĐỂ BẢO VỆ BẢN QUYỀN 28
2.1 Kỹ thuật thủy vân sử dụng các bit ít ý nghĩa nhất (LSB) 28
2.1.1 Giới thiệu về bít ít ý nghĩa nhất (LSB) 28
2.1.2 Kỹ thuật thủy vân sử dụng LSB 28
2.2 Kỹ thuật thủy vân sử dụng các bit ý nghĩa nhất (MSB) 32
2.2.1 Giới thiệu về bít ý nghĩa nhất (MSB) 32
2.2.2 Kỹ thuật thủy vân sử dụng MSB 33
2.3 Kỹ thuật thủy vân dựa vào việc chèn thêm ảnh nhị phân 37
2.3.1 Giới thiệu về ý tưởng chèn thêm ảnh nhị phân 37
Trang 62.3.2 Xây dựng lược đồ thủy vân 39
CHƯƠNG 3 CÀI ĐẶT VÀ THỬ NGHIỆM 43
3.1 Phát biểu bài toán 43
3.2 Phân tích bài toán 44
3.2.1.Thiết kế CSDL 47
3.2.2 Thiết kế chương trình 48
3.3 Thử nghiệm và đánh giá 51
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 53
TÀI LIỆU THAM KHẢO 55
Trang 7DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Bộ GD&ĐT Bộ giáo dục và đào tạo
Bộ TTTT Bộ thông tin truyền thông
Trang 8DANH MỤC CÁC HÌNH VẼ
Hình 1.1: Biểu diễn quan hệ 11
Hình 1.2: Biểu diễn thuộc tính 11
Hình 1.3: Biểu diễn bộ dữ liệu 12
Hình 1.4: Các loại thủy vân 15
Hình 2.3.1: (a) Ảnh nhị phân và giá trị thập phân tương ứng (b) Thuộc tính văn bản sau khi được thủy vân, trong đó các chỉ số là số thứ tự các dấu cách đơn và DS là dấu cách đúp 39
Hình 3.1 Biểu đồ use case 44
Hình 3.2 Biểu đồ trình tự use case nhúng thủy vân 45
Hình 3.3 Biểu đồ trình tự use case phát hiện thủy vân 46
Hình 3.4 Biểu đồ thiết kế lớp 46
Hình 3.5 Một số bộ của quan hệ r 47
Hình 3.6 Một số giá trị của các thuộc tính kiểu văn bản 48
Hình 3.7 Giao diện nhúng thủy vân 49
Hình 3.8 Thông báo nhúng thủy vân thành công 49
Hình 3.9 Giao diện phát hiện thủy vân 50
Hình 3.10 Giao diện thông báo trường hợp CSDL là CSDL được thủy vân bằng thuật toán 2.3.1 51
Hình 3.11 Giao diện thông báo trường hợp CSDL không phải là CSDL được thủy vân bằng thuật toán 2.3.1 51
Hình 3.12 Một số giá trị của thuộc tính kiểu văn bản Noidungthi sau khi nhúng thủy vân 52
Trang 9MỞ ĐẦU
1 Lý do chọn đề tài
Cùng với sự phát triển mạnh mẽ của CNTT, cuộc cách mạng thông tin kỹ thuật số đã đem lại những thay đổi nhanh chóng trong xã hội và trong cuộc sống của chúng ta Một xã hội ảo được hình thành trên mạng Internet toàn cầu
và là nơi diễn ra quá trình mua bán – giao thương, trao đổi thông tin trong mọi lĩnh vực y tế, an ninh, giáo dục, kinh tế, xã hội Công nghệ đa phương tiện phát tiển, cộng với khả năng sao chép mô phỏng dẫn đến việc thực thi quyền
sở hữu CSDL là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ về mặt
kỹ thuật, tổ chức, luật pháp đã mở ra nhiều hướng mới cho sự phát triển của thủy vân, đặc biệt là lĩnh vực bảo mật CSDL
Thực tế hiện nay, vấn đề quan trọng trong các môi trường ứng dụng dựa trên Internet và trong nhiều ứng dụng phân phối sản phẩm là việc chứng minh quyền sở hữu đối với các CSDL quan hệ sau khi đã phân phối hoặc chuyển giao Gần đây, một số nhà nghiên cứu đã nhận thấy tầm quan trọng của thủy vân các CSDL và đưa ra một số lược đồ thủy vân bảo vệ bản quyền các CSDL quan hệ Các lược đồ này là các lược đồ thủy vân bền vững được thiết
kế để bảo vệ bản quyền Vì vậy, vấn đề cần quan tâm ở đây là CSDL phải xác thực và mọi xuyên tạc cần phải được phát hiện và chỉ ra vị trí của chúng Đối với các ứng dụng khác nhau, mục đích thiết kế của các lược đồ thủy vân cũng khác nhau
Với mong muốn xây dựng một hệ thống đáp ứng nhu cầu bảo vệ bản quyền ngân hàng đề thi của chương trình ứng dụng CNTT cơ bản theo thông
tư 17 của Bộ GD&ĐT và Bộ TTTT tại đơn vị công tác là mục tiêu để em thực hiện công trình nghiên cứu của mình Em rất mong những kiến thức của mình
sẽ góp phần vào việc nâng cao chất lượng bảo vệ bản quyền ngân hàng đề thi
Trang 10cấp chứng chỉ ứng dụng CNTT cơ bản tại trường Đại học Thể dục Thể thao(TDTT) Bắc Ninh
Xuất phát từ thực tế đó, em lựa chọn đề tài: “Dựa vào thông tin thủy vân
để bảo vệ bản quyền cơ sở dữ liệu quan hệ”
2 Mục đích nghiên cứu
Tìm hiểu và cài đặt thử nghiệm thủy vân trên CSDL quan hệ dựa vào việc chèn thêm ảnh nhị phân, từ đó xây dựng chương trình thử nghiệm để bảo
vệ bản quyền cho ngân hàng đề thi chứng chỉ ứng dụng CNTT cơ bản theo
thông tư 17 Bộ GD&ĐT và Bộ TTTT của trường Đại học TDTT Bắc Ninh
3 Nhiệm vụ nghiên cứu
- Tìm hiểu cơ bản về CSDL
- Nghiên cứu thủy vân CSDL quan hệ
- Các kỹ thuật thuỷ vân
- Mô tả chi tiết lược đồ thủy vân dựa vào việc chèn thêm ảnh nhị phân
để bảo vệ bản quyền CSDL quan hệ
- Cài đặt chương trình thử nghiệm
4 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Lược đồ thủy vân bảo vệ bản quyền CSDL quan hệ
- Phạm vi nghiên cứu: Kỹ thuật thủy vân chèn thêm ảnh nhị phân để bảo vệ
bản quyền CSDL quan hệ
5 Giả thuyết khoa học
Luận văn hoàn thành sẽ góp phần nâng cao chất lượng bảo vệ bản quyền ngân
hàng đề thi cấp chứng chỉ ứng dụng CNTT cơ bản tại trường Đại học TDTT Bắc Ninh
Trang 116 Phương pháp nghiên cứu
a Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây dựng cơ sở lý thuyết của luận văn và các biện pháp cần thiết để giải quyết các vấn đề của luận văn
b Phương pháp nghiên cứu chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể nghiên cứu, tìm hiểu các thuật toán và thiết kế chương trình phù hợp với yêu cầu thực tiễn, nội dung xử lý nhanh đáp ứng được yêu cầu của người sử dụng
c Phương pháp nghiên cứu thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên cứu và kết quả đạt được qua những phương pháp trên
Trang 12CHƯƠNG 1 CƠ SỞ LÝ THUYẾT
1.1 Cơ sở dữ liệu
1.1.1 Dữ liệu
Trong máy tính, thuật ngữ dữ liệu được xem như là các đặc tính được biết đến mà có thể ghi lại và lưu trữ trên các thiết bị ghi nhớ của máy tính Dữ liệu là những mô tả về sự vật, con người và sự kiện trong thế giới thực
Dữ liệu bao gồm số, kí tự, văn bản, hình ảnh, đồ họa, âm thanh,đoạn phim,… có một giá trị nào đó đối với người sử dụng (NSD) chúng vỡ được lưu trữ, xử lý trong máy tính.[7]
Ví dụ: - Dữ liệu về khách: tên, địa chỉ, điện thoại, thẻ tín dụng
- Dữ liệu về xe ô tô của khách: hãng xe, đời xe, năm sản xuất
- Dữ liệu về nhật ký sửa chữa: ngày phục vụ, tên thợ sửa chữa, số tiền thanh toán
Trong hoạt động kinh tế xã hội (KT_XH) của con người, người ta thường chia ra hai loại dữ liệu là loại dữ liệu phản ánh cấu trúc nội bộ của cơ quan (nhân sự, nhà xưởng, thiết bị,… dữ liệu ít biến động) và loại dữ liệu phản ánh hoạt động của tổ chức (sản xuất, mua bán, giao dịch,…) Trong doanh nghiệp, không kể con người và thiết bị, dữ liệu cùng với xử lý là 2 thành phần
cơ bản của hệ thống: dữ liệu thường dùng để ghi nhận thực trạng
Dữ liệu có thể được chia thành nhiều cấp theo kiểu cây phân cấp lưu trữ dữ liệu
(Data storage hierarchy)
Trang 13Database - cơ sở dữ liệu File - tệp
Record - bản ghi Field- trường Character or byte - Ký tự hoặc byte Bit
Bit (binary digit) là một số có 1 ký tự số (digit), được biểu diễn bằng số
0/1 Đây là đơn vị lưu trữ nhỏ nhất trong máy tính
Một ký tự (character) hoặc byte là một tổ hợp 8 bit liên tục nhau Ký tự
gồm có:
- Ký tự chữ cái A - Z, a - z
- Ký tự số 0 - 9
- Ký tự đặc biệt (+, %, $, )
Cấu trúc bit nhỏ nhất cho 1 ký tự là 0000 0000
Cấu trúc bit lớn nhất cho 1 ký tự là 1111 1111
Như vậy có 256 byte biểu diễn 28= 256 ký tự khác nhau
Có 2 hệ thống mã để chuyển đổi mã 8 bit thành các ký tự:
- Extended binary coded decimal interchange code (dùng cho máy
mainframe và máy IBM lớn)
- American standard code for information interchange (dùng cho máy mini và
Trang 14PC mới hiện nay dùng chip có dung lượng lớn nh− 32, 64 bit
Field (Trường) là tập các byte có liên quan
Ví dụ: tên người có thể được cấu tạo từ các trường tên, tên lót, họ
Trường là đơn vị dữ liệu nhỏ nhất có nghĩa đối với NSD
Trường có thể chỉ chứa 1 ký tự F (female)/M (male)
Trường số có thể có dấu chấm (.) và có dấu (âm/dương) Một số phần mềm không được phép sử dụng số âm và dấu chấm thập phân
Trường phải được khai báo trước
Record (bản ghi) là tập các trường có liên hệ với nhau
Bản ghi về hợp đồng thuê nhân công có thể có trường tên, địa chỉ, số giờ làm việc trong tuần Trường trong bản ghi được phân loại (type) xác định độ dài tối
đa (size) Nhờ vậy bản ghi xác định được số byte tổng cộng được chứa trong một vùng liên tục trong bộ nhớ
File (tệp) là tập các bản ghi chứa các dữ liệu có quan hệ với nhau được
lưu vào thiết bị nhớ thứ cấp (đĩa mềm, đĩa cứng, băng caset)
Các phương pháp chủ yếu để tổ chức lưu trữ và đọc các tệp trên đĩa hoặc các thiết bị lưu trữ gồm:
- Tổ chức tệp kiểu tuần tự: các bản ghi được lưu theo thứ tự
- Tổ chức tệp truy xuất ngẫu nhiên (trực tiếp): lưu các tệp tin theo thứ tự ngẫu nhiên
- Tổ chức tệp theo chỉ mục: tổ chức một trường khoá trong mỗi bản ghi nên
có thể truy xuất bản ghi này theo kiểu tuần tự hoặc ngẫu nhiên
Trang 15Phép Hash (hashing) lỡ một kỹ thuật được sử dụng để tính địa chỉ của một bản ghi trên thiết bị vật lý (đĩa từ) Còn tệp được tạo ra theo kỹ thuật này được gọi
là tệp Hash (hash file)
Database (CSDL) là hệ thống tích hợp của các tệp, được thiết kế nhằm
mục đích làm giảm thiểu sự trùng lặp các dữ liệu Ngoài ra chúng còn có một cấu trúc có thứ tự để kết nối các tệp lại với nhau Theo nghĩa phổ thông, CSDL là tập hợp dữ liệu về một đơn vị tổ chức nào đó, lưu trên máy, có cách tổ chức quản lý theo một kiểu mô hình nào đó Trên thực tế, người ta đã đưa ra một định nghĩa CSDL đầy đủ hơn dưới đây
Định nghĩa 1.1: Cơ sở dữ liệu
CSDL được xác định như một bộ sưu tập các dữ liệu có liên quan logic với nhau; nó được tổ chức sắp xếp theo một cách nào đó và được các hệ ứng dụng của một đơn vị/cơ quan cụ thể nào đó sử dụng.[6]
Ví dụ: một CSDL của cửa hàng bán sơn có thể chứa các dữ liệu về
khách hàng (bao gồm các khoản mục dữ liệu như tên khách hàng, địa chỉ, số điện thoại, thẻ tín dụng), các dữ liệu về sơn của khách hàng (bao gồm các khoản dữ liệu như hãng sơn, màu sơn, số lượng) và nhật ký các lần mua sơn (như ngày mua, tên người bán, và số tiền đã thanh toán)
CSDL thường được sử dụng với những ứng dụng cài đặt riêng lẻ trong máy tính cá nhân, hoặc dưới dạng một CSDL tập trung trên mạng LAN, hoặc dưới dạng một CSDL phân tán trên mạng WAN
Các thành phần của môi trường sử dụng CSDL bao gồm:
- Tệp và CSDL
- Phần cứng và hệ điều hành
- Cấu trúc dữ liệu và phương pháp truy xuất dữ liệu
Trang 161.1.2 Cách tiếp cận CSDL
Cách tiếp cận CSDL nhấn mạnh đến tính chia sẻ và tích hợp của dữ liệu trong toàn bộ hoạt động của một tổ chức Theo cách tiếp cận này, dữ liệu được lưu trữ có tổ chức, tập trung dưới dạng một CSDL và giữa các dữ liệu có sự liên kết logic với nhau
Các ưu điểm mà cách tiếp cận dựa trên CSDL mang lại so với cách tiếp cận dựa trên các hệ thống xử lý tệp truyền thống:
Tối thiểu hoá dư thừa dữ liệu: Mục đích thiết kế trong cách tiếp cận
CSDL chính là cố gắng tích hợp các tệp dữ liệu riêng rẽ (và cũng là dư thừa) trong mô hình xử lý tệp trước đây vào một cấu trúc logic duy nhất Mỗi một sự kiện cụ thể sẽ được lưu trữ tại một vị trí quy định trong CSDL Cũng cần lưu ý rằng, cách tiếp cận CSDL có thể không loại bỏ hoàn toàn vấn đề dư thừa dữ liệu, nhưng nó đã cho phép người thiết kế kiểm soát được vấn đề này Ví dụ, đối với mỗi đơn hàng trong bảng ORDER có chứa một trường Customer_id để biểu diễn mối liên kết giữa nâng cao hiệu quả truy vấn của CSDL, chúng ta có thể chấp nhận hình thức lưu trữ dư thừa dữ liệu
Tính độc lập chương trình - dữ liệu: Tính độc lập với dữ liệu được thể
hiện ở sự tách biệt rõ ràng giữa chương trình ứng dụng và các mô tả dữ liệu (siêu
dữ liệu), do vậy nó cho phép dữ liệu của một doanh nghiệp được phép sửa đổi (trong một giới hạn nào đó) mà không phải thay đổi lại chương trình thao tác trên các dữ liệu đó
Nâng cao tính nhất quán dữ liệu: Với việc loại bỏ tính dư thừa dữ liệu,
cách tiếp cận CSDL đã giảm bớt được đáng kể tính không nhất quán của dữ liệu
Ví dụ, nếu địa chỉ của khách hàng được lưu trữ duy nhất, khi đó, nếu khách hàng thay đổi địa chỉ, chúng ta chỉ việc làm một động tác là đơn giản sửa đổi lại địa chỉ của khách hàng ở vị trí duy nhất đó, các truy vấn liên quan đến giá trị này sẽ được tự động nhận, giá trị mới khi được thực hiện Như vậy, vấn đề về cập nhật,
Trang 17sửa đổi dữ liệu rất đơn giản và nhất quán Một điểm quan trọng hơn, cách tiếp cận CSDL sẽ làm giảm đáng kể không gian nhớ so với phương pháp lưu trữ dữ liệu trong các hệ thống xử lý tệp truyền thống
Nâng cao tính chia sẻ dữ liệu: CSDL được thiết kế nhằm mục đích chia
sẻ dữ liệu Mỗi người sử dụng hợp pháp được gán những quyền sử dụng CSDL khác nhau, đối với mỗi người (hoặc nhóm người) sử dụng sẽ được cung cấp những khung nhìn sử dụng khác nhau, do vậy họ có thể chủ động trong việc chia sẻ dữ liệu thông qua các quyền kiểm soát dữ liệu
Nâng cao tính sản phẩm của ứng dụng: Một lợi thế đáng kể của cách tiếp
cận CSDL đó là giảm đáng kể chi phí và thời gian cho việc phát triển những ứng dụng nghiệp vụ
Áp đặt dễ dàng các tiêu chuẩn: Với cách tiếp cận CSDL, các tiêu chuẩn
như quy ước đặt tên, sử dụng quy trình thống nhất trong việc truy nhập, cập nhật và bảo vệ dữ liệu dễ dàng được thực hiện Các chức năng quản trị CSDL thườn cung cấp một loạt các công cụ nhằm đảm bảo những tiêu chuẩn này luôn phải được thoả mãn Tính chất này làm cho việc bảo trì và trao đổi dữ liệu trở nên dễ dàng và thuận lợi hơn
Nâng cao chất lượng dữ liệu: Với cách tiếp cận CSDL, người thiết kế
có thể xây dựng các ràng buộc toàn vẹn nhằm đảm bảo dữ liệu khi được đưa vào CSDL phải thoả mãn một số quy tắc nào đó Hoặc đối với những CSDL lớn như kho dữ liệu, thì thông thường dữ liệu được làm sạch trước khi được đưa
vào kho dữ liệu
Nâng cao khả năng truy xuất dữ liệu: Với các CSDL quan hệ, người sử
dụng không cần biết kỹ năng về lập trình cũng có thể dễ dàng tìm kiếm và hiển thị
dữ liệu thông qua một ngôn ngữ hỏi đáp dữ liệu rất thân thiện đã được tiêu chuẩn hoá
Giảm chi phí bảo trì chương trình: Tính chất này là hệ quả của tính độc lập
Trang 18chương trình – dữ liệu, cho phép xây dựng chương trình tách biệt khỏi dữ liệu ở mức độ nhất định, do vậy khi có sự sửa đổi, chúng ta chỉ việc sửa đổi một số mô-đun thao tác trên dữ liệu mà không nhất thiết phải sửa đổi lại toàn bộ chương trình Chính điều này đã dẫn đến việc giảm bớt chi phí bảo trì chương trình
Trên đây là những ưu điểm mà cách tiếp cận CSDL mang lại Một CSDL
thường được tích hợp vào trong một hệ quản trị CSDL (đó là một chương
trình máy tính hay chính xác hơn là một bộ các chương trình máy tính được xây dựng để quản lý một CSDL)
1.1.3 Khái niệm cơ sở dữ liệu quan hệ
Định nghĩa 1.2: CSDL quan hệ
CSDL được xây dựng dựa trên mô hình dữ liệu quan hệ gọi là CSDL quan hệ
1.1.3.1 Mô hình CSDL quan hệ
Mô hình CSDL quan hệ được tiến sĩ E.F Codd phát triển vào năm
1970 Loại CSDL này đã loại bỏ được những vấn đề liên quan đến các thiết
kế CSDL khác Sử dụng mô hình này có thể giảm thiểu việc dư thừa dữ liệu, tiết kiệm được không gian lưu trữ và có khả năng truy xuất dữ liệu hiệu quả Hiện nay CSDL quan hệ đang được sử dụng phổ biến cho các ứng dụng
Mô hình CSDL quan hệ lưu trữ dữ liệu trên một hoặc nhiều bảng, mỗi bảng gồm nhiều hàng (row), nhiều cột (column) và được gọi là một quan hệ Trong thực tế các hàng, các cột được gọi tên theo thuật ngữ là bản ghi (record) và trường (field)
Trang 19
NHANVIEN MaNV Ho Ten Ngaysinh Gioitinh
1 Nguyen Minh Ngoc 11/5/1995 Nam
2 Tran Thi Thom 8/10/1980 Nu
3 Nguyen Tri Quan 26/7/1985 Nam
Hình 1.1: Biểu diễn quan hệ
- Thực thể: Là đối tượng có trong thế giới thực mà ta cần mô tả các đặc trưng của nó
Ví dụ: Thực thể NHANVIEN Các đặc trưng của thực thể NHANVIEN gồm:
Mã nhân viên (1), Họ (Nguyễn Minh), Tên (Ngọc) Ngày sinh (11/5/1995),
- Thuộc tính: Là tên các cột của quan hệ, các dữ liệu thể hiện các đặc trưng của thực thể, mỗi thuộc tính có một kiểu dữ liệu tương ứng
NHANVIEN MaNV Ho Ten Ngaysinh Gioitinh
1 Nguyen Minh Ngoc 11/5/1995 Nam
2 Tran Thị Thom 8/10/1980 Nu
3 Nguyen Tri Quan 26/7/1985 Nam
Hình 1.2: Biểu diễn thuộc tính
- Miền thuộc tính: Tập các giá trị có thể có của thuộc tính gọi là miền giá trị của thuộc tính đó gồm có tên, kiểu dữ liệu, khuôn dạng,
Các thuộc tính
Trang 20Ví dụ: Ten: kiểu dữ liệu và Text, Ngaysinh, kiểu dữ liệu: date/time, khuôn dạng: dd/mm/yyyy
- Bộ dữ liệu: Là các dòng (bản ghi) của quan hệ không kể dòng tên của các thuộc tính, mỗi bộ chứa giá trị cụ thể của các thuộc tính
NHANVIEN MaNV Ho Ten Ngaysinh Gioitinh
1 Nguyen Minh Ngoc 11/5/1995 Nam
2 Tran Thi Thom 8/10/1980 Nu
3 Nguyen Tri Quan 26/7/1985 Nam
Hình 1.3: Biểu diễn bộ dữ liệu
Một số mô hình dữ liệu đã được nghiên cứu:
- Mô hình dữ liệu mạng: Thể hiện trực tiếp các ràng buộc tùy ý giữa các loại bản ghi Là mô hình dữ liệu được biểu diễn bởi một đồ thị có hướng
- Mô hình dữ liệu quan hệ: Các ràng buộc được thể hiện qua các quan hệ tức là bảng giá trị Mô hình dựa trên lý thuyết tập hợp và đại số quan
hệ Vì tính chất chặt chẽ của toán học về lí thuyết tập hợp nên mô hình này đã
mô tả dữ liệu một cách rõ ràng, uyển chuyển và trở thành rất thông dụng
- Mô hình dữ liệu hướng đối tượng: Cho phép biểu diễn dữ liệu tự nhiên và sát với thực tế hơn cả Tuy nhiên cho đến nay, chưa có một cơ sở toán học tốt hình thức hóa ở mức cao, chặt chẽ đối với mô hình này
1.1.3.2 Quan hệ, lược đồ quan hệ
Định nghĩa 1.3: Quan hệ
Cho U = {A1,A2, ,An}(trong đó U là tên quan hệ, A1,A2, ,An là các thuộc tính) là một tập hữu hạn các thuộc tính khác rỗng Mỗi thuộc tính Ai
U; i=1÷n có một miền giá trị xác định
Mô hình cơ sở dữ liệu quan hệ thường biểu diễn một quan hệ trên tập các thuộc tính bằng bảng 2 chiều Các thuộc tính của quan hệ là các cột
Bộ dữ liệu
Trang 21A1,A2, ,An, các hàng của quan hệ đƣợc gọi là các bộ (bản ghi), ký hiệu r và giá trị của mỗi bộ gồm m thành phần Quan hệ r đƣợc biểu diễn bởi bảng sau:
SINHVIEN(MaSV Ten Ngaysinh Điachi)
Bộ giá trị là (KHMT01, Lan, 12/01/1993, Lào Cai)
Định nghĩa 1.4: Lược đồ quan hệ
Tập tất cả các thuộc tính trong một quan hệ cùng với mối liên hệ giữa chúng đƣợc gọi là lƣợc đồ quan hệ
1.1.3.3 Khóa quan hệ
Khóa của quan hệ: Trong một lƣợc đồ quan hệ luôn tồn tại một thuộc tính hay một tập các thuộc tính có khả năng biểu diễn duy nhất các thuộc tính còn lại Nói cách khác giá trị của một hay nhiều thuộc tính có thể xác định
duy nhất giá trị các thuộc tính khác
Định nghĩa 1.5: Khóa quan hệ
Khóa của quan hệ U xác định trên tập thuộc tính U = {A1, A2, A} là tập con K U sao cho bất kỳ hai bộ khác nhau t1, t2 r luôn thỏa t1.K ≠ t2.K
Trang 22Khóa là khái niệm quan trọng trong thiết kế CSDL quan hệ Khóa thường được áp dụng trong việc tìm kiếm và cập nhật dữ liệu trong các quan hệ
1.2 Thủy vân
1.2.1 Lịch sử ra đời
Khái niệm thủy vân đã ra đời từ lâu và được các công nhân nhà máy giấy ở Italia sử dụng Các tờ giấy được thủy vân sẽ mỏng hơn và có hoa văn trên đó Ý nghĩa của việc thủy vân này giúp các xưởng sản xuất giấy đánh dấu bản quyền trên tờ giấy của họ làm ra Thuật ngữ thủy vân bắt nguồn từ một loại mực vô hình và chỉ hiện lên khi nhúng vào nước
Năm 1954 với bằng sáng chế của Emile Hembrooke thủy vân số được coi là ra đời nhưng mãi tới những năm 1980 nghiên cứu thủy vân mới được đặt ra như một lĩnh vực nghiên cứu độc lập và khái niệm thủy vân chỉ được hoàn thiện vào giữa những năm 90 của thế kỷ 20
Agrawal và Kiernan (2002) đưa ra những đề xuất đầu tiên về kỹ thuật thủy vân trên CSDL quan hệ bởi nhu cầu cấp thiết của người chủ dữ liệu muốn bảo vệ sản phẩm của mình trước những tấn công bên ngoài Các tác giả
đã đề xuất một lược đồ thủy vân trong đó dữ liệu có thể chấp nhận những thay đổi nhỏ mà không ảnh hưởng đến giá trị sử dụng của chúng
Trang 23Mục đích của thủy vân: Các kỹ thuật thủy vân khác nhau được thiết kế
để phục vụ cho các mục đích khác nhau, cụ thể là: bảo vệ bản quyền, đảm bảo
sự toàn vẹn hay phát hiện giả mạo, khoanh vùng, chứng minh quyền sở hữu, Đối với các kỹ thuật thủy vân dùng để bảo vệ bản quyền cho cơ sở dữ liệu quan hệ là thủy vân bền vững
1.2.2 Khái niệm
Định nghĩa 1.6: Thủy vân
Thủy vân là kỹ thuật nhúng thông tin vào dữ liệu (dữ liệu có thể là văn bản, hình ảnh, audio, video hay cơ sở dữ liệu, ) trước khi phân phối dữ liệu trên môi trường trao đổi thông tin nhằm xác định thông tin về chủ sở hữu hoặc nhận biết sự tấn công trái phép từ bên ngoài đối với dữ liệu đã được thủy vân Thông tin giấu trong dữ liệu được gọi là thủy vân (watermark)
1.2.3 Phân loại
Hình 1.4: Các loại thủy vân
- Thủy vân bền vững: yêu cầu dữ liệu nhúng (dấu thủy vân) phải tồn tại trước
các phép tấn công nhằm loại bỏ dấu thủy vân, hoặc trong trường hợp loại bỏ được dấu thủy vân thì dữ liệu chứa dấu thủy vân cũng không còn giá trị sử
Trang 24dụng Do vậy, các lược đồ thủy vân bền vững thường được ứng dụng trong bài toán bảo vệ bản quyền trên sản phẩm số
- Thủy vân dễ vỡ: là kỹ thuật nhúng thủy vân vào trong ảnh sao cho sản phẩm
khi phân phối, truyền tải trong môi trường nếu có bất kỳ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thủy vân đã được giấu trong đối tượng đó sẽ không còn nguyên vẹn như thủy vân gốc Trái với thủy vân bền vững, thủy vân dễ vỡ yêu cầu dấu thủy vân phải nhậy cảm (dễ bị biến đổi) trước sự thay đổi của dữ liệu chứa dấu thủy vân Do vậy, thủy vân dễ vỡ được dùng trong việc
xác thực thông tin và phát hiện bị xuyên tạc, làm giả
- Thủy vân hiện: là thủy vân được hiện ngay trên sản phẩm và người sử dụng
có thể nhìn thấy được hoặc các thủy vân hiện trên ảnh thì thường hiện thị dưới dạng chìm, mờ hoặc trong suốt nhằm không gây ảnh hưởng đến chất lượng sản phẩm ảnh gốc và thông tin bản quyền cũng hiện thị ngay trên sản phẩm gốc
- Thủy vân ẩn: thì cũng giống như giấu tin, yêu cầu tính ẩn rất cao, bằng mắt
thường không thể nhìn thấy thủy vân Với vấn đề bản quyền, thủy vân ẩn mang nhiều tính bất ngờ hơn trong việc phát hiện sản phẩm bị lấy cắp hay giả mạo (Trong trường hợp kiện cáo, chủ sở hữu hợp pháp sẽ đưa ra bằng chứng
là thủy vân đã được nhúng vào sản phẩm đó)
1.2.4 Khóa thủy vân
Chủ sở hữu của CSDL có thể giữ bí mật cho thông tin thủy vân W và
là người duy nhất có thể tìm lại được thông tin này thì cần phải trộn W với
một dữ liệu được gọi là khóa do chính chủ CSDL lựa chọn Thông tin thứ hai này được gọi là khóa thủy vân và được định nghĩa như sau:
Định nghĩa 1.7: Khóa thủy vân
Khóa thủy vân là một lượng dữ liệu bí mật chỉ có chủ sở hữu CSDL
Trang 25biết và lựa chọn nhằm mục đích xác định thủy vân trong lược đồ thủy vân Khóa thủy vân thường được ký hiệu là K và khóa K này sẽ được kết hợp với thủy vân để nhúng vào CSDL cũng như để phát hiện thủy vân
Khóa K sẽ được kết hợp với thủy vân W để nhúng vào CSDL Khóa
thủy vân chính là mấu chốt của kỹ thuật thủy vân CSDL có sử dụng khóa thủy vân
Khóa thủy vân sẽ được nhúng vào trong CSDL quan hệ bằng nhiều cách Thông thường khóa thủy vân sẽ được nhúng với dữ liệu trong CSDL quan hệ rồi đưa vào trong thuật toán sử dụng Điều quan trọng ở đây chính là việc ta giấu khóa thủy vân vào trong thuật toán như thế nào để không bị phát hiện đồng thời có thể chứng minh được đây chính là CSDL quan hệ của mình Hay nói cách khác, việc đưa khóa vào trong CSDL quan hệ là một trong những điểm quan trọng của bài toán bảo vệ bản quyền và đảm bảo sự toàn vẹn dữ liệu trong CSDL quan hệ có sử dụng khóa Một trong những cách giấu khóa hữu hiệu nhất là sử dụng hàm Hash vì kỹ thuật này đảm bảo được yêu cầu bảo mật cũng như chi phí tính toán
1.2.5 Các yêu cầu của thủy vân
Tuỳ thuộc vào mục đích và ứng dụng mà các yêu cầu của hệ thống watermarking được đặt ra Với các hệ thống thực tế, hệ thống thuỷ vân đòi hỏi các yêu cầu sau:
+ Tính không nhận thấy được (Imperceptibility): Các điều chỉnh
gây ra do nhúng watermark phải thấp hơn ngưỡng cảm thụ của con người, nghĩa là các mẫu dùng trong nhúng watermark chỉ được phép thay đổi rất nhỏ trong giới hạn cho phép
+ Tính bền vững (Robustness): Đây là một yêu cầu nòng cốt của
watermarking Tùy vào từng loại ứng dụng mà tính bền vững này bằng được nhìn nhận dưới nhiều quan điểm khác nhau, nếu như đối với các ứng dụng
Trang 26dùng để bảo vệ quyền sở hữu thì watermark cần phải bền vững qua một số các hành động cập nhật nội dung của dữ liệu Nếu nhƣ đối với ứng dụng để chống làm giả hoặc chống lại sự thay đổi trên dữ liệu thì đòi hỏi watermark phải huỷ
bỏ khi có các tác vụ này xảy ra
+ Tính không chia tách đƣợc (Inseparability): Sau khi dữ liệu đƣợc
nhúng watermark thì yêu cầu là phải rất khó hoặc không thể tách thành 2 phần riêng biệt nhƣ lúc đầu
+ Bảo mật (Security): Sau khi đã nhúng watermark vào dữ liệu, thì yêu
cầu là chỉ cho phép những user có quyền mới chỉnh sửa và phát hiện đƣợc
watermark điều này đƣợc thực hiện nhờ vào key dùng làm khoá trong giải
thuật nhúng watermark vào dữ liệu và giải thuật phát hiện ra watermark trong
dữ liệu
+ Tìm lại watermark: Có thể cần hoặc không cần đến dữ liệu gốc vẫn
có thể tìm lại đƣợc thuỷ vân đã nhúng
+ Trích watermark hay kiểm chứng: Cho phép kiểm tra sự tồn tại của
watermark trong dữ liệu đã nhúng
1.3 Thủy vân CSDL quan hệ
Việc nhúng thông tin an toàn đòi hỏi thủy vân đƣợc nhúng trong dữ liệu không thể bị làm giả mạo hoặc bị tẩy xóa một cách dễ dàng
Nhúng ẩn là thủy vân không thể nhìn thấy đƣợc trong dữ liệu
Trang 27Phát hiện thủy vân được thực hiện theo phương pháp “mù” là không đòi hỏi dữ liệu gốc cũng như thủy vân gốc Đồng thời, khi nhúng thủy vân vào dữ liệu cần đảm bảo các thay đổi trên dữ liệu là trong giới hạn cho phép của từng ứng dụng cụ thể
1.3.2 Sự cần thiết của các kỹ thuật thủy vân CSDL quan hệ
Hiện nay, có khá nhiều tài liệu về thuỷ vân các dữ liệu đa phương tiện Hầu hết các kỹ thuật này ban đầu được phát triển cho các bức ảnh tĩnh và sau
đó được mở rộng cho video và audio Có rất nhiều các kết quả của thuỷ vân
dữ liệu đa phương tiện có thể áp dụng cho thủy vân CSDL quan hệ, nhưng cho đến nay vẫn còn rất nhiều thách thức kỹ thuật mới đối với lĩnh vực thuỷ vân CSDL quan hệ bởi vì các dữ liệu quan hệ và các dữ liệu đa phương tiện khác nhau ở khá nhiều khía cạnh quan trọng Những khác biệt đó bao gồm:
- Một đối tượng đa phương tiện thường chứa một lượng các bit dư thừa Vì vậy, các kỹ thuật thuỷ vân có một cái mặt nạ (vỏ) rất rộng để có thể giấu tin vào trong Trong khi đó, một quan hệ CSDL chứa các bộ, mỗi bộ này biểu diễn một đối tượng riêng biệt Cho nên, các kỹ thuật thuỷ vân cần phải được trải rộng trên tất cả các đối tượng riêng biệt này
- Vị trí tương đối về không gian/thời gian của các phần khác nhau của một đối tượng đa phương tiện có đặc thù là không thể thay đổi Nhưng các bộ của một quan hệ lại cấu thành một tập hợp và do vậy không cần phải áp đặt một thứ tự nào giữa các đối tượng này
- Các phần khác nhau của một đối tượng đa phương tiện không thể bị cắt bỏ hoặc thay thế một cách tuỳ ý mà không gây ra những thay đổi trong đối tượng Ngược lại, việc thêm, bớt, và cập nhật các bộ của một bảng quan hệ lại
là những phép toán chuẩn trong CSDL Do đó, sẽ rất khó để phát hiện những xâm hại đơn giản như xóa bỏ một số bộ hoặc thay thế chúng bằng các bộ của các quan hệ khác
Trang 28Do có những khác nhau như đã nêu trên đây mà các kỹ thuật được phát triển cho các dữ liệu đa phương tiện không thể được sử dụng trực tiếp để thuỷ vân các dữ liệu quan hệ
Thật vậy, giả sử chúng ta ánh xạ một quan hệ thành một bức ảnh bằng cách xem mỗi giá trị thuộc tính như một điểm ảnh Nhưng “bức ảnh” được định nghĩa như vậy sẽ thiếu rất nhiều tính chất của một bức ảnh thật Ví dụ, các điểm ảnh nằm cạnh nhau trong một bức ảnh thật thường có quan hệ rất mật thiết với nhau và quan hệ này là cơ sở cho nhiều kỹ thuật thuỷ vân ảnh tĩnh Các kỹ thuật thuỷ vân trên miền biến đổi của ảnh thường thực hiện theo quy trình: trước hết áp dụng một phép biến đổi (cosine rời rạc - DCT, sóng nhỏ - DWT, ) miền giá trị của bức ảnh, sau đó nhúng thuỷ vân vào miền đã biến đổi rồi biến đổi ngược trở lại Cách làm này trải các tín hiệu thuỷ vân như phủ một màn nhiễu trên toàn bộ bức ảnh Áp dụng trực tiếp các kỹ thuật này cho một quan hệ sẽ làm sai lệch giá trị của tất cả các thuộc tính Điều đó
có thể sẽ không được chấp nhận Hơn nữa, một thuỷ vân như vậy có thể không tồn tại được ngay cả trước những cập nhật nhỏ đối với quan hệ
Các kỹ thuật thủy vân văn bản thường lợi dụng các tính chất đặc biệt của văn bản đã được định dạng Thủy vân thường được nhúng vào văn bản bằng cách thay đổi khoảng cách giữa các từ và các dòng văn bản Một số kỹ thuật dựa vào việc nhấn mạnh một vài câu trong văn bản Nhìn chung, các kỹ thuật này có thể sử dụng để thủy vân các quan hệ chỉ chứa các thuộc tính kiểu văn bản, còn đối với các quan hệ chứa các thuộc tính kiểu đơn giản thì rất khó
áp dụng
1.3.3 Yêu cầu của thủy vân trên CSDL quan hệ
Hệ thống thủy vân cần phải thỏa mãn những tính chất sau đây:
Trang 291.3.3.1 Khả năng có thể phát hiện
Người chủ sở hữu cần phải có khả năng phát hiện (Detectability) thủy
vân bằng cách xem xét ν bộ từ CSDL nghi ngờ Rõ ràng là nếu chủ sở hữu phát hiện mẫu thủy vân có mặt ở tất cả ν bộ thì người chủ sở hữu có lý do xác
đáng để nghi ngờ có sự sao chép trái phép Tuy nhiên, chủ sở hữu cũng có thể
ngờ vực ngay cả khi phát hiện mẫu thủy vân chỉ có mặt ở ít nhất là τ bộ (τ≤ ν), trong đó τ phụ thuộc vào ν và một giá trị α cho trước, được gọi là mức ý nghĩa của phép thử Giá trị của τ được xác định sao cho xác suất để chủ sở hữu sẽ tìm thấy mẫu thủy vân của mình trong ít nhất τ bộ từ ν bộ là nhỏ hơn α
Một hướng khác, người được ủy quyền sử dụng CSDL quan hệ muốn xác nhận dữ liệu được gửi từ chủ sở hữu là nguyên vẹn không bị thay đổi trong quá trình gửi CSDL quan hệ được gửi từ chủ sở hữu phải chứa thủy
vân đã được nhúng ν bộ sẽ được xem xét để xác minh tính toàn vẹn của dữ
liệu Khi có bất kỳ thay đổi nào trong dữ liệu được thủy vân thì CSDL đó đã bị sửa đổi Người được ủy quyền sử dụng CSDL quan hệ có thể yêu cầu chủ sở hữu gửi lại dữ liệu hoặc có thể khoanh vùng các giả mạo và vẫn có thể sử dụng được các dữ liệu không bị giả mạo bên trong
1.3.3.2 Tính bền vững và dễ vỡ
Trước những tấn công nhằm xóa bỏ thủy vân thì thủy vân cần phải bền
vững Ví như, kẻ tấn công thay đổi ξ bộ trong quan hệ r của chủ sở hữu Khi
đó, nói rằng thủy vân là an toàn đối với tấn công này nếu kẻ tấn công không thể phá hủy các dấu hiệu thủy vân
ở ít nhất τ bộ, trong đó τ phụ thuộc vào ν và α như đã nói ở trên
Ngược lại, trong các lược đồ thủy vân dễ vỡ, khi có bất kỳ tấn công nào lên
dữ liệu thì các thủy vân đã không còn nguyên vẹn Vì vậy, kẻ tấn công dữ liệu
mong muốn thay đổi ξ bộ trong quan hệ r của chủ sở hữu mà vẫn không làm
Trang 30thay đổi thủy vân Khi đó, nếu những thay đổi của kẻ tấn công làm thay đổi các thủy vân được giấu thì ta có thể kết luận rằng quan hệ đã bị tấn công
1.3.3.3 Khả năng cập nhật dữ liệu
Sau khi quan hệ r đã thủy vân, chủ sở hữu có thể cập nhật quan hệ r khi
cần thiết mà không làm hỏng thủy vân Nếu chủ sở hữu thêm hoặc bớt các bộ,
hoặc sửa đổi các giá trị của các thuộc tính của r, thì thủy vân cần phải có khả
năng cập nhật trên những phần gia tăng Tức là, các giá trị thủy vân chỉ phải tính toán lại đối với các bộ được thêm vào hoặc đã bị sửa đổi
Tuy nhiên, khi quan hệ r đã thủy vân được cập nhật dữ liệu thì kẻ tấn công dữ liệu sẽ xem đây là các tấn công trên quan hệ r Để giải quyết vấn đề này, chủ sở hữu có thể cập nhật, thủy vân lại quan hệ r và gửi sang cho người
được ủy quyền sử dụng dữ liệu Vấn đề này giải quyết cho bài toán đảm bảo tính toàn vẹn của quan hệ trong quá trình truyền tải
1.3.3.4 Tính ẩn và hiện
Đối với thuỷ vân ẩn, không dễ nhận thấy được bằng mắt thường của con người những dữ liệu sau khi thủy vân (trừ chủ sở hữu) Sự thay đổi do các dấu hiệu thuỷ vân gây ra cho CSDL quan hệ không được làm giảm giá trị sử dụng của CSDL Hơn nữa, các phép đo thống kê thông thường như trung bình, phương sai của các thuộc tính số cũng không nên bị ảnh hưởng đáng kể
Tuy nhiên, trong một số trường hợp, thủy vân có tính hiện, dễ dàng nhận thấy bằng mắt thường hoặc bằng một số phương pháp kiểm tra Nhưng
sự thay đổi do các thủy vân gây ra cho CSDL quan hệ không làm ảnh hưởng tới giá trị sử dụng của CSDL quan hệ Tính hiện của CSDL quan hệ có thể giúp cho việc dễ vỡ của thủy vân khi có bất kỳ tấn công nào trên CSDL được nhúng
Trang 31Để phát hiện mù đối với CSDL quan hệ thì một số thông số liên quan đến chủ sở hữu vẫn là cần thiết để chứng minh CSDL quan hệ thuộc quyền sở hữu hoặc chứng minh tính toàn vẹn của CSDL quan hệ
1.3.4 Ứng dụng của thủy vân CSDL quan hệ
1.3.4.1 Bảo vệ bản quyền tác giả
Ở Việt Nam từ bản quyền được nhắc đến rất nhiều, và có lẽ là một trong những lĩnh vực Sở hữu trí tuệ (SHTT) được nhắc đến nhiều nhất Tuy nhiên, khái niệm bản quyền đôi khi vẫn chưa được hiểu rõ, mọi người rất hay dùng từ bản quyền để chỉ về patent – bằng sáng chế Điều này sai cơ bản, bởi mặc dù trong luật Sở hữu trí tuệ không có khái niệm bản quyền, nhưng bản quyền vốn là từ tương đương với copyrights Theo Điều 3 Luật SHTT thì
“Đối tượng quyền tác giả bao gồm tác phẩm văn học, nghệ thuật, khoa học;
đối tượng quyền liên quan đến quyền tác giả bao gồm cuộc biểu diễn, bản ghi
âm, ghi hình, chương trình phát sóng, tín hiệu vệ tinh mang chương trình được mã hoá” Cần lưu ý là bản quyền chỉ bảo vệ sự thể hiện (expression)
chứ không bảo hộ ý tưởng nằm trong đó Đơn giản là mọi người sẽ không được sao chép cái post này nếu chưa được sự đồng ý của tôi, nhưng mọi người hoàn toàn có thể tự viết một post khác dựa trên những thông tin mọi người thu thập được từ post này
Khi thời kì kinh tế tri thức ngày càng trở lên phổ biến và đắt giá, các tài liệu số trong máy tính hoặc tài liệu truyền qua mạng máy tính được biểu diễn
Trang 32dưới dạng số hóa (chỉ dùng số 0 và 1) thì vấn đề bảo vệ bản quyền càng trở lên quan trọng, bởi chính những đặc trưng của tài liệu số như:
- Sao chép dễ dàng: Với 1 vài thao tác click chuột đơn giản thì một bức họa trị giá hàng triệu đô la của danh họa Picasso, hoặc một cuốn từ điển hàng nghìn trang có thể được sao chép trong vài giây Điểm đặc biệt là khi sao chép tài liệu số thì chất lượng bản sao chép được giữ nguyên vẹn so với bản gốc
- Phát tán dễ dàng: Ngày nay, người sử dụng có thể dễ dàng tìm và tải về những bộ phim mới nhất còn chưa được trình chiếu ở rạp chỉ sau vài phút tìm kiếm trên mạng Mặt khác, thông qua các dịch vụ chia sẻ file trực tuyến (online file sharing service), email hay qua các tin nhắn tức thời (IM_Instant Message) một người sử dụng bình thường có thể trở thành nguồn phát tán tài liệu cũng rất dễ dàng
- Lưu trữ dễ dàng: việc lưu trữ các tài liệu số hóa đã trở lên đơn giản, dễ dàng hơn bao giờ hết nhờ giá thành các thiết bị lưu trữ ngày càng rẻ, dung lượng ổ cứng ngày càng lớn
Chính vì vậy, những tình huống mới nảy sinh khi trao đổi thông tin trên mạng như:
Bên A nhận được một bản tin trên mạng, thì lấy gì làm đảm bảo rằng
nó là của Bên B đã gửi cho Bên A
Có cách nào để xác nhận tiền là của Bên B đã thanh toán cho Bên A khi nhận được tờ Sec điện tử hay tiền điện tử trên mạng
Tiền đó là tiền giả hay tiền thật?
Thông thường, người gửi phải ký phía dưới đối với văn bản quan trọng Nhưng khi truyền trên mạng, văn bản hay giấy thanh toán có thể bị trộm cắp
và phía dưới nó có thể dán một chữ ký khác Để giải quyết và đảm bảo cho nhu cầu an toàn dữ liệu và giữ bí mật thông tin liên lạc từ lâu con người đã phát minh ra một số công cụ hết sức hiệu quả như: