Về lý thuyết: Thu thập và phân tích các tài liệu và thông tin liên quan đến: - Cấu trúc dữ liệu âm thanh - Mô hình hệ thống thủy vân và tách thủy vân với các tệp dữ liệu âm thanh - Các t
Trang 1Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
Trần Thị Thành
KỸ THUẬT BẢO VỆ BẢN QUYỀN NHẠC SỐ BẰNG
THỦY VÂN
LUẬN VĂN THẠC SĨ: KHOA HỌC MÁY TÍNH
Thái Nguyên, tháng 9 năm 2015
Trang 2Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
ĐẠI HỌC THÁI NGUYÊN TRƯỜNG ĐẠI HỌC CNTT VÀ TRUYỀN THÔNG
Trang 3Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Kỹ thuật bảo vệ bản quyền bản nhạc số
bằng thủy vân” là sản phẩm của riêng cá nhân, không sao chép lại của người
khác Trong toàn bộ nội dung của luận văn, những điều được trình bày hoặc là của cá nhân hoặc là được tổng hợp, nghiên cứu từ nhiều nguồn tài liệu Tất cả các tài liệu tham khảo đều có xuất xứ và trích dẫn rõ ràng
Tôi xin hoàn toàn chịu trách nhiệm và chịu mọi hình thức kỷ luật theo quy định cho lời cam đoan của mình
Thái Nguyên, ngày 20 tháng 07 năm 2015
Học viên
Trần Thị Thành
Trang 4Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
LỜI CẢM ƠN
Lời đầu tiên, tôi xin bày tỏ lòng biết ơn đến thầy Đặng Văn Đức - Viện Công nghệ thông tin, người đã tận tình hướng dẫn, chỉ bảo và giúp đỡ tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn này
Tôi xin chân thành cảm ơn các thầy cô giáo trường Đại học Công nghệ Thông tin và Truyền thông - Đại học Thái Nguyên đã giảng dạy và cung cấp cho chúng tôi những kiến thức rất bổ ích trong thời gian học cao học, giúp tôi
có nền tảng tri thức để phục vụ nghiên cứu khoa học sau này
Tôi cũng xin cảm ơn Lãnh đạo và đồng nghiệp tại đơn vị đã tạo điều kiện
và giúp đỡ tôi trong suốt quá trình nghiên cứu và hoàn thành luận văn Tôi cũng xin bày tỏ lòng cảm ơn đến gia đình và bạn bè, những người luôn quan tâm, động viên và khuyến khích tôi trong quá trình học tập
Thái Nguyên, ngày 20 tháng 07 năm 2015
Trần Thị Thành
Trang 5Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
MỤC LỤC
LỜI CẢM ƠN 4
MỤC LỤC 5
DANH MỤC CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN 7
DANH MỤC CÁC HÌNH ẢNH 8
DANH MỤC CÁC BẢNG BIỂU 9
MỞ ĐẦU 10
1 Đặt vấn đề 10
2 Đối tượng và phạm vi nghiên cứu 11
3 Hướng nghiên cứu của đề tài 11
4 Nội dung của luận văn 11
5 Phương pháp nghiên cứu 12
CHƯƠNG 1: TỔNG QUAN VỀ THỦY VÂN DỮ LIỆU ÂM THANH 13
1.1 Thủy vân số và thủy vân dữ liệu âm thanh 13
1.1.1 Vài nét về lịch sử giấu tin 13
1.1.2 Định nghĩa 14
1.1.3 Mô hình kỹ thuật giấu tin 14
1.2 Phân loại kỹ thuật giấu tin 15
1.3 Thủy vân và yêu cầu cơ bản của thủy vân âm thanh 17
1.3.1 Phân loại thủy vân số 17
1.3.2 Mô hình hệ thống thủy vân âm thanh 19
1.3.3 Các đặc tính của thủy vân âm thanh 21
1.4 Một số ứng dụng đang được triển khai 21
1.5 Âm thanh số 23
1.5.1 Khái niệm về âm thanh và âm thanh số 23
1.5.2 Một số định dạng file âm thanh trên máy tính 24
Trang 6Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
CHƯƠNG 2 THUẬT TOÁN THỦY VÂN ÂM THANH TRÊN MIỀN
THỜI GIAN VÀ MIỀN TẦN SỐ 28
2.1 Thuật toán thủy vân âm thanh sử dụng biến đổi Cosine rời rạc 28
2.1.1 Biến đổi Cosine rời rạc 28
2.1.2 Thuật toán thủy vân âm thanh sử dụng biến đổi Cosine rời rạc 30
2.2 Thuật toán thủy vân âm thanh sử dụng biến đổi DCT trên đoạn tín hiệu có năng lượng cao 33
2.3 Thuật toán thủy vân âm thanh sử dụng DCT và biến đổi Arnold 38
2.3.1 Biến đổi Arnold 38
2.3.2 Thuật toán thủy vân âm thanh sử dụng DCT và biến đổi Arnold 42
2.4 Thuật toán thủy vân âm thanh sử dụng kỹ thuật thay thế LSB 46
2.4.1 Thuật toán LSB cơ bản 46
2.4.2 Thuật toán thủy vân âm thanhsử dụng kỹ thuật thay thế LSB 50
2.5 Kỹ thuật đánh giá hiệu quả của hệ thống thủy vân âm thanh 53
2.5.1 Tỷ lệ lỗi bit (Bit Error Rate – BER) 53
2.5.2 Hệ số tương quan chuẩn hóa (Normalized Correlation Coefficient – NCC) 53
2.5.3 Chất lượng cảm nhận (Perceptual Quality) 53
CHƯƠNG 3 XÂY DỰNG CHƯƠNG TRÌNH THỬ NGHIỆM 55
3.1 Mô hình hệ thống thử nghiệm 55
3.2 Công nghệ sử dụng phát triển chương trình thử nghiệm 57
3.3 Đánh giá kết quả thử nghiệm 57
KẾT LUẬN 60
TÀI LIỆU THAM KHẢO 61
PHỤ LỤC 1 Cấu trúc file âm thanh dạng WAV 63
Trang 7Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC TỪ VIẾT TẮT TRONG LUẬN VĂN
AAC - Định dạng âm thanh chuẩn (Advanced Audio Coding)
AIFF - Định dạng không mất thông tin (Audio Interchange File Format) DCT - Phép biến đổi Cosin rời rạc (Discrete Cosine Tranform)
FLAC - Nén âm thanh không mất dữ liệu (Free Lossless Audio Codec),
FT - Biến đổi Fourier (Fourier Transform)
LSB - Bít ít quan trọng nhất (Least Significant Bít)
MP3 - Định dạng nén âm thanh (Movie Picture Experts Group-Layer 3)
PCM - Điều biến mã xung (Pulse Code Modulation)
WAV - Định dạng âm thanh dạng sóng (Waveform Audio Format)
WMA - Định dạng âm thanh của Microsoft (Windows Media Audio)
Trang 8Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC HÌNH ẢNH
Hình 1.1: Lược đồ chung cho quá trình giấu tin 14
Hình 1.2: Lược đồ chung cho quá trình tách tin 15
Hình 1.3: Phân loại kỹ thuật giấu tin 16
Hình 1.4: Phân loại thủy vân số 18
Hình 1.5: Mô hình thủy vân âm thanh 19
Hình 1.6: Mô hình tách thủy vân âm thanh 20
Hình 1.7: Tín hiệu âm thanh 23
Hình 1.8: Số hóa tín hiệu âm thanh 24
Hình 2.1: Sơ đồ quy trình nhúng thủy vân biến đổi Cosine rời rạc 31
Hình 2.2: Sơ đồ quy trình tách thủy vân biến đổi Cosine rời rạc 32
Hình 2.4: Sơ đồ quy trình tách thủy vân trên đoạn tín hiệu có năng lượng cao trong miền biến đổi 37
Hình 2.5: Phân phối các tọa độ ảnh 39
Hình 2.7: Sơ đồ quy trình nhúng thủy vân sử dụng DCT và biến đổi Arnold 44 Hình 2.8: Sơ đồ quy trình tách thủy vân sử dụng DCT và biến đổi Arnold 46
Hình 2.9:Sơ đồ quy trình nhúng thủy vân bằng phương pháp thay thế LSB 51 Hình 2.10: Sơ đồ quy trình tách thủy vân bằng phương pháp thay thế LSB 52
Hình 3.1: Mô hình thử nghiệm thủy vân tệp âm thanh 56
Hình 3.2: Mô hình thử nghiệm tách thủy vân 56
Hình 3.3: Giao diện nhúng thủy vân 57
Hình 3.4: Giao diện hoàn thành nhúng thủy vân 58
Hình 3.5: Giao diện tách thủy vân 58
Hình 3.6: Giao diện khi hoàn thành tách thủy vân và so sánh ảnh 59
Trang 9Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1: So sánh giấu thông tin mật và giấu thông tin thủy vân 17Bảng 1.2: Một số định dạng file âm thanh trên máy tính 27Bảng 2.1: Thuật toán chu kỳ xáo trộn Arnold 39
Trang 10Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
MỞ ĐẦU
1 Đặt vấn đề
Cuộc cách mạng thông tin dữ liệu số đã đem lại những thay đổi sâu sắc trong xã hội và trong cuộc sống Những thuận lợi thông tin dữ liệu số mang lại cũng đề ra những thách thức và cơ hội mới cho quá trình đổi mới Sự ra đời những phần mềm có tính năng mạnh, các thiết bị mới như máy ảnh kỹ thuật số, máy quét chất lượng cao, máy in, máy ghi âm kỹ thuật số,… đã với tới thế giới tiêu dùng rộng lớn để sáng tạo, xử lý và thưởng thức các dữ liệu
số Mạng Internet toàn cầu đã biến thành một xã hội ảo nơi diễn ra quá trình trao đổi thông tin trong mọi lĩnh vực chính trị, quân sự, quốc phòng, kinh tế, thương mại… Đồng thời trong môi trường mở và tiện nghi như thế xuất hiện nhiều những vấn nạn, tiêu cực đang rất cần đến các giải pháp hữu hiệu cho vấn đề an toàn thông tin như nạn ăn cắp bản quyền, nạn xuyên tạc thông tin, truy nhập thông tin trái phép Trong bối cảnh như vậy, việc thực thi quyền sở hữu dữ liệu và đảm bảo sự toàn vẹn dữ liệu là một yêu cầu quan trọng đòi hỏi các giải pháp đồng bộ, bao gồm các khía cạnh về kỹ thuật, về tổ chức và cả luật pháp Tháng 3/1998 ở Hồng Kông, chính quyền đã tịch thu một số lượng đĩa CD âm nhạc lậu trị giá 85 triệu đôla, và vào 6/1998, ở Đức cũng đã tịch thu các sản phẩm phần mềm và kĩ thuật số lậu trị giá 1,9 triệu đô la Quốc hội
Mỹ thông qua dự luật về “Hành động bảo vệ bản quyền kỷ nguyên kĩ thuật số” (Digital Millenium Copyright Act) để bảo vệ quyền sở hữu trí tuệ với các sản phẩm kĩ thuật số [6] Tất cả các việc đó nói nên sự cần thiết phải có một cách để bảo vệ các sản phẩm kĩ thuật số khỏi các thao tác sao chép, xử lý trái phép và ngăn chặn các hoạt động này xảy ra Một phương pháp chống sao chép trái phép và bảo vệ bản quyền cho các sản phẩm số - thuỷ vân số (digital watermarking) đã ra đời trong hoàn cảnh này Thuỷ vân số là một phương pháp dùng để bảo vệ các sản phẩm số Nó có thể được dùng trong các lĩnh
Trang 11Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
vực bảo vệ bản quyền, chống sao chép, phân biệt giả mạo, …Các sản phẩm số này có thể là văn bản, audio, video, phần mềm, ảnh, Thuỷ vân số là một phương pháp mới dựa trên lý thuyết tổng hợp của nhiều lĩnh vực khác nhau như mật mã học, lý thuyết thông tin, lý thuyết truyền thông và xử lý tín hiệu
số, xử lý ảnh Mục đích của phương pháp này là dấu thêm một lượng thông tin có ích vào sản phẩm số và lượng thông tin này được gọi là thuỷ vân
Chính vì tính khoa học và tính hữu ích trong ứng dụng thực tiễn của thủy vân số trong việc bảo vệ bản quyền, đặc biệt với các tác phẩm âm nhạc
như trình bày trên đây, nên em quyết định lựa chọn đề tài là: “Kỹ thuật bảo
vệ bản quyền bản nhạc số bằng thủy vân”
2 Đối tượng và phạm vi nghiên cứu
Tìm hiểu tổng quan về các hướng tiếp cận chính cho việc bảo vệ bản nhạc số bằng phương pháp thủy vân Tập trung vào các thuật toán tách - nhúng thủy vân
3 Hướng nghiên cứu của đề tài
a Về lý thuyết:
Thu thập và phân tích các tài liệu và thông tin liên quan đến:
- Cấu trúc dữ liệu âm thanh
- Mô hình hệ thống thủy vân và tách thủy vân với các tệp dữ liệu âm thanh
- Các thuật toán nhúng - tách thủy vân tệp âm thanh
- Phương pháp đánh giá chất lượng thủy vân
b Về thực nghiệm:
- Áp dụng thử nghiệm thuật toán
- Kiểm tra, thử nghiệm và đánh giá kết quả
4 Nội dung của luận văn
Ngoài phần mở đầu trình bày lý do chọn đề tài và tình hình nghiên cứu
Trang 12Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
trong và ngoài nước về các kỹ thuật (thuật toán) thủy vân dữ liệu âm thanh, phần kết luận tóm tắt các kết quả chính đã đạt được và hướng nghiên cứu tiếp theo của luận văn, các kết quả chính của luận văn được trình bày trong 3 chương như sau đây:
Chương 1:Trình bày tổng quan về thủy vân dữ liệu đa phương tiện, trong
đó có dữ liệu âm thanh và tổng quan về cấu trúc dữ liệu âm thanh
Chương 2:Trình bày về một số thuật toán thủy vân âm thanh trong miền biến đổi và miền thời gian Trước khi trình bày cụ thể về các thuật toán, một
số kiến thức cơ bản liên quan được trình bày như mô hình tổng quát thủy vân
âm thanh, các phép biến DCT và Arnold và phương pháp đánh giá hiệu quả của hệ thống thủy vân âm thanh
Chương 3: Trình bày thử nghiệm một thuật toán thủy vân âm thanh bằng MatLab, kèm theo đánh giá và nhận xét
5 Phương pháp nghiên cứu
- Nghiên cứu các tài liệu viết về dữ liệu âm thanh, thủy vân số, nhúng - tách thủy vân và các vấn đề liên quan
- Tổng hợp, so sánh, phân tích
- Xây dựng chương trình thử nghiệm
Trang 13Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
CHƯƠNG 1: TỔNG QUAN VỀ THỦY VÂN DỮ LIỆU ÂM THANH
1.1 Thủy vân số và thủy vân dữ liệu âm thanh
1.1.1 Vài nét về lịch sử giấu tin
Từ Steganography bắt nguồn từ tiếng Hi Lạp và được sử dụng cho tới ngày nay, nó có nghĩa là tài liệu được phủ (covered writing) Các câu chuyện
kể về kỹ thuật giấu thông tin được truyền qua nhiều thế hệ Có lẽ những ghi chép sớm nhất về kỹ thuật giấu thông tin (thông tin được hiểu theo nghĩa nguyên thủy của nó) thuộc về sử gia Herodotus người Hy lạp Khi bạo chúa
Hy lạp Histiaeus bị vua Darius bắt giữ ở Susa vào thế kỷ thứ năm trước Công nguyên, ông đã gửi một thông báo bí mật cho con rể của mình là Aristagoras
ở Miletus Histiaeus đã cạo trọc đầu của một nô lệ tin cậy và xăm một thông báo trên da đầu của người nô lệ ấy Khi tóc của người nô lệ này mọc đủ dài, anh ta đã được gửi tới Miletus [2][6]
Một câu chuyện khác ở thời Hy-Lạp cổ đại cũng do Herodotus ghi lại Môi trường để ghi văn bản chính là các viên thuốc được bọc trong sáp ong Demeratus, một người Hy lạp, cần thông báo cho Sparta rằng Xerxes định xâm chiếm Hy lạp Để tránh bị phát hiện, anh ta đã bóc lớp sáp ra khỏi các viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại các viên thuốc bằng một lớp sáp mới Những viên thuốc được để ngỏ và lọt qua mọi sự kiểm tra một cách dễ dàng
Một cách giấu tin phổ biến là sử dụng mực không màu Đây là một phương tiện hữu hiệu cho bảo mật thông tin trong một thời gian dài Người Romans cổ đã biết sử dụng những chất sẵn có như nước quả, nước tiểu và sữa
để viết các thông báo bí mật giữa những hàng văn tự thông thường Khi bị hơ nóng, những loại mực không nhìn thấy này sẽ trở nên sẫm màu và có thể đọc được một cách dễ dàng Mực không màu cũng được sử dụng rất gần đây, như
Trang 14Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
trong thời gian chiến tranh Thế giới lần thứ II
Ý tưởng che giấu thông tin đã có từ hàng nghìn năm về trước nhưng kỹ thuật này được dùng chủ yếu trong quân đội và trong các cơ quan tình báo Mãi cho tới vài thập niên gần đây, giấu thông tin mới được các nhà nghiên cứu và các viện công nghệ thông tin quan tâm và đã có rất nhiều các công trình nghiên cứu về vấn đề này Cuộc cách mạng số hoá thông tin và sự phát triển nhanh chóng của mạng truyền thông là nguyên nhân chính dẫn đến sự thay đổi này Những phiên bản sao chép hoàn hảo, các kỹ thuật thay thế, sửa đổi tinh vi, cộng với sự lưu thông phân phối trên mạng của các dữ liệu đa phương tiện đã sinh ra rất nhiều vấn đề nhức nhối về nạn ăn cắp bản quyền, phân phối bất hợp pháp, xuyên tạc trái phép
1.1.2 Định nghĩa
Giấu thông tin (Steganography) là một kỹ thuật nhúng thông tin
(embeding) vào trong một nguồn đa phương tiện gọi là các phương tiện
chứa(host data) mà không gây ra sự nhận biết về sự tồn tại của thông tin giấu
(invisible)
1.1.3 Mô hình kỹ thuật giấu tin
Mô hình của kỹ thuật giấu tin cơ bản được mô tả trong Hình 1.1 và Hình 1.2 Trong đó Hình 1.1 Biểu diễn quá trình giấu tin cơ bản [6]
Hình 1.1: Lược đồ chung cho quá trình giấu tin Phương tiện chứa: bao gồm các đối tượng được dùng làm môi trường để giấu tin như text, audio, video, image …
Bộ nhúng thông tin
Phương tiện chứa
Phương tiện chứa đã được giấu tin Thông tin cần giấu
Trang 15Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Thông tin cần giấu: là một lượng thông tin mang một ý nghĩa nào đó tuỳ thuộc vào mục đích của người sử dụng Thông tin sẽ được giấu vào trong một phương tiện chứa nhờ một bộ nhúng
Bộ nhúng là những chương trình, thuật toán giấu tin và được thực hiện với một khoá bí mật giống như các hệ mã mật cổ điển Sau khi giấu tin, các phương tiện chứa có giấu tin sẽ được gửi đi hoặc được phân phối sử dụng trên mạng
Hình 1.2: Lược đồ chung cho quá trình tách tin Hình 1.2 chỉ ra các công việc giải mã thông tin đã giấu [6] Quá trình giải mã được thực hiện thông qua một bộ giải mã tương ứng với bộ nhúng thông tin cùng với khoá của quá trình nhúng Kết quả thu được gồm phương tiện chứa gốc và thông tin đã giấu Bước tiếp theo, thông tin giấu sẽ được xử
lý, kiểm định so sánh với thông tin giấu ban đầu
1.2 Phân loại kỹ thuật giấu tin
Có nhiều cách để tiến hành phân loại các phương pháp giấu thông tin thông qua các tiêu chí khác nhau: như theo phương tiện chứa tin, các phương pháp tác động lên phương tiện chứa tin, hay phân loại dựa theo các mục đích
sử dụng
Theo mục đích sử dụng, giấu thông tin có hai loại như hình 1.3:
Bộ lọc thông tin
Phương tiện chứa đã
được giấu tin
Phương tiện chứa
Thông tin giấu Khóa K
Kiểm định
Trang 16Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Hình 1.3: Phân loại kỹ thuật giấu tin
Giấu thông tin mật
Đây là ứng dụng phổ biến nhất từ trước tới nay Đối với giấu thông tin mật người ta quan tâm chủ yếu tới các mục tiêu sau:
- Độ an toàn của tin giấu (khả năng không bị phát hiện của tin giấu)
- Lượng thông tin tối đa có thể giấu trong một phương tiện chứa cụ thể
mà vẫn có thể đảm bảo an toàn
- Độ bảo mật của thông tin trong trường hợp giấu tin bị phát hiện
Giấu thông tin mật không quan tâm nhiều tới các yêu cầu về khả năng bền vững của phương tiện chứa Việc giải mã để nhận được thông tin cũng không cần phương tiện chứa gốc ban đầu Các yêu cầu về khả năng chống tấn công không được quan tâm lắm, thay vào đó là thông tin giấu phải được bảo mật Đối với các thuật toán giấu thông tin mật, người ta không chú trọng đến việc bảo vệ thông tin mật trước sự tấn công của các đối thủ Mà thay vào đó quan tâm đến tính ẩn và tính an toàn đối với dữ liệu cần giấu
Giấu thông tin thủy vân
Khác với kỹ thuật giấu thông tin để giữ bí mật thông tin, giấu thông tin thủy vân có mục tiêu là bảo vệ bản quyền và xác thực thông tin Vì vậy, kỹ thuật này không chống lại việc khai thác thông tin, mà quan trọng nhất đối với
nó là đảm bảo tuyệt đối tính bền vững Nghĩa là: không thể hủy bỏ được thông tin giấu trừ khi hủy sản phẩm chứa Ngoài ra các thông tin nhúng cần
có ảnh hưởng tối thiểu đối với phương tiện chứa Vì vậy, thông tin cần giấu càng nhỏ càng tốt
Giấu thông tin
Trang 17Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Bảng so sánh giấu thông tin mật và giấu thông tin thủy vân [2]
Steganography
Giấu tin mật
Watermarking Thủy vân số
- Dùng trong các hoạt động xuất bản
Cách
thực
hiện
Không làm thay đổi phương tiện
chứa thông tin
Có thể tác động nhỏ về cảm nhận tới phương tiện chứa
Cách
thực
hiện
- Giấu được nhiều thông tin nhất
- Không quan tâm đến độ bền
của phương tiện chứa
- Không quan sát được việc giấu
- Dữ liệu nhúng có thể nhận thấy hay không nhận thấy
- Không kiểm tra được nếu
Bảng 1.1: So sánh giấu thông tin mật và giấu thông tin thủy vân
1.3 Thủy vân và yêu cầu cơ bản của thủy vân âm thanh
1.3.1 Phân loại thủy vân số
Nói đến thuỷ vân số là nói đến kỹ thuật giấu tin hướng đến những ứng dụng bảo đảm an toàn dữ liệu cho đối tượng được sử dụng để giấu tin như: bảo vệ bản quyền, phát hiện xuyên tạc, nhận thực thông tin, điều khiển sao chép v.v… Có thể thấy rõ là phần ứng dụng của thủy vân rất lớn, mỗi ứng dụng lại có những yêu cầu riêng và tính chất riêng, do đó các kỹ thuật thuỷ vân cũng có những tính năng khác biệt tương ứng:
Trang 18Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Hình 1.4: Phân loại thủy vân số Các kỹ thuật thuỷ vân trên hình 1.4[6] được phân biệt bởi những đặc trưng, tính chất của từng kỹ thuật và ứng dụng những kỹ thuật đó Thuỷ vân
“dễ vỡ” (fragile) là kỹ thuật nhúng thuỷ vân vào trong đối tượng đa phương tiện (ảnh, âm thanh…) sao cho khi phân phối sản phẩm trong môi trường mở nếu có bất cứ một phép biến đổi nào làm thay đổi đối tượng sản phẩm gốc thì thuỷ vân đã được giấu trong đối tượng sẽ không còn nguyên vẹn như trước khi giấu nữa (dễ vỡ) Các kỹ thuật thuỷ vân có tính chất này được sử dụng trong các ứng dụng nhận thực thông tin (authentication) và phát hiện xuyên tạc thông tin (tamper detection) Rất dễ hiểu vì sao những ứng dụng này cần đến kỹ thuật thuỷ vân dễ vỡ Ví dụ như để bảo vệ chống xuyên tạc một đối tượng đa phương tiện nào đó ta nhúng một thuỷ vân vào đối tượng và sau đó phân phối, quảng bá đối tượng đa phương tiện đó Khi cần kiểm tra lại ta sử dụng hệ thống đọc thủy vân Nếu không đọc được thuỷ vân hoặc thuỷ vân đã
bị sai lệch nhiều so với thuỷ vân ban đầu đã nhúng vào thì có nghĩa là có thể đối tượng đa phương tiện đó đã bị thay đổi Cái khó ở đây là ta phải phân biệt giữa sai lệch thuỷ vân do xuyên tạc và sai lệch do lỗi đường truyền Ngược lại, với kỹ thuật thuỷ vân dễ vỡ là kỹ thuật thuỷ vân bền vững (robust) Các
kỹ thuật thuỷ vân bền vững thường được ứng dụng trong các ứng dụng bảo vệ bản quyền Trong những ứng dụng đó, thuỷ vân đóng vai trò là thông tin sở hữu của người chủ hợp pháp Thuỷ vân được nhúng trong sản phẩm như một
Thủy vân số
Thủy vân ẩn Thủy vân hiện Thủy vân ẩn Thủy vân hiện
Trang 19Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
hình thức dán tem bản quyền Trong trường hợp như thế, thuỷ vân phải tồn tại bền vững cùng với sản phẩm nhằm chống việc tẩy xoá, làm giả hay biến đổi phá huỷ thuỷ vân Một yêu cầu lí tưởng đối với thuỷ vân bền vững là nếu muốn loại bỏ thuỷ vân thì chỉ có một cách duy nhất là phá huỷ sản phẩm Thuỷ vân bền vững lại được chia thành hai loại là thuỷ vân ẩn và thuỷ vân hiện Thuỷ vân hiện là loại thuỷ vân được hiện ngay trên sản phẩm và người dùng có thể nhìn thấy được giống như các biểu tượng kênh chương trình vô tuyến mà chúng ta thường thấy VTV3, CCTV, TV5…Các thuỷ vân hiện trên ảnh thường dưới dạng chìm, mờ hoặc trong suốt để không gây ảnh hưởng đến chất lượng ảnh gốc Đối với thuỷ vân hiện, thông tin bản quyền hiển thị ngay trên sản phẩm
1.3.2 Mô hình hệ thống thủy vân âm thanh
Mô hình tổng quát của hệ thống thủy vân âm thanh được mô tả trên hình 1.5 Đầu vào hệ thống là tệp âm thanh, có thể là tệp âm nhạc nào đó cần bảo
vệ bản quyền và một ảnh thủy vân để nhúng vào tệp âm thanh Bộ nhúng thông tin là mô đun chương trình cài đặt thuật toán nhúng ảnh thủy vân vào
âm thanh Trong luận văn này ảnh thủy vân được xác trộn trước khi nhúng vào tệp âm thanh Có nhiều kỹ thuật xáo trộn ảnh Luận văn sử dụng phép biến đổi Arnold để xáo trộn ảnh thủy vân Sau khi biến đổi Arnold, ảnh được biến đổi sang miền tần số Các hệ số sau khi biến đổi DCT của ảnh được nhúng vào tệp âm thanh
Hình 1.5: Mô hình thủy vân âm thanh
Bộ nhúng thông tin
Tệp âm thanh
Tệp âm thanh đã thủy vân Ảnh thủy vân
Trang 20Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Như đã trình bày trong chương 1 và theo [9], có nhiều kỹ thuật thủy vân
âm thanh Trong phạm vi luận văn này, hai kỹ thuật thủy vân âm thanh được nghiên cứu, đó là:
- Thủy vân âm thanh trong miền thời gian với kỹ thuật nhúng thủy vân vào LSB
- Thủy vân âm thanh trong miền biến đổi với kỹ thuật nhúng thủy vân vào các hệ số tập trung năng lượng cao của phép biến đổi cosine rời rạc DCT Việc tách thủy vân được thực hiện theo mô hình 1.6 Đầu vào của hệ thống là tệp âm thanh đã nhúng thủy vân với một khóa K Bộ lọc thông tin là
mô đun chương trình cài đặt thuật toán tách ảnh thủy vân khỏi dữ liệu âm thanh Đầu ra của hệ thống là tệp ảnh thủy vân và tệp âm thanh gốc Trong luận văn này, các thuật toán tách ảnh thủy vân được nghiên cứu tương ứng với các thuật toán nhúng ảnh thủy vân vào âm thanh như trình bày trên đây
Hình 1.6: Mô hình tách thủy vân âm thanh
Để cài đặt được mô hình nhúng ảnh thủy vân vào tệp âm thanh và tách ảnh thủy vân khỏi tệp âm thanh, một số kiến thức cơ sở được trình bày trong mục sau Các kiến thức cơ sở bao gồm phép biến đổi cosine rời rạc (thuận/nghịch), phép biến đổi Arnold (thuận/nghịch) để áp dụng trên các tín hiệu âm thanh và tín hiệu ảnh Ngoài ra một số độ đo đánh giá hiệu năng hệ thống nhúng và ảnh thủy vân khỏi tệp âm thanh được trình bày
Bộ lọc thông tin
Tệp âm thanh có
thủy vân
Tệp âm thanh gốc
Ảnh thủy vân Khóa K
Trang 21Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
1.3.3 Các đặc tính của thủy vân âm thanh
- Tính không thấy được: nghĩa không thể nhận thấy được sự xuất hiện của thủy vân Chúng ta không thể cảm nhận sự thay đổi của âm thanh sau khi được nhúng thủy vân vào
- Tính bền vững: nghĩa là thủy vân không thể phá hủy giá trị của âm thanh gốc
- Tính an toàn: có nghĩa là thủy vân không thể bị xóa một cách dễ dàng,
và có thể cung cấp đầy đủ bằng chứng về bản quyền
- Tính vững mạnh: có nghĩa là có thể chống lại các cuộc tấn công thủy vân của các tín hiệu âm thanh Chúng ta vẫn còn có thể trích xuất hình mờ ngay cả khi âm thanh bị tấn công
- Khả năng chứa thủy vân: là số lượng dữ liệu tối đa có thể được nhúng vào các hệ thống âm thanh
1.4 Một số ứng dụng đang đƣợc triển khai
Thủy vân có rất nhiều ứng dụng trong đời sống nổi bật nhất [6]:
Bảo vệ bản quyền tác giả: Đây là ứng dụng cơbản nhất của kỹ thuật
thuỷ vân số (digital watermarking) - một dạng của phương pháp giấu tin Một thông tin nào đó mang ý nghĩa quyền sở hữu tác giả (người ta gọi nó là thuỷ vân - watermark) sẽ được nhúng vào trong các sản phẩm, thuỷ vân đó chỉ một mình người chủ sở hữu hợp pháp các sản phẩm đó có và được dùng làm minh chứng cho bản quyền sản phẩm Giả sử có một thành phẩm dữ liệu dạng đa phương tiện như ảnh, âm thanh, video và cần được lưu thông trên mạng Để bảo vệ các sản phẩm chống lại các hành vi lấy cắp hoặc làm nhái cần phải có một kỹ thuật để “dán tem bản quyền” vào sản phẩm này Việc dán tem hay chính là việc nhúng thuỷ vân cần phải đảm bảo không để lại một ảnh hưởng lớn nào đến việc cảm nhận sản phẩm Yêu cầu kỹ thuật đối với ứng dụng này
là thuỷ vân phải tồn tại bền vững cùng với sản phẩm, muốn bỏ thuỷ vân này
Trang 22Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
mà không được phép của người chủ sở hữu thì chỉ còn cách là phá huỷ sản phẩm
Nhận thực thông tin hay phát hiện xuyên tạc thông tin: Một tập các
thông tin sẽ được giấutrong phương tiện chứa sau đó được sử dụng để nhận biết xem dữ liệu trên phương tiện gốc đó có bị thay đổi hay không Các thuỷ vân nên được ẩn để tránh được sự tò mò của kẻ thù, hơn nữa việc làm giả các thuỷ vân hợp lệ hay xuyên tạc thông tin nguồn cũng cần được xem xét Trong các ứng dụng thực tế, người ta mong muốn tìm được vị trí bị xuyên tạc cũng như phân biệt được các thay đổi (ví dụ như phân biệt xem một đối tượng đa phương tiện chứa thông tin giấu đã bị thay đổi, xuyên tạc nội dung hay là chỉ
bị nén mất dữ liệu) Yêu cầu chung đối với ứng dụng này là khả năng giấu
thông tin cao và thuỷ vân không cần bền vững
Giấu vân tay hay dán nhãn: Thuỷvântrong những ứng dụng này được
sử dụng để nhận diện người gửi hay người nhận của một thông tin nào đó Ví
dụ như các vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin gốc trước khi chuyển cho nhiều người Với những ứng dụng này thì yêu cầu là đảm bảo độ an toàn cao cho các thuỷ vân tránh sự xoá giấu vết trong khi phân phối
Điều khiển truy cập: Các thuỷvân trong những trườnghợp này được sử
dụng để điều khiển truy cập đối với các thông tin Các thiết bị phát hiện ra thuỷ vân thường được gắn sẵn vào trong các hệ thống đọc ghi Ví dụ như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật Các ứng dụng loại này cũng yêu cầu thuỷ vân phải được bảo đảm an toàn và cũng sử dụng phương pháp phát hiện thuỷ vân đã giấu mà không cần thông tin gốc
Chú giải: Các thông tin giấu được trong những trường hợp này
càngnhiều càng tốt, việc giải mã để nhận được thông tin cũng không cần phương tiện chứa gốc ban đầu Các yêu cầu mạnh về chống tấn công của kẻ
Trang 23Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
thù không cần thiết lắm thay vào đó là thông tin giấu phải được giấu kín (có thể sử dụng trong truyền thông tin mật)
1.5 Âm thanh số
1.5.1 Khái niệm về âm thanh và âm thanh số
Trong phần này một số đặc trưng âm thanh sẽ được trình bày [1]
Âm thanh: Là các dao động cơ học (biến đổi vị trí qua lại) của các
phân tử, nguyên tử hay các hạt làm nênvật chất và lan truyền trong vật chất như các sóng Âm thanh, giống như nhiều sóng, được đặc trưng bởi tần số, bướcsóng, chu kỳ, biên độ và vận tốc lan truyền (tốc độ âm thanh)
Hình 1.7: Tín hiệu âm thanh Một đặc tính của âm thanh đây là một sóng dọc, tức là nó là sự lan truyền dao động của đại lượng vô hướng là áp suất, là sự lan truyền dao động của đại lượng có hướng là vận tốc và vị trí của các phân tử hay nguyên tử trong môi trường, trong đó phương dao động luôn trùng với phương chuyển động của sóng
Cũng như các sóng cơ học khác, sóng âm mang năng lượng tỉ lệ với bình phương biên độ sóng Năng lượng đó truyền đi từ nguồn âm đến tai ta Cường
độ âm thanh là lượng năng lượng được sóng âm truyền đi trong một đơn vị thời gian qua một đơn vị diện tích đặt vuông góc với phương truyền âm
Trang 24Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Ngoài ra trường độ cũng góp phần ảnh hưởng đến chất lượng âm thanh
Âm thanh số: Là các mẫu được lấy theo phương pháp lượng tử hóa,
chuyển đổi giá trị mẫu (âm lượng) liên tục thành giá trị rời rạc Thông thường các mẫu này đã được lọc để loại bỏ những tần số không mong muốn (giữ lại tiếng nói từ 50 Hz đến 10 KHz, âm nhạc từ 20 Hz đến 20 kHz)
(a) Tín hiệu gốc dạng tương
tự (b) Lấy mẫu (c) Giá trị lấy mẫu và lượng
tử hóa (d) Dãy số sau khi số hóa
Hình 1.8: Số hóa tín hiệu âm thanh
1.5.2 Một số định dạng file âm thanh trên máy tính
Với sự phát triển của âm thanh số trong thời gian gần đây rất nhiều các loại định dạng âm thanh đã ra đời, mỗi loại định dạng âm thanh lại có những
đặc trưng, cấu trúc khác nhau
Có ba nhóm định dạng file âm thanh, gồm:
- Các loại định dạng không nén: WAV, AIFF và AU
Cả WAV và AIFF đều đựợc coi là các định dạng âm thanh “không thể mất” Chúng được tạo ra dựa trên nền tảng PCM “điều biến mã xung” (Pulse Code Modulation) với một vài thay dổi nhỏ trong bộ dữ liệu lưu trữ, bên cạnh
đó hai loại định dạng này có thể chuyển đổi được cho nhau mà không hề bị giảm chất lượng âm thanh
Chúng cũng được coi là “không mất dữ liệu” - không bị nén - và một
Trang 25Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
file âm thanh PCM stereo, chẳng hạn có tần số là 44.1kHz và độ nén là 16 bít (chất lượng đĩa CD) thì chất lựợng âm thanh có thể lên đến 10MB một phút sau khi được chuyển đổi (convert)
- Các loại định dạng: FLAC, ALAC, APE
FLAC (Free Lossless Audio Codec), ALAC (Apple Lossless Audio Codec) và APE (Monkey’s Audio) là các loại định dạng nén âm thanh, chúng
sử dụng các thuật toán nén dữ liệu Sự khác nhau giữa các file nén và các file FLAC đó là FLAC được thiết kế chuyên cho âm thanh thế nên tỉ lệ nén của nó tốt hơn và không bị mất dữ liệu Thông thường thì file FLAC bằng khoảng một nửa kích cỡ file WAV Một file FLAC cho âm thanh stereo với chất lượng CD chạy khoảng 5MB mỗi phút
Hầu hết các định dạng ta sử dụng hàng ngày được xếp vào loại “dễ mất
dữ liệu” (lossy); bởi lẽ đôi khi người ta phải giảm chất lượng âm thanh của file xuống để tăng “diện tích sử dụng” của file đó lên
- Các loại định dạng “dễ mất dữ liệu”: MP3, AAC, WMA, Vorbis
Một file MP3 với “chất lượng CD” trung bình chỉ chạy khoảng 1MB mỗi phút Đây là một file đã được nén tuy nhiên không giống như các định dạng
“không mất dữ liệu”, ta không thể chuyển đổi lại các file định dạng “dễ mất
dữ liệu” để chúng trở lại chất lượng âm thanh tốt được
Những định dạng “dễ mất dữ liệu” khác nhau sử dụng những thuật toán khác nhau để lưu trữ thông tin, và vì thế chúng thường có chênh lệch về tỷ lệ giữa kích cỡ file và chất lượng âm thanh Những định dạng “dễ mất dữ liệu” cũng sử dụng số bít để chỉ chất lượng âm thanh, thường vào khoảng
“192kbít/s” hay “192kbps”
- Một số định dạng âm thanh trên máy tính[2]
Trang 26Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Phần mở
Định dạng tập tin âm thanh tiêu chuẩn được
sử dụng bởi Apple được coi là tương đương
Apple wav
Microsystems
Định dạng tập tin âm thanh tiêu chuẩn được
sử dụng bởi Sun, Unix và Java Những âm thanh trong các tập tin AU có thể PCM hoặc
nén với μ-law, a-law or G729 codecs
.mp3
Layer-3 định dạng MPEG là định dạng phổ biến nhất để tải về và lưu trữ âm nhạc Bằng cách loại bỏ các phần của tập tin âm thanh
mà chủ yếu là không nghe được, các tập tin mp3 được nén để khoảng một phần mười kích thước của một tập tin PCM tương đương
trong khi duy trì chất lượng âm thanh tốt
- khoảng 10MB mỗi phút của âm nhạc
.ra,.ram RealNetworks Định dạng Real Audio được thiết kế để
truyền tải âm thanh qua Internet Các định
Trang 27Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
dạng.ra cho phép các tập tin được lưu trữ trong một thời trang khép kín trên một máy tính, với tất cả các dữ liệu âm thanh chứa bên
trong tập tin đó
.acc
Fraunhofer, Dolby, Sony và
4 tiêu chuẩn hỗ trợ đầy đủ các tính năng phụ
.qt Apple Được sử dụng để định dạng đa phương tiện
Trang 28Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
CHƯƠNG 2 THUẬT TOÁN THỦY VÂN ÂM THANH TRÊN MIỀN
THỜI GIAN VÀ MIỀN TẦN SỐ
Trong chương này, một số thuật toán thủy vân âm thanh trong miền thời gian sử dụng kỹ thuật thay thế LSB và thủy vân âm thanh trong miền tần số
sử dụng biến đổi DCT được trình bày [12]
2.1 Thuật toán thủy vân âm thanh sử dụng biến đổi Cosine rời rạc
2.1.1 Biến đổi Cosine rời rạc
Các quá trình nén là xác định các thông số tin dư thừa trong miền không gian của hình ảnh hay tín hiệu video Nén không gian được thực hiện bởi phép biến đổi DCT (Discrete Cosine Tranform) DCT biến đổi dữ liệu dưới dạng biên độ thành dạng tần số Mục đích của quá trình biến đổi là tách liên kết của từng ảnh con, hoặc gói càng nhiều năng lượng của ảnh con vào một phần nhỏ các hệ số hàm truyền Việc mã hoá và truyền chỉ thực hiện đối với các hệ số năng lượng này, và có thể cho kết quả tốt khi tạo lại tín hiệu Video
có chất lượng cao
DCT đã trở thành tiêu chuẩn quốc tế cho các hệ thống mã chuyển vị bởi
nó có đặc tính gói năng lượng tốt, cho kết quả là số thực và có thuật toán nhanh [9]
Biến đổi Fourier rời rạc một chiều
Xét dãy rời rạc f x x 0,1, N 1 Biến đổi Fourier rời rạc thuận ngược một chiều xác định bởi
Biến đổi Fourier rời rạc hai chiều
Cặp biến đổi Fourier rời rạc hai chiều thuận ngược cho bởi
Trang 29Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Phép biến đổi Cosin rời rạc
Cặp biến đổi Cosin rời rạc một chiều thuận ngược cho bởi
NÕuu u
Trang 30Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
2.1.2 Thuật toán thủy vân âm thanh sử dụng biến đổi Cosine rời rạc
Trong tài liệu [6] đã mô tả phương pháp nhúng thủy vân trên n hệ số DCT của tệp âm thanh sau khi biến đổi DCT, bao gồm cả thành phần DC theo công thức sau:
vi’=vi(1+αxi) (2.3) trong đó, vi là hệ số sau khi biến đổi DCT từ tệp âm thanh, xi là giá trị của dấu ẩn sẽ trộn với vi; α là tham số và vi’ là hệ số hiệu chỉnh (giá trị cộng thêm vào các vị trí tương ứng trong tệp âm thanh gốc)
Việc tách thủy vân có thể được thực hiện bằng cách đảo công thức (2.3)
ẩn trong miền thời gian-biên độ của tệp âm thanh
Áp dụng ý tưởng của Cox, các tác giả của tài liệu [12] đề xuất lược đồ nhúng và tách thủy vân tệp âm thanh trên cơ sở biến đổi cosine rời rạc, trong
đó dấu ẩn có thể là ảnh
Hình 2.1 mô tả quy trình này
Trang 31Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Hình 2.1: Sơ đồ quy trình nhúng thủy vân biến đổi Cosine rời rạc
Thuật toán 2.1 Nhúng thủy vân sử dụng DCT
Từ Hình 2.1 thuật toán nhúng được mô tả như dưới đây
Input: Tệp âm thanh, Tệp ảnh (dấu ẩn – mark)
Output: Tệp âm thanh đã nhúng thủy vân
Các bước của thuật toán:
Bước 1: Đọc tệp âm thanh (có thể trong khuôn mẫu WAV như mô tả
Trang 32Số hóa bởi Trung tâm Học liệu - ĐHTN http://www.lrc-tnu.edu.vn/
Bước 7: Trộn tệp dấu ẩn trong miền tần số vào tệp âm thanh trong miền
tần số (sau khi biến đổi DCT) Việc trộn này có thể sử dụng kỹ thuật do Cox đề xuất như công thức (2.3)
Bước 8: Áp dụng DCT ngược (áp dụng công thức 2.2) tệp âm thanh đã
nhúng ảnh để có được tệp âm thanh trong miền quan sát
Bước 9: Kết thúc
Việc tách thủy vân được thực hiện theo sơ đồ trên hình 2.2
Hình 2.2: Sơ đồ quy trình tách thủy vân biến đổi Cosine rời rạc
Thuật toán 2.2 Tách thủy vân sử dụng DCT
Việc tách thủy vân ảnh khỏi tệp âm thanh được thực hiện theo các bước sau đây
Input: Tệp âm thanh đã thủy vân, Tệp âm thanh gốc
Output: Tệp ảnh (dấu ẩn – Mark)
DCT
Âm thanh đã nhúng ảnh