1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tìm hiểu kỹ thuật watermarking đối với audio số

29 577 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 29
Dung lượng 32,65 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Watermarking là một kỹ thuật mới cho phép nhúng thông tin tác giả, gọi là một Watermark, vào các tài liệu số hóa sao cho chất lượng trực quan của tài liệu không bị ảnh hưởng và khi cần c

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG

Báo Cáo:

XỬ LÝ DỮ LIỆU ĐA PHƯƠNG TIỆN

Đề tài:

“Tìm hiểu kỹ thuật Watermarking đối với audio số”

GVHD: PGS.TS Nguyễn Thị Hoàng Lan

Phạm Minh Hiếu

20121610

20121693

Trang 2

MỤC LỤC

LỜI NÓI ĐẦU 3

I TÌM HIỂU CHUNG 5

1 Watermarking 5

a Tổng quan 5

b Lịch sử 6

c Phân loại 7

d Ứng dụng 10

2 Watermarking trên âm thanh số 12

a Giới thiệu chung 12

b Một số kỹ thuật giấu tin trong Audio 13

II SƠ ĐỒ AUDIO WATERMARKING 17

1 Dựa trên quan điểm Watermark như một dạng truyền thông 17

a Mô hình cơ bản 17

b Mô hình Watermarking truyền thông với thông tin phụ ở bộ trung chuyển 18

c Mô hình Watermarking theo quan niệm truyền thông đa công 19

2 Dựa trên quan điểm hình học 20

a Các phân phối và miền trong không gian đa phương tiện 20

b Mô hình Watermarking trong không gian nhúng 21

III THUẬT TOÁN XỬ LÝ DỮ LIỆU 24

1 Ý tưởng thuật toán 24

2 Quá trình tạo Watermark 24

a Mô hình 24

b Thuật toán 25

3 Quá trình nhúng Watermark 25

4 Quá trình rút trích Watermark 26

IV CÀI ĐẶT THỬ NGHIỆM 28

TÀI LIỆU THAM KHẢO 29

Trang 3

Ngày nay, bên cạnh những ích lợi to lớn, thiết thực mà mạng máy tính đem lại, chúng ta cũng đang đối đầu với những thử thách liên quan đến các vấn đề truyền thông bảo mật và đặc biệt là vấn đề phân phối các tài liệu đa phương tiện sao cho bảo đảm quyền sở hữu trí tuệ Tình trạng sao chép bất hợp pháp, giả mạo các tác phẩm số hóa gây bức xúc không chỉ riêng các tác giả mà còn cho cả những người làm pháp luật Những hành vi xâm phạm bản quyền như giả mạo, ăn cắp tác phẩm, sử dụng các tác phẩm không có bản quyền… đang trở nên phổ biến và ngày càng tinh vi

Tuy nhiên với các phương pháp bảo vệ dữ liệu truyền thống như mã hoá,

sử dụng khóa đều không đem lại hiệu quả cao trong tình hình hiện nay Các loại truyền thông đa phương tiện như âm thanh số, ảnh số , video là những dạng dữ liệu rất khó bảo vệ Trong bối cảnh đó, kỹ thuật Watermarking

ra đời như một cứu cánh Watermarking là một kỹ thuật mới cho phép nhúng thông tin tác giả, gọi là một Watermark, vào các tài liệu số hóa sao cho chất lượng trực quan của tài liệu không bị ảnh hưởng và khi cần có thể dò lại được Watermark đã nhúng nhằm xác nhận bản quyền

Bài tiểu luận tiến hành nghiên cứu một số vấn đề lý thuyết tổng quan về Watermarking và các ứng dụng của nó trong công nghệ truyền thông đa phương tiện, đồng thời tìm hiểu và phân tích sơ bộ về một số kỹ thuật Watermarking trong môi trường ảnh màu kỹ thuật số

Bài tiểu luận được trình bày thành 4 phần:

Phần 1: Tìm hiểu chung kĩ thuật Watermarking Phần 2: Tìm hiểu và phân tích sơ đồ audio watermarking trên miền thời gian hoặc miền tần số

Phần 3: Tìm hiểu sơ đồ thuật toán xử lí dữ liệu Phần 4: Cài đặt thử nghiệm thuật toán

Do thời gian thực hiện và kiến thức còn nhều hạn chế nên chắc chắn không

Trang 4

tránh khỏi những sai lầm, thiếu sót, kính mong nhận được sự đóng góp ý kiến,

bổ sung, sửa đổi của quý thầy cô giáo, các bạn đồng nghiệp, đồng môn để bài tiểu luận hoàn chỉnh hơn, thiết thực hơn

Xin chân thành cảm ơn !

Trang 5

Dữ liệu sau quá trình nhúng được gọi là dữ liệu nhúng Tanaka (1990), Caronni và Tirkel (1993) lần lượt đưa ra những ấn bản đầu tiên về Watermarking nhưng chưa nhận được sự quan tâm đúng mức Mãi đến năm 1995, chủ đề này mới bắt đầu được quan tâm và kể từ đó, Watermarking số đã phát triển rất nhanh với nhiều hướng nghiên cứu và phương pháp thực hiện khác nhau

Watermarking được ứng dụng trong nhiều lĩnh vực như bảo vệ quyền sở hữu, điều khiển việc sao chép, xác nhận giấy tờ hay truyền đạt thông tin khác… trong đó ứng dụng phổ biến của nó là cung cấp bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách nhúng các thông tin bản quyền Rõ ràng trong ứng dụng này, thông tin nhúng cần phải bền vững trước các thao tác nhằm loại bỏ chúng

Trang 6

a) Sơ đồ nhúng Watermark b) Sơ đồ khôi phục Watermark Tất cả các phương pháp Watermarking đều có chung các khối sau: một hệ thống nhúng Watermark và một hệ thống khôi phục Watermark Ngõ vào là Watermark, dữ liệu cần nhúng và mã cá nhân hay công cộng Watermark có thể ở bất kì dạng nào như chữ số, văn bản hay hình ảnh Khoá có thể được dùng để tăng cường tính bảo mật, nghĩa là ngăn chặn những kẻ không có bản quyền khôi phục hay phá hủy Watermark Các hệ thống thực tế dùng ít nhất

là một khoá, thậm chí kết hợp nhiều khoá Ngõ ra là dữ liệu đã được Watermark Quá trình khôi phục Watermark tổng quát Các ngõ vào là dữ liệu

đã Watermark, khoá và dữ liệu gốc (có thể có hoặc không tuỳ thuộc vào phương pháp) Ngõ ra hoặc là Watermark khôi phục được hoặc đại lượng nào đó chỉ ra mối tương quan giữa nó và Watermark cho trước ở ngõ vào

b Lịch sử

Nghệ thuật làm giấy đã được phát minh ở Trung Quốc cách đây trên một ngàn năm nhưng mãi đến khoảng năm 1282, các công nghệ Watermark trên giấy mới xuất hiện đầu tiên dưới hình thức một số vị trí khuôn giấy là các mẫu dây mỏng hơn, khi đó giấy sẽ mỏng và trong suốt hơn ở những vị trí dây mỏng Các Watermark giấy nguyên thủy giúp xác nhận xưởng sản xuất hay đơn giản chỉ là để trang trí Vào thế kỉ thứ 18, ở châu Âu và Mỹ, Watermark trên giấy đã đem lại những lợi ích thiết thực trong việc xác định nhãn hiệu thương mại, ghi nhận ngày sản xuất, chống làm tiền giả Thuật ngữ Watermark bắt nguồn từ một loại mực vô hình được viết lên giấy và chỉ hiển thị khi nhúng giấy đó vào nước Thuật ngữ digital Watermarking được cộng đồng thế giới chấp nhận rộng rãi vào đầu thập niên 1990 Khoảng năm

1995, sự quan tâm đến Watermarking bắt đầu phát triển nhanh Năm 1996, hội thảo về che dấu thông lần đầu tiên đưa Watermarking vào phần trình nội

Trang 7

dung chính Đến năm 1999, SPIE đã tổ chức hội nghị đặc biệt về Bảo mật và Watermarking trên các nội dung đa phương tiện

Cũng trong khoảng thời gian này, một số tổ chức đã quan tâm đến kỹ thuật Watermarking với những mức độ khác nhau Chẳng hạn CPTWG thử nghiệm

hệ thống Watermarking bảo vệ phim trên DVD SDMI sử dụng Watermarking trong việc bảo vệ các đoạn nhạc Hai dự án khác được liên minh Châu Âu ủng

hộ, VIVA và Talisman đã thử nghiệm sử dụng Watermarking để theo dõi phát sóng Vào cuối thập niên 1990, một số công ty đưa Watermarking vào thương trường, chẳng hạn các nhà phân phối nhạc trên internet sử dụng Liqid Audio áp dụng công nghệ của Verance Corporation Trong lĩnh vực Watermarking ảnh, Photoshop đã tích hợp một bộ nhúng và bộ dò Watermark tên là Digimarc

c Phân loại

Có nhiều cách phân loại kỹ thuật watermarking khác nhau, có thể phân loại như sau:

Phân loại watermarking theo miền nhúng

• Miền không gian

• Miền tần số

− Miền DFT

Trang 8

− Định dạng đa phương tiện đặc biệt (ví dụ như hoạt hình)

• Theo hệ thống nhìn của con người kỹ thuật watermarking số có thể chia thành các loại sau:

− Watermark có thể nhìn thấy (Visible Watermark)

− Watermark bền vững không nhìn thấy (Invisible-Robust Watermark)

Trang 9

− Watermark yếu không nhìn thấy (Invisible-Fragile Watermark)

− Watermark kép (Dual Watermark)

• Phương pháp thay đổi dữ liệu chủ

− Cộng tuyến tính của tín hiệu trải phổ

− Tổng hợp ảnh (nhúng một logo)

− Thay thế và lượng tử hóa không tuyến tính

• Phân loại kỹ thuật watermarking dựa vào các ứng dụng

• Ngoài ra, kỹ thuật watermarking có thể được chia làm 3 loại khác nhau như sau:

− Watermark rõ rang

− Watermark bền vững không rõ rang

− Watermark dễ hư không rõ ràng

Trang 10

• Độ khả dụng của tham chiếu dữ liệu (ví dụ như ảnh gốc) cho quá trình trích watermark

• Bảo vệ quyền sở hữu (Copyright Protection)

Đây là ứng dụng cơ bản nhất của kỹ thuật digital watermarking Mục đích của watermarking cho bảo vệ quyền tác giả là nhúng thông tin xác nhận bản quyền (watermark) vào dữ liệu ảnh số để có thể nhận biết người chủ bản quyền Ngoài mục đích xác nhận người chủ bản quyền còn để kiểm tra kín công việc của người mua (truy xét các bản sao không hợp lệ) Dữ liệu nhúng có thể là một

số đăng ký (giống như UPC trên đĩa), một đoạn thông điệp, logo hình hoặc là một mẫu duy nhất (như ADN: Acid deoxyribonucleic) Ví dụ như hệ thống quản lí sao chép DVD đã được ứng dụng ở Nhật Watermark mang các giá trị chỉ trạng thái cho phép sao chép dữ liệu như “copy never” - không được phép sao chép hay “copy once” - chỉ được copy một lần sau khi copy xong, bộ đọc, ghi watermark sẽ ghi watermark mới, chỉ trạng thái mới lên DVD Các ứng dụng loại này yêu cầu watermark phải được bảo đảm an toàn và sử dụng phương pháp phát hiện watermark đã giấu mà không cần thông tin gốc

Watermark số có thể nhận thấy được hoặc không nhìn thấy được Watermark ảnh nhìn thấy được thường là logo của người bản quyền, có thể dễ dàng đặt vào ảnh nhưng khó gở bỏ Tuy nhiên nhiều ứng dụng cần watermark không nhận thấy Trong luận văn chỉ đề cập đến “invisible watermark” trong ảnh số

Invisible watermark đòi hỏi phải có tính bền vững cao trước các quá trình xử lý

Trang 11

ảnh như nén ảnh (ví dụ JPEG, JPEG2000), lọc ảnh, biến đổi hình học (xoay, cắt ảnh, co dãn ảnh ) Muốn loại bỏ watermark này mà không được phép của người chủ sở hữu thì chỉ có cách là phá huỷ sản phẩm Để thiết lập quyền sở hữu hợp pháp, sơ đồ watermark phải an toàn để chống lại những tấn công cố ý

• Xác nhận thông tin ảnh và tình trạng nguyên vẹn dữ liệu (Image Athentication and Data Integrity)

Một ứng dụng khác của watermarking là xác nhận đúng ảnh và xác nhận sự giả mạo Ảnh số ngày càng được sử dụng như một chứng cứ buộc tội ngày nay Watermark được sử dụng để phát hiện nó có bị sửa đổi hay không và có thể định vị được vị trí sửa đó Ảnh số dễ bị sửa đổi từ ứng dụng xử lý ảnh phức tạp Watermark được sử dụng để xác nhận tính xác thực của ảnh Đối với ứng dụng loại này watermark cần phải yếu (fragile) không cần bền vững trước các phép

xử lý trên ảnh đã được giấu tin để bất cứ sự sửa đổi nào trên ảnh sẽ phá hủy watermark (phát hiện sự sửa đổi)

• Lấy dấu vân tay hay dán nhãn (Fingerprinting and Labeling)

Nhãn ảnh là một ứng dụng mà thông tin về nội dung ảnh được mã hóa thành watermark và được chèn vào ảnh Mục tiêu của ứng dụng này tập trung vào vấn

đề truyền thông tin, về tính hợp pháp của người nhận hơn là tính hợp pháp của nguồn dữ liệu số, nhằm xác định các bản sao của dữ liệu được phân phối chỉ có một Việc này rất hữu dụng trong việc giám sát và theo dõi các bản sao được sản xuất bất hợp pháp Nó tương tự như số seri trong sản phẩm phần mềm, mỗi một sản phẩm sẽ mang một watermark riêng, loại ứng dụng này được gọi là

“fingerpringting” và nó liên quan đến việc gắn những watermark khác nhau thực hiện dễ dàng và độ phức tạp thấp Watermark được sử dụng trong lĩnh vực này cũng đòi hỏi tính bền vững cao trước những tấn công cố ý

• Theo dõi quá trình sử dụng (Tracking)

Digital watermarking có thể được dùng để theo dõi quá trình sử dụng của các digital media Mỗi bản sao của sản phẩm được chứa một watermark duy nhất dùng để xác định người được phép sử dụng là ai Nếu có sự nhân bản bất hợp pháp, ta có thể truy ra người vi phạm nhờ vào watermark được chứa bên trong digital media

• Kiểm tra giả mạo (Tamper Proofing)

Trang 12

Digital watermarking có thể được dùng để chống sự giả mạo Nếu có bất cứ

sự thay đổi nào về nội dung của các digital media thì watermark này sẽ bị huỷ

đi Do đó rất khó làm giả các digital media có chứa watermark

• Kiểm tra truyền thông (Broadcast Monitoring)

Nhiều chương trình rất tốn kém chi phí để sản xuất và phát trên mạng lưới truyền hình như: tin tức, phim ảnh, các sự kiện thể thao, quảng cáo Bảo vệ tài sản trí tuệ và ngăn chặn các hoạt động phát sóng lại một cách bất hợp pháp là vô cùng quan trọng Các công ty truyền thông và quảng cáo có thể dùng kỹ thuật digital watermarking để quản lý xem có bao nhiêu khách hàng đã dùng dịch vụ cung cấp

• Truyền tin bí mật (Concealed Communication)

Vì digital watermarking là một dạng đặc biệt của kỹ thuật che giấu dữ liệu (steganography) nên người ta có thể dùng để truyền các thông tin bí mật

2 Watermarking trên âm thanh số

a Giới thiệu chung

Các kỹ thuật Watermarking trên âm thanh số hiện nay chủ yếu khai thác khuyết điểm của hệ chính giác ( HAS- Human Auditory System) đó là đặc tính

ít nhạy cảm với những thay đổi nhỏ trên miền thời gian và miền tần số Tewfik

và Hamdy[3] đã phân tích các phương pháp ẩn dữ liệu trong tín hiệu âm thanh

số tiêu biểu là: mã hoá LSB, mã hoá pha , trải phổ, ẩn echo Các kĩ thuật LSB tuy không bền vững nhưng khả năng lưu trữ lớn Mã hoá pha bền vững trước các thao tác lấy mẫu lại, khả năng lưu trữ thấp Bằng cách chèn các echo có biên

độ nhỏ vào miền thời gian , phương pháp ẩn echo được đánh giá cao về khả năng bền vững và tỉ lệ nhúng, tuy nhiên khả năng trong suốt kém Được đánh giá cao hơn cả là kỹ thuật chuyển đổi thông tin với hai hướng tiếp cận chính là

kỹ thuật trải phổ và điều biến chỉ mục lượng tử

Ưu điểm quan trọng đem lại thành công cho hướng phát triển này là không sử dụng tín hiệu gốc trong quá trình rút trích và khó có thể dò tìm watermark bằng các phương pháp phân tích thông kê Tuy nhiên lượng tử hoá không đem lại hiệu quả cao do khả năng chống tấn công thấp Hiện nay trải phổ đang là kỹ thuật được đánh giá cao, được nghiên cứu tập trung phát triển, cải tiến

Trang 13

b Một số kỹ thuật giấu tin trong Audio

Các kỹ thuật giấu tin trong audio dựa vào hệ thống thính giác của con người [1-3] Việc giấu tin trong audio thường là khó hơn trong các dữ liệu media khác

do hệ thống thính giác của con người khá nhạy với các nhiễu Sau đây là một số phương pháp giấu:

• Mã hóa LSB (Least Significant Bit)

Phương pháp mã hóa LSB là cách đơn giản nhất để nhúng thông tin vào trong dữ liệu audio Phương pháp này sẽ thay thế bít ít quan trọng nhất (thường

là bít cuối) của mỗi mẫu dữ liệu bằng bít thông tin giấu Ví dụ mẫu 8 bít như sau:

Sau khi giấu bít 1 sẽ như sau:

Ưu điểm của phương pháp này là dễ cài đặt và cho phép giấu dữ liệu nhiều Có thể tăng thêm dữ liệu giấu bằng cách dùng hai bít LSB Tuy nhiên cách này làm cũng làm tăng nhiễu trên đối tượng chứa dẫn đến đối phương dễ phát hiện và thực hiện các tấn công Vì vậy dữ liệu chứa cần phải được chọn trước khi giấu sử dụng phương pháp mã hóa LSB

ðể tăng độ an toàn cho kỹ thuật này, ta sử dụng bộ sinh số nguyên ngẫu nhiên để sinh ra các vị trí các mẫu được chọn giấu chứ không phải các mẫu liên tục Bộ sinh số này sử dụng một khóa bí mật key như là phần tử khởi tạo của bộ sinh số Khóa key này được sử dụng trong cả quá trình giấu tin và giải tin Lưu ý là bộ sinh số không tạo ra các giá trị trùng nhau để tránh trường hợp một vị trí được giấu hai lần

• Mã hóa Parity (Parity Coding)

Trang 14

Thay vì chia dữ liệu thành các mẫu riêng lẻ, phương pháp mã hóa chẵn lẻ chia dữ liệu thành các nhóm mẫu và giấu từng bit thông tin vào trong các nhóm mẫu này Nếu parity bít của nhóm mẫu này không trùng với bit thông tin giấu thì ta tiến hành điều chỉnh một bít nào đó trong nhóm mẫu này Phương pháp này cho ta nhiều sự lựa chọn hơn khi thay đổi 1 bít và có vẻ “kín đáo” hơn so với phương pháp điều chỉnh LSB

Cả hai phương pháp LSB và Parity đều có những hạn chế Do tai người khá nhạy nên những thay đổi trên dữ liệu chứa sẽ sinh nhiễu và người nghe rất dễ nhận ra Một điểm nữa là hai phương pháp này không bền vững và thông tin sẽ

bị mất sau khi thực hiện việc lấy mẫu lại Một trong những cách khắc phục là thực hiện việc giấu nhiều lần Tuy nhiên cách này cũng có hạn chế là nó làm tăng thời gian xử lý

• Mã hóa Phase (Phase Coding)

Phương pháp mã hóa pha giải quyết được các hạn chế do sinh ra nhiễu của hai phương pháp giấu dữ liệu trên Phương pháp mã hóa pha dựa vào tính chất

là các thành phần của pha không gây ảnh hưởng đến hệ thống thính giác của con người như nhiễu Việc giấu tin được thực hiện bằng cách điều chỉnh pha trong phổ pha của dữ liệu số

Dữ liệu sau khi giấu Quá trình mã hóa pha được chia thành các bước sau:

− Dữ liệu âm thanh gốc được chia thành các segment nhỏ hơn có dài bằng chiều dài chiều dài bằng với thông tin cần giấu

− Thực hiện biến đổi Fourier rời rạc DFT trên mỗi đoạn

Ngày đăng: 08/06/2016, 23:55

HÌNH ẢNH LIÊN QUAN

Hình - 3: Mô hình Watermarking theo quan niệm truyền thông với thong tin phụ ở bộ trung chuyển - Tìm hiểu kỹ thuật watermarking đối với audio số
nh 3: Mô hình Watermarking theo quan niệm truyền thông với thong tin phụ ở bộ trung chuyển (Trang 19)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w