ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG. LUẬN VĂN THẠC SĨ KỸ THUẬT

Watermarking là một cách để bảo vệ quyền sở hữu các hình ảnh hoặc video số thông qua các thông tin được nhúng vào bên trong chúng.. Có thể chia watermarking thành 2 loại: watermarking có

Trang 1

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

HÀ NGỌC HẢI

ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG

HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU

VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG

LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - Năm 2017

Trang 2

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA

HÀ NGỌC HẢI

ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG

HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU

VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG

Chuyên ngành : Khoa học máy tính

Mã số : 60.48.01.01

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: PGS TS Nguyễn Thanh Bình

Đà Nẵng - Năm 2017

Trang 3

LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác

Tác giả luận văn

Hà Ngọc Hải

Trang 4

TÓM TẮT LUẬN VĂN ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN

DỮ LIỆU VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG

Hà Ngọc Hải - học viên cao học khóa 31, chuyên ngành Khoa học máy tính

Tóm tắt - Sự phát triển của internet băng thông rộng đang thúc đẩy mạnh mẽ sự phát triển

của công nghệ đa truyền thông Multimedia Các nguồn dữ liệu multimedia như âm thanh, hình ảnh, văn bản… có thể được truy cập và được phân phối nhanh hơn và rộng hơn Xu thế này mang lại nhiều lợi ích cho người sở hữu các sản phẩm multimedia, nhưng cũng thách thức quyền sở hữu của chúng ta bởi vì hầu hết các dữ liệu multimedia được phân phối dưới các định dạng không bảo mật Hiện nay, việc sao chép và phân phối lại bất hợp pháp các sản phẩm multimedia đang diễn ra liên tục không có kiểm soát Khi ra pháp luật, để phân xử quyền sở hữu các sản phẩm multimedia là việc không dễ dàng nếu không có một cơ chế có thể đảm bảo tính toàn vẹn chân thực quyền tác giả Trong luận văn này chúng tôi xây dựng một hệ thống quản lý và bảo vệ bản quyền video tại Đài THVL sử dụng watermarking thông qua các biến đổi DWT – DCT Hệ thống giúp kiểm soát quá trình truy cập các video của người dùng trong mạng nội bộ, chèn watermark bản quyền vào video, và trích xuất ra khi cần thiết Các kết quả đạt được bước đầu và hướng phát triển tiếp theo của ứng dụng

Từ khóa - Quản lý video; DWT; DCT; watermaking; bản quyền video; truyền hình Vĩnh

Long

WATERMARKING APPLYING FOR BUILDING VIDEO DATA COPYRIGHT MANAGING AND PROTECTING SYSTEM

AT VINH LONG TELEVISION STATION

Abstract - The development of the broadband internet has been boosting the development

of multimedia technology The multimedia data resources such as audio, video, image and text are able to be accessed and distributed faster and widely This trend is beneficial for the owners

of multimedia products However, there are challenges for copyright holder because most of multimedia data files have been distributed in insecure formats Currently, the illegal copying and redistribution of multimedia products are taking place continuously without much control Meanwhile, the legal arbitration about copyright issues on multimedia products will be hard, if

we do not have an effective method of checking the integrity and accuracy of the copyright In this thesis, we have developed a system to manage and protect the video copyright at the Vinh Long Television Station (VLTS) using watermarking base on DWT - DCT transformation The system is able to control the users’ process of accessing videos in the local area network, inserting the copyright watermark of VLTS into videos, and extracting it when necessary The thesis also includes the initial result, and the future development of the application

Key words - Video Management; DWT; DCT; watermarking; video copyright; Vinh Long

Television Station

Trang 5

MỤC LỤC

LỜI CAM ĐOAN i

TÓM TẮT LUẬN VĂN ii

MỤC LỤC iii

DANH MỤC CÁC TỪ VIẾT TẮT vi

DANH MỤC CÁC BẢNG vii

DANH MỤC CÁC HÌNH viii

MỞ ĐẦU 1

1 Lý do chọn đề tài 1

2 Mục đích và ý nghĩa đề tài 3

3 Mục tiêu và nhiệm vụ 4

4 Đối tượng và phạm vi nghiên cứu 4

5 Bố cục luận văn 5

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 6

1.1 TỔNG QUAN VỀ TẬP TIN VIDEO 6

1.1.1 Cấu trúc tập tin video chuẩn mpeg 6

1.1.2 Phép biến đổi DCT (Discrete Cosine Transform) 8

1.1.3 Phép biến đổi DWT (Discrete Wavelet Transform) 10

1.1.4 Phép biến đổi DFT (Discrete Fourier Transform) 14

1.2 MÔ HÌNH NHÚNG THÔNG TIN BẢN QUYỀN VÀO VIDEO 15

1.2.1 Giới thiệu chung về watermarking 15

1.2.2 Các tiêu chí cần có của một thuật toán watermarking mạnh mẽ 16

1.2.2.1 Tính bảo mật 16

1.2.2.2 Tính vô hình 17

1.2.2.3 Tính vô hình đối với thống kê 17

1.2.2.4 Tỉ lệ bit 17

1.2.2.5 Quá trình dò đáng tin cậy 17

1.2.2.6 Tính mạnh mẽ 17

1.2.2.7 Nhúng nhiều watermark 18

Trang 6

1.2.2.8 Blind/non-blind, public/private watermarking 18

1.2.2.9 Watermarking đọc được và dò được 19

1.2.2.10 Tính khả đảo và tính thuận nghịch của watermark 19

1.2.2.11 Tính có thể thay đổi tỉ lệ (scalability) 19

1.2.3 Mô hình watermarking trên video 19

1.2.4 Kỹ thuật watermarking trên video sử dụng biến đổi DWT 20

1.2.4.1 Kỹ thuật watermarking của Mehul R và Priti R 20

1.2.4.2 Kỹ thuật watermarking của Tao P và Eskicioglu A M 21

1.2.5 Watermarking trên video bằng biến đổi DWT – DCT 23

1.3 KẾT CHƯƠNG 25

CHƯƠNG 2 XÂY DỰNG ỨNG DỤNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN VIDEO CHO ĐÀI THVL 26

2.1 MÔ TẢ BÀI TOÁN VỀ QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU VIDEO TẠI ĐÀI PTTH VĨNH LONG 26

2.2 LỰA CHỌN MÔ HÌNH 27

2.2.1 Các mô hình quản lý bản quyền số 27

2.2.1.1 Kiến trúc chung 27

2.2.1.2 Kỹ thuật nhúng thông tin ẩn 29

2.2.1.3 Giải pháp của Microsoft 30

2.2.2 Mô hình đề xuất phù hợp với Đài THVL 33

2.3 LỰA CHỌN KỸ THUẬT WATERMARKING 34

2.3.1 Các hệ số DWT - DCT trong quá trình thực hiện watermarking 34

2.3.2 Các kiểu tấn công dữ liệu trên tập tin video 38

2.3.3 Yêu cầu với hệ thống video watermarking 39

2.4 MÔ HÌNH QUẢN LÝ TẬP TIN VIDEO THEO DẠNG CLIENT – SERVER 39 2.4.1 Thiết kế cơ sở dữ liệu 39

2.4.2 Phân quyền người dùng 43

2.4.3 Bảo mật hệ thống 43

2.4.4 Truyền tải tập tin trong mạng 43

2.5 KẾT CHƯƠNG 44

Trang 7

CHƯƠNG 3 CÀI ĐẶT VÀ THỬ NGHIỆM 45

3.1 MÔI TRƯỜNG CÀI ĐẶT 45

3.2 CÀI ĐẶT HỆ THỐNG 45

3.3 KẾT QUẢ THỬ NGHIỆM 48

3.3.1 Đối với hệ thống quản lý video 48

3.3.2 Đối với công cụ watermarking 48

3.4 ĐÁNH GIÁ KẾT QUẢ 54

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN LUẬN VĂN 56

TÀI LIỆU THAM KHẢO 57 QUYẾT ĐỊNH GIAO ĐỀ TÀI

BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN

Trang 8

DANH MỤC CÁC TỪ VIẾT TẮT

DCT Discrete Cosine Transform Biến đổi consin rời rạc

IDCT Inverse Discrete Cosine Transform Biến đổi consin rời rạc nghịch DWT Discrete Wavelet Transform Biến đổi wavelet rời rạc

HVS Human Visual System Hệ thống thị giác ở người

IDWT Inverse Discrete Wavelet Transform Biến đổi wavelet rời rạc nghịch MSE Mean Square Error Sai lệch trung bình bình phương

PSNR Peak Signal to Noise Ratio Tỷ số tín hiệu đỉnh trên nhiễu

SVD Singular Value Decomposition Biến đổi giá trị số ít

LBS Least significant bit Bít ít quan trọng nhất

MAM Media Asset Manager Quản lý tài sản đa phương tiện

Trang 10

DANH MỤC CÁC HÌNH

Số hiệu

1.2 Ảnh gốc và năng lượng phân bố của ảnh qua phép biến

1.3 Phân chia 3 miền tần số ảnh của phép biến đổi DCT 10

1.5 Quá trình phân tích và tổng hợp tín hiệu 12

1.8 Mô hình tổng quát watermark cho tập tin video 19 1.9 Sơ đồ giải thuật để nhúng watermark vào video 23 2.1 Kiến trúc hệ thống quản lý bản quyền số 27

2.3 Mô hình quản lý bản quyền số của Microsoft 30

2.5 Mô hình client-server quản lý video phù hợp cho Đài

2.12 Sơ đồ cơ sở dữ liệu của MAM cho THVL (phần video) 42

3.4 Nhập thông tin metadata vào tập tin video tải lên 47 3.5 Danh sách các tập tin video đã tải lên hệ thống 47 3.6 Cấu hình hệ thống địa chỉ máy server 48

Trang 12

MỞ ĐẦU

1 LÝ DO CHỌN ĐỀ TÀI

Tháng 4/1977, Tỉnh Cửu Long ra quyết định xây dựng Đài Phát thanh Cửu Long,

phát sóng thử nghiệm từ 2/9/1977 trên sóng 950 Khz tức 315m Năm 1984, Đài Phát

thanh Cửu Long đổi tên thành Đài PT-TH Cửu Long Năm 1989, Đài lắp đặt 1 máy phát thanh 10Kw, sóng phát thanh phủ sóng toàn tỉnh và các tỉnh lân cận Năm 1992, tách tỉnh Cửu Long thành 2 tỉnh Vĩnh Long và Trà Vinh, Đài đổi tên là Đài PT-TH Vĩnh Long Tháng 12/1993 Đài lắp đặt thêm máy pháp sóng công suất 250w trên kênh

12 VHF, xây dựng Trung tâm kỹ thuật truyền hình Đài Phát thanh và Truyền hình tỉnh Vĩnh Long là đơn vị sự nghiệp thuộc Ủy ban nhân dân tỉnh tỉnh Vĩnh Long, thực hiện chức năng cơ quan báo chí của Đảng bộ, chính quyền và nhân dân tỉnh Vĩnh Long Từ đó đến nay, Đài Phát thanh và Truyền hình tỉnh Vĩnh Long luôn nâng cao chất lượng phát thanh và truyền hình, trở thành một trong những đài có chỉ có người xem cao của khu vực và cả nước

Trong các năm qua, Đài PTTH Vĩnh Long (THVL) luôn nỗ lực đổi mới nội dung các chương trình phát thanh và truyền hình, mang lại cho khán thính giả những chương trình hay và bổ ích Ngoài các chương trình phim truyện nước ngoài, phim truyện Việt Nam và các chương trình trò chơi truyền hình (games show) cũng được đài đầu tư phát triển

Cùng với sự phát triển của ngành công nghệ thông tin, Đài THVL thực hiện việc chuyển đổi từ lưu trữ tương tự (analog) trên băng từ sang lưu trữ số dưới dạng các tập tin video và audio trên các server để thuận tiện việc sao chép, xử lý và phát sóng Đài THVL phát triển website của đài tại địa chỉ www.thvl.vn thực hiện việc đưa thông tin đến với nhiều người hơn thông qua internet Tại đây, kênh tivi trực tuyến cũng được phát song song với việc phát sóng truyền hình

Nhận thấy được vai trò của internet trong việc đưa thông tin đến với người dùng, Đài THVL phát triển thêm kênh youtube để đưa các chương trình giải trí, gameshow, phim truyện,… đã được phát sóng để khán giả trong và ngoài nước có thể xem lại tại địa chỉ https://www.youtube.com/user/VinhLongTV Kênh youtube của Đài nhận được

sự ủng hộ nhiệt tình của khán giả với hơn 975,163 lượt đăng ký theo dõi (Subscribe) Tuy nhiên, việc tải lên internet các tập tin video không được bảo vệ một cách có hiệu quả, khiến cho việc “đánh cắp” rất dễ dàng Rất nhiều trang web đã lấy tín hiệu từ

Trang 13

kênh tivi trực tuyến của đài để phát lại, thu hút người xem Một số tập tin trên kênh youtube của đài đã bị sao chép, và phát tán lại công khai trên internet

Tương tự như với kênh youtube, các video của Đài PTTH Vĩnh Long rất có khả năng bị đánh cắp và phát tán bằng những hình thức khác Vậy khi có tranh chấp bản quyền tập tin video, thì đâu sẽ là bằng chứng để giải quyết tranh chấp? Do đó, vấn đề đặt ra là, cần có một giải pháp bảo vệ hiệu quả bản quyền các tập tin video, trong trường hợp cụ thể là các tập tin video của đài THVL Giải pháp cần phải thêm được thông tin bản quyền vào tập tin video dưới dạng ẩn, và khi cần thiết, có thể trích xuất lại nội dung ẩn trong video đã được bảo vệ Bên cạnh đó, cần có một công cụ quản lý các tập tin video một cách tập trung, công cụ này dùng để xác thực những người dùng nào được quyền truy xuất vào tập tin video được lưu trữ, nhằm hạn chế tối đa khả năng đánh cắp video Đây là nội dung chính được đề cập đến của quyển luận văn này Watermarking là một cách để bảo vệ quyền sở hữu các hình ảnh hoặc video số thông qua các thông tin được nhúng vào bên trong chúng Có thể chia watermarking thành 2 loại: watermarking có thể nhìn thấy được (visible watermarking, non-blind watermarking) và watermarking ẩn (invisible watermarking, blind watermarking) Watermarking miền biến đổi sử dụng các phép biến đổi như DCT (Discrete Cosine Transform), DFT (Discrete Fourier Transform), DWT (Discrete Wavelet Transform) lên ảnh hoặc video số, bằng cách thay đổi các hệ số của các phép biến đổi, thông tin có thể được nhúng vào đối tượng sau biến đổi

Nén video là vấn đề tất yếu của các hệ thống truyền dẫn Xu thế của các hệ thống

sử dụng multimedia là phải làm sao đạt được tỷ số nén video cao mà vẫn đảm bảo chất lượng của hình ảnh sau khi khôi phục MPEG là chuẩn nén ảnh động có tốc độ bit thấp nhưng vẫn đảm bảo chất lượng yêu cầu Chuẩn nén MPEG dành cho video hiện rất phổ biến và trở nên thông dụng trong nhiều lĩnh vực sử dụng multimedia, đặc biệt là phát thanh truyền hình Hiện tại, MPEG-4 (AVC/ H.264) được sử dụng để nén tín hiệu các kênh truyền hình độ nét cao HD (High Definition) Xa hơn nữa là chuẩn nén HEVC/ H.265 đang được nghiên cứu và phát triển có thể giúp cải thiện 50% tốc độ bit

so với chuẩn H.264 với cùng chất lượng Phương thức nén MPEG nói chung và chuẩn H.264, H.265 nói riêng, thực hiện dựa trên biến đổi DWT để nén video

Ngoài việc bảo vệ bằng watermarking, chúng ta cần có một công cụ quản lý tập tin video một cách tập trung và có phân quyền truy cập để kiểm soát tất cả các tập tin video Công cụ quản lý tập tin được thiết kế theo mô hình client – server Các máy client được cung cấp một phần mềm giao tiếp với server Phần mềm client cung cấp cho người dùng các chức năng để thực hiện việc ingest tập tin video, tìm kiếm, trích xuất tập tin video cần thiết sau khi người dùng đăng nhập với quyền tương ứng Phần mềm chạy trên máy server sẽ thực hiện việc kiểm tra đăng nhập của người dùng,

Trang 14

quyền truy xuất để đưa ra các chức năng tương ứng Phần mềm chạy phía server kiêm luôn chức năng thêm watermarking vào tập tin video Như vậy, với các video được trích xuất từ hệ thống, sẽ được kiểm soát bằng quyền truy cập của người dùng, và watermarking ẩn khi có tranh chấp bản quyền

Đứng trước yêu cầu quản lý và bảo vệ bản quyền dữ liệu video của Đài THVL, đồng thời thấy được tầm quan trọng và hướng phát triển của các biến đổi đối với kỹ

thuật nén video, luận văn này tập trung vào nghiên cứu và xây dựng “Ứng dụng watermarking trong xây dựng hệ thống quản lý và bảo vệ bản quyền dữ liệu

video tại Đài Truyền hình Vĩnh Long”

2 MỤC ĐÍCH VÀ Ý NGHĨA ĐỀ TÀI

2.1 Mục đích

Hiện tại, việc bảo vệ bản quyền video, hình ảnh, âm thanh của Đài THVL còn đơn giản, chưa có một biện pháp hữu hiệu để xác thực bản quyền Việc chia sẻ hình ảnh, video, audio của người dùng trên mạng internet hiện nay hết sức đơn giản và phổ biến Từ đó, đặt ra yêu cầu về thông tin bản quyền tác giả của các hình ảnh, video, hay audio này Việc bảo vệ sẽ được nâng lên một mức khi các tập tin video được quản lý tập trung, kiểm soát được người dùng nào được quyền truy xuất dữ liệu Luận văn sẽ đưa ra mô hình và chạy mô phỏng quá trình nhúng thông tin bản quyền vào đoạn video được nén theo chuẩn MPEG, cùng với công cụ quản lý tập trung tập tin video theo mô hình clients – server Áp dụng mô hình đó để ghi thông tin chủ sở hữu, và quản lý người dùng, giúp bảo vệ bản quyền video của Đài THVL

2.2 Ý nghĩa khoa học

Luận văn giúp hiểu rõ hơn về chuẩn nén video MPEG, phép biến đổi DWT cũng như phương thức sử dụng các hệ số DWT vào kỹ thuật nhúng thông tin bản quyền vào video Từ đó, làm nền tảng áp dụng cho chuẩn nén video mới HECV/ H.265 đang được phát triển

Phương thức quản lý tập tin video tập trung và các vấn đề phát sinh như cân bằng tải trong hệ thống mạng nội bộ, quá trình lập lịch chuyển đổi định dạng các tập tin video để đảm bảo độ ổn định và tối ưu hóa sức mạnh của server

Quản lý tập tin video đòi hỏi thêm yêu cầu bảo mật thông tin từ việc xác định người dùng hợp lệ, quá trình truyền tải tập tin trong mạng phải được tính toàn vẹn của tập tin video, cũng như việc sao lưu và phục hồi hệ thống khi cần thiết

2.3 Ý nghĩa thực tiễn

Kết quả mong muốn đạt được là một chương trình chạy theo mô hình clients - server dùng để nhúng thông tin xác định bản quyền vào đoạn video sử dụng biến đổi

Trang 15

DWT, quản lý tập tin video, tìm kiếm, trả về kết quả, Chương trình quản lý phải có phân quyền người dùng một cách rõ ràng, tương ứng với mỗi người dùng sẽ có những thao tác nhất định với tập tin video như chỉ được ingest, được tìm kiếm, được trích xuất tập tin video,…Bên cạnh đó, có một chương trình để trích xuất thông tin bản quyền ra khỏi đoạn video và đối chiếu thông tin được nhúng ban đầu Đây là giải pháp hữu ích giúp bảo vệ bản quyền video của Đài PTTH Vĩnh Long khi có cách tranh chấp bản quyền xảy ra

3 MỤC TIÊU VÀ NHIỆM VỤ

3.1 Mục tiêu

- Nghiên cứu phương pháp nhúng dữ liệu vào tập tin video thông qua biến đổi DWT, DCT đồng thời trích xuất được dữ liệu đã nhúng vào khi cần thiết

- Hiểu rõ cách thức nén tập tin video theo chuẩn mpeg

- Mô hình clients – server, quản lý dữ liệu có dung lượng lớn là các tập tin video

- Phân quyền người dùng, xác thực thông tin người dùng truy cập vào hệ thống

- Lưu trữ tối ưu tập tin video, tạo bản sao tập tin video chất lượng thấp để dùng làm preview khi người dùng tìm kiếm

- Bảo mật hệ thống khi xác nhận thông tin người dùng đăng nhập

- Bảo đảm tính toàn vẹn của tập tin video khi truyền tải trong mạng

3.2 Nhiệm vụ

Để đạt được những mục tiêu trên thị nhiệm vụ đặt ra của đề tài là:

- Nghiên cứu về phép biến đổi DWT, và các phép biến đổi DCT, DFT để thấy được phép biến đổi tối ưu hơn

- Nghiên cứu cấu trúc tập tin video, cụ thể là tập tin mpeg 2

- Xây dựng giải thuật và cài đặt mã nguồn để thực hiện nhúng thông tin vào tập

tin video

- Thiết kế cơ sở dữ liệu tối ưu cho việc phân quyền của người dùng

- Xây dựng giải thuật và cài đặt mã nguồn phần mềm clients – phần mềm server

- Phân quyền người dùng, nhóm người dùng trong hệ thống

- Tối ưu hóa tốc độ truyền tải tập tin qua mạng do đặc điểm tập tin video là tập

tin có dung lượng lớn

- Tối ưu hóa dữ liệu metadata để phục vụ cho việc tìm kiếm tập tin video sau này

- Đánh giá kết quả theo yêu cầu của đề tài

4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU

Trong khuôn khổ của luận văn thuộc loại ứng dụng, tôi chỉ giới hạn nghiên cứu các vấn đề sau:

Trang 16

- Phép biến đổi trên miền DWT, DCT

- Cấu trúc tập tin mpeg 2

- Công cụ mô phỏng nhúng thông tin và trích xuất thông tin với tập tin video

Luận văn sẽ tập trung nghiên cứu biến đổi DWT, DCT trong xử lý ảnh và đưa ra phương pháp để đưa những thông tin bản quyền vào trong một đoạn video Mô hình sử dụng cho luận văn cũng dựa vào mô hình chung của kỹ thuật watermarking Chương trình sẽ gồm 2 thành phần: Nhúng watermarking và phát hiện, trích xuất watermarking

Như vậy, luận văn sẽ tập trung vào giải quyết vấn đề watermarking mà cụ thể là các thông số của biến đổi DWT, DCT sao cho phù hợp với MPEG video nhằm đạt được hiệu quả tốt

Mô hình clients – server quản lý dữ liệu tập trung, phân quyền người dùng Chương trình quản lý tập tin video thực hiện việc chuyển đổi video về một chuẩn thống nhất được chọn lựa trước Tập tin video nguồn từ nhiều định dạng khác nhau sẽ được chuyển đổi sang định dạng “chuẩn”, đồng thời các dữ liệu metadata sẽ được trong cơ sở dữ liệu để thực hiện việc tìm kiếm sau này Dữ liệu metadata do người dùng cung cấp thông qua giao diện làm việc phía clients bao gồm: thể loại, tên tác phẩm, diễn viên, thời lượng, tác giả, quay phim, đạo diễn, … Phía server sẽ thực hiện việc chuyển mã các định dạng video từ các nguồn khác nhau về dạng nhất định (trường hợp này là chuẩn mpeg 2), thêm watermarking, thực hiện các truy vấn của người dùng, trả về kết quả, trả về tập tin video cho người dùng khi được yêu cầu

5 BỐ CỤC LUẬN VĂN

Chương 1 Cơ sở lý thuyết Chương này trình bày các cơ sở lý thuyết của các

phép biến đổi trên miền tần số, cũng như cấu trúc của tập tin video theo định dạng MPEG, đây là cơ sở để thực hiện việc watermarking bảo vệ bản quyền video cho đài THVL

Chương 2 Xây dựng ứng dụng quản lý và bảo vệ bản quyền video cho đài THVL Chương này trình bày các mô hình về bảo vệ bản quyền video, từ đó rút ra

một mô hình thích hợp để xây dựng ứng dụng cho đài THVL Lựa chọn cách thức watermarking để bảo vệ bản quyền video

Chương 3 Cài đặt và thử nghiệm Chương này trình bày quá trình cài đặt và

thử nghiệm hệ thống; một số kết quả thực nghiệm và đánh giá

Phần kết luận.

Trang 17

CHƯƠNG 1

CƠ SỞ LÝ THUYẾT

Để xây dựng ứng dụng bảo vệ bản quyền video cho Đài THVL, một số nội dung

lý thuyết cần được nghiên cứu, làm cơ sở cho việc cài đặt vào ứng dụng Nội dung chương này tập trung vào giới thiệu về cấu trúc tập tin chuẩn mpeg, các phép biến đổi trong miền không gian DWT, DCT, DFT, và các giải thuật watermaking được áp dụng

1.1 TỔNG QUAN VỀ TẬP TIN VIDEO

Trước khi máy tính trở nên phổ biến, phim ảnh được lưu trữ trên băng từ, chính

vì vậy rất hạn chế trong các thao tác chỉnh sửa, biên tập, hay sao chép Sau khi máy tính trở nên phổ biến, việc chuyển đổi cách thức lưu trữ được thực hiện nhằm mục đích tiết kiệm thời gian và chi phí Để chuyển đổi cách lưu trữ tuần tự sang dạng số cần thiết phải có các định dạng chuẩn để lưu trữ hiệu quả, từ đó, nhiều định dạng tập tin video lần lượt ra đời như mpeg, avi, wmv, mkv, …Đáng kể nhất phải kể đến chuẩn nén mpeg do nhóm chuyên hình ảnh được thành lập từ tháng 2 năm 1988 Motion Pictures Expert Group giới thiệu Các định dạng được giới thiệu bao gồm MPEG-1, MPEG-2, MPEG-3, và MPEG-4 (hay H.264)

1.1.1 Cấu trúc tập tin video chuẩn mpeg

• Lớp cắt lát dòng bít (slice): Mảng bao gồm một và cấu trúc khối kề nhau Kích thước lớn nhất của mảng có thể bao gồm toàn bộ bức ảnh và kích thước nhỏ nhất của mảng là một cấu trúc khối Thông tin đầu tiên chứa đựng vị trí của mảng trong toàn bộ ảnh, và hệ số cân bằng lượng tử…

• Lớp ảnh (picture): cho phép bộ giải mã xác định loại ảnh được mã hóa Thông tin đầu dùng để chỉ thứ tự truyền khung (để bộ mã hóa có thể sắp xếp các ảnh lại theo thứ tự đúng) và các thông tin về đồng bộ, độ phân giải và phạm vi vector chuyển động Trong nén MPEG người ta sử dụng 3 loại ảnh sau:

Trang 18

o Ảnh I (Intra Pictures): được mã hóa độc lập mà không cần tham khảo các ảnh khác Hiệu quả nén tín hiệu đạt được do loại bỏ được dư thừa về không gian

mà không có yếu tố thời gian tham gia vào quá trình Ảnh I được dùng một cách tuần hoàn để tạo thành điểm tựa cho dòng dữ liệu trong quá trình giải mã

o Ảnh P (Predicted Pictures): được mã hoá từ ảnh I hoặc ảnh P ngay trước

để bù chuyển động và chính nó cũng có thể dùng để tham khảo cho việc tiên đoán ảnh tiếp theo Mỗi khối ảnh trong ảnh P có thể được mã hóa theo kiểu tiên đoán hoặc mã hóa một cách độc lập Do sử dụng cả nén không gian và thời gian nên hiệu quả nén của ảnh P cao hơn đáng kể so với ảnh I

o Ảnh B (Bidirectionally Predictive Pictures) có thể sử dụng các ảnh I và P phía trước và phía sau nó để bù chuyển động vì vậy cho tỷ lệ nén cao nhất Mỗi khối trong ảnh B có thể tiên đoán theo chiều ngược, xuôi, cả hai hướng hoặc được mã hóa độc lập Tuy nhiên để tiên đoán ngược từ một bức ảnh phía sau nó thì bộ mã hóa phải sắp xếp lại các bức ảnh Do vậy sẽ tạo ra độ trễ do phải sắp xếp lại thông tin, độ trễ lớn hay nhỏ phụ thuộc vào số bức ảnh B liên tiếp nhau được truyền

• Lớp nhóm ảnh (GOP): các ảnh I, P, B thường xuất hiện theo một thứ tự lặp đi lặp lại một cách tuần hoàn Vì vậy xuất hiện nhóm ảnh GOP Chất lượng ảnh không chỉ phụ thuộc vào tỷ lệ nén trong từng khuôn hình mà còn phụ thuộc vào độ dài của nhóm ảnh GOP Chúng là đơn vị mang thông tin độc lập của MPEG và bắt buộc phải bắt đầu bằng một ảnh I Tiếp sau đó là một loạt các ảnh P và B Cấu trúc của một GOP được mô tả bởi 2 tham số: N (số ảnh trong GOP) và M (khoảng cách giữa các ảnh P)

• Lớp dãy ảnh (sequence): đoạn video bao gồm thông tin đầu, một số nhóm ảnh

và thông tin kết đoạn

- Mỗi lớp này hỗ trợ một chức năng nhất định: một là chức năng xử lý tín hiệu (DCT và bù chuyển động) Hai là chức năng logic (tái đồng bộ, điểm truy xuất ngẫu nhiên)

Trang 19

Hình 1.1 Cấu trúc tập tin Mpeg

1.1.2 Phép biến đổi DCT (Discrete Cosine Transform)

Biến đổi Cosin rời rạc viết tắt là DCT (Discrete Cosine Transform) do Ahmed và các đồng nghiệp của ông đưa ra vào năm 1974 Từ đó cho đến nay, nó được sử dụng rất phổ biến trong nhiều kỹ thuật xử lí ảnh số Trong các kỹ thuật watermark ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT được sử dụng nhiều nhất

Trong lĩnh vực xử lý ảnh số ta sử dụng biến đổi DCT 2 chiều có dạng như sau:

i

Trang 20

- Đặc điểm của phép biến đổi DCT trên ảnh hai chiều

Biến đổi DCT trên ảnh thể hiện đặc tính nội dung về tần số của thông tin ảnh Hệ

số góc trên là lớn và đặc trưng cho giá trị trung bình thành phần một chiều gọi là hệ số

DC, còn các hệ số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần số cao theo hướng ngang và theo hướng thẳng đứng gọi là các hệ số AC

Hình 1.2 Ảnh gốc và năng lượng phân bố của ảnh qua phép biến đổi DCT

Bản thân biến đổi DCT không nén được dữ liệu

Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo đường chéo, thì tương ứng theo các hướng đó, các hệ số biến đổi DCT cũng lớn

Tóm lại, DCT làm giảm độ tương quan không gian của thông tin trong khối ảnh Điều đó cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn

Khối hệ số DCT có thể chia thành 3 miền, miền tần số thấp chứa các thông tin quan trọng ảnh hưởng đến tri giác, miền tần số giữa, và miền tần số cao Các thông tin trong miền tần số cao thường mang tính trị giác thấp

Trang 21

(a)

(b)

(c)

Hình 1.3 Phân chia 3 miền tần số ảnh của phép biến đổi DCT

(a) Miền tần số thấp, (b) Miền tần số ở giữa, (c) Miền tần số cao

Trong các thuật toán watermark, miền hệ số DCT tần số cao thường không được

sử dụng do nó thường không bền vững với các phép xử lí ảnh, hoặc nén ảnh JPEG Miền tần số thấp cũng ít được sử dụng do một sự thay đổi dù nhỏ trong miền này cũng làm giảm chất lượng tri giác của ảnh Vì vậy, miền tần số ở giữa thường hay được sử dụng nhất và cũng cho kết quả tốt nhất

1.1.3 Phép biến đổi DWT (Discrete Wavelet Transform)

Đây là phép biến đổi mới nhất áp dụng cho ảnh số Ý tưởng của DWT cho tín hiệu một chiều như sau: Tín hiệu được chia thành hai phần, phần tần số cao và phần tần số thấp Đối với nhiều tín hiệu, phần nội dung có tần số thấp chứa những thông tin quan trọng nhất - những đặc tính nhận dạng Trái lại, phần nội dung có tần số cao chỉ mang sắc thái của tín hiệu Bởi vậy, trong biến đổi sóng nhỏ, người ta thường nói về các phần gần đúng (approximations) và các phần tiểu tiết (details) của tín hiệu Phần gần đúng là những thành phần có tỷ lệ cao (highscale) nhưng có tần số thấp của tín hiệu Phần tiểu tiết là những thành phần có tỷ lệ thấp nhưng có tần số cao của tín hiệu

Để tách một tín hiệu thành hai phần như trên, người ta dùng hai bộ lọc bù nhau

Bộ lọc thứ nhất gọi là low-pass filter chỉ cho phép các thành phần có tần số thấp đi qua Bộ lọc thứ hai gọi là high-pass filter chỉ cho phép các thành phần có tần số cao đi qua

Quá trình lọc ở mức cơ bản nhất có dạng như sau

Trang 22

Hình 1.4 Lọc theo tần số thấp và tần số cao

Tín hiệu gốc S qua hai phép lọc được phân tích thành hai tín hiệu, A và D Có một điều cần lưu ý là, nếu chúng ta thực hiện quá trình này trên một tín hiệu số thực sự thì sẽ thu được một số lượng dữ liệu gấp đôi số lượng ban đầu Ví dụ, giả sử tín hiệu gốc S gồm 1000 mẫu dữ liệu thì mỗi tín hiệu được lọc ra cũng sẽ gồm 1000 mẫu Tổng cộng sẽ có 2000 mẫu Nhưng để đảm bảo có thể tổng hợp lại tín hiệu ban đầu, chúng ta thực sự chỉ cần sử dụng một nửa số tín hiệu được lọc Do đó, nên có một qui trình giảm bớt một nửa số mẫu của A và D Qui trình này được gọi là downsampling Sau khi giảm đi một nửa, chúng ta sẽ có hai tín hiệu tương ứng là cA và cD Các dữ liệu của cA và cD được gọi là các hệ số sóng nhỏ

Toàn bộ hai quá trình trên đây, lọc và cắt giảm mẫu được gọi là phân tích các tín hiệu hoặc biến đổi sóng nhỏ rời rạc (DWT) Đó là quá trình xuôi, còn ngược lại phải làm như thế nào để có thể lắp ghép các tín hiệu thu được thành tín hiệu gốc mà không

bị mất thông tin Quá trình này được gọi là tổng hợp các tín hiệu hoặc biến đổi sóng nhỏ rời rạc ngược (IDWT)

Để tổng hợp tín hiệu, người ta sẽ tăng số mẫu lên gấp đôi, được gọi là upsampling và sau đó lọc ngược trở lại Các bộ lọc phân tích (L và H) và các bộ lọc tổng hợp (L” và H”) cần phải được chọn lựa để thoả mãn một số điều kiện đảm bảo cho quá trình phân tích và tổng hợp là đồng nhất Các bộ lọc này được gọi là đối xứng gương trực giao (quadrature mirror filters) Quá trình phân tích và tổng hợp một tín hiệu có thể được mô tả như sau:

Trang 23

Hình 1.5 Quá trình phân tích và tổng hợp tín hiệu

Trên đây chúng ta mới nói đến quá trình phân tích các tín hiệu thành hai tín hiệu xấp xỉ và chi tiết Quá trình này được gọi là phân tích một mức Có thể lặp lại quá trình này bằng cách tiếp tục phân tích tín hiệu xấp xỉ thành hai tín hiệu ở giải tần thấp hơn

Từ đây xuất hiện một khái niệm được gọi là phân tích nhiều mức

Về mặt lý thuyết, quá trình này có thể lặp lại vô hạn Tuy nhiên, trong thực tế, việc phân tích chỉ có thể tiếp diễn cho đến khi phần chi tiết chỉ còn một mẫu hay một điểm Việc lựa chọn số mức phân tích hoàn toàn phụ thuộc vào bản chất của tín hiệu Tương tự như các tín hiệu một chiều, các tín hiệu hai chiều (tức là các bức ảnh) cũng có thể được phân tích tương tự bằng DWT nhưng theo cả hai chiều dọc và ngang Một bộ lọc tần số thấp và một bộ lọc tần số cao sẽ được sử dụng kết hợp để lọc các tín hiệu Đầu tiên, ảnh gốc sẽ được lọc thấp theo chiều dọc Sau đó, nếu lọc lại bằng chính

bộ lọc này theo chiều ngang ta sẽ có băng LL và nếu lọc lại bằng bộ lọc cao ta sẽ có băng LH Tiếp theo, ảnh gốc sẽ được lọc cao theo chiều dọc và sau đó sẽ được lọc lại theo chiều ngang bằng lọc thấp để có băng HL và bằng lọc cao để có băng HH

Quá trình trên lại có thể tiếp tục đối với băng LL để tạo ra phép biến đổi DWT hai mức như minh hoạ trong hình dưới đây:

Hình 1.6 Biến đổi dwt hai mức

Trang 24

Về mặt toán học, ta có thể tạo lại ảnh ban đầu bằng quá trình DWT ngược hay IDWT

Ta có thể mô tả bằng toán học DWT và IDWT như sau:

𝑓𝑗ℎ𝑖𝑔ℎ 0 (𝑘) là phần chi tiết của F(n) tại các dãi tần khác nhau

Tín hiệu ban đầu F(n) có thể được xây dựng lại từ các hệ số DWT bằng cách đệ quy như sau:

Trang 25

Biến đổi DWT và IDWT cho mảng hai chiều MxN có thể được định nghĩa tương

tự bằng cách thực hiện các biến đổi một chiều DWT và IDWT cho mỗi chiều tương ứng Biến đổi sóng có rất nhiều lợi thế so với các biến đổi khác, đó chính là:

- Biến đổi sóng lăn là một mô tả đa độ phân giải của ảnh Quá trình giải mã có thể được xử lý tuần tự từ độ phân giải thấp cho đến độ phân giải cao

- Biến đổi DWT gần gũi với hệ thống thị giác người hơn biến đổi DCT vì vậy, có thể nén với tỉ lệ cao bằng DWT mà sự biến đổi ảnh khó nhận thấy hơn nếu dùng DCT với tỉ lệ tương tự

Biến đổi sóng tạo ra một cấu trúc được gọi là biểu diễn tỉ lệ không gian space representation) Trong biểu diễn này, các tín hiệu tần số cao được xác định chính xác trong miền điểm ảnh (pixel), còn các tín hiệu tần số thấp được xác định chính xác trong miền tần số

(scale-1.1.4 Phép biến đổi DFT (Discrete Fourier Transform)

Phép biến đổi Fourier rời rạc viết tắt là DFT (Discrete Fourier Transform) là một công cụ toán học được dùng để chuyển cách biểu diễn tín hiệu và hệ thống rời rạc hoặc liên tục sang miền tần số rời rạc Thực chất của cách biểu diễn này là lấy từng điểm rời rạc trên vòng tròn đơn vị trong mặt phẳng Z để biểu diễn Việc biểu diễn trong miền tần số rời rạc đặc biệt hiệu quả khi xuất hiện các thuật toán tính toán nhanh DFT ta gọi

là phép biến đổi Fourier nhanh FFT (Fast Fourier Transform)

Biểu diễn dưới dạng toán học bằng công thức sau

Trang 26

1.2 MÔ HÌNH NHÚNG THÔNG TIN BẢN QUYỀN VÀO VIDEO

1.2.1 Giới thiệu chung về watermarking

Watermarking số được coi là ra đời từ năm 1954 với bằng sáng chế của Emile Hembrooke Tuy nhiên, nghiên cứu watermarking vẫn chưa được đặt ra như một lĩnh vực nghiên cứu độc lập cho tới những năm 1980 và khái niệm watermarking chỉ được hoàn thiện vào giữa những năm 90 của thế kỷ 20

Agrawal và Kiernan [17] đưa ra những đề xuất đầu tiên về kỹ thuật watermarking trên cơ sở dữ liệu quan hệ bởi nhu cầu cấp thiết của người chủ dữ liệu muốn bảo vệ sản phẩm của mình trước những tấn công bên ngoài Các tác giả đã đề xuất một lược

đồ watermarking trong đó dữ liệu có thể chấp nhận những thay đổi nhỏ mà không ảnh hưởng đến giá trị sử dụng của chúng

Mục đích của watermarking: Các lược đồ watermarking khác nhau được thiết kế

để phục vụ cho các mục đích khác nhau, cụ thể là: bảo vệ bản quyền, đảm bảo sự toàn vẹn hay phát hiện giả mạo, khoanh vùng, chứng minh quyền sở hữu, Đối với các lược đồ watermarking bền vững thường dùng để bảo vệ bản quyền các tập tin đa phương tiện như ảnh số, video, audio

Trang 27

Hình 1.7 Phân loại watermarking

1.2.2 Các tiêu chí cần có của một thuật toán watermarking mạnh mẽ

Tùy thuộc vào từng ứng dụng, kỹ thuật watermarking có những đòi hỏi khác

nhau Tuy nhiên có một số yêu cầu chung mà mà hầu hết các ứng dụng thực tế phải đạt

được

1.2.2.1 Tính bảo mật

Giống như trong lĩnh vực mã hóa, tính hiệu quả của một thuật toán không thể dựa

vào giả định là các kẻ tấn công không biết cách mà watermark được nhúng vào tài liệu

đa phương tiện Tuy nhiên, giả định đó lại được dùng để đánh giá độ an toàn của các

sản phẩm thương mại sử dụng watermarking có giá trị trên thị trường Vì vậy với một

ứng dụng watermarking, một khi biết được cách làm việc của bộ nhúng và bộ dò, việc

Nhận biết Không nhận biết

Bền vững

Công cộng

Cá nhân

Gần như không khả đảo

Trang 28

làm cho watermark không đọc được thường rất dễ dàng Hơn nữa một số kỹ thuật sử dụng dữ liệu gốc trong quy trình dò và thường thì các giải pháp loại này không khả thi trong thực tế

1.2.2.2 Tính vô hình

Những nhà nghiên cứu gần đây đã cố nhúng những watermark bằng cách sao cho

nó không thể được nhận ra Tuy nhiên yêu cầu này mâu thuẫn với các yêu cầu khác chẳng hạn sức chịu đựng và độ an toàn chống sự bền vững chống được giả mạo đặc biệt là các thuật toán nén có mất thông tin

1.2.2.3 Tính vô hình đối với thống kê

Watermark không thể dò được bằng phương pháp thống kê bởi một người không được phép Ví dụ nhiều tác phẩm kỹ thuật số đã được nhúng cùng một watermark sao cho khi thực hiện tấn công dựa trên thống kê thì không tài nào trích được watermark Một giải pháp khả thi là sử dụng watermark phụ thuộc nội dung [18]

1.2.2.4 Tỉ lệ bit

Tùy thuộc vào ứng dụng, thuật toán watermark có thể cho phép một số lượng bit cần ẩn được định nghĩa trước Không tồn tại các quy tắc chung, tuy nhiên đối với ảnh thì tối thiểu 300 - 400 bit

Trong bất kỳ trường hợp nào thì nhà thiết kế hệ thống phải nhớ rằng tốt nhất là không nên giới hạn số lượng bit được nhúng vào dữ liệu

1.2.2.5 Quá trình dò đáng tin cậy

Thậm chí khi không có các tấn công cũng như các biến dạng tín hiệu, khả năng không dò được watermark đã nhúng hoặc dò sai watermark phải rất nhỏ Thông thường các thuật toán dựa trên thống kê dễ dàng thỏa được các yêu này Tuy nhiên một khả năng như vậy phải được đưa lên hàng đầu nếu ứng dụng watermark liên quan đến tính pháp lý, vì có như vậy mới tạo sự tin cậy chắc chắn trong các phán quyết cuối cùng

1.2.2.6 Tính mạnh mẽ

Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dưới dạng kỹ thuật số thông thường có liên quan tới nhiều kiểu biến dạng, chẳng hạn như nén có mất thông tin, hay trong trường hợp ảnh là các phép lọc, định lại kích thước, cải tiến độ tương phản, phép quay, … Để watermarking hữu ích, watermark phải dò được ngay khi cả các biến dạng xảy ra [10] [14]

Trang 29

1.2.2.7 Nhúng nhiều watermark

Cần phải cho phép nhúng một tập hợp các watermark khác nhau trong cùng ảnh bằng cách sao cho mỗi watermark có thể dò được bởi người dùng được cấp quyền Đặc trưng này thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc tính tác quyền được truyền từ người sở hữu tác phẩm đến các tác phẩm khác Hơn nữa chúng

ta có thể ngăn người khác thực hiện watermarking cho một tác phẩm đã được đóng dấu

1.2.2.8 Blind/non-blind, public/private watermarking

Mối quan tâm đặc biệt là cơ chế sử dụng để khôi phục vết ấn từ ảnh Trong một

số trường hợp để phát triển một thuật toán mạnh mẽ, watermark được trích bằng cách

so sánh các phiên bản đã được đóng dấu và chưa đóng dấu Nhiều phương pháp được

đề xuất chịu đựng được nhiều kỹ thuật xử lý ảnh và các tấn công có thể nhằm vào việc

gỡ watermark hay làm cho nó không thể đọc được [10] [11] [12] [13] Tuy nhiên

thông thường trong thế giới thực, sự có mặt của ảnh gốc trong quá trình dò không được bảo đảm, do vậy thuật toán cần ảnh gốc để hồi phục vết ấn không thích hợp cho nhiều ứng dụng thực tế Ngoài ra loại thuật toán này không thể được dùng cho

việc chứng minh quyền sở hữu hoàn toàn trừ khi thỏa một số yêu cầu phụ khác như không tựa khả đảo (non-quasi-invertibility) của watermark, vốn rất khó đạt được và hầu như không thể chứng minh Các kỹ thuật khôi phục watermark không cần so sánh các tín hiệu được mark và không được mark thường gọi là oblivious hay blind Trong các trường hợp khác thuật ngữ public watermarking được dùng để đối lại với private watermarking

Thực sự, thuật ngữ public/private watermarking để chỉ một khái niệm khác: một

kỹ thuật được gọi là private nếu chỉ có người sở hữu tài liệu hay người được cấp quyền mới trích watermark bởi vì anh ta mới là người có thể truy xuất vào ảnh gốc hoặc anh

ta mới là người biết khoá chính xác đúng để trích watermark từ dữ liệu chủ Trái lại các kỹ thuật mà cho phép bất kỳ người nào cũng đọc được watermark được gọi là public Hầu hết mọi người cho rằng các cơ chế private dường như mạnh mẽ hơn public

ở chỗ là mỗi khi watermark được đọc, kỹ thuật public làm cho các kẻ tấn công dễ xóa watermark hay làm cho watermark không đọc được chẳng hạn bằng cách đảo quy trình nhúng hay bằng cách nhúng một watermark đảo (watermark reversibility) Nói một cách tổng quát trong số các kỹ thuật watermarking ảnh được đề xuất gần đây, các sản phẩm thương mại thường áp dụng các hệ thống public trong khi các nghiên cứu lại tập trung vào tiếp cận private

Trang 30

1.2.2.9 Watermarking đọc được và dò được

Một watermark mà có thể dò được chỉ nếu nội dung của nó được biết trước gọi là một watermark dò được Ngược lại các kỹ thuật cho phép watermark đọc được ngay khi nội dung của nó bỏ qua thì gọi là watermark đọc được Nói cách khác, theo hướng tiếp cận dò được, người ta có thể chỉ cần biết một watermark có tồn tại trong dữ liệu hay không

1.2.2.10 Tính khả đảo và tính thuận nghịch của watermark

Mặc dù tính mạnh mẽ thường được chỉ ra như một yêu cầu chính được thỏa mãn, mối quan tâm lớn lại tập trung vào tính khả đảo của watermark Thuật ngữ khả đảo được dùng với những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa một watermark là khả đảo nếu các người dùng được cấp quyền có thể xoá nó khỏi tài liệu

1.2.2.11 Tính có thể thay đổi tỉ lệ (scalability)

Chi phí nhúng có thể ít quan trọng hơn là chi phí dò, vốn thường phải xảy ra theo thời gian thực, ví dụ như tốc độ giải mã của các frame video Các yêu cầu tính toán ràng buột một watermark phải đơn giản, nhưng sự đơn giản này có thể giảm trầm trọng tính chịu đựng giả mạo [14]

1.2.3 Mô hình watermarking trên video

Hình 1.8 Mô hình tổng quát watermark cho tập tin video

Trang 31

Tập tin video, theo cách hiểu đơn giản là tập hợp các frames hình lần lượt nhau

Do đó, bài toán watermarking trên tập tin video có thể đưa về bài toán watermarking trên một bức ảnh Quá trình được lặp lại cho tất cả các frames hình còn lại trong video

Có nhiều phương pháp để watermarking một video như sử dụng biến đổi DCT, DFT, DWT hoặc các phương pháp khác như LSB, PCA

1.2.4 Kỹ thuật watermarking trên video sử dụng biến đổi DWT

Các kỹ thuật watermark sau được áp dụng trên ảnh tĩnh Việc áp dụng trên video được thực hiện tương tự như bằng áp dụng giải thuật watermark trên toàn bộ frames hình của video

1.2.4.1 Kỹ thuật watermarking của Mehul R và Priti R

Trong kỹ thuật watermark của Mehul R và Priti R., các tác giả đã sử dụng phép biến đổi sóng nhỏ hai chiều để phân tích ảnh gốc thành bốn băng LL, HL, LH và HH rồi nhúng tín hiệu watermark thứ nhất vào băng LL, nhúng một watermark khác vào băng HH Kết quả thử nghiệm cho thấy watermark bền vững trước một số phép xử lý ảnh thông thường [8]

a Sử dụng phép biến đổi sóng nhỏ hai chiều mức hai đối với I

b Nhúng watermark J vào băng LL2, nhúng watermark K vào băng HH2 bởi công thức: V’i,j = Vi,j + ∝Wi,j Với Vi,j là hệ số tương ứng trong LL2 và H2; ∝ là hệ số tương quan giữa tính ẩn và tính bền vững của watermark

c Sử dụng phép biến đổi ngược IDWT để tổng hợp lại được ảnh chứa watermark

Quá trình tách watermark

Đầu vào: - Ảnh gốc I và ảnh chứa watermark I’

- Hệ số tương quan ∝ đã sử dụng khi nhúng watermark

Đầu ra: - Ảnh watermark

Thực hiện:

Trang 32

a Sử dụng phép biến đổi sóng nhỏ hai chiều mức hai đối với ảnh gốc I và ảnh chứa watermark I’

b Từ kết quả phân tích trên, tính giá trị lệch giữa các điểm tương ứng thuộc các băng LL2, HH2 của ảnh chứa watermark và ảnh gốc rồi chia cho ∝ để được bit tương ứng thuộc ảnh watermark:

W’i,j = (V’i,j – Vi,j)/∝

- Đánh giá kết quả

Qua thử nghiệm, kỹ thuật watermark của Mehul R và Priti R cho kết quả watermark bền vững trước một nhóm các biến đổi thông thường đối với ảnh chứa watermark Watermark nhúng ở băng LL bền vững trước một nhóm các phép biến đổi, trong khi watermark nhúng ở băng HH lại bền vững trước một nhóm các biến đổi khác Điều đó thể hiện, watermark được nhúng ở các băng khác nhau thể hiện tính bền vững khác nhau trước các tấn công vào hệ watermark Như vậy, có thể sử dụng watermark nhúng vào tất cả các băng trong phép phân tích sóng nhỏ để có thể tìm được sự bền vững ở ít nhất một trong các băng trước các tấn công hoặc có thể xây dựng một phương pháp nhúng kết hợp vào các băng để tìm một watermark tổng hợp từ các băng đã nhúng

Quá trình tách watermark ở đây được yêu cầu sử dụng cả ảnh gốc và ảnh chứa watermark

1.2.4.2 Kỹ thuật watermarking của Tao P và Eskicioglu A M

Trong kỹ thuật watermark của Tao P và Eskicioglu A.M., các tác giả đã tổng hợp từ một số ý tưởng đã được đề xuất trong một số bài báo trước đó Từ việc sử dụng phép biến đổi sóng nhỏ hai chiều để phân tích ảnh gốc thành các băng tần khác nhau, rồi nhúng tín hiệu watermark vào một hoặc một số các băng tần Theo cách đó, watermark có thể bền vững trước một số tấn công nhưng lại kém bền vững với một nhóm các tấn công khác Khắc phục nhược điểm trên, trong thuật toán, các tác giả đã nhúng tín hiệu watermark vào cả bốn băng tần trong phép phân tích sóng nhỏ, mỗi băng tần có thể sử dụng các hệ số khác nhau [12] Qua thử nghiệm cho thấy, trước hầu hết các phép biến đổi với ảnh chứa watermark, luôn tìm và tách ra được watermark ở ít nhất một băng tần có độ sai khác thấp so với watermark gốc

Quá trình nhúng watermark

Đầu vào: - Ảnh chứa I = (aij, 0≤i, j≤2n)

- Ảnh watermark là ảnh nhị phân, W = (wij∈{0, 1}, 0≤i, j≤n)

Đầu ra: - Ảnh chứa đã được nhúng watermark Iw

Trang 33

Thực hiện:

a Thực hiện phép biến đổi sóng nhỏ DWT mức một phân tích ảnh chứa I

b Sửa các miền tần số Vij tương ứng với các băng LL, HL, LH, và HH:

Đầu ra: - Watermark là ảnh nhị phân W Thực hiện:

a Thực hiện phép biến đổi sóng nhỏ DWT mức một để phân tích ảnh gốc I và ảnh đã nhúng watermark (có thể đã qua xử lý) Iw*

hệ số dựa trên những cơ sở nào cũng cần được tiếp tục nghiên cứu để có thể đưa ra cơ

sở khoa học cho việc lựa chọn các hệ số phù hợp cho từng bức ảnh gốc và watermark

cụ thể

Đa số các lược đồ watermark sử dụng phép biến đổi sóng nhỏ thì băng LL chưa được sửa đổi, vì điều đó gây ảnh hưởng về chất lượng của ảnh sau khi nhúng watermark Trong cách làm này, tuy watermark được nhúng vào cả bốn băng nhưng giá trị PSNR cho thấy chất lượng của ảnh sau khi nhúng watermark là chấp nhận được Quá trình tách watermark ở đây được yêu cầu sử dụng cả ảnh gốc và ảnh chứa watermark

Trang 34

1.2.5 Watermarking trên video bằng biến đổi DWT – DCT

Đa số các phương pháp watermarking sử dụng các biến đổi DWT hay DCT độc lập đều cần đến ảnh gốc hoặc ảnh dùng làm watermark để trích xuất lại thông tin Cách làm này gần như không khả thi cho một ứng dụng thực tế xét về nhiều phương diện như tính hiệu quả, tính kinh tế, Một ví dụ đơn giản để thấy cách làm này không hiệu quả là: Khi cần xác nhận một đoạn video để chứng minh đó là video bản quyền của đài THVL, chúng ta không thể mang toàn bộ video lưu trữ ra chỉ để làm “đầu vào” so sánh với video tranh chấp để dò tìm watermark

Tác giả M.Vara Lakshmi1 và P.Krishna [9] đã đề xuất một phương pháp có tính thực tế hơn, có thể trích xuất watermark mà không cần đến dữ liệu gốc để so sánh

Bằng cách kết hợp 2 biến đổi DWT và DCT trong giải thuật, giúp đưa ảnh watermark nhị phân được nhúng vào trong khối 4x4 Khi cần trích xuất, dựa vào dữ liệu đã được nhúng trước đó trích xuất thành ảnh nhị phân

Hình 1.9 Sơ đồ giải thuật để nhúng watermark vào video

Trang 35

Bước 1: Tách video V cần nhúng watermark ra thành từng frames hình

Mỗi frames hình tương đương 1 ảnh màu RGB

Bước 2: Frame hình C sẽ được xử lý, tách ra thành 3 kênh tương ứng với 3

màu Đỏ (R), xanh lá (G), xanh dương (B)

Bước 3: Áp dụng biến đổi DWT trên kênh B, ta thu được bốn băng con là

LL, HL, LH, HH Lý do chọn kênh B để áp dụng biến đổi DWT là vì kênh B ít gây nhạy cảm với mắt, điều này giúp cho thuật toán thêm mạnh và tăng tính ẩn của watermark

Bước 4: Áp dụng biến đổi DWT lần nữa trên băng con HL để thu về bốn

băng con nhỏ hơn là LL2, HL2, LH2, HH2

Bước 5: Chia nhỏ băng con HL2 thành các khối nhỏ kích thước 4x4 không

trùng lập

Bước 6: Áp dụng biến đổi DCT cho tất cả khối nhỏ 4x4 ở bước 5

Bước 7: Chuyển đổi hình ảnh watermark w thành dạng nhị phân

Bước 8: Số bit có thể được nhúng tương ứng với số khối trong kênh B Các

bit được nhúng vào miền tần số trung bình của khối 4X4 dựa trên kích thước hình ảnh

Bước 9: Lặp lại bước 8 cho tất cả các bit của watermark

Bước 10: Áp dụng nghịch đảo biến đổi DCT cho tất cả khác khối

Bước 11: Áp dụng IDWT 2 cấp độ thu được kênh B’ đã nhúng watermark Bước 12: Kết hợp kênh R, G và kênh B’ để có được watermarked hình ảnh

'WI'

Bước 13: Lặp lại bước 2 đến bước 12 cho tất cả các frames hình trong

video V Ta thu được video đã nhúng watermark V’

Trang 36

Giải thuật trích xuất

Đầu vào: - Video đã được nhúng watermark V’

Đầu ra: - Ảnh nhị phân watermark đã nhúng

Bước 1: Tách video V’ ra thành từng frame hình Các frames hình ‘WI’ này

đã được nhúng watermark

Bước 2: Tách các kênh R, G và B của hình ảnh watermark 'WI'

Bước 3: Áp dụng DWT trên kênh B để thu được các băng con LL1, HL1,

Bước 6: Áp dụng biến đổi DCT cho các khối 4x4 ở bước 5

Bước 7: Các bit đánh dấu watermark được tách ra từ miền trung bình của

khối 4x4 và lặp lại quá trình này cho đến khi khai thác tất cả các bit từ tất cả các khối 4x4

Bước 8: Sau đó áp dụng IDCT cho tất cả các khối 4X4 để lấy hình ảnh

Các thuật toán watermarking dựa vào phép biến đổi trên miền tần số có ưu điểm trước một số phương pháp tấn công Bằng việc kết hợp giữa hai phép biến đổi DWT

và DCT tạo ra được một phương pháp watermarking bền vững trước các tấn công, vừa

có thể trích xuất lại hình ảnh watermark đã nhúng khi cần thiết mà không phải dùng đến ảnh gốc để so sánh

Trang 37

CHƯƠNG 2 XÂY DỰNG ỨNG DỤNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN

VIDEO CHO ĐÀI THVL

Để xây dựng ứng dụng quản lý và bảo vệ bản quyền video cho đài THVL, chúng

ta cần lựa chọn một mô hình thích hợp vừa đảm bảo hiệu quả cao, vừa phù hợp với thực tế hoạt động của đơn vị Nội dung chương 2 sẽ trình bày các mô hình quản lý video được sử dụng rộng rãi trên thế giới, từ đó đề xuất một mô hình phù hợp với Đài THVL

2.1 MÔ TẢ BÀI TOÁN VỀ QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU VIDEO TẠI ĐÀI PTTH VĨNH LONG

Đài THVL hiện có 12 phòng, một trung tâm và một công ty trực thuộc Đài Trong đó có đến 8 phòng chuyên môn làm nội dung, và liên quan đến dữ liệu video Quá trình thực hiện một sản phẩm video là sự phối hợp giữa các phòng chuyên môn với nhau Quy trình được thực hiện như sau:

Đầu vào bao gồm dữ liệu video được quay từ quay phim, và các nguồn video khác như video clip ca nhạc, hoặc phim truyện được mua bản quyền Kỹ thuật dựng phim chịu trách nhiệm cùng biên tập, và đạo diễn dựng thành tác phẩm hoàn chỉnh từ dữ liệu video do quay phim quay

Tác phẩm sau khi hoàn thành, được gửi đến ban biên tập (trưởng phó phòng) để xét duyệt về nội dung cũng như hình ảnh Nếu được duyệt, tập tin video sẽ được đưa vào dữ liệu trên sever lưu trữ

Dựa vào lịch phát sóng hàng ngày, kỹ thuật viên phát hình sẽ truy xuất tập tin video đã được duyệt tương ứng để thực hiện việc phát sóng Các kỹ thuật viên website cũng thực hiện quá trình lấy tập tin video đã duyệt để tải lên internet

Tập tin sau khi phát sóng được đưa về lưu trữ trong một server dữ liệu khác Những tập tin này sẽ được sử dụng làm tư liệu khi cần thiết hoặc làm đối chiếu khi có phát sinh tình huống tranh cãi về thời lượng quảng cáo, nội dung quảng cáo, nội dung phản ánh chưa đúng thực tế, …

Cách thức quản lý hiện tại chưa hiệu quả do còn tổ chức lưu trữ theo dạng tập tin

và thư mục, nên khi cần thiết rất khó tìm kiếm ra một video phù hợp Thêm vào đó, phần bản quyền dữ liệu video cũng chưa được chú trọng, khi cho tải lên internet các

Trang 38

video chưa được bảo vệ Việc người dùng internet lấy video của Đài THVL để đăng tải lại ồ ạt trong thời gian qua là một ví dụ cụ thể

Do đó, cần xây dựng một ứng dụng vừa giúp quản lý video một cách toàn diện, vừa thực hiện được việc tìm kiếm theo từ khóa các video phù hợp, cũng như nhúng vào video nội dung bản quyền để làm căn cứ xác định khi cần thiết Từ những yêu cầu đặt ra, việc giải quyết bài toán về quản lý và bảo vệ bản quyền video của đài THVL sẽ được nghiên cứu và xây dựng trong nội dung của luận văn này

2.2 LỰA CHỌN MÔ HÌNH

Đài truyền hình Vĩnh Long hiện nay là nơi tập trung số lượng video lớn, nên cần một giải pháp tổng thể, vừa quản lý được số lượng lớn tập tin video, vừa giải quyết được vấn đề bản quyền, việc sao chép bất hợp pháp tập tin video để phát tán

Để giải quyết bài toán quản lý và bảo vệ bản quyền video cho Đài THVL, chúng

ta cần tìm một mô hình quản lý phù hợp và một phương pháp bảo vệ bản quyền tập tin video hiệu quả

2.2.1 Các mô hình quản lý bản quyền số

2.2.1.1 Kiến trúc chung

Một hệ thống quản lý bản quyền số gồm các thành phần cơ bản sau: nhà cung cấp nội dung, các kênh phân phối nội dung, máy chủ bản quyền, trung tâm xác thực, phần mềm trình diễn (player), người dùng và các tập tin đa phương tiện

Hình 2.1 Kiến trúc hệ thống quản lý bản quyền số

Định dạng
Số trang	76
Dung lượng	3,6 MB