Watermarking là một cách để bảo vệ quyền sở hữu các hình ảnh hoặc video số thông qua các thông tin được nhúng vào bên trong chúng.. Có thể chia watermarking thành 2 loại: watermarking có
Trang 1ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
HÀ NGỌC HẢI
ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG
HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU
VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG
LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2017
Trang 2ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
HÀ NGỌC HẢI
ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG
HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU
VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG
Chuyên ngành : Khoa học máy tính
Mã số : 60.48.01.01
LUẬN VĂN THẠC SĨ KỸ THUẬT
Người hướng dẫn khoa học: PGS TS Nguyễn Thanh Bình
Đà Nẵng - Năm 2017
Trang 3LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Tác giả luận văn
Hà Ngọc Hải
Trang 4TÓM TẮT LUẬN VĂN ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN
DỮ LIỆU VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG
Hà Ngọc Hải - học viên cao học khóa 31, chuyên ngành Khoa học máy tính
Tóm tắt - Sự phát triển của internet băng thông rộng đang thúc đẩy mạnh mẽ sự phát triển
của công nghệ đa truyền thông Multimedia Các nguồn dữ liệu multimedia như âm thanh, hình ảnh, văn bản… có thể được truy cập và được phân phối nhanh hơn và rộng hơn Xu thế này mang lại nhiều lợi ích cho người sở hữu các sản phẩm multimedia, nhưng cũng thách thức quyền sở hữu của chúng ta bởi vì hầu hết các dữ liệu multimedia được phân phối dưới các định dạng không bảo mật Hiện nay, việc sao chép và phân phối lại bất hợp pháp các sản phẩm multimedia đang diễn ra liên tục không có kiểm soát Khi ra pháp luật, để phân xử quyền sở hữu các sản phẩm multimedia là việc không dễ dàng nếu không có một cơ chế có thể đảm bảo tính toàn vẹn chân thực quyền tác giả Trong luận văn này chúng tôi xây dựng một hệ thống quản lý và bảo vệ bản quyền video tại Đài THVL sử dụng watermarking thông qua các biến đổi DWT – DCT Hệ thống giúp kiểm soát quá trình truy cập các video của người dùng trong mạng nội bộ, chèn watermark bản quyền vào video, và trích xuất ra khi cần thiết Các kết quả đạt được bước đầu và hướng phát triển tiếp theo của ứng dụng
Từ khóa - Quản lý video; DWT; DCT; watermaking; bản quyền video; truyền hình Vĩnh
Long
WATERMARKING APPLYING FOR BUILDING VIDEO DATA COPYRIGHT MANAGING AND PROTECTING SYSTEM
AT VINH LONG TELEVISION STATION
Abstract - The development of the broadband internet has been boosting the development
of multimedia technology The multimedia data resources such as audio, video, image and text are able to be accessed and distributed faster and widely This trend is beneficial for the owners
of multimedia products However, there are challenges for copyright holder because most of multimedia data files have been distributed in insecure formats Currently, the illegal copying and redistribution of multimedia products are taking place continuously without much control Meanwhile, the legal arbitration about copyright issues on multimedia products will be hard, if
we do not have an effective method of checking the integrity and accuracy of the copyright In this thesis, we have developed a system to manage and protect the video copyright at the Vinh Long Television Station (VLTS) using watermarking base on DWT - DCT transformation The system is able to control the users’ process of accessing videos in the local area network, inserting the copyright watermark of VLTS into videos, and extracting it when necessary The thesis also includes the initial result, and the future development of the application
Key words - Video Management; DWT; DCT; watermarking; video copyright; Vinh Long
Television Station
Trang 5MỤC LỤC
LỜI CAM ĐOAN i
TÓM TẮT LUẬN VĂN ii
MỤC LỤC iii
DANH MỤC CÁC TỪ VIẾT TẮT vi
DANH MỤC CÁC BẢNG vii
DANH MỤC CÁC HÌNH viii
MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục đích và ý nghĩa đề tài 3
3 Mục tiêu và nhiệm vụ 4
4 Đối tượng và phạm vi nghiên cứu 4
5 Bố cục luận văn 5
CHƯƠNG 1 CƠ SỞ LÝ THUYẾT 6
1.1 TỔNG QUAN VỀ TẬP TIN VIDEO 6
1.1.1 Cấu trúc tập tin video chuẩn mpeg 6
1.1.2 Phép biến đổi DCT (Discrete Cosine Transform) 8
1.1.3 Phép biến đổi DWT (Discrete Wavelet Transform) 10
1.1.4 Phép biến đổi DFT (Discrete Fourier Transform) 14
1.2 MÔ HÌNH NHÚNG THÔNG TIN BẢN QUYỀN VÀO VIDEO 15
1.2.1 Giới thiệu chung về watermarking 15
1.2.2 Các tiêu chí cần có của một thuật toán watermarking mạnh mẽ 16
1.2.2.1 Tính bảo mật 16
1.2.2.2 Tính vô hình 17
1.2.2.3 Tính vô hình đối với thống kê 17
1.2.2.4 Tỉ lệ bit 17
1.2.2.5 Quá trình dò đáng tin cậy 17
1.2.2.6 Tính mạnh mẽ 17
1.2.2.7 Nhúng nhiều watermark 18
Trang 61.2.2.8 Blind/non-blind, public/private watermarking 18
1.2.2.9 Watermarking đọc được và dò được 19
1.2.2.10 Tính khả đảo và tính thuận nghịch của watermark 19
1.2.2.11 Tính có thể thay đổi tỉ lệ (scalability) 19
1.2.3 Mô hình watermarking trên video 19
1.2.4 Kỹ thuật watermarking trên video sử dụng biến đổi DWT 20
1.2.4.1 Kỹ thuật watermarking của Mehul R và Priti R 20
1.2.4.2 Kỹ thuật watermarking của Tao P và Eskicioglu A M 21
1.2.5 Watermarking trên video bằng biến đổi DWT – DCT 23
1.3 KẾT CHƯƠNG 25
CHƯƠNG 2 XÂY DỰNG ỨNG DỤNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN VIDEO CHO ĐÀI THVL 26
2.1 MÔ TẢ BÀI TOÁN VỀ QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU VIDEO TẠI ĐÀI PTTH VĨNH LONG 26
2.2 LỰA CHỌN MÔ HÌNH 27
2.2.1 Các mô hình quản lý bản quyền số 27
2.2.1.1 Kiến trúc chung 27
2.2.1.2 Kỹ thuật nhúng thông tin ẩn 29
2.2.1.3 Giải pháp của Microsoft 30
2.2.2 Mô hình đề xuất phù hợp với Đài THVL 33
2.3 LỰA CHỌN KỸ THUẬT WATERMARKING 34
2.3.1 Các hệ số DWT - DCT trong quá trình thực hiện watermarking 34
2.3.2 Các kiểu tấn công dữ liệu trên tập tin video 38
2.3.3 Yêu cầu với hệ thống video watermarking 39
2.4 MÔ HÌNH QUẢN LÝ TẬP TIN VIDEO THEO DẠNG CLIENT – SERVER 39 2.4.1 Thiết kế cơ sở dữ liệu 39
2.4.2 Phân quyền người dùng 43
2.4.3 Bảo mật hệ thống 43
2.4.4 Truyền tải tập tin trong mạng 43
2.5 KẾT CHƯƠNG 44
Trang 7CHƯƠNG 3 CÀI ĐẶT VÀ THỬ NGHIỆM 45
3.1 MÔI TRƯỜNG CÀI ĐẶT 45
3.2 CÀI ĐẶT HỆ THỐNG 45
3.3 KẾT QUẢ THỬ NGHIỆM 48
3.3.1 Đối với hệ thống quản lý video 48
3.3.2 Đối với công cụ watermarking 48
3.4 ĐÁNH GIÁ KẾT QUẢ 54
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN LUẬN VĂN 56
TÀI LIỆU THAM KHẢO 57 QUYẾT ĐỊNH GIAO ĐỀ TÀI
BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN
Trang 8DANH MỤC CÁC TỪ VIẾT TẮT
DCT Discrete Cosine Transform Biến đổi consin rời rạc
IDCT Inverse Discrete Cosine Transform Biến đổi consin rời rạc nghịch DWT Discrete Wavelet Transform Biến đổi wavelet rời rạc
HVS Human Visual System Hệ thống thị giác ở người
IDWT Inverse Discrete Wavelet Transform Biến đổi wavelet rời rạc nghịch MSE Mean Square Error Sai lệch trung bình bình phương
PSNR Peak Signal to Noise Ratio Tỷ số tín hiệu đỉnh trên nhiễu
SVD Singular Value Decomposition Biến đổi giá trị số ít
LBS Least significant bit Bít ít quan trọng nhất
MAM Media Asset Manager Quản lý tài sản đa phương tiện
Trang 10DANH MỤC CÁC HÌNH
Số hiệu
1.2 Ảnh gốc và năng lượng phân bố của ảnh qua phép biến
1.3 Phân chia 3 miền tần số ảnh của phép biến đổi DCT 10
1.5 Quá trình phân tích và tổng hợp tín hiệu 12
1.8 Mô hình tổng quát watermark cho tập tin video 19 1.9 Sơ đồ giải thuật để nhúng watermark vào video 23 2.1 Kiến trúc hệ thống quản lý bản quyền số 27
2.3 Mô hình quản lý bản quyền số của Microsoft 30
2.5 Mô hình client-server quản lý video phù hợp cho Đài
2.12 Sơ đồ cơ sở dữ liệu của MAM cho THVL (phần video) 42
3.4 Nhập thông tin metadata vào tập tin video tải lên 47 3.5 Danh sách các tập tin video đã tải lên hệ thống 47 3.6 Cấu hình hệ thống địa chỉ máy server 48
Trang 12MỞ ĐẦU
1 LÝ DO CHỌN ĐỀ TÀI
Tháng 4/1977, Tỉnh Cửu Long ra quyết định xây dựng Đài Phát thanh Cửu Long,
phát sóng thử nghiệm từ 2/9/1977 trên sóng 950 Khz tức 315m Năm 1984, Đài Phát
thanh Cửu Long đổi tên thành Đài PT-TH Cửu Long Năm 1989, Đài lắp đặt 1 máy phát thanh 10Kw, sóng phát thanh phủ sóng toàn tỉnh và các tỉnh lân cận Năm 1992, tách tỉnh Cửu Long thành 2 tỉnh Vĩnh Long và Trà Vinh, Đài đổi tên là Đài PT-TH Vĩnh Long Tháng 12/1993 Đài lắp đặt thêm máy pháp sóng công suất 250w trên kênh
12 VHF, xây dựng Trung tâm kỹ thuật truyền hình Đài Phát thanh và Truyền hình tỉnh Vĩnh Long là đơn vị sự nghiệp thuộc Ủy ban nhân dân tỉnh tỉnh Vĩnh Long, thực hiện chức năng cơ quan báo chí của Đảng bộ, chính quyền và nhân dân tỉnh Vĩnh Long Từ đó đến nay, Đài Phát thanh và Truyền hình tỉnh Vĩnh Long luôn nâng cao chất lượng phát thanh và truyền hình, trở thành một trong những đài có chỉ có người xem cao của khu vực và cả nước
Trong các năm qua, Đài PTTH Vĩnh Long (THVL) luôn nỗ lực đổi mới nội dung các chương trình phát thanh và truyền hình, mang lại cho khán thính giả những chương trình hay và bổ ích Ngoài các chương trình phim truyện nước ngoài, phim truyện Việt Nam và các chương trình trò chơi truyền hình (games show) cũng được đài đầu tư phát triển
Cùng với sự phát triển của ngành công nghệ thông tin, Đài THVL thực hiện việc chuyển đổi từ lưu trữ tương tự (analog) trên băng từ sang lưu trữ số dưới dạng các tập tin video và audio trên các server để thuận tiện việc sao chép, xử lý và phát sóng Đài THVL phát triển website của đài tại địa chỉ www.thvl.vn thực hiện việc đưa thông tin đến với nhiều người hơn thông qua internet Tại đây, kênh tivi trực tuyến cũng được phát song song với việc phát sóng truyền hình
Nhận thấy được vai trò của internet trong việc đưa thông tin đến với người dùng, Đài THVL phát triển thêm kênh youtube để đưa các chương trình giải trí, gameshow, phim truyện,… đã được phát sóng để khán giả trong và ngoài nước có thể xem lại tại địa chỉ https://www.youtube.com/user/VinhLongTV Kênh youtube của Đài nhận được
sự ủng hộ nhiệt tình của khán giả với hơn 975,163 lượt đăng ký theo dõi (Subscribe) Tuy nhiên, việc tải lên internet các tập tin video không được bảo vệ một cách có hiệu quả, khiến cho việc “đánh cắp” rất dễ dàng Rất nhiều trang web đã lấy tín hiệu từ
Trang 13kênh tivi trực tuyến của đài để phát lại, thu hút người xem Một số tập tin trên kênh youtube của đài đã bị sao chép, và phát tán lại công khai trên internet
Tương tự như với kênh youtube, các video của Đài PTTH Vĩnh Long rất có khả năng bị đánh cắp và phát tán bằng những hình thức khác Vậy khi có tranh chấp bản quyền tập tin video, thì đâu sẽ là bằng chứng để giải quyết tranh chấp? Do đó, vấn đề đặt ra là, cần có một giải pháp bảo vệ hiệu quả bản quyền các tập tin video, trong trường hợp cụ thể là các tập tin video của đài THVL Giải pháp cần phải thêm được thông tin bản quyền vào tập tin video dưới dạng ẩn, và khi cần thiết, có thể trích xuất lại nội dung ẩn trong video đã được bảo vệ Bên cạnh đó, cần có một công cụ quản lý các tập tin video một cách tập trung, công cụ này dùng để xác thực những người dùng nào được quyền truy xuất vào tập tin video được lưu trữ, nhằm hạn chế tối đa khả năng đánh cắp video Đây là nội dung chính được đề cập đến của quyển luận văn này Watermarking là một cách để bảo vệ quyền sở hữu các hình ảnh hoặc video số thông qua các thông tin được nhúng vào bên trong chúng Có thể chia watermarking thành 2 loại: watermarking có thể nhìn thấy được (visible watermarking, non-blind watermarking) và watermarking ẩn (invisible watermarking, blind watermarking) Watermarking miền biến đổi sử dụng các phép biến đổi như DCT (Discrete Cosine Transform), DFT (Discrete Fourier Transform), DWT (Discrete Wavelet Transform) lên ảnh hoặc video số, bằng cách thay đổi các hệ số của các phép biến đổi, thông tin có thể được nhúng vào đối tượng sau biến đổi
Nén video là vấn đề tất yếu của các hệ thống truyền dẫn Xu thế của các hệ thống
sử dụng multimedia là phải làm sao đạt được tỷ số nén video cao mà vẫn đảm bảo chất lượng của hình ảnh sau khi khôi phục MPEG là chuẩn nén ảnh động có tốc độ bit thấp nhưng vẫn đảm bảo chất lượng yêu cầu Chuẩn nén MPEG dành cho video hiện rất phổ biến và trở nên thông dụng trong nhiều lĩnh vực sử dụng multimedia, đặc biệt là phát thanh truyền hình Hiện tại, MPEG-4 (AVC/ H.264) được sử dụng để nén tín hiệu các kênh truyền hình độ nét cao HD (High Definition) Xa hơn nữa là chuẩn nén HEVC/ H.265 đang được nghiên cứu và phát triển có thể giúp cải thiện 50% tốc độ bit
so với chuẩn H.264 với cùng chất lượng Phương thức nén MPEG nói chung và chuẩn H.264, H.265 nói riêng, thực hiện dựa trên biến đổi DWT để nén video
Ngoài việc bảo vệ bằng watermarking, chúng ta cần có một công cụ quản lý tập tin video một cách tập trung và có phân quyền truy cập để kiểm soát tất cả các tập tin video Công cụ quản lý tập tin được thiết kế theo mô hình client – server Các máy client được cung cấp một phần mềm giao tiếp với server Phần mềm client cung cấp cho người dùng các chức năng để thực hiện việc ingest tập tin video, tìm kiếm, trích xuất tập tin video cần thiết sau khi người dùng đăng nhập với quyền tương ứng Phần mềm chạy trên máy server sẽ thực hiện việc kiểm tra đăng nhập của người dùng,
Trang 14quyền truy xuất để đưa ra các chức năng tương ứng Phần mềm chạy phía server kiêm luôn chức năng thêm watermarking vào tập tin video Như vậy, với các video được trích xuất từ hệ thống, sẽ được kiểm soát bằng quyền truy cập của người dùng, và watermarking ẩn khi có tranh chấp bản quyền
Đứng trước yêu cầu quản lý và bảo vệ bản quyền dữ liệu video của Đài THVL, đồng thời thấy được tầm quan trọng và hướng phát triển của các biến đổi đối với kỹ
thuật nén video, luận văn này tập trung vào nghiên cứu và xây dựng “Ứng dụng watermarking trong xây dựng hệ thống quản lý và bảo vệ bản quyền dữ liệu
video tại Đài Truyền hình Vĩnh Long”
2 MỤC ĐÍCH VÀ Ý NGHĨA ĐỀ TÀI
2.1 Mục đích
Hiện tại, việc bảo vệ bản quyền video, hình ảnh, âm thanh của Đài THVL còn đơn giản, chưa có một biện pháp hữu hiệu để xác thực bản quyền Việc chia sẻ hình ảnh, video, audio của người dùng trên mạng internet hiện nay hết sức đơn giản và phổ biến Từ đó, đặt ra yêu cầu về thông tin bản quyền tác giả của các hình ảnh, video, hay audio này Việc bảo vệ sẽ được nâng lên một mức khi các tập tin video được quản lý tập trung, kiểm soát được người dùng nào được quyền truy xuất dữ liệu Luận văn sẽ đưa ra mô hình và chạy mô phỏng quá trình nhúng thông tin bản quyền vào đoạn video được nén theo chuẩn MPEG, cùng với công cụ quản lý tập trung tập tin video theo mô hình clients – server Áp dụng mô hình đó để ghi thông tin chủ sở hữu, và quản lý người dùng, giúp bảo vệ bản quyền video của Đài THVL
2.2 Ý nghĩa khoa học
Luận văn giúp hiểu rõ hơn về chuẩn nén video MPEG, phép biến đổi DWT cũng như phương thức sử dụng các hệ số DWT vào kỹ thuật nhúng thông tin bản quyền vào video Từ đó, làm nền tảng áp dụng cho chuẩn nén video mới HECV/ H.265 đang được phát triển
Phương thức quản lý tập tin video tập trung và các vấn đề phát sinh như cân bằng tải trong hệ thống mạng nội bộ, quá trình lập lịch chuyển đổi định dạng các tập tin video để đảm bảo độ ổn định và tối ưu hóa sức mạnh của server
Quản lý tập tin video đòi hỏi thêm yêu cầu bảo mật thông tin từ việc xác định người dùng hợp lệ, quá trình truyền tải tập tin trong mạng phải được tính toàn vẹn của tập tin video, cũng như việc sao lưu và phục hồi hệ thống khi cần thiết
2.3 Ý nghĩa thực tiễn
Kết quả mong muốn đạt được là một chương trình chạy theo mô hình clients - server dùng để nhúng thông tin xác định bản quyền vào đoạn video sử dụng biến đổi
Trang 15DWT, quản lý tập tin video, tìm kiếm, trả về kết quả, Chương trình quản lý phải có phân quyền người dùng một cách rõ ràng, tương ứng với mỗi người dùng sẽ có những thao tác nhất định với tập tin video như chỉ được ingest, được tìm kiếm, được trích xuất tập tin video,…Bên cạnh đó, có một chương trình để trích xuất thông tin bản quyền ra khỏi đoạn video và đối chiếu thông tin được nhúng ban đầu Đây là giải pháp hữu ích giúp bảo vệ bản quyền video của Đài PTTH Vĩnh Long khi có cách tranh chấp bản quyền xảy ra
3 MỤC TIÊU VÀ NHIỆM VỤ
3.1 Mục tiêu
- Nghiên cứu phương pháp nhúng dữ liệu vào tập tin video thông qua biến đổi DWT, DCT đồng thời trích xuất được dữ liệu đã nhúng vào khi cần thiết
- Hiểu rõ cách thức nén tập tin video theo chuẩn mpeg
- Mô hình clients – server, quản lý dữ liệu có dung lượng lớn là các tập tin video
- Phân quyền người dùng, xác thực thông tin người dùng truy cập vào hệ thống
- Lưu trữ tối ưu tập tin video, tạo bản sao tập tin video chất lượng thấp để dùng làm preview khi người dùng tìm kiếm
- Bảo mật hệ thống khi xác nhận thông tin người dùng đăng nhập
- Bảo đảm tính toàn vẹn của tập tin video khi truyền tải trong mạng
3.2 Nhiệm vụ
Để đạt được những mục tiêu trên thị nhiệm vụ đặt ra của đề tài là:
- Nghiên cứu về phép biến đổi DWT, và các phép biến đổi DCT, DFT để thấy được phép biến đổi tối ưu hơn
- Nghiên cứu cấu trúc tập tin video, cụ thể là tập tin mpeg 2
- Xây dựng giải thuật và cài đặt mã nguồn để thực hiện nhúng thông tin vào tập
tin video
- Thiết kế cơ sở dữ liệu tối ưu cho việc phân quyền của người dùng
- Xây dựng giải thuật và cài đặt mã nguồn phần mềm clients – phần mềm server
- Phân quyền người dùng, nhóm người dùng trong hệ thống
- Tối ưu hóa tốc độ truyền tải tập tin qua mạng do đặc điểm tập tin video là tập
tin có dung lượng lớn
- Tối ưu hóa dữ liệu metadata để phục vụ cho việc tìm kiếm tập tin video sau này
- Đánh giá kết quả theo yêu cầu của đề tài
4 ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Trong khuôn khổ của luận văn thuộc loại ứng dụng, tôi chỉ giới hạn nghiên cứu các vấn đề sau:
Trang 16- Phép biến đổi trên miền DWT, DCT
- Cấu trúc tập tin mpeg 2
- Công cụ mô phỏng nhúng thông tin và trích xuất thông tin với tập tin video
Luận văn sẽ tập trung nghiên cứu biến đổi DWT, DCT trong xử lý ảnh và đưa ra phương pháp để đưa những thông tin bản quyền vào trong một đoạn video Mô hình sử dụng cho luận văn cũng dựa vào mô hình chung của kỹ thuật watermarking Chương trình sẽ gồm 2 thành phần: Nhúng watermarking và phát hiện, trích xuất watermarking
Như vậy, luận văn sẽ tập trung vào giải quyết vấn đề watermarking mà cụ thể là các thông số của biến đổi DWT, DCT sao cho phù hợp với MPEG video nhằm đạt được hiệu quả tốt
Mô hình clients – server quản lý dữ liệu tập trung, phân quyền người dùng Chương trình quản lý tập tin video thực hiện việc chuyển đổi video về một chuẩn thống nhất được chọn lựa trước Tập tin video nguồn từ nhiều định dạng khác nhau sẽ được chuyển đổi sang định dạng “chuẩn”, đồng thời các dữ liệu metadata sẽ được trong cơ sở dữ liệu để thực hiện việc tìm kiếm sau này Dữ liệu metadata do người dùng cung cấp thông qua giao diện làm việc phía clients bao gồm: thể loại, tên tác phẩm, diễn viên, thời lượng, tác giả, quay phim, đạo diễn, … Phía server sẽ thực hiện việc chuyển mã các định dạng video từ các nguồn khác nhau về dạng nhất định (trường hợp này là chuẩn mpeg 2), thêm watermarking, thực hiện các truy vấn của người dùng, trả về kết quả, trả về tập tin video cho người dùng khi được yêu cầu
5 BỐ CỤC LUẬN VĂN
Chương 1 Cơ sở lý thuyết Chương này trình bày các cơ sở lý thuyết của các
phép biến đổi trên miền tần số, cũng như cấu trúc của tập tin video theo định dạng MPEG, đây là cơ sở để thực hiện việc watermarking bảo vệ bản quyền video cho đài THVL
Chương 2 Xây dựng ứng dụng quản lý và bảo vệ bản quyền video cho đài THVL Chương này trình bày các mô hình về bảo vệ bản quyền video, từ đó rút ra
một mô hình thích hợp để xây dựng ứng dụng cho đài THVL Lựa chọn cách thức watermarking để bảo vệ bản quyền video
Chương 3 Cài đặt và thử nghiệm Chương này trình bày quá trình cài đặt và
thử nghiệm hệ thống; một số kết quả thực nghiệm và đánh giá
Phần kết luận.
Trang 17CHƯƠNG 1
CƠ SỞ LÝ THUYẾT
Để xây dựng ứng dụng bảo vệ bản quyền video cho Đài THVL, một số nội dung
lý thuyết cần được nghiên cứu, làm cơ sở cho việc cài đặt vào ứng dụng Nội dung chương này tập trung vào giới thiệu về cấu trúc tập tin chuẩn mpeg, các phép biến đổi trong miền không gian DWT, DCT, DFT, và các giải thuật watermaking được áp dụng
1.1 TỔNG QUAN VỀ TẬP TIN VIDEO
Trước khi máy tính trở nên phổ biến, phim ảnh được lưu trữ trên băng từ, chính
vì vậy rất hạn chế trong các thao tác chỉnh sửa, biên tập, hay sao chép Sau khi máy tính trở nên phổ biến, việc chuyển đổi cách thức lưu trữ được thực hiện nhằm mục đích tiết kiệm thời gian và chi phí Để chuyển đổi cách lưu trữ tuần tự sang dạng số cần thiết phải có các định dạng chuẩn để lưu trữ hiệu quả, từ đó, nhiều định dạng tập tin video lần lượt ra đời như mpeg, avi, wmv, mkv, …Đáng kể nhất phải kể đến chuẩn nén mpeg do nhóm chuyên hình ảnh được thành lập từ tháng 2 năm 1988 Motion Pictures Expert Group giới thiệu Các định dạng được giới thiệu bao gồm MPEG-1, MPEG-2, MPEG-3, và MPEG-4 (hay H.264)
1.1.1 Cấu trúc tập tin video chuẩn mpeg
• Lớp cắt lát dòng bít (slice): Mảng bao gồm một và cấu trúc khối kề nhau Kích thước lớn nhất của mảng có thể bao gồm toàn bộ bức ảnh và kích thước nhỏ nhất của mảng là một cấu trúc khối Thông tin đầu tiên chứa đựng vị trí của mảng trong toàn bộ ảnh, và hệ số cân bằng lượng tử…
• Lớp ảnh (picture): cho phép bộ giải mã xác định loại ảnh được mã hóa Thông tin đầu dùng để chỉ thứ tự truyền khung (để bộ mã hóa có thể sắp xếp các ảnh lại theo thứ tự đúng) và các thông tin về đồng bộ, độ phân giải và phạm vi vector chuyển động Trong nén MPEG người ta sử dụng 3 loại ảnh sau:
Trang 18o Ảnh I (Intra Pictures): được mã hóa độc lập mà không cần tham khảo các ảnh khác Hiệu quả nén tín hiệu đạt được do loại bỏ được dư thừa về không gian
mà không có yếu tố thời gian tham gia vào quá trình Ảnh I được dùng một cách tuần hoàn để tạo thành điểm tựa cho dòng dữ liệu trong quá trình giải mã
o Ảnh P (Predicted Pictures): được mã hoá từ ảnh I hoặc ảnh P ngay trước
để bù chuyển động và chính nó cũng có thể dùng để tham khảo cho việc tiên đoán ảnh tiếp theo Mỗi khối ảnh trong ảnh P có thể được mã hóa theo kiểu tiên đoán hoặc mã hóa một cách độc lập Do sử dụng cả nén không gian và thời gian nên hiệu quả nén của ảnh P cao hơn đáng kể so với ảnh I
o Ảnh B (Bidirectionally Predictive Pictures) có thể sử dụng các ảnh I và P phía trước và phía sau nó để bù chuyển động vì vậy cho tỷ lệ nén cao nhất Mỗi khối trong ảnh B có thể tiên đoán theo chiều ngược, xuôi, cả hai hướng hoặc được mã hóa độc lập Tuy nhiên để tiên đoán ngược từ một bức ảnh phía sau nó thì bộ mã hóa phải sắp xếp lại các bức ảnh Do vậy sẽ tạo ra độ trễ do phải sắp xếp lại thông tin, độ trễ lớn hay nhỏ phụ thuộc vào số bức ảnh B liên tiếp nhau được truyền
• Lớp nhóm ảnh (GOP): các ảnh I, P, B thường xuất hiện theo một thứ tự lặp đi lặp lại một cách tuần hoàn Vì vậy xuất hiện nhóm ảnh GOP Chất lượng ảnh không chỉ phụ thuộc vào tỷ lệ nén trong từng khuôn hình mà còn phụ thuộc vào độ dài của nhóm ảnh GOP Chúng là đơn vị mang thông tin độc lập của MPEG và bắt buộc phải bắt đầu bằng một ảnh I Tiếp sau đó là một loạt các ảnh P và B Cấu trúc của một GOP được mô tả bởi 2 tham số: N (số ảnh trong GOP) và M (khoảng cách giữa các ảnh P)
• Lớp dãy ảnh (sequence): đoạn video bao gồm thông tin đầu, một số nhóm ảnh
và thông tin kết đoạn
- Mỗi lớp này hỗ trợ một chức năng nhất định: một là chức năng xử lý tín hiệu (DCT và bù chuyển động) Hai là chức năng logic (tái đồng bộ, điểm truy xuất ngẫu nhiên)
Trang 19Hình 1.1 Cấu trúc tập tin Mpeg
1.1.2 Phép biến đổi DCT (Discrete Cosine Transform)
Biến đổi Cosin rời rạc viết tắt là DCT (Discrete Cosine Transform) do Ahmed và các đồng nghiệp của ông đưa ra vào năm 1974 Từ đó cho đến nay, nó được sử dụng rất phổ biến trong nhiều kỹ thuật xử lí ảnh số Trong các kỹ thuật watermark ảnh dựa trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT được sử dụng nhiều nhất
Trong lĩnh vực xử lý ảnh số ta sử dụng biến đổi DCT 2 chiều có dạng như sau:
i
i
Trang 20- Đặc điểm của phép biến đổi DCT trên ảnh hai chiều
Biến đổi DCT trên ảnh thể hiện đặc tính nội dung về tần số của thông tin ảnh Hệ
số góc trên là lớn và đặc trưng cho giá trị trung bình thành phần một chiều gọi là hệ số
DC, còn các hệ số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần số cao theo hướng ngang và theo hướng thẳng đứng gọi là các hệ số AC
Hình 1.2 Ảnh gốc và năng lượng phân bố của ảnh qua phép biến đổi DCT
Bản thân biến đổi DCT không nén được dữ liệu
Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng hay theo đường chéo, thì tương ứng theo các hướng đó, các hệ số biến đổi DCT cũng lớn
Tóm lại, DCT làm giảm độ tương quan không gian của thông tin trong khối ảnh Điều đó cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có phần dư thừa ít hơn
Khối hệ số DCT có thể chia thành 3 miền, miền tần số thấp chứa các thông tin quan trọng ảnh hưởng đến tri giác, miền tần số giữa, và miền tần số cao Các thông tin trong miền tần số cao thường mang tính trị giác thấp
Trang 21(a)
(b)
(c)
Hình 1.3 Phân chia 3 miền tần số ảnh của phép biến đổi DCT
(a) Miền tần số thấp, (b) Miền tần số ở giữa, (c) Miền tần số cao
Trong các thuật toán watermark, miền hệ số DCT tần số cao thường không được
sử dụng do nó thường không bền vững với các phép xử lí ảnh, hoặc nén ảnh JPEG Miền tần số thấp cũng ít được sử dụng do một sự thay đổi dù nhỏ trong miền này cũng làm giảm chất lượng tri giác của ảnh Vì vậy, miền tần số ở giữa thường hay được sử dụng nhất và cũng cho kết quả tốt nhất
1.1.3 Phép biến đổi DWT (Discrete Wavelet Transform)
Đây là phép biến đổi mới nhất áp dụng cho ảnh số Ý tưởng của DWT cho tín hiệu một chiều như sau: Tín hiệu được chia thành hai phần, phần tần số cao và phần tần số thấp Đối với nhiều tín hiệu, phần nội dung có tần số thấp chứa những thông tin quan trọng nhất - những đặc tính nhận dạng Trái lại, phần nội dung có tần số cao chỉ mang sắc thái của tín hiệu Bởi vậy, trong biến đổi sóng nhỏ, người ta thường nói về các phần gần đúng (approximations) và các phần tiểu tiết (details) của tín hiệu Phần gần đúng là những thành phần có tỷ lệ cao (highscale) nhưng có tần số thấp của tín hiệu Phần tiểu tiết là những thành phần có tỷ lệ thấp nhưng có tần số cao của tín hiệu
Để tách một tín hiệu thành hai phần như trên, người ta dùng hai bộ lọc bù nhau
Bộ lọc thứ nhất gọi là low-pass filter chỉ cho phép các thành phần có tần số thấp đi qua Bộ lọc thứ hai gọi là high-pass filter chỉ cho phép các thành phần có tần số cao đi qua
Quá trình lọc ở mức cơ bản nhất có dạng như sau
Trang 22Hình 1.4 Lọc theo tần số thấp và tần số cao
Tín hiệu gốc S qua hai phép lọc được phân tích thành hai tín hiệu, A và D Có một điều cần lưu ý là, nếu chúng ta thực hiện quá trình này trên một tín hiệu số thực sự thì sẽ thu được một số lượng dữ liệu gấp đôi số lượng ban đầu Ví dụ, giả sử tín hiệu gốc S gồm 1000 mẫu dữ liệu thì mỗi tín hiệu được lọc ra cũng sẽ gồm 1000 mẫu Tổng cộng sẽ có 2000 mẫu Nhưng để đảm bảo có thể tổng hợp lại tín hiệu ban đầu, chúng ta thực sự chỉ cần sử dụng một nửa số tín hiệu được lọc Do đó, nên có một qui trình giảm bớt một nửa số mẫu của A và D Qui trình này được gọi là downsampling Sau khi giảm đi một nửa, chúng ta sẽ có hai tín hiệu tương ứng là cA và cD Các dữ liệu của cA và cD được gọi là các hệ số sóng nhỏ
Toàn bộ hai quá trình trên đây, lọc và cắt giảm mẫu được gọi là phân tích các tín hiệu hoặc biến đổi sóng nhỏ rời rạc (DWT) Đó là quá trình xuôi, còn ngược lại phải làm như thế nào để có thể lắp ghép các tín hiệu thu được thành tín hiệu gốc mà không
bị mất thông tin Quá trình này được gọi là tổng hợp các tín hiệu hoặc biến đổi sóng nhỏ rời rạc ngược (IDWT)
Để tổng hợp tín hiệu, người ta sẽ tăng số mẫu lên gấp đôi, được gọi là upsampling và sau đó lọc ngược trở lại Các bộ lọc phân tích (L và H) và các bộ lọc tổng hợp (L” và H”) cần phải được chọn lựa để thoả mãn một số điều kiện đảm bảo cho quá trình phân tích và tổng hợp là đồng nhất Các bộ lọc này được gọi là đối xứng gương trực giao (quadrature mirror filters) Quá trình phân tích và tổng hợp một tín hiệu có thể được mô tả như sau:
Trang 23Hình 1.5 Quá trình phân tích và tổng hợp tín hiệu
Trên đây chúng ta mới nói đến quá trình phân tích các tín hiệu thành hai tín hiệu xấp xỉ và chi tiết Quá trình này được gọi là phân tích một mức Có thể lặp lại quá trình này bằng cách tiếp tục phân tích tín hiệu xấp xỉ thành hai tín hiệu ở giải tần thấp hơn
Từ đây xuất hiện một khái niệm được gọi là phân tích nhiều mức
Về mặt lý thuyết, quá trình này có thể lặp lại vô hạn Tuy nhiên, trong thực tế, việc phân tích chỉ có thể tiếp diễn cho đến khi phần chi tiết chỉ còn một mẫu hay một điểm Việc lựa chọn số mức phân tích hoàn toàn phụ thuộc vào bản chất của tín hiệu Tương tự như các tín hiệu một chiều, các tín hiệu hai chiều (tức là các bức ảnh) cũng có thể được phân tích tương tự bằng DWT nhưng theo cả hai chiều dọc và ngang Một bộ lọc tần số thấp và một bộ lọc tần số cao sẽ được sử dụng kết hợp để lọc các tín hiệu Đầu tiên, ảnh gốc sẽ được lọc thấp theo chiều dọc Sau đó, nếu lọc lại bằng chính
bộ lọc này theo chiều ngang ta sẽ có băng LL và nếu lọc lại bằng bộ lọc cao ta sẽ có băng LH Tiếp theo, ảnh gốc sẽ được lọc cao theo chiều dọc và sau đó sẽ được lọc lại theo chiều ngang bằng lọc thấp để có băng HL và bằng lọc cao để có băng HH
Quá trình trên lại có thể tiếp tục đối với băng LL để tạo ra phép biến đổi DWT hai mức như minh hoạ trong hình dưới đây:
Hình 1.6 Biến đổi dwt hai mức
Trang 24Về mặt toán học, ta có thể tạo lại ảnh ban đầu bằng quá trình DWT ngược hay IDWT
Ta có thể mô tả bằng toán học DWT và IDWT như sau:
𝑓𝑗ℎ𝑖𝑔ℎ 0 (𝑘) là phần chi tiết của F(n) tại các dãi tần khác nhau
Tín hiệu ban đầu F(n) có thể được xây dựng lại từ các hệ số DWT bằng cách đệ quy như sau:
Trang 25Biến đổi DWT và IDWT cho mảng hai chiều MxN có thể được định nghĩa tương
tự bằng cách thực hiện các biến đổi một chiều DWT và IDWT cho mỗi chiều tương ứng Biến đổi sóng có rất nhiều lợi thế so với các biến đổi khác, đó chính là:
- Biến đổi sóng lăn là một mô tả đa độ phân giải của ảnh Quá trình giải mã có thể được xử lý tuần tự từ độ phân giải thấp cho đến độ phân giải cao
- Biến đổi DWT gần gũi với hệ thống thị giác người hơn biến đổi DCT vì vậy, có thể nén với tỉ lệ cao bằng DWT mà sự biến đổi ảnh khó nhận thấy hơn nếu dùng DCT với tỉ lệ tương tự
Biến đổi sóng tạo ra một cấu trúc được gọi là biểu diễn tỉ lệ không gian space representation) Trong biểu diễn này, các tín hiệu tần số cao được xác định chính xác trong miền điểm ảnh (pixel), còn các tín hiệu tần số thấp được xác định chính xác trong miền tần số
(scale-1.1.4 Phép biến đổi DFT (Discrete Fourier Transform)
Phép biến đổi Fourier rời rạc viết tắt là DFT (Discrete Fourier Transform) là một công cụ toán học được dùng để chuyển cách biểu diễn tín hiệu và hệ thống rời rạc hoặc liên tục sang miền tần số rời rạc Thực chất của cách biểu diễn này là lấy từng điểm rời rạc trên vòng tròn đơn vị trong mặt phẳng Z để biểu diễn Việc biểu diễn trong miền tần số rời rạc đặc biệt hiệu quả khi xuất hiện các thuật toán tính toán nhanh DFT ta gọi
là phép biến đổi Fourier nhanh FFT (Fast Fourier Transform)
Biểu diễn dưới dạng toán học bằng công thức sau
Trang 261.2 MÔ HÌNH NHÚNG THÔNG TIN BẢN QUYỀN VÀO VIDEO
1.2.1 Giới thiệu chung về watermarking
Watermarking số được coi là ra đời từ năm 1954 với bằng sáng chế của Emile Hembrooke Tuy nhiên, nghiên cứu watermarking vẫn chưa được đặt ra như một lĩnh vực nghiên cứu độc lập cho tới những năm 1980 và khái niệm watermarking chỉ được hoàn thiện vào giữa những năm 90 của thế kỷ 20
Agrawal và Kiernan [17] đưa ra những đề xuất đầu tiên về kỹ thuật watermarking trên cơ sở dữ liệu quan hệ bởi nhu cầu cấp thiết của người chủ dữ liệu muốn bảo vệ sản phẩm của mình trước những tấn công bên ngoài Các tác giả đã đề xuất một lược
đồ watermarking trong đó dữ liệu có thể chấp nhận những thay đổi nhỏ mà không ảnh hưởng đến giá trị sử dụng của chúng
Mục đích của watermarking: Các lược đồ watermarking khác nhau được thiết kế
để phục vụ cho các mục đích khác nhau, cụ thể là: bảo vệ bản quyền, đảm bảo sự toàn vẹn hay phát hiện giả mạo, khoanh vùng, chứng minh quyền sở hữu, Đối với các lược đồ watermarking bền vững thường dùng để bảo vệ bản quyền các tập tin đa phương tiện như ảnh số, video, audio
Trang 27Hình 1.7 Phân loại watermarking
1.2.2 Các tiêu chí cần có của một thuật toán watermarking mạnh mẽ
Tùy thuộc vào từng ứng dụng, kỹ thuật watermarking có những đòi hỏi khác
nhau Tuy nhiên có một số yêu cầu chung mà mà hầu hết các ứng dụng thực tế phải đạt
được
1.2.2.1 Tính bảo mật
Giống như trong lĩnh vực mã hóa, tính hiệu quả của một thuật toán không thể dựa
vào giả định là các kẻ tấn công không biết cách mà watermark được nhúng vào tài liệu
đa phương tiện Tuy nhiên, giả định đó lại được dùng để đánh giá độ an toàn của các
sản phẩm thương mại sử dụng watermarking có giá trị trên thị trường Vì vậy với một
ứng dụng watermarking, một khi biết được cách làm việc của bộ nhúng và bộ dò, việc
Nhận biết Không nhận biết
Bền vững
Công cộng
Cá nhân
Gần như không khả đảo
Trang 28làm cho watermark không đọc được thường rất dễ dàng Hơn nữa một số kỹ thuật sử dụng dữ liệu gốc trong quy trình dò và thường thì các giải pháp loại này không khả thi trong thực tế
1.2.2.2 Tính vô hình
Những nhà nghiên cứu gần đây đã cố nhúng những watermark bằng cách sao cho
nó không thể được nhận ra Tuy nhiên yêu cầu này mâu thuẫn với các yêu cầu khác chẳng hạn sức chịu đựng và độ an toàn chống sự bền vững chống được giả mạo đặc biệt là các thuật toán nén có mất thông tin
1.2.2.3 Tính vô hình đối với thống kê
Watermark không thể dò được bằng phương pháp thống kê bởi một người không được phép Ví dụ nhiều tác phẩm kỹ thuật số đã được nhúng cùng một watermark sao cho khi thực hiện tấn công dựa trên thống kê thì không tài nào trích được watermark Một giải pháp khả thi là sử dụng watermark phụ thuộc nội dung [18]
1.2.2.4 Tỉ lệ bit
Tùy thuộc vào ứng dụng, thuật toán watermark có thể cho phép một số lượng bit cần ẩn được định nghĩa trước Không tồn tại các quy tắc chung, tuy nhiên đối với ảnh thì tối thiểu 300 - 400 bit
Trong bất kỳ trường hợp nào thì nhà thiết kế hệ thống phải nhớ rằng tốt nhất là không nên giới hạn số lượng bit được nhúng vào dữ liệu
1.2.2.5 Quá trình dò đáng tin cậy
Thậm chí khi không có các tấn công cũng như các biến dạng tín hiệu, khả năng không dò được watermark đã nhúng hoặc dò sai watermark phải rất nhỏ Thông thường các thuật toán dựa trên thống kê dễ dàng thỏa được các yêu này Tuy nhiên một khả năng như vậy phải được đưa lên hàng đầu nếu ứng dụng watermark liên quan đến tính pháp lý, vì có như vậy mới tạo sự tin cậy chắc chắn trong các phán quyết cuối cùng
1.2.2.6 Tính mạnh mẽ
Việc sử dụng các tín hiệu âm nhạc, hình ảnh và phim dưới dạng kỹ thuật số thông thường có liên quan tới nhiều kiểu biến dạng, chẳng hạn như nén có mất thông tin, hay trong trường hợp ảnh là các phép lọc, định lại kích thước, cải tiến độ tương phản, phép quay, … Để watermarking hữu ích, watermark phải dò được ngay khi cả các biến dạng xảy ra [10] [14]
Trang 291.2.2.7 Nhúng nhiều watermark
Cần phải cho phép nhúng một tập hợp các watermark khác nhau trong cùng ảnh bằng cách sao cho mỗi watermark có thể dò được bởi người dùng được cấp quyền Đặc trưng này thì hữu dụng trong các ứng dụng dấu vân tay, trong đó thuộc tính tác quyền được truyền từ người sở hữu tác phẩm đến các tác phẩm khác Hơn nữa chúng
ta có thể ngăn người khác thực hiện watermarking cho một tác phẩm đã được đóng dấu
1.2.2.8 Blind/non-blind, public/private watermarking
Mối quan tâm đặc biệt là cơ chế sử dụng để khôi phục vết ấn từ ảnh Trong một
số trường hợp để phát triển một thuật toán mạnh mẽ, watermark được trích bằng cách
so sánh các phiên bản đã được đóng dấu và chưa đóng dấu Nhiều phương pháp được
đề xuất chịu đựng được nhiều kỹ thuật xử lý ảnh và các tấn công có thể nhằm vào việc
gỡ watermark hay làm cho nó không thể đọc được [10] [11] [12] [13] Tuy nhiên
thông thường trong thế giới thực, sự có mặt của ảnh gốc trong quá trình dò không được bảo đảm, do vậy thuật toán cần ảnh gốc để hồi phục vết ấn không thích hợp cho nhiều ứng dụng thực tế Ngoài ra loại thuật toán này không thể được dùng cho
việc chứng minh quyền sở hữu hoàn toàn trừ khi thỏa một số yêu cầu phụ khác như không tựa khả đảo (non-quasi-invertibility) của watermark, vốn rất khó đạt được và hầu như không thể chứng minh Các kỹ thuật khôi phục watermark không cần so sánh các tín hiệu được mark và không được mark thường gọi là oblivious hay blind Trong các trường hợp khác thuật ngữ public watermarking được dùng để đối lại với private watermarking
Thực sự, thuật ngữ public/private watermarking để chỉ một khái niệm khác: một
kỹ thuật được gọi là private nếu chỉ có người sở hữu tài liệu hay người được cấp quyền mới trích watermark bởi vì anh ta mới là người có thể truy xuất vào ảnh gốc hoặc anh
ta mới là người biết khoá chính xác đúng để trích watermark từ dữ liệu chủ Trái lại các kỹ thuật mà cho phép bất kỳ người nào cũng đọc được watermark được gọi là public Hầu hết mọi người cho rằng các cơ chế private dường như mạnh mẽ hơn public
ở chỗ là mỗi khi watermark được đọc, kỹ thuật public làm cho các kẻ tấn công dễ xóa watermark hay làm cho watermark không đọc được chẳng hạn bằng cách đảo quy trình nhúng hay bằng cách nhúng một watermark đảo (watermark reversibility) Nói một cách tổng quát trong số các kỹ thuật watermarking ảnh được đề xuất gần đây, các sản phẩm thương mại thường áp dụng các hệ thống public trong khi các nghiên cứu lại tập trung vào tiếp cận private
Trang 301.2.2.9 Watermarking đọc được và dò được
Một watermark mà có thể dò được chỉ nếu nội dung của nó được biết trước gọi là một watermark dò được Ngược lại các kỹ thuật cho phép watermark đọc được ngay khi nội dung của nó bỏ qua thì gọi là watermark đọc được Nói cách khác, theo hướng tiếp cận dò được, người ta có thể chỉ cần biết một watermark có tồn tại trong dữ liệu hay không
1.2.2.10 Tính khả đảo và tính thuận nghịch của watermark
Mặc dù tính mạnh mẽ thường được chỉ ra như một yêu cầu chính được thỏa mãn, mối quan tâm lớn lại tập trung vào tính khả đảo của watermark Thuật ngữ khả đảo được dùng với những ý nghĩa khác nhau, nghĩa tự nhiên nhất định nghĩa một watermark là khả đảo nếu các người dùng được cấp quyền có thể xoá nó khỏi tài liệu
1.2.2.11 Tính có thể thay đổi tỉ lệ (scalability)
Chi phí nhúng có thể ít quan trọng hơn là chi phí dò, vốn thường phải xảy ra theo thời gian thực, ví dụ như tốc độ giải mã của các frame video Các yêu cầu tính toán ràng buột một watermark phải đơn giản, nhưng sự đơn giản này có thể giảm trầm trọng tính chịu đựng giả mạo [14]
1.2.3 Mô hình watermarking trên video
Hình 1.8 Mô hình tổng quát watermark cho tập tin video
Trang 31Tập tin video, theo cách hiểu đơn giản là tập hợp các frames hình lần lượt nhau
Do đó, bài toán watermarking trên tập tin video có thể đưa về bài toán watermarking trên một bức ảnh Quá trình được lặp lại cho tất cả các frames hình còn lại trong video
Có nhiều phương pháp để watermarking một video như sử dụng biến đổi DCT, DFT, DWT hoặc các phương pháp khác như LSB, PCA
1.2.4 Kỹ thuật watermarking trên video sử dụng biến đổi DWT
Các kỹ thuật watermark sau được áp dụng trên ảnh tĩnh Việc áp dụng trên video được thực hiện tương tự như bằng áp dụng giải thuật watermark trên toàn bộ frames hình của video
1.2.4.1 Kỹ thuật watermarking của Mehul R và Priti R
Trong kỹ thuật watermark của Mehul R và Priti R., các tác giả đã sử dụng phép biến đổi sóng nhỏ hai chiều để phân tích ảnh gốc thành bốn băng LL, HL, LH và HH rồi nhúng tín hiệu watermark thứ nhất vào băng LL, nhúng một watermark khác vào băng HH Kết quả thử nghiệm cho thấy watermark bền vững trước một số phép xử lý ảnh thông thường [8]
a Sử dụng phép biến đổi sóng nhỏ hai chiều mức hai đối với I
b Nhúng watermark J vào băng LL2, nhúng watermark K vào băng HH2 bởi công thức: V’i,j = Vi,j + ∝Wi,j Với Vi,j là hệ số tương ứng trong LL2 và H2; ∝ là hệ số tương quan giữa tính ẩn và tính bền vững của watermark
c Sử dụng phép biến đổi ngược IDWT để tổng hợp lại được ảnh chứa watermark
Quá trình tách watermark
Đầu vào: - Ảnh gốc I và ảnh chứa watermark I’
- Hệ số tương quan ∝ đã sử dụng khi nhúng watermark
Đầu ra: - Ảnh watermark
Thực hiện:
Trang 32a Sử dụng phép biến đổi sóng nhỏ hai chiều mức hai đối với ảnh gốc I và ảnh chứa watermark I’
b Từ kết quả phân tích trên, tính giá trị lệch giữa các điểm tương ứng thuộc các băng LL2, HH2 của ảnh chứa watermark và ảnh gốc rồi chia cho ∝ để được bit tương ứng thuộc ảnh watermark:
W’i,j = (V’i,j – Vi,j)/∝
- Đánh giá kết quả
Qua thử nghiệm, kỹ thuật watermark của Mehul R và Priti R cho kết quả watermark bền vững trước một nhóm các biến đổi thông thường đối với ảnh chứa watermark Watermark nhúng ở băng LL bền vững trước một nhóm các phép biến đổi, trong khi watermark nhúng ở băng HH lại bền vững trước một nhóm các biến đổi khác Điều đó thể hiện, watermark được nhúng ở các băng khác nhau thể hiện tính bền vững khác nhau trước các tấn công vào hệ watermark Như vậy, có thể sử dụng watermark nhúng vào tất cả các băng trong phép phân tích sóng nhỏ để có thể tìm được sự bền vững ở ít nhất một trong các băng trước các tấn công hoặc có thể xây dựng một phương pháp nhúng kết hợp vào các băng để tìm một watermark tổng hợp từ các băng đã nhúng
Quá trình tách watermark ở đây được yêu cầu sử dụng cả ảnh gốc và ảnh chứa watermark
1.2.4.2 Kỹ thuật watermarking của Tao P và Eskicioglu A M
Trong kỹ thuật watermark của Tao P và Eskicioglu A.M., các tác giả đã tổng hợp từ một số ý tưởng đã được đề xuất trong một số bài báo trước đó Từ việc sử dụng phép biến đổi sóng nhỏ hai chiều để phân tích ảnh gốc thành các băng tần khác nhau, rồi nhúng tín hiệu watermark vào một hoặc một số các băng tần Theo cách đó, watermark có thể bền vững trước một số tấn công nhưng lại kém bền vững với một nhóm các tấn công khác Khắc phục nhược điểm trên, trong thuật toán, các tác giả đã nhúng tín hiệu watermark vào cả bốn băng tần trong phép phân tích sóng nhỏ, mỗi băng tần có thể sử dụng các hệ số khác nhau [12] Qua thử nghiệm cho thấy, trước hầu hết các phép biến đổi với ảnh chứa watermark, luôn tìm và tách ra được watermark ở ít nhất một băng tần có độ sai khác thấp so với watermark gốc
Quá trình nhúng watermark
Đầu vào: - Ảnh chứa I = (aij, 0≤i, j≤2n)
- Ảnh watermark là ảnh nhị phân, W = (wij∈{0, 1}, 0≤i, j≤n)
Đầu ra: - Ảnh chứa đã được nhúng watermark Iw
Trang 33Thực hiện:
a Thực hiện phép biến đổi sóng nhỏ DWT mức một phân tích ảnh chứa I
b Sửa các miền tần số Vij tương ứng với các băng LL, HL, LH, và HH:
Đầu ra: - Watermark là ảnh nhị phân W Thực hiện:
a Thực hiện phép biến đổi sóng nhỏ DWT mức một để phân tích ảnh gốc I và ảnh đã nhúng watermark (có thể đã qua xử lý) Iw*
hệ số dựa trên những cơ sở nào cũng cần được tiếp tục nghiên cứu để có thể đưa ra cơ
sở khoa học cho việc lựa chọn các hệ số phù hợp cho từng bức ảnh gốc và watermark
cụ thể
Đa số các lược đồ watermark sử dụng phép biến đổi sóng nhỏ thì băng LL chưa được sửa đổi, vì điều đó gây ảnh hưởng về chất lượng của ảnh sau khi nhúng watermark Trong cách làm này, tuy watermark được nhúng vào cả bốn băng nhưng giá trị PSNR cho thấy chất lượng của ảnh sau khi nhúng watermark là chấp nhận được Quá trình tách watermark ở đây được yêu cầu sử dụng cả ảnh gốc và ảnh chứa watermark
Trang 341.2.5 Watermarking trên video bằng biến đổi DWT – DCT
Đa số các phương pháp watermarking sử dụng các biến đổi DWT hay DCT độc lập đều cần đến ảnh gốc hoặc ảnh dùng làm watermark để trích xuất lại thông tin Cách làm này gần như không khả thi cho một ứng dụng thực tế xét về nhiều phương diện như tính hiệu quả, tính kinh tế, Một ví dụ đơn giản để thấy cách làm này không hiệu quả là: Khi cần xác nhận một đoạn video để chứng minh đó là video bản quyền của đài THVL, chúng ta không thể mang toàn bộ video lưu trữ ra chỉ để làm “đầu vào” so sánh với video tranh chấp để dò tìm watermark
Tác giả M.Vara Lakshmi1 và P.Krishna [9] đã đề xuất một phương pháp có tính thực tế hơn, có thể trích xuất watermark mà không cần đến dữ liệu gốc để so sánh
Bằng cách kết hợp 2 biến đổi DWT và DCT trong giải thuật, giúp đưa ảnh watermark nhị phân được nhúng vào trong khối 4x4 Khi cần trích xuất, dựa vào dữ liệu đã được nhúng trước đó trích xuất thành ảnh nhị phân
Hình 1.9 Sơ đồ giải thuật để nhúng watermark vào video
Trang 35Bước 1: Tách video V cần nhúng watermark ra thành từng frames hình
Mỗi frames hình tương đương 1 ảnh màu RGB
Bước 2: Frame hình C sẽ được xử lý, tách ra thành 3 kênh tương ứng với 3
màu Đỏ (R), xanh lá (G), xanh dương (B)
Bước 3: Áp dụng biến đổi DWT trên kênh B, ta thu được bốn băng con là
LL, HL, LH, HH Lý do chọn kênh B để áp dụng biến đổi DWT là vì kênh B ít gây nhạy cảm với mắt, điều này giúp cho thuật toán thêm mạnh và tăng tính ẩn của watermark
Bước 4: Áp dụng biến đổi DWT lần nữa trên băng con HL để thu về bốn
băng con nhỏ hơn là LL2, HL2, LH2, HH2
Bước 5: Chia nhỏ băng con HL2 thành các khối nhỏ kích thước 4x4 không
trùng lập
Bước 6: Áp dụng biến đổi DCT cho tất cả khối nhỏ 4x4 ở bước 5
Bước 7: Chuyển đổi hình ảnh watermark w thành dạng nhị phân
Bước 8: Số bit có thể được nhúng tương ứng với số khối trong kênh B Các
bit được nhúng vào miền tần số trung bình của khối 4X4 dựa trên kích thước hình ảnh
Bước 9: Lặp lại bước 8 cho tất cả các bit của watermark
Bước 10: Áp dụng nghịch đảo biến đổi DCT cho tất cả khác khối
Bước 11: Áp dụng IDWT 2 cấp độ thu được kênh B’ đã nhúng watermark Bước 12: Kết hợp kênh R, G và kênh B’ để có được watermarked hình ảnh
'WI'
Bước 13: Lặp lại bước 2 đến bước 12 cho tất cả các frames hình trong
video V Ta thu được video đã nhúng watermark V’
Trang 36Giải thuật trích xuất
Đầu vào: - Video đã được nhúng watermark V’
Đầu ra: - Ảnh nhị phân watermark đã nhúng
Bước 1: Tách video V’ ra thành từng frame hình Các frames hình ‘WI’ này
đã được nhúng watermark
Bước 2: Tách các kênh R, G và B của hình ảnh watermark 'WI'
Bước 3: Áp dụng DWT trên kênh B để thu được các băng con LL1, HL1,
Bước 6: Áp dụng biến đổi DCT cho các khối 4x4 ở bước 5
Bước 7: Các bit đánh dấu watermark được tách ra từ miền trung bình của
khối 4x4 và lặp lại quá trình này cho đến khi khai thác tất cả các bit từ tất cả các khối 4x4
Bước 8: Sau đó áp dụng IDCT cho tất cả các khối 4X4 để lấy hình ảnh
Các thuật toán watermarking dựa vào phép biến đổi trên miền tần số có ưu điểm trước một số phương pháp tấn công Bằng việc kết hợp giữa hai phép biến đổi DWT
và DCT tạo ra được một phương pháp watermarking bền vững trước các tấn công, vừa
có thể trích xuất lại hình ảnh watermark đã nhúng khi cần thiết mà không phải dùng đến ảnh gốc để so sánh
Trang 37CHƯƠNG 2 XÂY DỰNG ỨNG DỤNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN
VIDEO CHO ĐÀI THVL
Để xây dựng ứng dụng quản lý và bảo vệ bản quyền video cho đài THVL, chúng
ta cần lựa chọn một mô hình thích hợp vừa đảm bảo hiệu quả cao, vừa phù hợp với thực tế hoạt động của đơn vị Nội dung chương 2 sẽ trình bày các mô hình quản lý video được sử dụng rộng rãi trên thế giới, từ đó đề xuất một mô hình phù hợp với Đài THVL
2.1 MÔ TẢ BÀI TOÁN VỀ QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU VIDEO TẠI ĐÀI PTTH VĨNH LONG
Đài THVL hiện có 12 phòng, một trung tâm và một công ty trực thuộc Đài Trong đó có đến 8 phòng chuyên môn làm nội dung, và liên quan đến dữ liệu video Quá trình thực hiện một sản phẩm video là sự phối hợp giữa các phòng chuyên môn với nhau Quy trình được thực hiện như sau:
Đầu vào bao gồm dữ liệu video được quay từ quay phim, và các nguồn video khác như video clip ca nhạc, hoặc phim truyện được mua bản quyền Kỹ thuật dựng phim chịu trách nhiệm cùng biên tập, và đạo diễn dựng thành tác phẩm hoàn chỉnh từ dữ liệu video do quay phim quay
Tác phẩm sau khi hoàn thành, được gửi đến ban biên tập (trưởng phó phòng) để xét duyệt về nội dung cũng như hình ảnh Nếu được duyệt, tập tin video sẽ được đưa vào dữ liệu trên sever lưu trữ
Dựa vào lịch phát sóng hàng ngày, kỹ thuật viên phát hình sẽ truy xuất tập tin video đã được duyệt tương ứng để thực hiện việc phát sóng Các kỹ thuật viên website cũng thực hiện quá trình lấy tập tin video đã duyệt để tải lên internet
Tập tin sau khi phát sóng được đưa về lưu trữ trong một server dữ liệu khác Những tập tin này sẽ được sử dụng làm tư liệu khi cần thiết hoặc làm đối chiếu khi có phát sinh tình huống tranh cãi về thời lượng quảng cáo, nội dung quảng cáo, nội dung phản ánh chưa đúng thực tế, …
Cách thức quản lý hiện tại chưa hiệu quả do còn tổ chức lưu trữ theo dạng tập tin
và thư mục, nên khi cần thiết rất khó tìm kiếm ra một video phù hợp Thêm vào đó, phần bản quyền dữ liệu video cũng chưa được chú trọng, khi cho tải lên internet các
Trang 38video chưa được bảo vệ Việc người dùng internet lấy video của Đài THVL để đăng tải lại ồ ạt trong thời gian qua là một ví dụ cụ thể
Do đó, cần xây dựng một ứng dụng vừa giúp quản lý video một cách toàn diện, vừa thực hiện được việc tìm kiếm theo từ khóa các video phù hợp, cũng như nhúng vào video nội dung bản quyền để làm căn cứ xác định khi cần thiết Từ những yêu cầu đặt ra, việc giải quyết bài toán về quản lý và bảo vệ bản quyền video của đài THVL sẽ được nghiên cứu và xây dựng trong nội dung của luận văn này
2.2 LỰA CHỌN MÔ HÌNH
Đài truyền hình Vĩnh Long hiện nay là nơi tập trung số lượng video lớn, nên cần một giải pháp tổng thể, vừa quản lý được số lượng lớn tập tin video, vừa giải quyết được vấn đề bản quyền, việc sao chép bất hợp pháp tập tin video để phát tán
Để giải quyết bài toán quản lý và bảo vệ bản quyền video cho Đài THVL, chúng
ta cần tìm một mô hình quản lý phù hợp và một phương pháp bảo vệ bản quyền tập tin video hiệu quả
2.2.1 Các mô hình quản lý bản quyền số
2.2.1.1 Kiến trúc chung
Một hệ thống quản lý bản quyền số gồm các thành phần cơ bản sau: nhà cung cấp nội dung, các kênh phân phối nội dung, máy chủ bản quyền, trung tâm xác thực, phần mềm trình diễn (player), người dùng và các tập tin đa phương tiện
Hình 2.1 Kiến trúc hệ thống quản lý bản quyền số