So với các kỹ thuật nén sử dụng phép biến đổi trước đây như biến đổi Fourier FT, biến đổi cosine rời rạc DCT, v.v., biến đổi Wavelet rời rạc DWT có nhiều ưu điểm không chỉ trong xử lý ản
Trang 1ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS NGÔ QUỐC TẠO
Thái Nguyên - 2010
Trang 2LỜI CẢM ƠN
Em xin trân trọng cảm ơn các thầy giáo, cô giáo trong Viện Công nghệ thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên đã nhiệt tình giảng dạy và hết lòng giúp đỡ em trong quá trình học tập và nghiên cứu đề tài Luận văn được hoàn thành tại Khoa Công nghệ thông tin dưới sự hướng
dẫn của PGS.TS Ngô Quốc Tạo Em xin bày tỏ lòng kính trọng và biết ơn sâu
sắc tới thầy
Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K7 Khoa Công nghệ thông tin đã cổ vũ, động viên em trong suốt thời gian học tập và thực hiện đề tài
Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu sót, em mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn
Xin chân thành cảm ơn!
Thái Nguyên, tháng 11 năm 2010
Học viên
Phạm Nghĩa Luân
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Tìm hiểu mô hình nén ảnh sử dụng biến đổi WAVELET” là do tôi tự tìm hiểu và được hoàn thành dưới sự hướng dẫn
của thầy giáo PGS TS Ngô Quốc Tạo
Trang 4i
MỤC LỤC
Trang
Trang phụ bìa
Trang nhiệm vụ
Mục lục i
Danh mục các ký hiệu, các chữ viết tắt iii
Danh mục các bảng iv
Danh mục các hình vẽ, đồ thị v
MỞ ĐẦU 1
Chương 1 3
TỔNG QUAN VỀ BIẾN ĐỔI WAVELET 3
1.1 Tại sao sử dụng biến đổi Wavelet ? 3
1.2 Mã hoá băng con (Subband coding) 4
1.3 Biến đổi Wavelet (Wavelet transform) 7
1.3.1 Biến đổi Wavelet rời rạc (Discrete Wavelet transform – DWT) 9
1.3.2 Biểu diễn đa phân giải (Multiresolution) 10
1.3.3 Biến đổi Wavelet và các bộ lọc 14
1.3.4 Hệ thống biến đổi Wavelet nhiều chiều 15
1.3.5 Thiết kế bộ lọc Wavelet 16
1.4 Tính chất của biến đổi Wavelet 21
1.5 Một số ứng dụng nổi bật của Wavelet 22
1.5.1 Nén tín hiệu 22
1.5.2 Lọc nhiễu 22
1.5.3 Phát hiện biên 22
Chương 2 23
MỘT SỐ DẠNG CỦA BIẾN ĐỔI WAVELET 23
2.1 Biến đổi Wavelet Haar 23
2.2 Biến đổi Wavelet Meyer 24
2.3 Biến đổi Wavelet Daubechies 25
Chương 3 27
BIẾN ĐỔI WAVELET TRONG NÉN ẢNH 27
Trang 5ii
3.1 Tổng quan về nén ảnh 27
3.1.1 Giới thiệu chung về nén ảnh 27
3.1.2 Phân loại các kỹ thuật nén 28
3.1.3 Tiêu chuẩn đánh giá chất lượng mã hoá ảnh 29
3.2 Mã hóa của ảnh con Wavelet (Coding of the Wavelet subimages) 30
3.2.1 Lượng tử hóa xấp xỉ kế tiếp (Quantization by successive approximation) 31
3.2.2 Những điểm giống nhau giữa các băng tần 32
3.3 Thuật toán EZW (Embedded zero tree Wavelet algorithm) 34
3.3.1 Thuật toán 34
3.3.2 Phân tích thuật toán 36
3.4 Phương pháp mã hoá phân cấp theo vùng (Set partitioning in hierarchical trees - SPIHT) 38
3.5 Mã hoá nhúng khối với cắt xén tối ưu hóa (Embedded block coding with optimised truncation - EBCOT) 44
3.5.1 Lượng tử hoá mặt phẳng bit (Bit plane quantisation) 47
3.5.2 Điều kiện số học mã hóa của mặt phẳng bit (mã hóa bậc 1) 48
3.5.3 Mã hóa phân đoạn mặt phẳng bit (Fractional bit plane coding) 50
3.5.4 Sự hình thành tầng (layer) và tổ chức dòng bit (mã hoá bậc 2) 59
3.5.5 Điều chỉnh tỷ lệ (Rate control) 60
Chương 4 62
CHƯƠNG TRÌNH MINH HỌA 62
4.1 Nén ảnh sử dụng biến đổi Wavelet 62
KẾT LUẬN 65
TÀI LIỆU THAM KHẢO 66
Trang 6iii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
(Embedded block coding with optimised truncation)
(Joint Photographic Experts Group)
JPEG2000 Chuẩn nén ảnh JPEG2000
Một tính năng mới nổi bật của JPEG2000
(Short Time FourierTransform)
Trang 7iv
DANH MỤC CÁC BẢNG
Bảng 1.1 Bộ lọc phân tích thông thấp và thông cao của bộ lọc song trực giao
số nguyên (5, 3) 18Bảng 1.2 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 3) lọc song trực giao 19Bảng 1.3 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 7) lọc song trực giao 19Bảng 3.1 Phân công chín bối cảnh dựa trên ý nghĩa khu vực lân cận 53
Trang 8v
DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Một dải của bộ lọc lấy dải 4
Hình 1.2 Hai dải của một bộ lọc phân tích 5
Hình 1.3 Hai dải của một bộ mã hoá / giải mã băng con 5
Hình 1.4a Sự tạo thành và phục hồi băng con thông thấp 6
Hình 1.4b Sự tạo thành và phục hồi băng con thông cao 7
Hình 1.5 Sự ảnh hưởng của các tham số lên sóng mẹ 8
Hình 1.6 Đa phân giải không gian 11
Hình 1.7 (a) Hàm tỷ lệ Haar (b) Wavelet Haar (c) Xấp xỉ của một hàm liên tục x(t) ở độ phân giải thô A0x(t) (d) Độ phân giải xấp xỉ cao A1x(t) 13
Hình 1.8 Một trong những giai đoạn biến đổi Wavelet 15
Hình 1.9 Biến đổi Wavelet nhiều dải mã hóa bằng cách sử dụng lặp đi lặp lại chia tách hai dải 16
Hình 1.10 (a) Bảy subimages tạo ra bởi các bộ mã hóa của hình 1.9 20
Hình 2.1 Hàm ψ (t ) của biến đổi Haar 23
Hình 2.2 Biến đổi Fourier của hàm tỉ lệ cho cở sở Meyer 24
Hình 2.3 Hàm ψ (t ) của biến đổi Meyer 25
Hình 2.4 Hàm ψ (t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8 26
Hình 3.1 Sơ đồ khối một hệ thống nén ảnh điển hình Error! Bookmark not defined. Hình 3.2 Nguyên tắc của xấp xỉ kế tiếp 31
Hình 3.3 Cây tứ phân biểu diễn của các băng tần cùng một hướng 33
Hình 3.4 Cây không gian định hướng và thiết lập phân vùng trong SPIHT 40 Hình 3.5 Lượng tử hoá miền không thay đổi với kích thước bước Δb 47
Hình 3.6 Tám biểu tượng lân cận tức thời 49
Hình 3.7 Dải lấy mẫu thứ tự trong một khối mã 49
Trang 9vi
Hình 3.8 Tác động của thứ tự mã hoá phân đoạn mặt phẳng bit trong giảm
biến dạng 51
Hình 3.9 Tỷ lệ biến dạng với phân đoạn tối ƣu 52
Hình 3.10 Một minh hoạ của mã hóa phân đoạn mặt phẳng bit 57
Hình 3.11 Hiệu suất nén của các thuật toán mã hóa Wavelet khác nhau 61
Hình 4.1 Lựa chọn file ảnh dạng bitmap 62
Hình 4.2 Kết quả sau khi nén sử dụng biến đổi Wavelet 63
Hình 4.3 Lựa chọn file giải nén 63
Hình 4.4 Kết quả sau khi giải nén 64
Trang 101
MỞ ĐẦU
Sự phân tích biến đổi Wavalet bắt đầu từ giữa những năm 80, vào thời điểm này chúng được phát triển để dò các tín hiệu địa chấn Tầm quan trọng của phép phân tích Wavelet duy trì trong phạm vi nhỏ, chủ yếu trong cộng đồng toán học vào cuối những năm 80 Ứng dụng của sự phân tích phép biến đổi Wavelet trong khoa học và trong các công trình thực sự bắt đầu từ những năm đầu của thập niên 90
Biến đổi Wavelet (Wavelet transform) được cung cấp để đặc biệt dùng cho việc phân tích tín hiệu, nhất là những tín hiệu không theo chu kì, nhiễu,
gián đoạn, nhất thời, v.v Biến đổi Wavelet được dùng trong nhiều ứng dụng
Trong xử lý ảnh, nó có thể được ứng dụng trong khử nhiễu, nén ảnh, phân tích không gian tần của ảnh, v.v
Cùng với sự phát triển mạnh mẽ của máy tính và sự ra đời của Internet, việc tìm một phương pháp nén ảnh để giảm bớt không gian lưu trữ thông tin
và truyền thông tin trên mạng nhanh chóng đang là một yêu cầu cần thiết Trong những năm gần đây, có rất nhiều phương pháp đã và đang được nghiên cứu rộng rãi để thực hiện nén ảnh Tất cả đều với một mục đích chung là làm thế nào để biểu diễn một ảnh với ít bit nhất để có thể tối thiểu hoá dung lượng kênh truyền và không gian lưu trữ trong khi vẫn giữ được tính trung thực của ảnh Điều này tương đương với việc biểu diễn ảnh có độ tin cậy cao nhất với
số bit nhỏ nhất
Đề tài này trình bày kỹ thuật nén ảnh và khử nhiễu sử dụng biến đổi Wavelet cho ảnh tĩnh So với các kỹ thuật nén sử dụng phép biến đổi trước đây như biến đổi Fourier (FT), biến đổi cosine rời rạc (DCT), v.v., biến đổi Wavelet rời rạc (DWT) có nhiều ưu điểm không chỉ trong xử lý ảnh mà còn nhiều ứng dụng khác Bằng chứng là sự ra đời của chuẩn nén JPEG2000 (dựa trên DWT) có tính năng vượt trội so với JPEG (dựa trên DCT)
Trang 112
Luận văn gồm có 4 chương với các nội dung sau:
Chương 1: Trình bày cơ sở toán học của phép biến đổi Wavelet, trong
đó đề cập đến mã hóa băng con, biến đổi Wavelet rời rạc với cách tiếp cận phân tích đa phân giải Đề cập đến cách thiết kế bộ lọc Wavelet, trình bày những tích chất cơ bản của phép biến đổi Wavelet, đồng thời nêu ra một số ứng dụng nổi bật của Wavelet như nén tín hiệu, lọc nhiễu…
Chương 2: Chương này đã giới thiệu một số họ của biến đổi Wavelet Đặc biệt họ Wavelet Daubechies - họ biến đổi Wavelet áp dụng trong JPEG2000
Chương 3: Trình bày cụ thể biến đổi Wavelet trong nén ảnh Trước hết trình bày tổng quan về nén ảnh và các kỹ thuật nén ảnh, mã hóa Wavelet ảnh con Giới thiệu các thuật toán như thuật toán EZW, SPIHT, mã hóa EBCOT
Chương 4: Chương trình minh họa
Luận văn đã đạt được một số kết quả nhưng cũng không tránh khỏi những sai sót Rất mong nhận được sự đóng góp ý kiến của các thầy cô, bạn bè và các bạn đồng nghiệp để đề tài được hoàn thiện hơn nữa
Trang 123
Chương 1 TỔNG QUAN VỀ BIẾN ĐỔI WAVELET 1.1 Tại sao sử dụng biến đổi Wavelet ?
Trước khi giới thiệu về biến đổi Wavelet và ứng dụng của nó trong nén ảnh, có thể đặt ra 2 câu hỏi:
- Có điểm gì chưa hợp lý khi sử dụng DCT không? và tại sao sử dụng biến đổi Wavelet?
- Nếu Wavelet là tốt hơn DCT, tại sao các phương pháp nén ảnh trước đây (JPEG) không sử dụng?
Câu trả lời cho phần đầu tiên là như sau:
Biến đổi DCT và các biến đổi theo khối khác chia ảnh thành những khối không chồng nhau và xử lý mỗi khối riêng rẽ Để có được tỷ lệ bit thấp, các hệ số của biến đổi được lượng tử hóa, như vậy sẽ có một lỗi đáng kể khi khôi phục lại ảnh ban đầu Lỗi khi khôi phục này thấy rõ hơn tại biên của mỗi khối (vì các khối được biến đổi độc lập) Để khắc phục lỗi này, người ta còn
đề cập tới việc sử dụng khối chồng lên nhau (khối giả) Tuy nhiên, biến đổi Wavelet là cách tiếp cận khác và đã dự kiến sẽ loại bỏ việc sử dụng khối giả
Câu trả lời cho phần thứ hai liên quan đến công nghệ được dùng cho nén ảnh ở thập niên 1980, thời điểm một số phương pháp nén ảnh được giới thiệu (JPEG) Tại thời điểm này, mặc dù biến đổi Wavelet và mã hoá băng con đã được biết đến, tuy nhiên, chưa có phương pháp mã hóa hiệu quả của biến đổi Wavelet Trong thực tế, các kiến nghị về sử dụng biến đổi Wavelet chưa được đề cập tới, do đó, biến đổi DCT được sử dụng trong nén ảnh
Tuy nhiên, sau sự ra đời của một số chuẩn nén JPEG, việc nghiên cứu
và sử dụng biến đổi Wavelet được đề cập tới Đặc biệt, sau khi Jussef Shapiro
giới thiệu Embedded zero tree Wavelet - EZW Trong chương này, chúng tôi
đề cập tới biến đổi Wavelet và sự hiệu quả của biến đổi này trong nén ảnh
Trang 134
1.2 Mã hoá băng con (Subband coding)
Trước khi xem xét biến đổi Wavelet, chúng ta tìm hiểu về mã hóa băng con Về mặt hình dáng, biến đổi Wavelet và mã hóa băng con tương tự nhau Tuy nhiên, mã hóa băng con là giải thuật, còn biến đổi Wavelet được giới thiệu dạng toán học
Mã hóa băng con lần đầu tiên được Crochiere giới thiệu vào năm 1976 Đây là kỹ thuật tốt cho nén tiếng nói và ảnh Nguyên tắc cơ bản của mã hóa băng con là chia phổ tín hiệu thành nhiều đoạn, sau đó mã hóa và truyền mỗi đoạn đó một cách độc lập Nguyên tắc này phù hợp với mã hóa hình ảnh Thứ nhất, với ảnh số, phổ của chúng không đều, phần lớn năng lượng được tập trung ở dải tần số thấp hơn Thứ hai, con người cảm nhận về nhiễu có xu hướng ở cả hai tần số cao và thấp và điều này cho phép các nhà thiết kế điều chỉnh dạng nén theo tiêu chí thị giác Thứ ba, có thể chia nhỏ ảnh thành khối, cấu trúc khối không thay đổi, do đó có thể sử dụng bộ biến đổi sang không gian tần như DCT
Trong mã hoá băng con, dải tần được tách bằng bộ lọc dải, minh họa trong hình 1.1 Bộ lọc được thiết kế dựa trên sự cảm nhận hình ảnh của mắt
người
Hình 1.1 Một dải của bộ lọc lấy dải
Trang 145
Với cách tiếp cận này, ảnh được chia thành nhiều khối nhỏ Các khối này được lượng tử hóa, mã hóa và truyền đi Quá trình khôi phục ảnh được thực hiện khi nhận được các khối trên, thông qua bộ lọc tổng hợp Hình 1.2 là
ví dụ về bộ lọc có 2 dải
Hình 1.2 Hai dải của một bộ lọc phân tích Như vậy, quá trình mã hóa / giải mã sử dụng 2 dải được minh họa trong
hình 1.3 Trong sơ đồ này, bộ lọc H 0 (z) và H 1 (z) của biến đổi z, tương ứng
với bộ lọc thông thấp và thông cao Bộ lọc G 0 (z) và G 1 (z) là các bộ lọc tổng
hợp tương ứng
Hình 1.3 Hai dải của một bộ mã hoá / giải mã băng con
Tại các bộ mã hóa, phép lấy mẫu giảm xuống 2 lần, phần còn lại được
sử dụng như trình tự ban đầu Hiệu quả của việc lấy mẫu xuống/ nén trên
Trang 15Tuy nhiên, vấn đề khó khăn của phương pháp là khó xây dựng bộ lọc lý tưởng phân tích vị trí cắt hợp lý Điều này được thể hiện trong hình 1.4a Một tín hiệu cho thấy mẫu gốc đã được bộ lọc lấy thông thấp để năng lượng một
số vẫn còn ở trên F s / 4, tần số cắt của bộ lọc lý tưởng cho các nhiệm vụ đề ra
Lấy mẫu xuống nén tín hiệu và mở rộng để cung cấp cho B, và C là hình ảnh
sau khi giãn nở hoặc lấy mẫu lên Cũng như tại bội số của F s , quá trình này
tạo ra các thành phần phổ bổ sung tại bội số lẻ của F s / 2 Những sai số lấy
mẫu gây ra khi việc phục hồi phân giải cuối cùng diễn ra tại D
Hình 1.4a Sự tạo thành và phục hồi băng con thông thấp
Trang 167
Trong trường hợp thông cao, hình 1.4b, các hiện tượng tương tự xảy ra,
ảnh đầu ra cuối cùng được tạo ra bằng cách thêm phần giải thông thấp hơn và thông cao cho quá trình hình thành và phục hồi dữ liệu của bộ lọc có liên quan Năng lượng sai số lấy mẫu thường được dự kiến sẽ gây nhiễu
Hình 1.4b Sự tạo thành và phục hồi băng con thông cao
1.3 Biến đổi Wavelet (Wavelet transform)
Biến đổi Wavelet là một trường hợp đặc biệt của mã hoá băng con, biến đổi này được sử dụng nhiều trong nén ảnh và video Mã hóa băng con cho ảnh được dựa trên phân tích tần số, còn các biến đổi Wavelet được dựa trên lý thuyết xấp xỉ Tuy nhiên, để làm trơn cục bộ có thể mô hình hóa như đa thức trên từng khúc Trong thực tế, Wavelet cung cấp một phương pháp hiệu quả
để xấp xỉ các hàm với một số lượng nhỏ các hàm cơ sở Về mặt toán học, một
Trang 17Trong đó Ψa, b (t) được gọi là hàm cơ sở, a là tham số co dãn, b là tham
số dịch Ψ (t) được gọi là sóng mẹ (mother Wavelet ) và được định nghĩa:
a
1
Ảnh hưởng của các tham số được thể hiện trong hình 1.5
Hình 1.5 Sự ảnh hưởng của các tham số lên sóng mẹ
Trong hình 1.5: (a) Wavelet mẹ Ψ (t) = Ψ1, 0 (t), a = 1, b = 0
(b) Wavelet Ψ1, b (t), a = 1, b ≠ 0
(c) Wavelet Ψ 2,0 (t) ở tỷ lệ a = 2, b = 0
(d) Wavelet Ψ 0.5,0 (t) ở tỷ lệ a = 1 / 2, b = 0
Với tham số a khác nhau, chiều rộng của các hàm cơ sở khác nhau Với
a lớn sẽ mở rộng phạm vi của hàm cơ sở trong miền thời gian và vì thế hẹp
hơn trong miền tần số Do đó nó cho phép thay đổi theo thời gian và độ phân
Trang 189
giải tần số (với sự cân bằng giữa cả hai) trong biến đổi Wavelet Tham số a là
thuộc tính của biến đổi Wavelet làm cho nó thích hợp với việc phân tích các tín hiệu có kích cỡ đường biên khác nhau như trong hình ảnh tự nhiên
1.3.1 Biến đổi Wavelet rời rạc (Discrete Wavelet transform – DWT)
Như định nghĩa biến đổi Wavelet trong (1.11) ánh xạ tín hiệu một chiều
x (t) vào một hàm hai chiều X w (a, b) và những tín hiệu ban đầu có thể được
phục hồi từ tính toán biến đổi Wavelet trên giá trị rời rạc của a và b a có thể
được thực hiện rời rạc bằng cách chọn a a0m , với a 0 > 1 và m là một số
nguyên Tăng a lên, băng thông của các hàm cơ sở (hoặc độ phân giải tần số)
giảm và vì thế độ phân giải các ô là cần thiết hơn để bao phủ khu vực Tương
tự như vậy, làm rời rạc b tương ứng với mẫu trong thời gian (lấy mẫu tần số
phụ thuộc vào băng thông của tín hiệu được lấy mẫu đó lần lượt là tỷ lệ
nghịch với a), nó có thể được chọn b nb0a0m Đối với a 0 = 2 và b 0 = 1 có
những sự lựa chọn của Ψ(t) sao cho hàm Ψ m, n (t) tạo thành một cơ sở trực
giao của không gian của các hàm bình phương khả tích Có nghĩa là bất kỳ
hàm bình phương khả tích x (t) có thể được biểu diễn như là một sự kết hợp
tuyến tính của hàm cơ sở như:
t t
Đáng lưu ý là cho mỗi lần tăng m, giá trị của a gấp đôi Tức là tăng gấp
đôi chiều rộng trong miền thời gian và giảm một nửa chiều rộng ở miền tần
số Điều này tương đương cho phân tích tín hiệu với băng con bát phân và tương ứng với biến đổi Wavelet hai ngôi tương tự như trong hình 1.1, dùng để
Trang 1910
mô tả các nguyên tắc cơ bản của mã hóa băng con, và do đó biến đổi Wavelet
là một loại mã hóa băng con
1.3.2 Biểu diễn đa phân giải (Multiresolution)
Áp dụng biến đổi Wavelet để mã hóa hình ảnh tốt hơn có thể được hiểu
với quan điểm của phân tích tín hiệu đa phân giải Giả sử có một hàm Φ (t) sao cho xác lập Φ (t - n), n Z là trực giao Cũng giả sử Φ (t) là lời giải của
hai quy mô phương trình khác nhau:
t
Trong đó c n là hệ số giãn nở (expansion coefficient) và là hình chiếu
của x (t) vào Φ (t - n) Từ đó phép giãn của một hàm thay đổi độ phân giải của
nó, có thể biểu diễn cho x (t) tại các độ phân giải khác nhau bởi hệ số giãn nở
và hàm co Φ (t) Do đó x (t) tại bất kỳ độ phân giải m có thể được biểu như sau:
) 2
( 2
m
Nếu V m là không gian được tạo ra bởi 2 -m/2 Φ (2 -m
t - n), sau đó từ 1.15,
Φ (t) là như vậy với bất kỳ i > j, các hàm tạo ra không gian V i cũng nằm trong
V j , tức là V i V j (i> j) Vì vậy, không gian ở quy mô tiếp có thể được lồng
giải giảm Do đó, một không gian ở độ phân giải thô V j-1 có thể được khai
Trang 2011
triển thành hai không gian con (subspaces): một không gian ở độ phân giải tốt
hơn V j và một bù trực giao của V j , biểu diễn bởi W j sao cho V j + W j = V j-1
trong đó W jV j Không gian W j là không gian của sự khác biệt giữa thô và tỷ
lệ độ phân giải tốt hơn, có thể được xem như là lượng chi tiết thêm vào khi đi
từ một độ phân giải V j nhỏ hơn đến có độ phân giải lớn hơn V j-1 Việc phân cấp của không gian được mô tả trong hình 1.6
Hình 1.6 Đa phân giải không gian
dịch và phép giãn của một hàm mẫu nguyên đơn Ψ (t), gọi là một Wavelet
Vì vậy, W m là không gian được tạo ra bởi Ψm, n (t) = 2 -m/2 Ψ (2 -m t - n) Wavelet
n t c
t) ( 1) 2 (2 )
Hàm Φ (t) được gọi là hàm tỷ lệ (scaling function) của biểu diễn đa
phân giải Vì vậy, các hệ số của biến đổi Wavelet (1.14) tương ứng với phép
chiếu của x (t) vào một không gian chi tiết của độ phân giải m, W m Do đó, một biến đổi Wavelet về cơ bản là phân tích một tín hiệu vào không gian của
Trang 211)
1 , 0 2
11
2
10
1)(
t
t t
Hàm tỷ lệ Φ (t) (một một hàm rect) và Wavelet Haar tương ứng Ψ (t) ví
dụ này được thể hiện trong hình 1.7a và b Về quan điểm xấp xỉ, sự phân tích
đa phân giải có thể được giải thích như sau: Cho x (t) có thể xấp xỉ ở độ phân giải j bằng hàm A j x (t) qua loạt khai triển hàm trực giao cơ sở Từ W j biểu
diễn cho không gian của sự khác biệt giữa một tỷ lệ thô V j-1 và một tỷ lệ trơn
V j , sau đó D j x (t) W j biểu diễn cho sự khác biệt của xấp xỉ của x (t) tại j-1
và độ phân giải j (tức là D j x (t) = A j-1 x (t) - A j x (t))
Trang 22()
Hình 1.7c và d hiển thị xấp xỉ của một hàm liên tục tại hai độ phân giải
liên tiếp sử dụng một hàm tỷ lệ hình chữ nhật Một khối thô A 0 x (t) đƣợc hiển
thị trong hình 1.7c và ở độ phân giải xấp xỉ cao A 1 x (t) trong hình 1.7d nơi mà
các hàm tỷ lệ là một phiên bản phóng rộng (giãn nở) của hàm hình chữ nhật
Đối với một hàm trơn x (t), phần lớn các biến thể (tín hiệu năng lƣợng) đƣợc chứa trong A 0 x (t), và D 0 x (t) là gần nhƣ bằng không Bằng cách lặp lại thủ
tục này chia tách và phân vùng A 0 x (t) = A 1 x (t) + D 1 X (t), biến đổi Wavelet
của tín hiệu x (t) có thể đƣợc lấy và do đó hàm gốc x (t) có thể đƣợc biểu diễn
về Wavelet của nó nhƣ là:
)()
(
)()
()
()
Trang 2314
1.3.3 Biến đổi Wavelet và các bộ lọc
Đối với thủ tục chia tách lặp mô tả ở trên được thực hiện nên có một
thuật toán hiệu quả cho việc thu thập D j x (t) từ việc khai triển hệ số ban đầu
của x (t) Một trong những hậu quả của phân vùng không gian đa phân giải là
n n
n n
n n
n t d
t
n t d
t
n t c
t
n t c
t
)2(2)
(
)2(2)
(
)2(2)
(
)2(2)
(
(1.21)
Những hệ thức truy hồi cung cấp cách tính toán các hệ số xấp xỉ của
x(t) ở độ phân giải j, A j x (t), và các hệ số của tín hiệu chi tiết D j x (t) từ các hệ
số xấp xỉ của x (t) tại một độ phân giải cao A j-1 x (t) Trong thực tế, thao tác
toán học đơn giản có thể chỉ ra rằng cả hai hệ số xấp xỉ tại một độ phân giải tốt hơn và hệ số chi tiết có thể đạt được bằng xoắn (convolving) các hệ số xấp
xỉ tại một độ phân giải thô với một bộ lọc và lấy mẫu xuống bởi hệ số 2 Đối với một hệ số xấp xỉ độ phân giải thấp, bộ lọc là một bộ lọc thông thấp với
vòi (taps) h k =c -k , và cho các chi tiết lọc là một bộ lọc thông cao với vòi g k =d -k Ngược lại, tín hiệu ở độ phân giải cao có thể được phục hồi từ xấp xỉ của nó với độ phân giải thấp hơn và hệ số chi tiết của tín hiệu tương ứng Nó có thể được thực hiện bởi lấy mẫu lên các hệ số của xấp xỉ với độ phân giải thấp hơn
và các hệ số chi tiết của một hệ số 2, xoắn (convolving) chúng với các bộ lọc
Trang 2415
tổng hợp các vòi h k c k và g k d k tương ứng, và cộng chúng với nhau
Một bước của quá trình chia tách và nghịch đảo được thể hiện trong hình 1.8,
mà là trong thực tế, giống như hình 1.3 cho băng con Vì vậy, quá trình lọc chia tách các tín hiệu vào thành các thành phần thông thấp và thông cao và từ
đó làm tăng độ phân giải tần số của hệ số 2, nhưng lấy mẫu xuống làm giảm
độ phân giải theo thời gian (temporal) do yếu tố tương tự Do đó, tại mỗi bước
kế tiếp, tần số có độ phân giải tốt hơn ở độ phân giải theo thời gian là đạt được
Hình 1.8 Một trong những giai đoạn biến đổi Wavelet
(a) phân tích (b) tổng hợp
1.3.4 Hệ thống biến đổi Wavelet nhiều chiều
khái niệm về cấu trúc bộ lọc hai băng hình 1.8 trong mỗi phân đoạn Ví dụ, phân tách một hình ảnh hai chiều có thể được thực hiện bằng cách thực hiện phân tách một chiều theo hàng và sau đó theo cột
Một biến đổi Wavelet bảy dải mã hóa của loại này được minh họa trong hình 1.9, nơi chia tách dải được thực hiện luân phiên tại các hướng ngang và dọc Trong hình, L và H biểu diễn cho các bộ lọc phân tích thông thấp và thông cao với một lấy mẫu xuống 2:1, tương ứng Ở giai đoạn đầu tiên của phân tách nhị tố (dyadic), ba ảnh con (subimages) với nội dung tần số cao
đường dọc tần số chi tiết hình ảnh Đây là đảo ngược trong subimage HL1 Subimage HH1 cao ngang và cao dọc chi tiết hình ảnh Những chi tiết hình
Trang 2516
ảnh ở một tần số thấp hơn được đại diện bởi các băng LH2, HL2 và HH2 tương
hình ảnh ban đầu, nhưng ở một kích thước nhỏ hơn
Hình 1.9 Biến đổi Wavelet nhiều dải mã hóa bằng cách sử dụng lặp đi lặp lại
chia tách hai dải
1.3.5 Thiết kế bộ lọc Wavelet
Như chúng ta đã thấy trong phần 1.3.3, trong thực tế biến đổi Wavelet
có thể được thực hiện bởi một dãy các bộ lọc, tương tự như các băng con Quan hệ giữa phân tích và tổng hợp của tỷ lệ và hàm Wavelet cũng làm theo trong các bộ lọc tổng hợp và phân tích các băng con Do đó ta có thể sử dụng các khái niệm về các bộ lọc trong (1.7) để thiết kế bộ lọc Wavelet Tuy nhiên, nếu sử dụng bộ lọc sản phẩm như đã được sử dụng cho các băng con, ta không đạt được bất cứ điều gì mới Nhưng, nếu chúng ta thêm một số ràng buộc về bộ lọc sản phẩm, đó là thuộc tính của biến đổi Wavelet được duy trì, sau đó một bộ lọc Wavelet có thể được thiết kế
Trang 2617
Một trong những ràng buộc bắt buộc phải được trình bày trong bộ lọc
sản phẩm P(z) là bộ lọc kết quả H 0 (z) và H 1 (z) là liên tục do yêu cầu của định
nghĩa Wavelet
Hơn nữa, đó là đôi khi mong muốn có Wavelet với số lượng lớn nhất
có thể dẫn xuất liên tục Đặc tính này trong điều kiện của biến đổi z có nghĩa
là bộ lọc Wavelet và hậu thức bộ lọc sản phẩm nên có các điểm 0 (zeros) tại
z= -1 Kích thước hệ số của số dẫn xuất hoặc số các điểm 0 tại z = -1 là được
đưa ra bởi tính đều đặn (tính quy luật) của Wavelet và cũng được gọi là những khoảnh số triệt tiêu Điều này có nghĩa là để có bộ lọc chuẩn (regular
filters), bộ lọc phải có đủ số điểm 0 tại z = -1, lớn hơn số lượng các điểm 0,
trực giao (biorthogonal filters) Trong bộ lọc song trực giao, phân tích thông
thấp và tổng hợp thông cao là trực giao với nhau và tương tự các phân tích thông cao và tổng hợp thông thấp là trực giao với nhau, vì thế mà có tên bộ lọc song trực giao Lưu ý rằng, trong các bộ lọc song trực giao, từ đó thông thấp và thông cao của một trong hai bộ lọc phân tích hoặc tổng hợp có thể có
độ dài khác nhau, chúng không phải là bản thân trực giao với nhau
Vì vậy, cho một bộ lọc Wavelet có ít nhất n điểm 0 tại z = -1, ta chọn
bộ lọc sản phẩm được:
)()1()
Trang 2718
mà Q(z) có n không rõ hệ số Tùy thuộc vào sự lựa chọn của Q(z) và của
Wavelet đều đặn, ta có thể thiết kế một bộ lọc Wavelet nhƣ mong muốn Ví
dụ với:
n = 2 và Q(z) = -1 + 4z -1 - z -2
bộ lọc sản phẩm trở thành:
)4
1()1()(z z1 4 z1z2
và với một sự gán trọng số thích hợp cho trực chuẩn (orthonormality) và sau
đó phân tích, nó dẫn đến thiết đặt hai bộ (5, 3) và (4, 4) giàn bộ lọc của (1.10)
Hệ số gia trọng (weighting factor) đƣợc xác định từ (1.7) Các bộ lọc này đã
đƣợc xuất phát ban đầu cho băng con, nhƣng nhƣ ta thấy chúng cũng có thể đƣợc sử dụng cho Wavelet Bộ lọc đôi (5, 3) là bộ lọc đƣợc đề nghị cho mã hóa không tổn hao (lossless) trong JPEG 2000 Các hệ số của bộ lọc phân tích của nó đƣợc cho trong bảng 1.1
Bảng 1.1 Bộ lọc phân tích thông thấp và thông cao của bộ lọc song trực giao
3
386
1()1()(
63
386
1)(3
4 3 2
1 6
1
4 3 2
z z
z P
z z z
z z
Q vµ n
(1.24)
cặp (9,3) của bộ lọc Daubechies đƣợc đƣa ra trong Bảng 1.2 Các giàn lọc đƣợc đề nghị cho mã hóa ảnh tĩnh trong MPEG-4
Trang 28Bảng 1.3 Bộ lọc phân tích thông thấp và thông cao của Daubechies (9, 7) lọc
Trang 2920
nhánh 9 (nine-tap) thông thấp và phân nhánh 3 thông cao cặp bộ lọc phân tích Daubechies ( 9, 3), được đưa ra trong Bảng 1.2 Các bộ lọc này đã được đề nghị cho phép mã hoá ảnh tĩnh trong MPEG-4, mà đã được hiển thị để đạt được hiệu quả nén tốt
Hình 1.10 (a) Bảy subimages tạo ra bởi các bộ mã hóa của hình 1.9
(b) Bố trí của các băng riêng lẻ Hình ảnh ban đầu (không được hiển thị) kích thước là 352 điểm ảnh bởi
240 dòng Băng 1-4, tại hai cấp độ của các phân khu, được 88 bởi 60, và băng 5-7 là 176 bởi 120 điểm ảnh Tất cả các băng, nhưng băng 1 (LL2) đã được khuếch đại bởi một hệ số 4 và một độ lệch +128 để tăng cường khả năng hiển thị các mức chi tiết thấp Phạm vi cho nén băng thông phát sinh chủ yếu là từ các mức năng lượng thấp xuất hiện trong subimages thông cao
Từ đó tại biên ảnh của tất cả các điểm ảnh đầu vào không có giá trị, một phần mở rộng của các kết cấu đối xứng đầu vào được thực hiện trước khi
áp dụng biến đổi Wavelet ở mỗi mức Các loại đối xứng mở rộng có thể khác nhau Ví dụ như trong MPEG-4, để đáp ứng các điều kiện xây dựng lại hoàn hảo với Daubechies cặp bộ lọc phân tích (9, 3) tap, hai loại đối xứng mở rộng được sử dụng
Trang 3021
Loại A chỉ được sử dụng ở giai đoạn tổng hợp Nó được sử dụng ở giai đoạn mép đuôi (trailing edge) của lọc thông thấp và mép trước (leading edge) của lọc thông cao Nếu các điểm ảnh tại biên của các đối tượng được biểu
diễn bởi abcde, sau đó mở rộng loại A trở thành edcba | abcde, nơi mà các
ký tự trong kiểu chữ đậm là những điểm ảnh trên bản gốc và chúng ở trong mặt trơn là những điểm ảnh mở rộng Lưu ý rằng trong một cặp bộ lọc phân
tích (9,3) của bảng 1.2, các cặp bộ lọc tổng hợp sẽ được (3, 9) với G 0 (z)=H 1 (-z)
và G 1 (z)= -H 0 (-z) , như đã được thể hiện trong (1.4)
Loại B là phần mở rộng được sử dụng cho cả mép trước và mép đuôi của các bộ lọc phân tích thông thấp và thông cao Đối với các bộ lọc tổng hợp, nó được sử dụng tại mép trước của thông thấp, nhưng ở mép đuôi của thông cao Với loại mở rộng các điểm ảnh ở mép trước và trở thành mép đuôi
edcb | abcde và abcde | dcba, tương ứng
1.4 Tính chất của biến đổi Wavelet
Tất cả chúng ta đều biết rằng biến đổi Fourier là một biến đổi đã và
đang được áp dụng rộng rãi trong nhiều ngành khoa học và kỹ thuật khác
nhau Biến đổi Fourier chuyển một hàm tín hiệu từ miền thời gian sang miền tần số Sử dụng biến đổi Fourier ta có thể biết được trong tín hiệu f (t) có các thành phần tần số nào Tuy nhiên biến đổi Fourier có một nhược điểm cơ bản
là với một tín hiệu f (t) ta không thể biết được rằng tại một thời điểm t thì tín hiệu có các thành phần tần số nào Một phép biến đổi tốt hơn biến đổi Fourier phải là phép biến đổi có đầy đủ tính năng của biến đổi Fourier và có khả năng xác định xem tại một thời điểm t bất kỳ trong tín hiệu f (t ) có thành phần tần
số nào Phép biến đổi Wavelet ra đời đã khắc phục được các nhược điểm của biến đổi Fourier trong phân tích tín hiệu Biến đổi Wavelet dù chỉ làm việc
với các tín hiệu một chiều (liên tục hoặc rời rạc) nhưng sau khi biến đổi xong
ta thu được một hàm số hai biến hoặc một tập các cặp giá trị W(a,b) minh họa
Trang 3122
các thành phần tần số khác nhau của tín hiệu xảy ra tại thời điểm t Các giá trị
W(a i ,b ) tạo thành một cột (i=1, 2, , n) cho biết một thành phần tần số có
trong những thời điểm t nào và các giá trị W(a,b i ) tạo thành hàng cho biết tại
một thời điểm t của tín hiệu f (t ) có các thành phần tần số nào
1.5 Một số ứng dụng nổi bật của Wavelet
Phần này chỉ nêu ra các lĩnh vực mang tính chất tổng quát các ứng dụng của Wavelet với tính chất giới thiệu và gợi mở
1.5.1 Nén tín hiệu
Do đặc điểm của mình, Wavelet đặc biệt tốt khi sử dụng để nén hay phân tích các tín hiệu không dừng, đặc biệt là tín hiệu ảnh số và các ứng dụng nén tiếng nói, nén dữ liệu
1.5.2 Lọc nhiễu
Tính chất của biến đổi Wavelet mà chúng ta đã xét tới trong phần ứng dụng cho nén tín hiệu được mở rộng bởi Iain Johnstone và David Donohos trong các ứng dụng khử nhiễu cho tín hiệu Phương pháp lọc nhiễu này được gọi là Wavelet Shrinkage Denoising (WSD)
1.5.3 Phát hiện biên
Biên của ảnh được có thể được định nghĩa một cách toán học như là những điểm khác biệt cục bộ Gần đây, biến đổi Fourier được xem là công cụ toán học chính để phân tích những điểm khác biệt này Tuy nhiên chuyển đổi Fourier là toàn cục và không thích nghi tốt với những sự khác biệt cục bộ này Thật là khó để tìm thấy vị trí và phân bố không gian của những điểm khác biệt với biến đổi Fourier Wavelet là một phân tích cục bộ, nó thích ứng cho việc phân tích tín hiệu trong miền tần số - thời gian, cái mà cần thiết cho việc phát hiện những điểm biên
Trang 3223
Chương 2 MỘT SỐ DẠNG CỦA BIẾN ĐỔI WAVELET 2.1 Biến đổi Wavelet Haar
Biến đổi Haar Wavelet là biến đổi đơn giản nhất trong các phép biến đổi Wavelet Hình vẽ 1.7 cho thấy dạng của hàm ψ (t ) với biến đổi Haar Do tính chất đơn giản của biến đổi Haar mà nó được ứng dụng tương đối nhiều trong nén ảnh, khi áp dụng biến đổi này để nén ảnh thì thuật toán nén ảnh trên
máy tính có một số điểm khác với công thức toán học của biến đổi Haar:
Hàm (t) là hàm thoả mãn điều kiện sau:
10
nÕu1
)
Nếu chúng ta định nghĩa hàm (t) ( 2t) ( 2t 1 ), chúng ta sẽ nhận được hàm sau:
12
/1nÕu1
2/10
nÕu1
( 2 )
n t
n
Hàm Haar là hàm Wavelet cơ bản nhất
Hình 2.1 Hàm ψ (t ) của biến đổi Haar
Trang 3324
2.2 Biến đổi Wavelet Meyer
Yves Meyer là một trong những nhà khoa học đã đặt nền móng cho phép biến đổi Wavelet Phép biến đổi Wavelet mang tên Meyer cũng là phép biến đổi thông dụng, biến đổi này có khả năng phân tích tín hiệu tốt hơn nhiều
so với biến đổi Haar
Yves Meyer cấu trúc cơ sở Wavelet trực giao nhƣ sau, đầu tiên định nghĩa chuyển đổi Fourier () của hàm tỉ lệ (t) nhƣ sau:
3
43
2nÕu1
4
32cos
3
2nÕu
1)
0t nÕu0
Hình 2.2 Biến đổi Fourier của hàm tỉ lệ cho cở sở Meyer
ta tính chuyển đổi Fourier của :
Trang 34l
e ( 2 (2 1)) ( /2))
Dạng của hàm ψ (t ) với biến đổi Meyer cho ở hình 2.3:
Hình 2.3 Hàm ψ (t ) của biến đổi Meyer
2.3 Biến đổi Wavelet Daubechies
Giống như Meyer, Daubechies cũng là một nhà khoa học có công lao to lớn trong việc nghiên cứu phát triển phép biến đổi Wavelet Biến đổi Daubechies là một trong những phép biến đổi phức tạp nhất trong biến đổi Wavelet Họ biến đổi này được ứng dụng hết sức rộng rãi, biến đổi Wavelet
áp dụng trong JPEG2000 là một biến đổi trong họ biến đổi Wavelet Daubechies
Chúng ta đã được biết biến đổi Wavelet Haar trong phần trên, đó chính
là họ Wavelet Daubechies chỉ với 2 hệ số tỉ lệ được gọi là D2 hay Haar Wavelet
Dưới đây là một số hàm ψ(t) trong họ biến đổi Wavelet Daubechies:
Trang 3526
Hình 2.4 Hàm ψ (t ) của họ biến đổi Daubechies n với n=2, 3, 7, 8
Trang 3627
Chương 3 BIẾN ĐỔI WAVELET TRONG NÉN ẢNH 3.1 Tổng quan về nén ảnh
3.1.1 Giới thiệu chung về nén ảnh
Nén ảnh số là một đề tài nghiên cứu rất phổ biến trong lĩnh vực xử lý
dữ liệu đa phương tiện Mục đích là làm thế nào để lưu trữ bức ảnh dưới dạng
có kích thước nhỏ hơn hay dưới dạng biểu diễn mà chỉ yêu cầu số bít mã hoá
ít hơn so với bức ảnh gốc Nén ảnh thực hiện được là do một thực tế: thông tin trong bức ảnh không phải là ngẫu nhiên mà có trật tự, có tổ chức Do đó, nếu bóc tách được tính trật tự, cấu trúc đó thì sẽ biết được phần thông tin nào quan trọng nhất trong bức ảnh để biểu diễn và truyền đi với số lượng bít ít hơn so với ảnh gốc mà vẫn đảm bảo tính đầy đủ thông tin Ở phía thu, quá trình giải mã sẽ tổ chức, sắp xếp lại được bức ảnh xấp xỉ gần chính xác so với ảnh gốc nhưng vẫn thoả mãn chất lượng yêu cầu, đảm bảo đủ thông tin cần thiết
Tóm lại, tín hiệu ảnh, video hay audio đều có thể nén lại bởi chúng có những tính chất như sau:
• Có sự tương quan dẫn đến dư thừa thông tin theo không gian: Trong phạm vi một bức ảnh hay một khung video tồn tại sự dư thừa đáng kể do mối tương quan giữa các điểm ảnh lân cận
• Có sự tương quan dẫn đến dư thừa thông tin theo phổ: Các dữ liệu thu được từ các bộ cảm biến của thiết bị thu nhận ảnh tồn tại sự tương quan đáng
kể giữa các mẫu thu, đây chính là nguyên nhân dẫn đến dư thừa theo phổ
• Có sự tương quan dẫn đến dư thừa thông tin theo thời gian: Trong một chuỗi ảnh video, tồn tại sự tương quan giữa các điểm ảnh của các khung video, điều này cho thấy có sự dư thừa thông tin theo thời gian
Trong hình 3.1, bộ mã hoá dữ liệu thực hiện quá trình nén bằng cách giảm kích thước dữ liệu ảnh gốc đến một mức phù hợp với việc lưu trữ và
Trang 3728
truyền dẫn trên kênh Tỉ lệ bít đầu ra của bộ mã hoá được tính là số bít cho một mẫu (điểm ảnh) Bộ mã hoá kênh thực hiện việc chuyển đổi luồng bít đã được nén thành dạng tín hiệu phù hợp cả cho việc lưu trữ và truyền dẫn, thường bộ mã hoá kênh sử dụng các kỹ thuật: mã hoá có độ dài thay đổi – RLC (Run Length Coding), mã hoá Huffman, mã hoá số học Bộ giải mã thực hiện quá trình ngược lại so với bộ mã hoá
Trong các hệ thống nén, tỉ lệ nén chính là tham số quan trọng đánh giá khả năng nén của hệ thống, công thức được tính như sau:
Tỉ lệ nén = Kích thước dữ liệu gốc / Kích thước dữ liệu nén
Đối với ảnh tĩnh, kích thước chính là số bít để biểu diễn toàn bộ bức ảnh Đối với ảnh video, kích thước chính là số bít để biểu diễn một đoạn
khung hình video
3.1.2 Phân loại các kỹ thuật nén
Các kỹ thuật nén chủ yếu được phân loại như sau: nén tổn hao và không tổn hao, mã hoá dự đoán và mã hoá dựa trên phép biến đổi, mã hoá băng con
3.1.2.1 Nén tổn hao và không tổn hao
Trong các kỹ thuật nén không tổn hao (losses compression), ảnh khôi phục giống hoàn toàn so với ảnh gốc Tuy nhiên, nén không tổn hao chỉ đạt được hiệu quả nén rất nhỏ Trái lại, các kỹ thuật nén có tổn hao (lossy compression) có thể đạt được hiệu quả nén cao hơn rất nhiều mà ở điều kiện cảm nhận hình ảnh thông thường sự mất mát thông tin không cảm nhận được
và vì thế vẫn đảm bảo chất lượng ảnh Một số kỹ thuật nén có tổn hao gồm: điều xung mã vi sai – DPCM, điều xung mã – PCM, lượng tử hoá véctơ –
VQ, mã hoá biến đổi và băng con Ảnh khôi phục trong hệ thống nén có tổn hao luôn có sự suy giảm thông tin so với ảnh gốc bởi vì: phương pháp nén này đã loại bỏ những thông tin dư thừa không cần thiết