[r]
Trang 1Chương 14
BIẾN ĐỔI SểNG CON
14.1 GIỚI THIỆU
Những quan tõm chớnh trong thời gian gần đõy là việc phỏt triển cỏc kỹ thuật biến đổi mới Nhận biết địa chỉ cỏc vấn đề đối với việc nộn ảnh, cỏc cạnh và cỏc đặc trưng cần nhận biết khỏc, cũng như việc phõn tớch cấu trỳc ảnh Cỏc kỹ thuật được biết đến như phõn tớch đa giải phỏp, phõn tớch phổ thời gian, thuật toỏn hỡnh chúp, và biến đổi súng con (Wavelet)
Trong chương này, chỳng ta sẽ xem lại một vài giới hạn trong biến đổi cổ điển Fourier và biến đổi tương tự Fourier và định nghĩa ba loại biến đổi súng con biến đổi súng con mở ra một triển vọng cải thiện được cho cỏc chương trỡnh ứng dụng Chỳng
ta sẽ sơ qua lịch sử phỏt triển dẫn tới phộp phõn tớch súng con, nờn nhớ biến đổi tương tự cú khuynh hướng thống nhất cỏc cỏch tiếp cận khỏc nhau với mục đớch quan trọng là biến đổi súng con Phần sau trong chương này, chỳng ta sẽ minh hoạ một vài ứng dụng của biến đổi súng con
Chỳng ta hạn chế biến đổi súng con với cỏc giỏ trị thực, tớnh toỏn được, cỏc hàm tớnh tớch phõn của một hoặc hai chiều, bao gồm cỏc tớn hiệu và cỏc ảnh mà chỳng ta quan tõm Như trước, để đơn giản chỳng ta giới thiệu cỏc khỏi niệm một chiều và sau
đú tổng quỏt hoỏ nú trong hai chiều cho cỏc chương trỡnh ứng dụng Chỳng ta bắt đầu bằng cỏch giới thiệu ba loại biến đổi cơ sở của súng con Sau đú chỳng ta minh hoạ một vài trường hợp cụ thể của súng con và một vài chương trỡnh ứng dụng của súng con
14.1.1 Súng và súng con
Trở lại biến đổi Fourier mà chỳng ta đó sử dụng, cỏc hàm cơ sở, súng hỡnh sin Chỳng được gọi với tờn như vậy vỡ nú giống như súng của đại dương và được truyền trong cỏc phương tiện khỏc Đối với biến đổi tớch phõn mà hai cận ở vụ cựng Cỏc vec tơ của biến đổi Fourier rời rạc cũng là cỏc số khỏc 0 trờn toàn miền xỏc định; tức
là, chỳng khụng được hỗ trợ trọn gúi
Ngược lại, cỏc thành phần tớn hiệu tức thời chỉ khỏc 0 trong một khoảng thời gian
ngắn, nhiều đặc điểm quan trọng trong ảnh (cỏc biờn chẳng hạn) cũng được định vị trong khụng gian Cỏc thành phần kể trờn khụng giống cỏc hàm cơ sở của biến đổi Fourier và chỳng khụng được thể hiện đầy đủ trong cỏc hệ số biến đổi (chẳng hạn như phổ tần số), sẽ đề cập đến sau này Việc này làm cho biến đổi Fourier và cỏc biến đổi súng khỏc, như đó đề cập trong phần trước của chương, ớt cỏc tuỳ chọn cho phộp nộn và phõn tớch tớn hiệu và ảnh trong cỏc thành phần tạm thời hay cố định Tớnh chất khỏ tốt đú là, chỳng ta chỳ ý biến đổi Fourier cú thể đưa ra cỏc hàm phõn tớch chẵn của một tớn hiệu tức thời hẹp như tổng của tớn hiệu hỡnh sin Thực
Trang 2Bạn có thể hiểu một cách không đầy đủ, các nhà toán học và các kỹ sư đã mở rộng một vài cách tiếp cận sử dụng biến đổi với các hàm cơ sở với khoảng tồn tại giới hạn Các hàm cơ sở có nhiều loại như chẳng hạn như tần số Chúng là sóng giới hạn bị
chặn và được biết đến với tên là sóng con (Wavelet) Biến đổi dựa trên chúng gọi là
biến đổi sóng con Chúng cũng được gọi như việc thực hiện xoá trong một lượng đáng quan tâm của ngôn ngữ tiếng pháp đối với các chủ thể
Hình 14-1 minh hoạ sự khác biệt giữa sóng và sóng con Hai sóng trên là sóng cosin và sóng sin khác nhau về tần số, nhưng không bền Hai sóng dưới là sóng con khác nhau về tần số và vị trí theo trục
HÌNH 14-1
Hình 14-1 Sóng và sóng con
Phép biến đổi Haar là ví dụ đơn giản nhất trong biến đổi sóng con Nó khác các biến đổi khác trong chương 13 cả vec tơ cơ sở sinh ra nó bởi phép chuyển đổi và lấy
tỷ lệ của một hàm đơn Hàm Haar, nó là một cặp xung chữ nhật lẻ, là biến đổi cổ điển nhất và đơn giản nhất của biến đổi sóng con
14.1.2 Phân tích phổ thời gian
Trong các tài liệu về xử lý tín hiệu bao gồm các công việc như nhận và phân tích tín hiệu trong thuật ngữ của biến đổi hai chiều theo không gian tần số và thời gian Các tiếp cận thực sự trước biến đổi Sóng con, nhưng bây giờ phải cải tạo cho thích hợp cùng công việc Tuỳ thuộc vào nó, mỗi thành phần tức thì của bản đồ tín hiệu được định vị trong miền tần số và thời gian mà đảm nhận cho các tính trội cho các thành phần tần số và thời gian xảy ra (hình 14-2)
HÌNH 14-2
Trang 3Hình 14-2 Không gian tần số- thời gian: (a) tín hiệu; (b) biểu diễn của nó
Trong phân tích ảnh, không gian là ba chiều và có thể được xem như một ngăn xếp ảnh Vị trí của thành phần sẽ xuất hiện chủ yếu tại mức cao của ngăn xếp sẽ đảm nhận cho tính trội của thành phần tần số Trong hình 14-3 chỉ ra một ảnh chứa hai thành phần định vị được đưa ra cho hai bộ lọc thông Trong trường hợp này hai bộ lọc hoàn toàn cô lập hai thành phần
Phương pháp tiếp cận này bắt đầu bằng với biến đổi Fourier cửa sổ Gabor, và dẫn đến biến đổi Fourier thời gian ngắn và mã hoá băng con
14.1.2.1 Sóng con và âm nhạc
Hãy chú ý các nốt nhạc trong hình 14-4, nó có thể được xem như việc mô tả không gian hai chiều tần số và thời gian Tần số tăng từ dưới lên, trong khi thời gian tăng theo chiều trái sang phải mỗi nốt trên khuôn nhạc đảm nhận cho thành phần của sóng con (âm tần) mà nó sẽ xuất hiện trong khi thực hiện một bài hát Độ bền của mỗi sóng con là được mã hoá bằng loại nốt, chứ không theo độ rộng của nó
Nếu ta phân tích việc thực hiện một bản nhạc và viết ra các điểm của nó, chúng ta
sẽ có một loại biến đổi sóng con Tương tự, việc ghi một bài hát có thể xem như một phép biển sóng con rời rạc, do nó xây dựng lại các tín hiệu từ việc đặt lại các tần số
và thời gian
HÌNH 14-3
Hình14-3 Phân tích không gian-tần số ảnh
HÌNH 14-4
Trang 414.1.3 Các biến đổi
Nhắc lại rằng mỗi hệ số trong một biến đổi được xác định bằng một tích giữa hàm đầu vào và một trong những hàm cơ sở Trong một vài trường hợp, giá trị này biểu diễn mức độ giống nhau hàm đầu vào và hàm cơ sở đó Nếu các hàm cơ sở là trực giao (hay trực chuẩn), thì tích nhận được giữa hai hàm cơ sở bằng 0, nghĩa là chúng hoàn toàn giống hệt nhau Vì vậy, nếu tín hiệu hay ảnh được tạo thành từ các thành phần tương tự với một hay một vài hàm cơ sở, thì tất cả trừ một hay một vài hệ số sẽ nhỏ
Tương tự, biến đổi ngược có thể xem như sự khôi phục lại các tín hiệu ban đầu hay các ảnh bằng cách tính tổng các hàm cơ sở có biên độ lớn bằng biến đổi các hệ
số Vì nếu tín hiệu hay ảnh được xây dựng từ các thành phần mà tương tự một hay một vài hàm cơ sở, sau đó phép tính tổng cần thiết có chỉ một vài thuật ngữ của biên
độ tín hiệu Rất nhiều thuật ngữ có thể sau đó bỏ qua và các tín hiệu hay ảnh có thể đưa lại bằng chỉ một vài biến đổi hệ số
Thêm vào đó, nếu các thành phần quan tâm trong tín hiệu hay ảnh tương tự như một hay một vài hàm cơ sở, sau đó những thành phần này sẽ rõ ràng trong các hệ số lớn đối với các hàm cơ sở Do đó chúng sẽ dễ dàng tìm thấy trong biến đổi Cuối cùng nếu một thành phần không được nhận biết tương tự là một hay một vài biến đổi
cơ sở, sau đó nó cũng sẽ dễ dàng được tìm thấy Nó sẽ dễ dàng bỏ đi, đơn giản bằng cách giảm hệ số đối với đáp ứng của biến đổi
Chúng ta bao gồm tất cả những giá trị tiềm ẩn trong sử dụng biến đổi với các hàm
cơ sở mà mở rộng các thành phần của tín hiệu hay ảnh được thực hiện việc biến đổi Chúng ta cũng nhớ đó là các thành phần tức thời không thể tương tự với các hàm cơ
sở của biến đổi Fourier hay các biến đổi sóng khác
14.1.3.1 Các loại biến đổi
Trở lại trong chương 10 có ba loại biến đổi khác nhau, nhưng đều có kỹ thuật liên quan đến biến đổi Fourier biến đổi tích phân Fourier, biến đổi chuỗi Fourier, biến đổi Fourier rời rạc
Phép biến đổi Fourier tích phân được thiết lập với hàm liên tục hai chiều (một tín hiệu và phổ của nó) Nó và rời rạc của nó được đưa ra trong tích phân một chiều là:
f x e dx f x F x e ds x
F j2 xs vµ j2 xs (1) Phép biến đổi chuỗi Fourier mở rộng đưa ra một hàm tuần hoàn (hay một hàm tức thời có thể tính trong một chu kỳ của một hàm tuần hoàn) như một sự liên tục của hệ
số Fourier (hữu hạn hoặc vô hạn) nó và rời rạc của nó thông thường được tạo với s =
ns một biến rời rạc, vì vậy:
0
2 0
2
n
sx n j n
L j n sx
n F n s f x e dx f x s F e
Trong đó L là quãng thời gian với s = 1/L
Phép biến đổi Fourier rời rạc đưa ra một hàm mẫu bằng một phổ mẫu, và số các
mẫu độc lập trong cùng cả hai miền Nó thông thường được tạo với x = i x một biến
rời rạc nếu g(x) là giới hạn giải và mẫu như đòi hỏi bởi thuyết lấy mẫu, sau đó g i = g(ix) và
Trang 5
1
0
2 1
0
k
N
k i j k i
N i
N
i πk j i
N g
e g N
Trong tất cả ba kỹ thuật biến đổi, sin và cosin của các tần số khác nhau tạo thành một tập các hàm cơ sở trực chuẩn Hơn nữa, mỗi hệ số biến đổi được xác định bởi tích của hàm biến đổi và một trong những hàm cơ sở DFT sử dụng một tích rời rạc
và các hàm rời rạc cơ sở, trong khi các biến đổi khác sử dụng một tích nguyên và các hàm cơ sở liên tục Trong mỗi trường hợp, biến đổi ngược bao gồm tổng các hàm cơ
sở mà biên độ của nó thay đổi tuỳ thuộc vào hệ số biến đổi Tổng này có thể trở thành một số nguyên đối với biến đổi Fourier liên tục
Biến đổi Fourier rời rạc trong chương trước cũng sử dụng các hàm rời rạc trực chuẩn cơ sở Vì thế, chúng thực hiện theo cách chung thông thường của biến đổi Fourier rời rạc Hầu hết trong các trường hợp, các hàm cơ sở là thực và biến đổi xuôi
và ngược đều giống nhau
14.1.3.2 Các loại biến đổi sóng con
Như với biến đổi Fourier, sóng con cũng có ba loại biến đổi: biến đổi sóng con liên tục (CWT), khai triển chuỗi sóng con, và biến đổi sóng con rời rạc (DWT) Tuy nhiên, nó hơi phức tạp hơn một chút, vì các hàm sóng con cơ sở có thể hoặc không thể là các hàm trực chuẩn
Tập các hàm cơ sở có thể hỗ trợ cho một biến đổi thậm chí khi các hàm không trực chuẩn Điều đó có nghĩa là, cho ví dụ, khai triển một chuỗi sóng con mở rộng phải thể hiện một hàm bằng rất nhiều hệ số Nếu dãy các hệ số bị cắt để có độ dài hữu hạn, thì chúng ta có thể khôi phục chỉ một phần gần đúng các hàm ban đầu Cũng như thế, một biến đổi sóng con rời rạc có thể đòi hỏi nhiều hệ số các điểm mẫu hơn hàm ban đầu để khôi phục lại nó một cách chính xác, hay mức gần giống có thể chấp nhận
14.1.3.3 Các ký hiệu và định nghĩa
Tiếp theo chúng ta đưa ra một số định nghĩa để làm sáng tỏ các khái niệm về biến đổi sóng con Chúng ta giới hạn điểm quan tâm chính chỉ là các hàm biến đổi một chiều
Mục đích làm cho phù hợp với phần lớn tài liệu biến đổi sóng con chúng ta sử
dụng j như là một chỉ số nguyên trong chương này Như một vài phần khác trong cuốn sách, chúng ta cũng sử dụng j để biểu diễn đơn vị ảo , phải lưu ý không sử 1 dụng trong cả hai phương pháp trong cùng một biểu thức Điểm phân biệt này sẽ rõ ràng hơn trong nội dung của nó
Lớp các hàm chúng ta tìm kiếm để thể hiện bằng biến đổi sóng con đó là các tích của hàm bình phương trên một trục thực (chẳng hạn là tập các số thực trên trục x)
Lớp này được ký hiệu là L 2 (R) Do đó ký hiệu f(x) L 2 (R) nghĩa là
f x 2dx (4) Trong phân tích sóng con, chúng ta tạo ra một tập các hàm cơ sở bằng cách giãn
và tính tiến một hàm (x) đơn nguyên, gọi là một sóng con cơ sở Đây là một hàm
Trang 614.2 BIẾN ĐỔI SÓNG CON LIÊN TỤC
Phép biến đổi sóng con liên tục (còn được gọi là biến đổi sóng con tích phân) được đưa ra bởi hai ông Grossman và Morlet
14.2.1 Định nghĩa
Nếu (x) là hàm thực của phổ Fourier,(x), thoả mãn tiêu chuẩn có thể chấp nhận
s
s C
2
) (
và (x) được gọi là sóng con cơ sở Chú ý rằng, vì s thuộc mẫu số của tích phân
nên cần có
Hơn nữa, vì () cũng bằng 0 nên chúng ta có thể nhận thấy phổ biên độ của
sóng con có thể chấp nhận tương tự hàm truyền đạt của bộ lọc thông dải Thực tế, đáp ứng xung của một bộ lọc thông dải bất kỳ với trung bình 0, suy giảm về 0 đủ nhanh bằng với tốc độ tăng tần số, đều có thể thoả mãn như một sóng con cơ sở đối với biến đổi này
Hình 14-5 Một sóng con
Tập các hàm sóng con cơ bản, { a,b (x)}, có thể được tạo ra bằng cách tịnh tiến và
lấy tỷ lệ sóng con cơ bản,
a
b x a
x
trong đó a > 0 và b là các số thực Biến a phản ảnh tỷ lệ hàm sóng con cơ bản, còn b xác định rõ vị trí tịnh tiến của hàm theo trục x Thông thường, sóng con cơ sở,
(x), được đặt tại gốc toạ độ sao cho a,b (x) đặt tại x = b
2 2 / 2
1 3
2 ) (x x ex
Biến đổi sóng con liên tục của f(x) liên quan đến sóng con (x) là
0 2 4 6 x
0
1
0.5
-0.5
Trang 7
b a
W f( , ) , ,b ( ) ,b( ) (9) Grossman và Morlet đã chứng minh rằng biến đổi sóng con liên tục ngược là
1 ) (
a
da db x b
a W C
x
Hệ số tỷ lệ trước vế phải của biểu thức (7) bảo đảm các tiêu chuẩn của tất cả các hàm sóng con cơ sở đều như nhau, vì
x f a dx a
b x f a
b x
2
14.2.2 CWT hai chiều
Biến đổi sóng con liên tục W(a,b) của hàm f(x) một chiều là một hàm hai biến
Đối với các hàm nhiều hơn một biến, biến đổi này cũng làm tăng số chiều thêm một
Nếu f(x,y) là hàm hai chiều thì biến đổi sóng con của nó là
f x y x y dxdy b
b a W
y
x b b y
x
trong đó b x và b y xác định biến đổi theo hai chiều Biến đổi sóng con ngược liên tục hai chiều là
1 ) , (
a
da db db y x b
b a W C
y x
y x
(13)
trong đó
a
b x a
b x a y
x x y
b
b x,y( , ) 1 ,
và (x,y) là sóng con cơ sở hai chiều Tổng quát hoá mở rộng để kiểm soát các
hàm có nhiều hơn hai biến
14.2.3 Giải thích khối lọc (Filter Bank)
Ví dụ minh hoạ tiếp theo là một cách để xem xét biến đổi sóng con liên tục
Chúng ta đầu tiên định nghĩa các hàm cơ sở chung với tỷ lệ a là
a
x a
x
a
Đây là hàm sóng con cơ sở tỷ lệ a và thông thường là a -1/2 Nó định nghĩa một tập
các hàm trở nên rộng rãi với việc tăng a Chúng ta cũng định nghĩa
x ax x
a
*
*
Trang 8 a a
f a b f x b x dx f W
~
~
Với phần không đổi a, sau đó W f (a,b) là tích chập của f(x) với sóng con liên hợp
theo tỷ lệ a
Hình 14-6 cho thấy biến đổi sóng con tích phân như một khối (bank) các bộ lọc
tuyến tính (tích chập) thực hiện trên f(x) mỗi giá trị của a định nghĩa một bộ lọc
thông dải khác nhau, và đầu ra của tất cả các bộ lọc, thực hiện đồng thời, bao gồm biến đổi sóng con Thêm vào đó biểu thức 10 trở thành
0
~
1
a
da x f
C a
da db x b b f
C x
(18)
Nó ngụ ý rằng các đầu ra bộ lọc, mỗi đầu ra lại được lọc bởi a (x) và lấy tỷ lệ hợp
lý, kết hợp với nhau để khôi phục f(x) Nó là phát biểu của Calderon, ra đời trước
Grossman và Morlet 20 năm
HÌNH 14-6
Hình 14-6 Sự giống nhau của khối lọc đối với biến đổi sóng con tích phân của
một tín hiệu Nhắc lại từ thuyết đồng dạng (Phần 10.2.5) đó là rằng
a
s F a ax
Có nghĩa là
s a x a as
a
Và các tần số trung tâm của các bộ lọc thông dải giảm khi các hàm truyền đạt trở
nên hẹp hơn với việc tăng a
14.2.4 Các khối lọc hai chiều
Hình 14-7 minh hoạ tiếp cận khối lọctheo hai chiều Ở đây, mỗi bộ lọc a (x,y) là
một đáp ứng xung hai chiều, và đầu ra của nó là một ảnh sao chép đã lọc thông dải Ngăn xếp các ảnh lọc bao gồm biến đổi sóng con
Mặt khác, độ dư thừa là rất đáng quan tâm Trong thực tế, nếu hàm truyền đạt
(u,v) của (x,y) khác 0, ngoại trừ tại gốc, thì theo lý thuyết, chúng ta có thể khôi
Trang 9phục ảnh ban đầu từ bất kỳ một trong các đầu ra của bộ lọc bằng cách lọc ngược (giải chập) Nếu ảnh bị giới hạn dải trong một khoảng mà trên đó tồn tại ít nhất một
a (u,v) khác 0, thì f(x,y) có thể được khôi phục từ đầu ra bộ lọc đơn lẻ đó Phần cuối
là giá trị tiềm năng của biến đổi sóng con tích phân không cần trình bày đầy đủ, mà
để phân tích tín hiệu và ảnh
Để minh hoạ việc này, giả sử lấy ảnh trong hình 14-7 làm ví dụ, các đối tượng hình tròn có kích cỡ khác nhau và thành phần sóng con cơ sở được chọn chỉ tương ứng với các đối tượng hình tròn có bán kính đơn vị Xem xét ngăn xếp ảnh ra sẽ phát hiện vị trí các đối tượng Hơn nữa, mỗi đối tượng chỉ xuất hiện trong từng ảnh ra cụ thể tương ứng với từng kích cỡ riêng biệt
HÌNH 14-7
Hình 14-7 Sự giống nhau của khối lọc đối với biến đổi sóng con tích phân của
một ảnh
14.3 KHAI TRIỂN CHUỖI SÓNG CON
14.3.1 Cặp sóng con (Dyadic Wavelet)
Kiểu biến đổi sóng con thứ hai có một vài điểm hạn chế hơn so với kiểu thứ nhất Ngoài ra, một sóng con cơ sở được lấy tỷ lệ và tịnh tiến để tạo thành tập các hàm cơ
sở Tuy nhiên, ở đây tỷ lệ và phép tịnh tiến được định rõ bởi các số nguyên chứ không phải là các số thực
Trong định nghĩa thứ hai này, chúng ta sẽ tự giới hạn để tạo các hàm cơ sở bằng
các tỷ lệ nhị phân và những cặp tịnh tiến của sóng con cơ sở, (x) Một cặp tịnh tiến
là một phép dịch đi một lượng k/2 j, nó là một phép nhân số nguyên hệ số tỷ lệ nhị phân và vì thế cũng là chiều rộng của sóng con Phép lấy tỷ lệ nhị phân và cặp tịnh tiến được minh hoạ trong hình 14-8
Trang 10Hình 14-8 Tỷ lệ nhị phân và cặp tịnh tiến của biến đổi sóng con 14.3.2 Định nghĩa
Hàm (x) là sóng con trực giao nếu tập { j,k (x)} của các hàm được định nghĩa bởi
x j j x k
k
j 2 / 2 2
Trong đó - <j, k< là các số nguyên, tạo thành co sở trực giao của L 2 (R) Số
nguyên j xác định độ giãn, trong khi k chỉ rõ sự tịnh tiến
Tập sóng con đã đề cập tạo thành một cơ sở trực giao nếu, đầu tiên,
m k l m l k
j, , , , ,
Trong đó l và m là các số nguyên, j,k là hàm delta Kronecker, và , cho biết
tích; và thứ hai nếu hàm f(x) L 2 (R) bất kỳ có thể viết lại như sau
j k
k j k
j x c
x
Trong đó hệ số biến đổi được cho bởi các tích; tức là
f x x f x x k dx
Biểu thức (23) và (24) chỉ rõ khai triển chuỗi sóng con của f(x) có liên quan tới
sóng con (x)
Chú ý rằng ở đây một hàm liên tục được thể hiện bởi một chuỗi vô hạn gấp hai lần, và nói chung, biến đổi lại được khắc phục Do các hàm cơ sở thường mở rộng ra
vô hạn hạn theo cả hai hướng, nên việc khôi phục hoàn chỉnh phải được bao gồm tất
cả các số hạng
Tuy nhiên, nếu chọn (x) thích hợp thì ta có thể cắt chuỗi mà không gặp sai số
xấp xỉ nghiêm trọng Nếu f(x) bị chặn và sóng con cơ sở được định vị tốt, thì nhiều
hệ số với |k| lớn sẽ không đáng kể Các hệ số với |j| lớn cũng sẽ nhỏ, vì các hàm sóng
con cơ sở sau đó trở thành cực kỳ rộng hay hẹp
14.3.3 Cặp sóng con đầy đủ (Compact Dyadic Wavelet)
Nếu ta giới hạn f(x) và sóng con cơ sở hơn nữa thành các hàm có gái trị 0 bên
ngoài khoảng [0,1], thì họ các hàm cơ sở trực chuẩn thường được xác định bằng một
chỉ số đơn n; tức là,
x j j x k
n 2 /2 2
Trong đó j và k là các hàm thực sự của n, như sau:
1 2 , , 1 , 0 ,
1 , 0
Đối với n, j bất kỳ là số nguyên lớn nhất ví dụ như 2j n và k = n - 2 j Biến đổi ngược bây giờ sẽ l
0
n n
n x c x