LẤY MẪU VÀ LƯỢNG TỬ HOÁ IMAGE SAMPLING AND QUANTIZATION Yêu cầu cơ bản nhất trong xử lý ảnh bằng máy tính là đưa ảnh về dạng biểu diễn số thích hợp, nghĩa là ảnh phải được biểu diễn bởi
Trang 1LẤY MẪU VÀ LƯỢNG TỬ HOÁ (IMAGE SAMPLING AND QUANTIZATION)
Yêu cầu cơ bản nhất trong xử lý ảnh bằng máy tính là đưa ảnh về dạng biểu diễn số thích hợp, nghĩa là ảnh phải được biểu diễn bởi một ma trận hữu hạn tương ứng với việc lấy mẫu ảnh trên một lưới rời rạc và mỗi pixel được lượng hoá bởi một số hữu hạn bit ảnh số được lượng hoá có thể được xử lý hay chuyển qua bước biến đổi số tương tự - DA(Digital to Analog) để tái hiện trên thiết bị hiện ảnh
2.2.1 Quét ảnh (Image scanning)
Phương pháp chung để lấy mẫu là quét ảnh theo hàng và mã hoá từng hàng Về nguyên tắc, một đối tượng, phim hay giấy trong suốt sẽ được chiếu sáng liên tục để tạo nên một ảnh điện tử trên tấm cảm quang Tuỳ theo các loại camera mà tấm cảm quang này là chất quang dẫn hay quang truyền Hệ thống camera ống sử dụng
phương pháp scan-out-digitalizer; còn hệ thống camera CCD(Charge Coup;ed Device) cho ảnh ma trận
f(x,y) fi(x,y) u(m,n) u(m,n)
ảnh vào
Hình 2.4 Lấy mẫu và lượng hoá
Camera CCD thực sự là thiết bị mẫu hoá tín hiệu 2 chiều và gọi là phương pháp sefl-scanning matrix Nguyên
tắc của 2 phương pháp được minh hoạ qua hình 2-6 trang bên
Lý thuyết mẫu hoá 2 chiều
- Ảnh với dải giới hạn (Band limited Images)
Một hàm f(x,y) gọi là dải giới hạn nếu khai triển Fourier F(ξ1, ξ2) của nó là 0 bên ngoài miền bao (hình 2.5) F(ξ1, ξ2) = 0 với ξ1 > ξx0 , ξ2 > ξy0 (2.2)
Với ξx0 và ξy0 là dải giới hạn theo x và y của ảnh
Quá trình số hoá ảnh có thể hiểu như mô hình tín hiệu dải giới hạn Một ảnh dải giới hạn f(x,y) thoả mãn phương trình 2.2 và được lấy mẫu đều trên một lưới hình chữ nhật với bước nhảy ∆x, ∆y có thể khôi phục lại không có sai sót dựa trên các giá trị mẫu f(m∆x,n∆y) Theo lý thuyết lấy mẫu trong xử lý tín hiệu, nếu tần số lấy mẫu theo x, y lớn hơn 2 lần dải giới hạn ξx0, ξy0 hay tương đương với:
1
∆ x
= ξxs > 2 ξx 0,
1
∆ y
= ξys > 2 ξy0
thì có thể khôi phục được Tỉ số này do Nyquist đề xuất và mang tên tỉ số Nyquist
F(ξ1, ξ2)
ξ2
Hiện
Biến đổi
D - > A
Máy tính
Lượng hoá
Lấy Mẫu
Trang 2ξ20
- ξ10 ξ10 ξ1
ξx0 ξ1 ξy0
-ξy0
ξ2
Hình 2.5 Khai triển Fourier của hàm dải giới hạn.
Hình 2.6 Phương pháp lấy mẫu & lượng hoá ảnh
Hơn nữa, việc khôi phục lại ảnh có thể nội suy theo công thức:
f(x,y) =
xs xs
ys ys
m n
,
−
−
−
−
=−∞
∞
∑
(2.3) Trong thực tế, nhiễu ngẫu nhiên luôn có mặt trong tín hiệu ảnh Do đó, lý thuyết lấy mẫu ở trên phải được mở rộng với một số kỹ thuật khác như: lưới không vuông, lưới bát giác Để đơn giản khi trình bày, những
kỹ thuật này không nêu ở đây Độc giả có quan tâm xin tham khảo tài liệu[1]
2.2.2 Lượng hoá ảnh (Image Quantization)
2.2.2.1 Khái niệm và nguyên tắc lượng hoá ảnh
camera
Chiếu sáng
(illumination)
object/phim (đối tượng chiếu sáng) đích
a) Phương pháp số hoá Scan-out
∆ Bộ
Chuyển
Mạch Bộ
điều khiển Lượng hoá
(Switch
∆ &logic u(m,n)
control)
b) Phương pháp Self-scanning array
Trang 3Lượng hoá ảnh là bước kế tiếp của việc lấymẫu, nhằm thực hiện một ánh xạ từ một biến liên tục u sang một biến rời rạc u* với các giá trị thuộc tập hữu hạn {r1, r2, , rL} Ánh xạ này thường là một hàm bậc thang (hình 2.7) tuân theo nguyên tắc sau:
Cho {tk, k=1, 2, L+1} là một tập các bước dịch chuyển hay mức độ quyết định; t1 là giá trị nhỏ nhất và tL+1
là giá trị lớn nhất của u
Cách đơn giản nhất là dùng lượng hoá đều Theo phương pháp này, giả sử đẩu ra của một bộ cảm biến ảnh nhận giá trị từ 0 đến 10.0 Nếu mẫu là lượng hoá đều trên 256 mức, thì bước dịch chuyển tk và mức xây dựng lại rk được tính bởi:
tk =
256 ( k − )
với k =1, 2, ,257; rk = tk -
5 256
với k =1, 2, , 256 Đại lượng q = tk - tk-1 = rk - rk-1 là hằng số với các giá trị k và gọi là khoảng lượng hoá
Trong phần này, ta chỉ xem xét các bộ lượng hoá không bộ nhớ (zero memory quantizer), có nghĩa là đầu ra chỉ phụ thuộc duy nhất là đầu vào Các bộ lượng hoá kiểu này rất có ích trong kỹ thuật mã hoá ảnh như
mã hoá điều xung PCM (Pulse Code Modulation), PCM vi phân, chuyển mã, v v Chú ý rằng, ánh xạ lượng hoá này không thuận nghịch, nghĩa là với một đầu ra đã cho, đầu vào là không duy nhất Vì vậy, người ta đã nghiên cứu bổ xung nhiều kỹ thuật khác nhau để cực tiểu hoá biến dạng, tăng hiệu quả Một kỹ thuật phổ dụng
là trung bình bình phương cực tiểu (do Lloyd-max đề xuất) chúng ta sẽ mô tả dưới đây.
Hình 2.7 Mô hình bộ lượng hoá.
2.2.2.2 Kỹ thuật lượng hoá trung bình bình phương cực tiểu
Kỹ thuật này nhằm cực tiểu hoá sai số trung bình bình phương đối với một số mức lượng hoá đã cho Cho u là một biến thực ngẫu nhiên với hàm mật độ liên tục Pu(u) Mong muốn ở đây là tìm được mức độ quyết định tk và mức khôi phục lại rk với một bộ lượng hoá L mức sao cho sai số trung bình bình phương là nhỏ nhất
Gọi ε = E[(u - u*)2] =
t
t
P u du
L
u
−
−
1 1
(2.4) Nhiệm vụ là tìm min của ε
Viết lại (2.4) ta có:
u*
u Bộ u* đầu ra
lượng hoá
u
lỗi lượng hoá
Trang 4ε = i
L
=
∑
1
t
t
P u du
i i
u
−
+
1 1
i=0, 1, ., L-1 (2.5)
Để tính rk, ta cần giải hệ phương trình (nhận được khi lấy vi phân 2.5):
(tk -rk-1)2Pu(tk) - (tk - rk) 2Pu(tk) = 0
2
tk
tk+
∫1 (u - rk)Pu(u)du = 0 Lưu ý rằng tk≥ tk-1, do đó giá trị của tk và rk cho bởi:
tk = (rk - rk-1)/2 k = 1, 2, L (2.6)
và rk =
up u du t
t
p u du t
t
u
u
k k
k k
( )
( )
+
+
∫
∫
1
1
k = 0, 1, , L-1 (2.7) Thông thường hệ phương trình (2.6), (2.7) là không tuyến tính
Kết quả trên chứng tỏ rằng mức dịch chuyển tối ưu nằm trên nửa đường của các mức xkhôi phục lại Các mức khôi phục lại tối ưu nằm tại trọng tâm của phân bố mật độ giữa các mức dịch chuyển
Giải hệ phương trình (2.6) & (2.7) ta thu được các cận t1 và tL+1 Trong thực tế, người ta hay áp dụng phương pháp Newton để giải phương trình trên Khi số mức lượng hoá lớn, người ta dùng phương pháp xấp xỉ
mật độ xác suất như một hàm hằng khôn ngoan (picewise) pu(u) = pu(vi) với vi = (ti + ti+1); ti = u < ti+1 Thay giá trị mới của pu(u) vào 2.5 và tính cực tiểu hoá, ta có lời giải xấp xỉ cho mức quyết định ti+1[1]:
ti+1 =
t t
t
u
u ti ti
k
[ ( )]
[ ( )]
/
/
−
− +
+
∫
1 3
1 3
1 1
(2.8) với A = tL+1 - t1 và rk = (k/L)A, k=1,2, ,L Từ đó ta dễ dàng tính được giá trị của sai số e (*)
Các hàm mật độ thường dùng là hàm Gauss và hàm Laplace
Hàm Gauss có dạng:
Pu(u) =
1
2
2 2
πσ
µ σ
exp(− −(u )
) (2.9) Hàm Laplace có dạng: Pu(u) = a/2 * exp(-a³u-µ³) (2.10)
trong đó:
- µ là kỳ vọng toán học
- s2 là hiệp biến với biến ngẫu nhiên u đối với hàm Gauss
Hiệp biến Laplace được tính bởi s2 =2/a
Trường hợp đặc biệt, nếu phân bố là đều thì hệ phương trình (2.6) & (2.7) là tuyến tính và sẽ cho ta
Trang 5các khoảng đều nhau giữa các mức dịch chuyển và mức khôi phục lại Do vậy, phép lượng hoá này có tên là lượng hoá tuyến tính
Giả sử hàm mật độ cho bởi công thức: 1/(tL+1 - t1) nếu ti = u = ti+1
pu(u) = 0 khác đi
Từ phương trình (2.7) ta có:
rk =
2 1 2 1
1
+ +
+
−
− =
−
)
(2.11)
do đó tk = (tk+1 - tk)/2 ⇒ tk = tk-1 = tk+1 - tk = const = q
Cuối cùng ta có q = (tL+1 -t1)/L; tk = tk-1 + q; rk = tk - q/2 (2.12)
Như vậy, mọi mức dịch chuyển và mức khôi phục lại đều cách đều Sai số của phép lượng hoá là u - u* sẽ phân phối đều trên khoảng (-q/2 , q/2) Sai số trung bình bình phương sẽ là:
e =
1
12
2 2
q u du
q
q
q
/ /
(2.13)*
Lượng hoá đều như trên khá thuận tiện cho cài đặt Tuy nhiên, trong thực tế ta còn gặp nhiều loại phân
bố không đều của các biến ngẫu nhiên Độc giả quan tâm đến các biến đổi này cũng như so sánh kết quả giữa một số phương pháp xin tham khảo tài liệu [1]