Cung cấp cho bạn kiến thức cơ bản về môn xử lý ảnh số như các phương pháp biến đổi ảnh,lọc nhiễu ,tìm biên,phân vùng ảnh,phục hồi ảnh,nâng cao chất lượng ảnh
Trang 1Daniel F.S | School of Electronics and Telecommunications 1
CHƯ G I: H P MÔN XỬ LÝ ẢNH SỐ
1.1 ĐỒ KHỐI QUÁ TRÌNH XỬ LÝ ẢNH
1.2 THÔNG TIN HÌNH ẢNH
I: năng lượng bức xạ nhận bởi hệ thống thông tin hình ảnh
I là một hàm số f(C,θ,φ,γ), cho bởi (x,y,z,λ,t) Trong đó:
o C(λ) l{ năng lượng bức xạ ứng với bước sóng λ
o θ,φ l{ góc tới và góc phản xạ của tia sáng
o γ l{ hệ số phản xạ
Coi rằng I độc lập với thời gian (bỏ qua chuyển động của vật thể hay camera), chiếu xuống trục z ta được:
o I(x,y,z,λ,t) = I(x,y,λ)
Trang 22 Hanoi University of Science and Technology| Daniel F.S
Với ảnh RGB:
Ii(x,y) = ∫I(x,y,λ) – Si(λ)dλ Trong đó: Ii: Ảnh R, G hoặc B
Si(λ) l{ đ|p ứng của tế bào cảm quang (hình nón) trong mắt người ứng với màu R,G hoặc B
Chuyển hệ màu:
[ ] [ ] [ ] [ ] Trong đó: T là ma trận chuyển đổi
Y,I,Q l{ độ chói (Luminance - Y) v{ cường độ màu (Chrominance - I,Q) H,S,I l{ m{u (Hue), độ b~o hòa (Saturation) v{ cường độ (Intensity)
Ảnh đơn sắc (Monochrome – black and white) chỉ có độ chói (Luminance) v{ cường độ (Intensity)
YIQ: Cho TV màu hệ NTSC [PRA91]
{
[ ] [
] [ ] [ ] [
] [ ]
CMY: Cho máy in màu [GON92]
{
( )
CMYK: Cho máy in màu [GON92]
{
( )
Trang 3Daniel F.S | School of Electronics and Telecommunications 3
HIS: Cho việc điều khiển màu [PRA91]
[ ]
1.4.1 Lấy mẫu (Sampling)
Tần số lấy mẫu (Xem bài 2.2)
Trong đó: fxs là tần số lấy mẫu theo phương x
Δx l{ bước lấy mẫu theo phương x
fxm là tần số max theo phương x
Tốc độ lấy mẫu điển hình cho tín hiệu hình ảnh NTSC
3 (for color) × (512×512) [samples/frame] × 30 [frames/s]
= 3 × 7.5 M [samples/s]
Up-sampling l{ qu| trình tăng tốc độ lấy mẫu Tăng độ phân giải, nội suy
Down-sampling là quá trình giảm tốc độ lấy mẫu Giảm tốc độ dữ liệu, giảm kích thước
1.4.2 Lượng tử hóa (Quantization)
Lượng tử hoá là ánh xạ từ các số thực mô tả giá trị lấy mẫu thành một dải hữu hạn các số thực Nói c|ch kh|c, đó l{ qu| trình số ho| biên độ
MSE = Mean Squared Error
Trang 44 Hanoi University of Science and Technology| Daniel F.S
CHƯ G II: BIẾ ĐỔI ẢNH
2.1 BIẾ ĐỔI Đ VỊ
A (Toán tử) là biến đổi đơn vị nếu A-1=A*T
Giả thiết vector vào u có kích thước Nx1, vector ra v được viết thành:
Biến đổi đơn vị: A-1=A*T có thể viết:
Phương trình trên có thể coi là biểu diễn tập {u(n)} dưới dạng chuỗi Các cột của ma trận A*T được gọi là các vector cơ sở của A:
Tính chất bảo to{n năng lượng : ||v||2 = ||u||2
2.3 BIẾ ĐỔI ÁCH ĐƯỢC
A là biến đổi đơn vị t|ch được nếu :
Trang 5Daniel F.S | School of Electronics and Telecommunications 5
Biểu diễn biến đổi ảnh dưới dạng chuỗi
Phương trình trên biểu diễn ảnh U dưới dạng tổ hợp tuyến tính của N2 ma trận A*k,l (với k,l = 0÷N-1) được gọi là các ảnh cơ bản
√ /√ ( ) /
√ /√ ( ) /
Trang 66 Hanoi University of Science and Technology| Daniel F.S
2.5 BIẾ ĐỔI FOURIER RỜI RẠC (DFT)
o Tuần hoàn: v(k) = v(k+N) với k bất kỳ
o DFT/DFT đơn vị của 1 chuỗi thực {u(n)} là liên hiệp đối xứng qua N/2
Trang 7Daniel F.S | School of Electronics and Telecommunications 7
o Tích chập vòng: DFT tích chập vòng 2 chiều của 2 ảnh là tích các DFT của chúng
o Tương quan: DFT tương quan vòng 2 chiều của 2 ảnh là tích liên hiệp các DFT của chúng
o Tổng hợp tín hiệu từ pha v{ độ lớn
Bài 2.2 Cho ảnh f x,y 4cos 4x cos6y
a/ Lấy mẫu với bước lấy mẫu x y 0, 2và x y 0,1
b/ Lọc bằng bộ lọc thông thấp (LPF) với dải thông (1/Δx, 1/Δy)
c/ X|c định ảnh lọc được trong mỗi trường hợp
( ) Với bước lấy mẫu Δx=Δy=0.2
( ) Với bước lấy mẫu Δx=Δy=0.1
( ) ∑ /
Trang 8
8 Hanoi University of Science and Technology| Daniel F.S
( )
∑ 0 / /1
∑ [ ( ) ( )]
Suy ra
( )
{
( )
{
Với Δx = Δy = 0.2 H(u) = H(v) = 0.2 với 0 < u < 2.5 và 0 < v < 2.5
}
( ) ( ) ( )
c/ Ảnh lọc được
Với Δx = Δy = 0.2, ( ) ( ) ( ) f1(x,y) = 25ej2π(2x + 2y)
Với Δx = Δy = 0.1, ( ) ( ) ( ) f2(x,y) = 25ej2π(2x + 3y)
2.7 BIẾ ĐỔI HADAMARD
Ma trận biến đổi Hadamard HN dễ dàng thiết lập được từ ma trận gốc H2 v{ đệ quy tích Kronecker
Trang 9
Daniel F.S | School of Electronics and Telecommunications 9
Tính chất của biến đổi Hadamard
0 0 0 1
0 0 0 1
1 1 1 1
Trang 10
10 Hanoi University of Science and Technology| Daniel F.S
2.8 BIẾ ĐỔI GIÁ TRỊ Đ HẤT (SVD)
Biến đổi tuyến tính t|ch được của ảnh U có thể viết dưới dạng: V = Ψ T UΦ
Trong đó, Ψ,Φ là các biến đổi đơn nhất:
ΦΦT = I ΨΨT = I
Biến đổi ngược: U = ΨVΦ T
Nếu V là ma trận đường chéo có hạng là r
Λ là ma trận đường chéo của các giá trị riêng của U T U hoặc UU T
U T U hoặc UU T l{ vuông v{ đối xứng nên các giá trị riêng là thực còn các vector riêng là
trực giao Hạng ma trận càng nhỏ thì số vector hàng (cột) độc lập cần để mô tả U càng ít
Tìm trị riêng dựa v{o phương trình |UTU – λkI|=0 λ1 = 18.06 λ2 = 1.94
Tìm vector riêng Φk dựa vào [UTU]Φk = λkΦk Với k = 1, 2
0 1 0 1
Tìm vector riêng Ψk theo Φk và U (Công thức ở trên)
[
] [
]
Trang 11Daniel F.S | School of Electronics and Telecommunications 11
Tính Uk
√ [
]
√ [
] [
] [
]
Trang 1212 Hanoi University of Science and Technology| Daniel F.S
CHƯ G III: Ă G CƯỜNG CHẤ LƯỢNG ẢNH
3.2 TOÁN TỬ ĐIỂM
3.2.1 Kéo dãn độ tương phản (Contrast stretching)
Tăng dải động của các mức xám trong ảnh được xử lý
Ghim (clipping): trường hợp đặc biệt của tăng độ tương phản khi α = γ= 0 Thích hợp
để làm giảm nhiễu nếu biết ảnh đầu vào nằm trong khoảng [a,b] Phải được thực hiện trên các ảnh được biểu diễn bởi một số hữu hạn c|c bit như số nguyên không dấu
Lấy ngưỡng (thresholding): trường hợp đặc biệt của ghim khi a=b=t
3.2.2 Biến đổi âm bản (image negative)
3.2.3 Trích chọn bit (Bit extraction)
Bài 3.1 Trích chọn bit từ LSB đến MSB cho ảnh 4bit kích thước 4x4 sau:
14 4 2 9
5 15 13 2
6 10 8 11
1 3 0 7
Giải: Dựa vào công thức { * +
Lần lượt thực hiện trích chọn từ bit 0 đến bit 3
Pixel Mức xám Trích bit 3 Trích bit 2 Trích bit 1 Trích bit 0
Dec Bin
Trang 13Daniel F.S | School of Electronics and Telecommunications 13
3.2.4 Nén dải (Range compression)
Dải động của ảnh được biến đổi đơn vị rất lớn chỉ nhìn thấy một số ít các pixel Có thể nén dải động
3.2.5 Trừ ảnh (Image subtraction)
Để so sánh 2 ảnh với nhau, thường là ảnh của cùng 1 đối tượng nhưng tại 2 thời điểm khác nhau Trừ theo từng bit
Trang 1414 Hanoi University of Science and Technology| Daniel F.S
3.2.6 Cân bằng mức xám đồ(Histogram Equalization)
Ảnh u có mức x|m đồ h(xi) , i=0÷(L-1), ta có phân bố xác suất
Ảnh ra v* cũng giả thiết là có L mức được cho bởi:
Bài 3.2 Cho ảnh 3 bit kích thước 5x5 Hãy cân bằng mức x|m đồ cho ảnh
Trang 15Daniel F.S | School of Electronics and Telecommunications 15
3.3 TOÁN TỬ KHÔNG GIAN
3.3.1 Lọc trung bình không gian (Spatial Averaging)
Giá trị pixel được thay thế bởi trung bình trọng số của các pixel lân cận
Trong đó W l{ cửa sổ lọc (mặt nạ), với a(k,l) là các hệ số lọc
Một số cửa sổ (mặt lạ) lọc
Bài 3.3 Cho ảnh 3 bit kích thước 5x5 Hãy lọc trung bình không gian cho ảnh, sử dụng cửa sổ lọc
3x3 thứ 2 ở trên
Giải:
Mở rộng ảnh (padding) bằng cách chèn thêm vào các giá trị ở rìa
Với cửa sổ lọc đ~ cho, gi| trị mỗi pixel được thay thế bằng
I(m,n)=int {1/10×[I(m-1,n-1)+I(m-1,n)+I(m-1,n+1)+I(m,n-1)+2×I(m,n)+I(m,n-1)+ +I(m+1,n-1)+I(m+1,n)+I(m+1,n+1)]}
Tiến hành lọc bằng cách quét cửa sổ qua từng pixel trong khu vực 5x5, ta được kết quả:
Lọc trung bình phù hợp để giảm nhiễu, lọc thông thấp, giảm lấy mẫu
Giả thiết ảnh ban đầu y(m,n)=u(m,n)+η(m,n) với η(m,n) là nhiễu trắng kỳ vọng=0 và phương sai=σ2
Trang 1616 Hanoi University of Science and Technology| Daniel F.S
Ảnh sau khi lọc:
Công suất nhiễu giảm đi Nw lần
3.3.2 Lọc trung vị (Median Filtering)
Giá trị pixel được thay thế bởi pixel trung tâm của dãy các pixel lân cận
Nếu Nw là chẵn thì thay thế bằng trung bình của 2 pixel trung tâm
Bài 3.4 Cho ảnh 3 bit kích thước 4x4
Hãy lọc trung vị cho ảnh, sử dụng cửa sổ lọc 3x3
Giải:
Mở rộng ảnh (padding) bằng cách chèn thêm vào các giá trị ở rìa
Tiến hành lọc bằng cách quét cửa sổ qua từng pixel trong khu vực 4x4
v(0,0) = median(0,0,0,0,1,1,2,2,6)=1 v(2,0) = median(0,2,2,2,2,3,3,6,6)=2 v(0,1) = median(0,0,1,1,2,2,2,2,6)=2 v(2,1) = median(0,2,2,2,3,4,5,6,6)=3 v(0,2) = median(1,1,2,2,2,3,6,7,7)=2 v(2,2) = median(0,2,3,4,5,6,6,6,7)=5 v(0,3) = median(2,2,2,3,3,7,7,7,7)=3 v(2,3) = median(2,3,3,4,5,6,6,7,7)=5 v(1,0) = median(0,0,0,1,2,2,2,2,6)=2 v(3,0) = median(0,2,2,3,3,3,3,6,6)=3 v(1,1) = median(0,0,1,2,2,2,2,4,6)=2 v(3,1) = median(0,2,3,3,4,5,5,6,6)=4 v(1,2) = median(0,1,2,2,3,4,6,7,7)=3 v(3,2) = median(0,4,5,5,6,6,6,6,7)=6 v(1,3) = median(2,2,3,3,4,7,7,7,7)=4 v(3,3) = median(4,5,5,6,6,6,6,7,7)=6
Trang 17Daniel F.S | School of Electronics and Telecommunications 17
Tính chất lọc trung vị:
o Phi tuyến
o Giảm nhiễu xung
o Bảo to{n đường biên
o T|ch được
3.3.3 Làm sắc nét (Sharpening)
Các thí nghiệm về tâm-vật lý chỉ ra rằng một bức ảnh hay tín hiệu hình ảnh có c|c đường biên được làm nổi bật thì về mặt chủ quan sẽ đem lại nhiều cảm giác hài lòng, thỏa mãn hơn l{ ảnh thực tế
Mặt nạ làm sắc nét (Unsharp Masking)
o Thường dùng trong công nghiệp in để làm nổi bật (crispening) c|c đường biên
o Phần tín hiệu không sắc nét (phần tần số thấp) sẽ được trừ khỏi ảnh Phần tần số cao được thêm vào ảnh
hLP, hHP : đ|p ứng xung của bộ lọc thông thấp v{ thông cao tương ứng λ: được chọn trong khoảng từ 0,25÷0,33
Bài 3.5 Tìm mặt nạ làm sắc nét, biết rằng mặt nạ bộ lọc thông thấp là
[
[ ]
3.3.4 Phóng ảnh – Nội suy (Zooming – Interpolation)
Có nhiều kỹ thuật nội suy (interpolation) dùng để thay đổi kích thước của ảnh nhằm tăng cường chất lượng của ảnh khi hiển thị
Tín hiệu liên tục được nội suy:
Trang 1818 Hanoi University of Science and Technology| Daniel F.S
Nội suy bậc hai: hc2(x) = hc1(x)* hc0(x)
Nội suy bậc ba (Cubic-B Spline)
( ) ( ) ( )
{
| | | |
| | | | | |
Nội suy liên tục 2 chiều
o Nội suy t|ch được: hc(x,y)=hc(x).hc(y)
o Nội suy song tuyến: Δx=x – m; Δy = y – n
Nội suy L:1 (L:1 Interpolator)
Gồm: tăng tốc độ lấy mẫu lên L lần, lọc thông thấp, khuếch đại lên L lần
o Bước 1: Chèn vào giữa c|c pixel c|c điểm 0
o Bước 2: X|c định đầu ra (tính toán các vị trí đ~ chèn)
Với bộ lọc nội suy h(k) là bộ lọc thông thấp đối xứng, Σh(k) = 1
Trang 19Daniel F.S | School of Electronics and Telecommunications 19
L:1 Decimator
Giảm tốc độ lấy mẫu đi L lần
Bài 3.6 Cho ảnh 3x3 Tìm ảnh nội suy 3:1 bậc 0 và bậc nhất
14 4 2
5 15 13
6 10 8
Giải:
1 Nội suy theo phương x
Tăng tốc độ lấy mẫu (Chèn v{o c|c điểm 0)
5 5 15 15 15 13 13
6 6 10 10 10 8 8
Trang 2020 Hanoi University of Science and Technology| Daniel F.S
C|c điểm ảnh sau khi qua bộ lọc và khuếch đại 3 lần
2 Nội suy theo phương y: Tương tự theo phương x
(a) Nội suy bậc 0
Trang 21Daniel F.S | School of Electronics and Telecommunications 21
CHƯ G IV: TRÍCH CHỌ ĐƯỜNG BIÊN
Đư ng i n:
o La sư thay đo i gia tri mư c xa m cu a ca c pixel trong vu ng la n ca n
o Sư thay đo i gia tri mư c xa m bie u die n qua toa n tư vi pha n (mie n lie n tu c) hoa c sai
kha c (mie n rơ i ra c)
o Ca c toa n tư thươ ng sư du ng: vi pha n ba c nha t (Gradient), vi pha n ba c 2 (Laplace)
C c ư c t c i n p t i n ư ng i n:
▼(.) : Xa c đi nh gradient ta i tư ng pixel theo ca c hươ ng
La y ngươ ng: Loa i bơ t ca c pixel co gradient nho hơn ngươ ng
4.1 TOÁN TỬ GRADIENT
Toán tử vi phân bậc nhất, tính gradient (trường có hướng) theo một hướng n{o đó
Thông tin gradient thu được sau đó được sử dụng để tăng cường hay trích đặc điểm (feature extraction) phục vụ cho mục đích ph}n vùng ảnh (image segmentation)
Gradient của ảnh rời rạc I(m,n)
Với: ▼x và ▼y tương ứng là gradient theo phương x v{ phương y tương ứng
Gradient nhạy với nhiễu hạt cục bộ
Góc hướng của gradient:
Trang 2222 Hanoi University of Science and Technology| Daniel F.S
4.1.1 Toán tử Sobel
4.1.2 Toán tử Prewitt
4.1.3 Toán tử la bàn
Tì nh gradient theo ca c hươ ng
Gradient ta i pixel (m,n): ▼I(m,n) = max{|▼k(m,n)|}
vơ i |▼k(m,n)| la gradient theo phương: đo ng, ta y, nam, ba c
Trang 23Daniel F.S | School of Electronics and Telecommunications 23
4.2 TOÁN TỬ LAPLACE
Với ảnh rời rạc
Với Ixx và Iyy tương ứng là các vi phân bậc hai theo phương x v{ phương y
Ví dụ với mặt nạ đầu tiên:
Thư c hie n tì m bie n tre n a nh :
o A p du ng ma t na Laplace le n tư ng pixel
o Xa c đi nh ca c đie m vươ t kho ng (Áp mặt nạ 3x3, điểm vượt 0 l{ điểm có 2 lân cận đối diện nhau trái dấu) đươ ng bie n
4.3 TOÁN TỬ LOG (LAPLACIAN OF GAUSSIAN)
Đầu ra củahệ thống
G là toán tử l{m trơn Gaussian
Đầu ra
Trang 2424 Hanoi University of Science and Technology| Daniel F.S
Dạng t|ch được của LoG
Ảnh đường biên thu được
Dạng rời rạc của LoG với cửa sổ MxM
Giả thiết h1(m) v{ h2(m) được lấy mẫu từ h1(z) và h2(z) với cửa sổ MxM
Trung bình của mặt nạ LoG phải bằng 0 để tránh sai số khi tìm điểm vượt 0 h1(m) và h2(m) cần được thay đổi để thỏa mãn
4.4 GRADIENT PHI TUYẾN
NG[I(m,n)] = max[I(m,n)] – I(m,n)
or = I(m,n) – min[I(m,n)]
Thư c hie n tre n a nh
o Xa c đi nh kì ch thươ c ma t na (m×n): 3x3,5x5
o Đa t ma t na le n tư ng pixel cu a a nh go c va xa c đi nh pixel max hoa c pixel min
o Pixel = Pixelmax – Pixel or Pixel = Pixel - Pixelmin
4.5 LAPLACE PHI TUYẾN
NL[I(m,n)] = {max[I(m,n)] – I(m,n)} – {I(m,n) –min[I(m,n)]}
= max[I(m,n)]+ min[I(m,n)] - 2 I(m,n)
Thư c hie n tre n a nh
o Xa c đi nh kì ch thươ c ma t na (m×n): 3x3,5x5
o Đa t ma t na le n tư ng pixel cu a a nh go c va xa c đi nh pixelmax va pixelmin
o Pixel = Pixelmax + Pixelmin – 2Pixel
Ca c toa n tư phi tuye n ko nha y vơ i nhie u va nhie u ha t
De thư c hie n
Trang 25Daniel F.S | School of Electronics and Telecommunications 25
]
[
]
[
]
Trang 2626 Hanoi University of Science and Technology| Daniel F.S
]
Trang 27Daniel F.S | School of Electronics and Telecommunications 27
CHƯ G V: HÂ VÙ G ẢNH
Mục đích: ph}n chia ảnh đầu vào thành các vùng nhỏ tách rời thỏa mãn 2 tính chất:
Đồng nhất (Homogeneity): các pixel trong từng vùng l{ đồng đều (theo 1 tiêu chí n{o đó)
Liên thông (Connectivity): luôn tồn tại một đường liên thông giữa 2 pixel bất kỳ trong cùng một vùng
5.1 PHÂN VÙNG DỰA VÀO LẤY GƯỠNG
Dựa trên các thống kê mức x|m đồ của ảnh để tạo ra c|c vùng đóng thuộc về c|c đối tượng có trong ảnh
Phương ph|p ph}n vùng đơn giản nhất , tính toán nhanh, có thể thực hiện dễ dàng trong thời gian thực sử dụng phần cứng chuyên biệt
Dựa trên phân tích mức x|m đồ để x|c định một hay nhiều mức ngưỡng để xắp sếp từng pixel trong ảnh
Nếu mức x|m đồ có 2 đỉnh (bimodal) thì mức ngưỡng là giá trị mức x|m tương ứng với điểm thấp nhất trong vùng hõm thung lũng (valley) của mức x|m đồ
Nếu không, ảnh được chia thành các phần nhỏ dựa trên một số giả thiết (heuristic) về tính chất của ảnh Mức x|m đồ của từng phần sau đó được sử dụng để x|c định mức ngưỡng
Lựa chọn mức ngưỡng
5.1.1 Mức ngưỡng tối thiểu xác suất sai số (Minimizing probability of error)
Giả thiết rằng phân bố mật độ xác suất pi(x) của nền v{ đối tượng chỉ có 1 đỉnh với kỳ vọng µi v{ phương sai σi (có nghĩa pdf của ảnh có 2 đỉnh)
Thuật toán lặp để tìm mức ngưỡng
o Bước 1: Coi 4 góc của ảnh là các pixel nền (m1), phần còn lại l{ c|c pixel đối tượng (m2)
o Bước 2: Tính kỳ vọng của các mức xám nền (μ1) v{ đối tượng (μ2)
Với Di là vùng i, N(Di) là số pixel trong vùng đó
o Bước 3: Đặt
o Bước 4: Nếu Tt+1 = Tt dừng Không thì quay lại bước 2