Đặt vấn đề Mục tiêu của luận văn là nghiên cứu các phương pháp biểu diễn biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên, và ứng dụng của nó trong xử lý ảnh văn bản Bi
Trang 1NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN BIÊN VÀ ỨNG DỤNG
Người hướng dẫn khoa học : TS Đỗ Năng Toàn Luận văn tốt nghiệp
2
Nội dung trình bày
Đặt vấn đề
Các phương pháp phát hiện biên
Ứng dụng biên trong xác định góc nghiêng văn bản
Kết luận
Trang 2Đặt vấn đề
Mục tiêu của luận văn là nghiên cứu các phương pháp biểu diễn biên, hệ thống hóa kiến thức về các phương pháp phát hiện biên,
và ứng dụng của nó trong xử lý ảnh văn bản
Biên là một vấn đề quan trọng trong xử lý ảnh vì các đặc điểm trích chọn trong quá trình phân tích ảnh chủ yếu dựa vào biên
Điểm biên là nơi có sự thay đổi sự thay đổi đột ngột về mức xám Tập hợp các điểm biên tạo thành biên hay đường bao của ảnh
Các phương pháp phát hiện biên
Phương pháp phát hiện biên trực tiếp: làm nổi biên dựa vào sự
biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm
Phương pháp phát hiện biên gián tiếp: nếu bằng cách nào đấy,
ta phân được ảnh thành các vùng thì đường phân ranh giữa các vùng đó chính là biên Việc phân vùng ảnh thường dựa vào kết cấu bề mặt của ảnh
Một số phương pháp khác: Cách tiếp cận theo mô hình mặt dựa
vào việc thực hiện xấp xỉ đa thức trên ảnh gốc hay ảnh đã thực hiện phép lọc Laplace Cách tiếp cận tối ưu nhằm xác định một hàm, làm giảm phương sai hoặc giảm một số điểm cực trị cục bộ
Trang 3Phương pháp phát hiện biên trực tiếp
Phương pháp Gradient: cho kết quả là ảnh biên dựa vào kỹ
thuật xác định các điểm có mức xám thay đổi đột ngột nhờ kỹ thuật lấy đạo hàm bậc nhất Theo định nghĩa, gradient là một véctơ có các thành phần biểu thị tốc độ thay đổi giá trị của điểm ảnh theo 2 hướng x và y
dx
y x f y dx x f f x
y x f
x
) , ( ) , ( )
,
∂
∂
dy
y x f dy y x f f y
y x f
y
) , ( ) , ( )
,
∂
∂
Kỹ thuật Gradient: dùng toán tử gradient lấy đạo hàm
theo 2 hướng
Kỹ thuật la bàn: dùng toán tử la bàn lấy đạo hàm theo 8
hướng chínhB, N, Đ, T, ĐB, TB, ĐN, TN.
6
Phương pháp phát hiện biên trực tiếp
-kỹ thuật
gradient-9 Toán tử Robert
¾ Áp dụng trực tiếp của công thức đạo hàm tại điểm (x,y) Với mỗi điểm ảnh I(x,y) của I, đạo hàm theo x, theo y được ký hiệu tương ứng bởi gx, gy được tính:
⎩
⎨
⎧
− +
=
− +
=
) , ( ) 1 , (
) , ( ) , 1 (
y x I y
x I g
y x I y x I g
y x
⎥
⎦
⎤
⎢
⎣
⎡
−
=
0 1
1 0
1
⎦
⎤
⎢
⎣
⎡
−
−
=
1 0
0 1
2
H
¾ Áp dụng toán tử Robert với ảnh nguồn I ta có ảnh kết quả Ikq như sau:
Ikq=I ⊗ H1+ I ⊗ H2
¾ Điều này tương đương với việc chập ảnh với 2 mặt nạ H1và H2:
Trang 4Phương pháp phát hiện biên trực tiếp
-kỹ thuật
gradient-9 Toán tử Sobel
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
=
1 0 1
2 0 2
1 0 1
1
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
=
1 2 1
0 0 0
1 2 1
2
H
9 Toán tử Prewitt
9 Toán tử Frei-Chen
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡− − −
=
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
=
1 2 1
0 0 0
1 2 1 H 1 0 0
2 0 2
1 0 0
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
=
1 0 1
1 0 1
1 0 1
1
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
=
1 0 1
0 0 0
1 1 1
2
H
Phương pháp phát hiện biên trực tiếp
-kỹ thuật la
bàn-⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
3 3
3
3 0
3
5 5
5
1
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
3 3 3
5 0 3
5 5 3
2
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
5 3 3
5 0 3
5 3 3
3
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
5 5
3
5 0
3
3 3
3
4
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
5 5 5
3 0 3
3 3 3
5
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
3 5 5
3 0 5
3 3 3
6
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
3 3 5
3 0 5
3 3 5
7
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
3 3 3
3 0 5
3 5 5
8
H
9 Toán tử Kirsch
Trang 5Phương pháp phát hiện biên trực tiếp
-phương pháp
Laplace- Toán tử Laplace được định nghĩa:
≈[2f(x,y)-f(x-1,y)-f(x+1,y)]+[2f(x,y)-f(x,y-1)-f(x,y+1)]
≈f(x+1,y)+f(x-1,y)+f(x,y+1)+f(x,y-1)-4f(x,y)
2
2 2
2
2
y
f x
f
f
∂
∂ +
∂
∂
=
Δ
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
=
0 1
0
1 4 1
0 1
0
1
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
=
1 1 1
1 8 1
1 1 1
2
H
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎣
⎡
−
−
−
−
−
=
1 2 1
2 4 2
1 2 1
3
H
3 kiểu mặt nạ hay dùng:
10
Phương pháp phát hiện biên trực tiếp
Original image Sobel Operator
Prewitt Operator Frei-Chen Operator Roberts Operator
Laplacian Operator
Robinson Operator Kirsh Operator
Hình ảnh nổi biên thu được từ việc áp dụng các toán tử
Trang 6Phương pháp phát hiện biên gián tiếp
Phân vùng ảnh
Dò biên:
Phương pháp phát hiện biên gián tiếp
-Các kỹ thuật phân vùng
ảnh- Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh, nó là một tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đấy: mức xám, mức màu, độ nhám,…
Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu (texture) tương đồng
Phân vùng ảnh dựa theo ngưỡng biên độ
Phân vùng theo miền đồng nhất
Phân vùng dựa theo kết cấu bề mặt (texture)
Trang 7Phương pháp phát hiện biên gián tiếp
-Phân vùng ảnh dựa theo ngưỡng biên
độ-H(k)
Lược đồ hình rắn lượn và cách chọn ngưỡng
⎩
⎨
⎧
<
>
=
T y x in
T y x in y
x out
) , ( 0
) , ( 1
) , (
Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính chất vật lý của ảnh như: độ phản xạ, độ truyền sáng, màu sắc hoặc đáp ứng đa phổ Như vậy có thể dùng ngưỡng biên độ để phân vùng khi mà biên độ đủ lớn đặc trưng cho ảnh
Quá trình nhị phân hóa ảnh, T là ngưỡng cần xác định
14
Phương pháp phát hiện biên gián tiếp
-Phân vùng theo miền đồng
nhất- Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan trọng nào đó của miền Việc lựa chọn các tính chất của miền sẽ xác định tiêu chuẩn phân vùng Tính đồng nhất của một miền của ảnh là điểm chủ yếu xác định tính hiệu quả của việc phân vùng
Phương pháp phân tách - cây tứ phân (split - quad trees)
Phương pháp hợp (merge)
Phương pháp tách - hợp (split - merge)
Trang 8Phương pháp phát hiện biên gián tiếp
-Phân vùng dựa theo kết cấu bề mặt
(texture)- Tiếp cận thống kê: các đặc trưng của kết cấu sợi như độ thô,
độ mịn hay hướng có thể ước lượng nhờ các biến đổi ảnh bằng
kỹ thuật lọc tuyến tính
Tiếp cận cấu trúc: kết cấu sợi có cấu trúc thuần nhất là những
phần tử sợi xác định, mà sự xuất hiện lặp đi lặp lại tuân theo một luật tất định hay ngẫu nhiên nào đấy
Phân đoạn theo tính kết cấu
ACF
Trích chọn đặc tính u(m,n)
Đặc tính sợi
Phân tích kết cấu sợi bằng dải tương quan
Phương pháp phát hiện biên gián tiếp
-kỹ thuật dò
biên-Dò biên tổng quát
Bước 1: Xác định cặp nền vùng xuất phát
Bước 2: Xác định cặp nền vùng tiếp theo
Bước 3: Lựa chọn điểm biên
Bước 4: Lặp lại bước 2 cho đến khi gặp cặp nền vùng xuất phát
Trang 9Phương pháp phát hiện biên gián tiếp
-kỹ thuật dò
biên- Dò biên theo quy hoạch động
"Con đường tối ưu giữa 2 điểm cho trước cũng là tối ưu giữa 2 điểm bất kỳ nằm trên đường tối ưu đó"
C
E
B
D A
C E
Minh họa nguyên lý Bellman
18
Bài toán phát hiện góc nghiêng văn bản
Phát hiện góc nghiêng và hiệu chỉnh góc nghiêng văn bản dựa vào chu tuyến ngoài của các đối tượng ảnh và phép biến đối Hough
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Trang 10 Thuật toán phát hiện góc nghiêng văn bản
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Xác định các đối tượng ảnh và hình chữ nhật nhỏ nhất chứa nó
Lấy điểm trung bình cạnh đáy của từng hình chữ nhật
XĐ đường thẳng
Tìm các đối tượng ảnh mới
và các hình chữ nhật chứa nó
Xoay văn bản với góc tìm được
Áp dụng biến đổi Hough để xác định đường thẳng từ tập điểm vừa tìm
được
T F
Mô tả thuật toán phát hiện góc nghiêng văn bản
Sử dụng kỹ thuật dò biên để tìm các hình chữ nhật nhỏ
nhất chứa các đối tượng ảnh
Bước 1: Tìm điểm bắt đầu của một vùng và ta tìm biên
của vùng đó (chữ trên dòng)
Bước 2: Xác định điểm xuất phát của vùng tiếp theo, nếu
gặp một điểm đã xét tìm một điểm ảnh trên cùng dòng có nhãn bằng với điểm đang xét và tiến trình tiếp tục duyệt
từ đây
Bước 3: Nếu như chạy ngang đến một giới hạn nào đó
không thấy điểm bắt đầu của một vùng mới thì thoát khỏi việc các hình chữ nhật nhỏ nhất chứa các chữ Ngược lại
ta quay lại bước 2
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Trang 11 Áp dụng biến đổi Hough xác định góc nghiêng văn bản
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Hough[ ϕ][r 2 ]=4
R 2 =x.cos ϕ+y.sinϕ
R 1 =x.cos ϕ+y.sinϕ
Hough[ ϕ][r 1 ]=3
ϕ
x
Hình 3.2: Ứng dụng biến đổi Hough trong phát hiện góc nghiêng
22
Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh gốc
Trang 12 Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh thu được sau khi dò biên
Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Trang 13 Thực nghiệm
ỨNG DỤNG BIÊN TRONG XÁC ĐỊNH
GÓC NGHIÊNG VĂN BẢN
Ảnh thu được sau khi chỉnh góc nghiêng
26
Với mục đích là hệ thống hóa kiến thức về các phương pháp phát hiện biên và ứng dụng với bài toán xác định góc nghiêng văn bản Luận văn đã đạt được một số kết quả như sau:
Trình bày các phương pháp phát hiện biên trực tiếp dựa vào đạo hàm, phương pháp phát hiện biên dựa trên các kỹ thuật dò biên, các kỹ thuật phân vùng ảnh
Áp dụng phương pháp dò biên cho bài toán xác định góc nghiêng văn bản
Cài đặt chương trình demo phát hiện góc nghiêng văn bản và hiệu chỉnh lại văn bản
K ết luận