Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN Hoàng Thị Vân Anh TÌM HIỂU MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHI
Trang 1Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
ĐẠI HỌC THÁI NGUYÊN KHOA CÔNG NGHỆ THÔNG TIN
Hoàng Thị Vân Anh
TÌM HIỂU MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN VÀ ỨNG DỤNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS NGÔ QUỐC TẠO
Thái Nguyên - 2010
Trang 2thông tin, Khoa Công nghệ thông tin Đại học Thái Nguyên đã nhiệt tình giảng dạy và hết lòng giúp đỡ em trong quá trình học tập và nghiên cứu đề tài Luận văn được hoàn thành tại Khoa Công nghệ thông tin dưới sự hướng
dẫn của PGS.TS Ngô Quốc Tạo Em xin bày tỏ lòng kính trọng và biết ơn sâu
sắc tới thầy
Em cũng xin chân thành cảm ơn các bạn đồng nghiệp phòng Khảo thí & Đảm bảo chất lượng trường Đại học Hải Phòng đã tạo điều kiện giúp đỡ trong quá trình hoàn thành luận văn này
Sự quan tâm, giúp đỡ của gia đình và bạn bè, đặc biệt lớp Cao học K7 Khoa Công nghệ thông tin đã cổ vũ, động viên em trong suốt thời gian học tập và thực hiện đề tài
Mặc dù có nhiều cố gắng song luận văn không thể tránh khỏi những thiếu sót, tác giả mong nhận được sự đóng góp ý kiến của các thầy cô và các bạn Xin chân thành cảm ơn!
Thái Nguyên, tháng 11 năm 2010
Tác giả
Hoàng Thị Vân Anh
Trang 3Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng” là do tôi tự tìm hiểu và được hoàn thành
dưới sự hướng dẫn của thầy giáo PGS TS Ngô Quốc Tạo
Trang 4MỤC LỤC
Trang Trang phụ bìa
Lời cam đoan
Mục lục i
Danh mục các bảng iv
Danh mục các hình vẽ iv
MỞ ĐẦU 1
CHƯƠNG I 3
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN PHÁT HIỆN 3
GÓC NGHIÊNG VĂN BẢN 3
1.1 Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh .3
1.1.1 Xử lý ảnh là gì? 3
Hình 1.2: Các giai đoạn trong xử lý ảnh 3
1.1.2 Các vấn đề cơ bản trong xử lý ảnh 4
1.1.2.1 Nắn chỉnh biến dạng 5
1.1.2.2 Khử nhiễu 5
1.1.2.3 Chỉnh mức xám 5
1.1.2.4 Phân tích ảnh 6
1.1.2.5 Nhận dạng ảnh 6
1.1.2.6 Nén ảnh 6
1.2 Bài toán phát hiện góc nghiêng văn bản 7
1.2.1 Giới thiệu bài toán phát hiện góc nghiêng văn bản 7
1.2.2 Biên và phương pháp phát hiện biên 8
1.2.2.1 Biên của đối tượng ảnh 8
1.2.2.2 Phương pháp phát hiện biên trực tiếp 9
1.2.2.3 Phương pháp phát hiện biên gián tiếp 11
1.2.2.4 Thuật toán dò biên tổng quát 12
Trang 5ii
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
CHƯƠNG II 15
MỘT SỐ KỸ THUẬT PHÁT HIỆN GÓC NGHIÊNG VĂN BẢN 15
2.1 Biến đổi Hough 15
2.1.1 Đường thẳng Hough 15
2.1.2 Áp dụng biến đổi Hough xác định góc nghiêng văn bản 19
2.1.3 Thuật toán phát hiện góc nghiêng văn bản 20
2.1.4 Chỉnh sửa góc nghiêng văn bản 22
2.2 Phương pháp hình chiếu 23
2.2.1 Thuật toán Postl 25
2.2.2 Thuật toán Baird 25
2.2.3 Thuật toán Nakano 26
2.3 Phép toán hình thái - Morphology 26
2.3.1 Phương pháp 26
2.3.2 Bước tiền xử lý 28
2.4 Phương pháp phân tích láng giềng 35
2.4.1 Phương pháp 35
2.4.2 Thuật toán Yue Lu và Chew Lim Tan 37
2.5 Phương pháp đường thẳng 38
2.5.1 Tư tưởng thuật toán phát hiện góc nghiêng văn bản 39
2.5.1.1 Chọn các miền xác định và các đối tượng 39
2.5.1.2 Lựa chọn các đối tượng 40
2.5.2 Bó cụm điểm chủ đạo 41
2.5.2.1 Định nghĩa 41
2.5.2.2 Phân cụm các điểm chủ đạo 42
2.5.3 Lựa chọn đường cơ sở 42
2.5.3.1 Phân loại điểm chủ đạo 42
2.5.3.2 Xác định đường thẳng sử dụng phương pháp bình phương nhỏ nhất 44 2.5.4 Thuật toán phát hiện góc nghiêng 45
2.5.4.1 Thuật toán định hướng góc nghiêng đơn giản 45
2.5.4.2 Thuật toán chính 46
2.5.5 Thuật toán sửa góc nghiêng 47
2.5.5.1 Mô hình quét dòng văn bản 47
Trang 62.5.5.2 Thuật toán chỉnh sửa góc nghiêng 48
2.5.5.3 Kết quả thử nghiệm 49
Bảng 1: Kết quả thực nghiệm của các phương pháp phát hiện góc nghiêng 49
2.6 Một vài phương pháp khác 50
CHƯƠNG 3 51
NÂNG CAO TỐC ĐỘ VÀ CHẤT LƯỢNG 51
PHÁT HIỆN GÓC NGHIÊNG 51
3.1 Xử lý ảnh có độ phân giải thấp 51
3.2 Tự động xác định ngưỡng phân loại 52
3.2.1 Mục đích và ý nghĩa việc dùng ngưỡng 52
3.2.2 Ý tưởng xuất phát 53
3.2.3 Phương pháp thực hiện 53
3.3 Một vài trường hợp ngoại lệ 56
CHƯƠNG 4 59
CÀI ĐẶT THỬ NGHIỆM 59
4.1 Sơ đồ chức năng của chương trình 59
4.2 Thiết kế Menu 60
4.3 Giao diện chính của chương trình 61
KẾT LUẬN 62
TÀI LIỆU THAM KHẢO 64
Trang 7iv
Số hóa bởi Trung tâm Học liệu - Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
DANH MỤC BẢNG BIỂU
Bảng 1: Kết quả thực nghiệm của các phương pháp phát hiện góc
nghiêng……… 49
DANH MỤC HÌNH VẼ Hình 1.1 Quá trình xử lý ảnh 3
Hình 1.2: Các giai đoạn trong xử lý ảnh 3
Hình 1.3a 7
Hình 1.3b 7
Hình 1.4a: Các 4- láng giềng của điểm ảnh P 11
Hình 1.4b: Các 8- láng giềng của điểm ảnh P 11
Hình 1.5a.Chu tuyến ngoài 12
Hình 1.5b Chu tuyến trong 12
Hình 1.6: Chu tuyến trong và chu tuyến ngoài của một đối tượng 12
Hình 1.7: Hướng các láng giềng của một điểm ảnh 13
Hình 1.8a: Hướng xác định cặp vùng nền xuất phát 14
Hình 1.8b: Hướng xác định cặp vùng nền tiếp theo 14
Hình 2.1: Biến đổi Hough cho đường thẳng 16
Hình 2.2: Tham số r – φ của đường thẳng 16
Hình 2.3: Biến đổi Hough trong không gian r- 17
Hình 2.4: Các hình chữ nhật ngoại tiếp 18
Hình 2.5 : Áp dụng biến đổi Hough phát hiện góc nghiêng văn 19
Hình 2.6 Quay một điểm ảnh quanh gốc tọa độ 22
Hình 2.7 Hiện tượng rỗ ảnh sau khi quay 23
Hình 2.8 a Ảnh gốc 23
Hình 2.8b Ảnh bị nghiêng 50 23
Hình 2.8 Phương pháp hình chiếu được tính từ ảnh trong hình 2.8a, 2.8b 24
Trang 8Hình 2.9 Một ví dụ các dòng văn bản có xu hướng dính lại với nhau do ảnh
hưởng của dấu 27
Hình 2.10: Các điểm left most bottom và bottom most left 28
Hình 2.11: Những khoảng góc nghiêng khác nhau được sử dụng để ước lượng góc nghiêng phù hợp cho phần tử cấu trúc 31
Hình 2.12: Một vài ví dụ của việc sử dụng phép đóng và mở với những phần tử cấu trúc nghiêng 32
Hình 2.13: Một thành phần liên thông dài với hệ tọa độ ảnh 33
Hình 2.14a Định nghĩa điểm chủ đạo 41
Hình 2.14b Định hướng góc nghiêng 41
Hình 2.15: Điểm chủ đạo trên dòng văn bản 43
Hình 2.16: Quan hệ láng giềng giữa các điểm chủ đạo 43
Hình 2.17: Định hướng thuật toán phát hiện góc nghiêng 45
Hình 2.18: Mô hình quét dòng văn bản 47
Hình 3.1 Một ảnh văn bản nghiêng có độ phân giải thấp 51
Hình 3.2: Ví dụ về một ảnh văn bản nghiêng với nhiều đối tượng phức tạp và ít ký tự 52
Hình 3.3: Sơ đồ phân bố histogram chu vi trước khi gom 55
Hình 3.4: Sơ đồ phân bố histogram chu vi sau khi gom 56
Hình 3.5 Ví dụ về một ảnh nghiêng có ít ký tự chữ cái 56
Hình 3.6 : Ví dụ về văn bản nghiêng có các đối tượng bao nhau 57
Trang 9và nhận dạng ảnh, một bộ phận quan trọng của xử lý ảnh là xử lý văn bản Một trong những nhiệm vụ chính cũng là đối tượng của xử lý ảnh văn bản là
tự động hóa công việc văn phòng
Hiện nay phần lớn lượng thông tin vẫn còn được lưu trữ, trình bày và phân phối thông qua phương tiện chủ yếu là giấy bởi con người tin tưởng hơn khi nhận được văn bản giấy Tuy nhiên có xu hướng đang phát triển để chia sẻ
và trao đổi thông tin điện tử, vì thế sự cần thiết để chuyển đổi từ tài liệu giấy sang tài liệu điện tử để lưu trữ, khôi phục và bảo trì ngày càng tăng lên Để chuyển đổi từ tài liệu giấy sang dạng điện tử thì kỹ thuật thường gồm ba bước: quét và công nghệ kỹ thuật số, phân tích bố cục và nhận dạng ký tự Khi văn bản được quét vào máy, văn bản bị nghiêng là không thể tránh khỏi
do các yếu tố khác nhau khi đưa ảnh vào Hầu hết các thuật toán nhận dạng ký
tự, phân tích bố cục là phổ biến nhưng lại rất nhạy cảm đối với sự biến dạng của ảnh văn bản và văn bản bị nghiêng có thể gây ra lỗi nghiêm trọng cho việc phân tích văn bản Do đó phát hiện và chỉnh sửa ảnh văn bản bị nghiêng
là cần thiết ở giai đoạn tiền xử lý để tránh nhiễu trong quá trình xử lý nghiêng Một trong những vấn đề đầu tiên trong xử lý ảnh văn bản là bài toán góc nghiêng văn bản Nguyên nhân dẫn đến văn bản bị nghiêng một góc xuất phát
từ quá trình quét ảnh hoặc copy ảnh, dẫn đến ảnh bị lệch đi một góc tương
Trang 10ứng Văn bản bị lệch có ảnh hưởng rất lớn đến các quá trình xử lý ảnh tiếp theo, vì vậy việc phát hiện và chỉnh sửa góc nghiêng văn bản là nhiệm vụ quan trọng đầu tiên trong xử lý ảnh văn bản
Với những lý do trên đây nên em đã chọn đề tài: “Tìm hiểu một số kỹ thuật phát hiện góc nghiêng văn bản và ứng dụng”
2 Mục tiêu nghiên cứu
Hiểu được các phương pháp phát hiện góc nghiêng văn bản Từ đó đưa
ra những nhận xét, so sánh giữa các phương pháp Lựa chọn công cụ phát triển phù hợp cài đặt ứng dụng
3 Đối tượng và phạm vi nghiên cứu
Tìm hiểu một vài kỹ thuật phát hiện góc nghiêng văn bản về mặt lý
thuyết, từ đó lựa chọn phương pháp cài đặt ứng dụng vào thực tế
Áp dụng đối với ảnh văn bản đen trắng
4 Ý nghĩa khoa học và thực tiễn của đề tài
Hệ thống hoá các kiến thức về kỹ thuật phát hiện góc nghiêng văn bản Việc tìm hiểu và phát triển ứng dụng thành công giúp cho việc xử lý ảnh trở nên đơn giản và dễ dàng hơn đối với một số trường hợp như: xử lý ảnh ban đầu để cho ra ảnh mới theo mong muốn của người dùng (ví dụ như ảnh bị nghiêng cần xử lý để thu được ảnh chính xác hơn…)
5 Phương pháp nghiên cứu
5.1 Dựa trên các tài liệu
- Tìm hiểu lý thuyết liên quan đến xử lý ảnh
- Tìm hiểu lý thuyết các kỹ thuật phát hiện góc nghiêng văn bản và chỉnh sửa
5.2 Phương pháp toán học
- Xử lý các số liệu thống kê
Trang 11data error !!! can't not
read
Trang 12data error !!! can't not
read
Trang 13data error !!! can't not
read
Trang 14data error !!! can't not
read
Trang 15data error !!! can't not
read
Trang 17data error !!! can't not
read
Trang 18data error !!! can't not
read
Trang 19data error !!! can't not
read
Trang 20data error !!! can't not
read
Trang 21data error !!! can't not
read
Trang 22data error !!! can't not
read
data error !!! can't not
read
Trang 23data error !!! can't not
read
data error !!! can't not
read
Trang 24data error !!! can't not
read
data error !!! can't not
read
Trang 26read
Trang 27data error !!! can't not
read