1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhận dạng các biểu mẫu tài liệu

14 481 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nhận dạng các biểu mẫu tài liệu
Tác giả Phan Văn Thuận
Người hướng dẫn PGS.TS. Ngô Quốc Tạo
Trường học Trường Đại học Công nghệ
Chuyên ngành Công nghệ thông tin
Thể loại Luận văn
Năm xuất bản 2007
Thành phố Hà Nội
Định dạng
Số trang 14
Dung lượng 303,8 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhận dạng các biểu mẫu tài liệu Phan Văn Thuận Trường Đại học Công nghệ Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10 Người hướng dẫn: PGS.TS. Ngô Quốc Tạo

Trang 1

Nhận dạng các biểu mẫu tài liệu

Phan Văn Thuận

Trường Đại học Công nghệ Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10

Người hướng dẫn: PGS.TS Ngô Quốc Tạo

Năm bảo vệ: 2007

Abstract: Giới thiệu bài toán nhập dữ liệu tự động nói chung: tình hình Việt Nam và thế

giới, các thành tựu đã đạt được trong lĩnh vực nhận dạng chữ viết, những khó khăn cũng như các đặc trưng của bài toán nhận dạng biểu mẫu nhập liệu so với các bài toán nhận dạng khác Nghiên cứu xây dựng hệ thống nhập liệu tự động bằng nhận dạng hình ảnh, phạm vi giới hạn và quy trình giải quyết bài toán Trình bày các phương pháp phân vùng ảnh, khử nghiêng, các khái niệm và tầm quan trọng của khử nghiêng và phân vùng ảnh trong nhận dạng biểu mẫu Đề xuất một số giải pháp sử dụng hệ thống xử lý biểu mẫu động cho việc phân vùng ảnh và tách chữ viết tay gồm: đưa ra các khái niệm về biểu mẫu động và hệ thống xử lý biểu mẫu động, trình bày các thuật toán cơ bản ứng dụng cho việc

nhận dạng biểu mẫu động, mô tả chi tiết quá trình thực nghiệm các thuật toán

Keywords: Biểu mẫu; Công nghệ thông tin; Phép toán hình thái; Xử lý ảnh

Content

MỞ ĐẦU

Nhập dữ liệu tự động đang là bài toán ngày càng thu hút nhiều sự chú ý và đầu tư nghiên cứu bởi vì đây thật sự là một vấn đề quan trọng, cần thiết do khả năng áp dụng rộng rãi vào thực

tế cũng như hiệu quả mà nó mang lại Trong bài toán này, khử nhiễu, khử nghiêng và phân vùng ảnh là một phần có vai trò đặc biệt quan trọng Chức năng của nó là chính xác ảnh, tách ra các vùng được nhập thông tin, tách chữ viết tay ra khỏi khung điền thông tin để làm đầu vào cho

module nhận dạng chữ Trong luận văn này chúng tôi trình bày một phương pháp sử dụng “cấu

trúc các chấm nhỏ” để tạo ra các khung điền thông tin Cấu trúc các chấm nhỏ này được tạo ra

bởi rất nhiều các chấm nhỏ hoặc các đoạn thẳng nhỏ Phương pháp của chúng tôi có những đặc điểm nổi bật sau:

Trang 2

 Không cần thiết kế biểu mẫu có màu sắc mà vẫn tách các ký tự chữ viết tay ra khỏi khung điền

 Dễ dàng tách phần chữ viết tay ra khỏi khung điền một cách nhanh chóng và dễ dàng bằng các thuật toán xử lý ảnh đơn giản, đặc biệt trong các trường hợp chữ viết tay đè lên khung

 Chi phí cho xử lý biểu mẫu là thấp

 Không cần biết trước vị trí logic của các khung điền chữ và tìm cách xử lý tự

động các ký tự trong khung

Chúng tôi đã tiến hành thực nghiệm trên nhiều mẫu biểu mẫu động và thu được những kết quả rất khả quan

Từ khóa – Xử lý ảnh, Phân tích trang tài liệu, Nhận dạng, Biểu mẫu, Phép toán hình thái, Active form

References

Tài liệu tiếng Việt

STT

[1] Phan Văn Thuận & Ngô Quốc Tạo:“ Kết hợp một số kỹ thuật xử lý ảnh nâng cao

cho xử lý biểu mẫu động và ứng dụng”, Hội thảo khoa học quốc gia lần thứ

3-Nghiên cứu cở bản và ứng dụng công nghệ thông tin, 10-2007

[2] Phan Văn Thuận & Đào Thanh Khiết: “Xử lý tự động phiếu điều tra”, Khóa luận

tốt nghiệp, đại học Công nghệ, đại học Quốc gia Hà nội, 5-2004

[3] Trần Thanh Phúc & Đinh Văn Phương: “ Nghiên cứu và xây dựng hệ thống nhập

tài liệu tự động bằng nhận dạng quang học”, Khóa luận tốt nghiệp , đại học Công

nghệ, đại học Quốc gia Hà nội, 5-2006

Tài liệu tiếng Anh

STT

Trang 3

[4] Yoji Maeda, Masaki Nakagawa: Design of paper based user interface for editing

document, Proc SPIE, Vol.4307, pp184- 192 (2001)

[5] http://www.parc.com/solutions/dataglyphs/

[6] Koichi Kise, Yasuo Miki, Keinosuke Matsumoto: Backgrounds as Information

Carriers for Printed Documents, Proc.15th ICPR’2000, Vol.4, pp380-384 (2000.9)

[7] Bilan Zhu, Masaki Nakagawa: Informationd Encoding Into and Decoding From

Dot Texture for Active Form, Proc ACM Symposium on Document Engineering,

pp105- 144 (2003.11)

[8] Taro SHIMAMURA Bilan ZHU Atsushi MASUDA Motoki ONUMA Takeshi

SAKURADA Masaki NAKAGAWA: “A Prototype of An Active Form System”,

Seventh International Conference on Document Analysis and Recognition

(ICDAR), Edinburgh, Scotland, pp921-925 (2003.8)

[9] Koichi Kise, Yasuo Miki, Keinosuke Matsumoto: Backgrounds as Information

Carriers for Printed Documents, Proc.15th ICPR’2000, Vol.4, pp380-384 (2000.9)

[10] Bilan Zhu, Taro Shimamura, Masaki Nakagawa:Document processing methods for

active form, Proc of the 3 rd IASTED International Conference Visualation, Image

and Image processing, September 8-10 -2003, Spain

[11] S.V Rice, F.R Jenkins, and T.A Nartker The Fifth Annual Test of OCR

Accuracy Technical Report TR-96-01, Information Science Research Institute,

University of Nevada, Las Vegas, April 1996

[12] RM Haralick Document Image Understanding: Geometric and Logical Layout In

IEEE Computer Society Con] Computer Vision and Pattern Recognition (CVPR),

pages 385390, Seattle, Washington, 1994

[13] Y.Y Tang, S.\\I Lee, and C.Y Suen Automatic Document Processing: a Survey

Pattern Recognition, 29(12):19311952, 1996

[14] A.K Jain and B Yu Document Representation and Its Application to Page

Decomposition Technical Report MSUCPS:TR96-63, Michigan State University,

East Lansing, MI, December 1996

[15] L O'Gorman and R Kasturi Dowment Image Analysis IEEE Computer Society

Press, Los Alamitos, CA, 1995

[16] F Fignoni, S Messelodi, and C.M Modena Review of the State of the Art in

Trang 4

Optical Character Recognition Part 1: Machine Printed Documents Technical

Report #9607-03, IRST, Trento, Italy, June 1996

[17] J.M White and G.D Rohrer Image Thresholding for Optical Character

Recognition and Other Apllications Requiring Character Image Extraction IBM

Journal of Besercl; and Development, 27(4):400411, July 1983

[18] T Taxt, P.J Flynn, and A.K Jain Segmentation of Document Images IEEE

Transaction on Pattern Analysis and Machine Intelligence, 1(12):13221329,

December 1989

[19] L O'Gorman Binarization and Multithresholding of Document Images Using

Connectivity CVGIP: Graphical Models and Image Processing, 56(6):494506,

1994

[20] H.-S Don A Noise Attribute Thresholding Method for Document Image

Binarization In Proc of the 3th International Conference on Document Analysis

and Recognition, pages 231234, Montreal, Canada, August 1995

[21] Y Liu and S.N Srihari Document Image Binarization Based on Texture Features

IEEE Transactions on Pattern Analysis and lldachine Intelligence, 19(5):540544,

May 1997

[22] J Sauvola, T Seppanen, S Haapakoski, and M Pietikainen Adaptive Document

Binarization In Proc of the 4th International Conference on Dowment Analysis

and Recognition, pages 147152, Ulm, Germany, August 1997

[23] P.W Palumbo, P Swarninathan, and S.N Srihari Document image binarization:

Evaluation of algorithms In Proc of SPIE Symposium Applications of Digital

Image Processing IX, volume 697, pages 278 285, San Diego, California, August

1986

[24] O.D Trier and T Taxt Evaluation of Binarization Methods for Document Images

IEEE Transactions on Pattern Analysis and lldachine Intelligence, 17(3):312315,

March 1995

[25] A.T Abak, U Baris, and B Sankur The Performance Evaluation of Thresholding

Algorithms for Optical Character Recognition In Proc of the 4th International

Conference on Dowment Analysis and Recognition, pages 697700, Ulm, Germany,

August 1997

Trang 5

[26] \"1 Post! Detection of linear oblique structures and skew scan in digitized

documents In Proc of the 8th International Conference on Pattern Recognition,

pages 687689, Paris, France, 1986

[27] H.S Baird The skew angle of printed documents In Proc of the Conference

Society of Photographic Scientists and Engineers, volume 40, pages 2124,

Rochester, NY, May, 20-21 1987

[28] G Ciardiello, G Scafuro, M.T Degrandi, M.R Spada, and M.P Roccotelli An

experimental system for office document handling and text recognition In Proc of

the 9th International Conference on Pattern Recognition, volume 2, pages 739743,

Roma, Italy, November, 14-17 1988

[29] Y Ishitani Document Skew Detection Based on Local Region Complexity In

Proc of the 2nd International Conference on Dowment Analysis and Recognition, pages 4952, 'I'sukuba, Japan, October 1993 IEEE Computer Society

[30] A Bagdanov and J Kanai Projection Profile Based Skew Estimation Algorithm

for JBIG Compressed Images In Proc of the 4th International Conference on

Dowment Analysis and Recognition, pages 401405, Ulm, Germany, August 1997

[31] S.N Srihari and V Govindaraju Analysis of Textual Images Using the Hough

Transform Machine Vision and Applications, 2(3):141 153, 1989

[32] S Hinds, J Fisher, and D D'Amato A document skew detection method using

run-length encoding and the Hough transform In Proc of the 10th International

Conference on Pattern Recognition, pages 464468, Atlantic City, NJ, June, 17-21

1990

[33] A.L Spitz Skew Determination in CCITT Group 4 Compressed Document

Images In Proc of the Symposium on Document Analysis and Information

Retrieval, pages 1125, Las Vegas, 1992

[34] D.S Le, G.R Thoma, and H Wechsler Automated Page Orientation and Skew

Angle Detection for Binary Document Images Pattern Recognition,

27(10):13251344, 1994

[35] Y Min, S.-B Cho, and Y Lee A Data Reduction Method for Efficient Document

Skew Estimation Based on Hough Transformation In Proc of the 13th

International Conference on Pattern Recognition, pages 732736, Vienna, Austria,

Trang 6

August 1996 IEEE Press

[36] U Pal and B.B Chaudhuri An improved document skew angle estimation

technique Pattern Recognition Letters, 17(8):899904, July 1996

[37] B Yu and A.K Jain A Robust and Fast Skew Detection Algorithm for Generic

Documents Pattern Recognition, 29(10):15991629, 1996

[38] A Hashizume, P.S Yeh, and A Rosenfeld A method of detecting the orientation

of aligned components Pattern Recognition Letters, 4:125132, 1986

[39] L O'Gorman The Document Spectrum for Page Layout Analysis

IEEE Transactions on Pattern Analysis and Machine Intelligence,

15(11):11621173, 1993

[40] R Smith A Simple and Efficient Skew Detection Algorithm via Text Row

Accumulation In Proc of the 3th International Conference on Dowment Analysis

and Recognition, pages 11451148, Montreal, Canada, August 1995

[41] T Akiyama and N Hagita Automated Entry System for Printed Documents

Pattern Recognition, 23(11):11411154, 1990

[42] H Yan Skew Correction of Document Images Using Interline Cross-Correlation

CVGIP: Graphical Models and Image Processing, 55(6):538543, November 1993

[43] B Gatos, N Paparnarkos, and C Charnzas Skew Detection and Text Line

Position Determination in Digitized Documents Pattern Recognition,

30(9):15051519, 1997

[44] J Sauvola and M Pietikainen Skew Angle Detection Using Texture Direction

Analysis In Proc of the 9th Scandinavian Conference on Image Analysis, pages

10991106, Uppsala, Sweden, June 1995

[45] C Sun and D Si Skew and Slant Correction for Document Images Using Gradient

Direction In Proc ofthe 4th International Conference on Document Analysis and

Recognition, pages 142146, Ulm, Germany, August 1997

[46] S Chen and RM Haralick An Automatic Algorithm for Text Skew Estimation in

Document Images Using Recursive Morphological transforms In Proc of the first

IEEE International Conference on Image Processing, pages 139143, Austin,

Texas, 1994

[47] H K Aghajan, B H Khalaj, and T Kailath Estimation of skew angle in

Trang 7

text-image analysis by SLIDE: subspace-based line detection Machine Vision and

Applications, 7:267276, 1994

[48] H.S Baird Anatomy of a Versatile Page Reader Proc of the IEEE,

80(7):10591065, 1992

[49] P.V.C Hough Methods and means for recognizing complex patterns US Patent

#3,069,654, December 18, 1962

[50] E.R Davies Machine Vision: Theory, Algorithms, Practicalities Academic Press,

1992

[51] S Chen and RM Haralick Recursive Erosion, Dilation, Opening and Closing

Transforms IEEE Transaction on Image Processing, 4(3):335345, March 1995

[52] A.P Dias Minimum Spanning Trees for Text Segmentation In Proc of Fifth

Annual Symposium on Dowment Analysis and Information Retrieval, Las Vegas,

Nevada, 1996

[53] H.S Baird Global-tn-Local Layout Analysis In Proc of the IAPR Workshop on

Syntactic and Structnrol Pattern Recognition, pages 136 147, Pont-a-Mousson,

France, September 1988

[54] H.S Baird, S.E Jones, and S.J Fortune Image Segmentation using

Shape-Directed Covers In Proc of the 10th International Conference on Pattern

Recognition, Atlantic City, NJ, June, 17-211990

[55] H.S Baird Background Structure in Document Images In Advances in Stmctural

and Syntactic Pattern Recognition, pages 253269 World Scientific, Singapore,

1992

[56] J Ha, RM Haralick, and LT Phillips Document Page Decomposition by the

Bounding-Box Projection Technique In Proc 0/ the 3th International Conference

on Dowment Analysis and Recognition, Montreal, Canada, August 1995

[57] S Chen, RM Haralick, and LT Phillips Extraction of Text Layout Structures on

Document Images based on Statistical Characterization In ISe1T/SPIE Symposium

on Electronic Imaging Science and Technology, Dowment Recognition II, pages

128139, San Jose', USA, 1995

[58] E.G Johnston SHORT NOTE: Printed Text Discrimination Computer Graphics

and Image Processing, 3:8389, 1974

Trang 8

[59] F Heines and J Lichter Layout extraction of mixed mode documents Machine

Vision and Applications, 7:237246, 1994

[60] O Deforges and D Barba Segmentation of Complex Documents Multilevel

Images: a Robust and Fast Text Bodies-Headers Detection and Extraction Scheme

In Proc 0/ the 3th International Conference on Document Analysis and Recognition, pages 770773, Montreal, Canada, August 1995

[61] P Parodi and G Piccioli An Efficient Pre-Processing of MixedContent Document

Images for OCR Systems In Proc 0/ the 13th International Conference on

Pattern Recognition, pages 778782, Vienna, Austria, August 1996 IEEE Press

[62] M.B.H Ali, F Fein, F Heines, T Jager, and A Weigel Document Analysis at

DFKL Part 1: Image Anlysis and Text Recognition Technical Report RR-95-02,

German Research Center for Artificial Intelligence (DKFI), Kaiserslautern,

Germany, March 1995

[63] K.J Wong, RG Casey, and F.M Wahl Document Analysis System IBM Journal

0/ Resercli and Development, 26(6):647656, 1982

[64] G Nagy and S.C Seth Hierarchical Representation of Optically Scanned

Documents In Proc 0/ the 7th International Conference on Pattern Recognition,

pages 347349, Montreal, Canada, 1984

[65] D Wang and S.N Srihari Classification of Newspaper Image Blocks Using

Texture Analysis Computer Vision, Graphics and Image Processing, 47:327352,

1989

[66] G Nagy, S Seth, and M Viswanathan A Prototype Document Image Analysis

System for Technical Journals Computer, 25(7):1022, 1992

[67] M Krishnamoorthy, G Nagy, S Seth, and M Viswanathan Syntactic

Segmentation and Labeling of Digitized Pages from Technical Journals IEEE

Transactions on Pattern Analysis and lldachine Intelligence, 15(7):737747, 1993

[68] D Sylwester and S Seth A Trainable, Single-Pass Algorithm for Column

Segmentation In Proc of the 3th International Conference on Dowment Analysis

and Recognition, pages 615618, Montreal, Canada, August 1995

[69] T Pavlidis and J Zhou Page Segmentation and Classification CVGIP: Graphical

Models and Image Processing, 54(6):484496, 1992

Trang 9

[70] A.K Jain and S Bhattacharjee Text Segmentation using Gabor filters for

automatic document processing lldachine Vision and Applications, 5(3):169184,

1992

[71] Y.Y Tang, H Ma, X Mao, D Liu, and C.Y Suen A New Approach to Document

Analysis Based on Modified Fractal Signature In Proc of the 3th International

Conference on Dowment Analysis and Recognition, pages 567570, Montreal,

Canada, August 1995

[72] N Normand and C Viani-Gaudin A Background Based Adaptive Page

Segmentation Algorithm In Proc of the 3th International Conference on

Dowment Analysis and Recognition, pages 138141, Montreal, Canada, August

1995

[73] K Kise, O Yanagida, and S Takarnatsu Page Segmentation Based on Thinning

of Background In Proc of the 13th International Conference on Pattern

Recognition, pages 788792, Vienna, Austria, August 1996 IEEE Press

[74] O.T Akindele and A Belaid Page Segmentation by Segment Tracing In Proc of

the 2nd International Conference on Dowment Analysis and Recognition, pages

341344, 'Tsnkuba, Japan, October 1993 IEEE Computer Society

[75] L.A Fletcher and R Kasturi A Robust Algorithm for Text String Separation from

Mixed Text/Graphics Images IEEE Transactions on Pattern Analysis and

Machine Intelligence, 10(6):910918, 1988

[76] A.A Zlatopolsky Automated document segmentation Pattern Recognition

Letters, 15(7):699704, July 1994

[77] S.-Y Wang and T Yagasaki Block Selection: A Method for Segmenting Page

Image of Various Editing Styles In Proc of the 3th International Conference on

Dowment Analysis and Recognition, pages 128133, Montreal, Canada, August

1995

[78] A Simon, J.-C Pret, and A.P Johnson A Fast Algorithm for BottomUp

Document Layout Analysis IEEE Transactions on Pattern Analysis and Machine

Intelligence, 19(3):273277, 1997

[79] T Saitoh and T Pavlidis Page Segmentation without Rectangle Assumption In

Proc of the 11th International Conference on Pattern Recognition, pages 277280,

Trang 10

The Hague, 1992

[80] Y Hirayama A Block Segmentation Method For Document Images with

Complicated Column Structures In Proc of the 2nd International Conference on

Dowment Analysis and Recognition, pages 91 94, T'sukuba, Japan, October 1993

IEEE Computer Society

[81] S Tsujimoto and H Asada Major components of a Complete Text Reading

System Proceedings of the IEEE, 80(7):11331149, 1992

[82] F Lebourgeois, Z Bublinski, and H Emptoz A Fast and Efficient Method For

Extracting Text Paragraphs and Graphics from Unconstrained Documents In

Proc of the 11th International Conference on Pattern Recognition, pages 272276,

The Hague, 1992

[83] W Scherl, F Wahl, and H Fuchsberger Automatic Separation of Text, Graphic

and Picture Segments in Printed Material In E.S Gelsema and L.N Kanal,

editors, "Pattern Recognition in Practice", pages 213221 North-Holland,

Amsterdam, 1980

[84] J Sauvola and M Pietikainen Page Segmentation and Classification using fast

Feature Extraction and Connectivity Analysis In Proc of the 3th International

Conference on Dowment Analysis and Recognition, pages 11271131, Montreal,

Canada, August 1995

[85] A.K Jain and Y Zhong Page Layout Segmentation based on Texture Analysis

Pattern Recognition, 29(5):743770, 1996

[86] K Etemad, D.S Doermann, and R Chellappa Multiscale Segmentation of

Unstructured Document Pages Using Soft Decision Integration IEEE

Transactions on Pattern Analysis and Machine Intelligence, 19(1):9296, January

1997

[87] F.Y Shih and S.S Chen Adaptive Document Block Segmentation and

Classification IEEE Transactions on Systems, Man, and Cybernetics,

26(5):797802, 1996

[88] R Sivararnaakrishnan, LT Phillips, J Ha, S Subrarnanium, and RM Haralick

Zone Classification in a Document using the Method of Feature Vector

Generation In Proc of the 3th International Conference on Document Analysis

Ngày đăng: 25/09/2013, 08:24

TỪ KHÓA LIÊN QUAN

w