1. Trang chủ
  2. » Luận Văn - Báo Cáo

LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI

74 21 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên Cứu Một Số Phương Pháp Nhận Dạng Chữ Và Số Viết Tay Trên Phiếu Ghi Điểm Thi
Tác giả Thái Lâm Ngọc Thi
Người hướng dẫn PGS.TS Đỗ Năng Toàn
Trường học Trường Đại Học Duy Tân
Chuyên ngành Khoa Học Máy Tính
Thể loại luận văn thạc sĩ
Năm xuất bản 2021
Thành phố Đà Nẵng
Định dạng
Số trang 74
Dung lượng 12,48 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

1 Đà Nẵng, ngày tháng năm 2021 HỌC VIÊN Thái Lâm Ngọc Thi BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC DUY TÂN THÁI LÂM NGỌC THI NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG CHỮ VÀ SỐ VIẾT TAY TRÊN PHIẾU GHI ĐIỂM THI Chuyên ngành Khoa học máy tính Mã số 60480101 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH Người hướng dẫn khoa học PGS TS Đỗ Năng Toàn Đà Nẵng, 2021 LỜI CẢM ƠN Luận văn được thực hiện tại Trường Đại học Duy Tân dưới sự hướng dẫn của thầy PGS TS Đỗ Năng Toàn Trước hết em xin bày tỏ lòng biết ơn sâu sắc t.

Trang 1

Đà Nẵng, ngày … tháng … năm 2021

HỌC VIÊN

Thái Lâm Ngọc Thi

THÁI LÂM NGỌC THI

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG CHỮ VÀ SỐ VIẾT TAY TRÊN PHIẾU GHI

ĐIỂM THI

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Đà Nẵng, 2021

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC DUY TÂN

THÁI LÂM NGỌC THI

NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG CHỮ VÀ SỐ VIẾT TAY TRÊN PHIẾU GHI ĐIỂM THI

Chuyên ngành: Khoa học máy tính

Mã số: 60480101

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS Đỗ Năng Toàn

Đà Nẵng, 2021

Trang 3

Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, các đồng nghiệpnhững người đã động viên, giúp đỡ và tạo điều kiện cho em trong quá trìnhhọc tập và hoàn thành luận văn.

Trang 4

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi

Các số liệu và kết quả nghiên cứu trong luận văn này là trung thực vàkhông trùng lặp với các đề tài khác

Đà Nẵng, ngày … tháng … năm 2021

HỌC VIÊN

Thái Lâm Ngọc Thi

Trang 5

MỤC LỤC

LỜI CẢM ƠN i

MỤC LỤC iii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT vi

DANH MỤC CÁC HÌNH, ẢNH CHỤP vii

MỞ ĐẦU 1

1 Lý do chọn đề tài: 1

2 Mục đích nghiên cứu: 2

3 Nhiệm vụ nghiên cứu: 2

4 Đối tượng và phạm vi nghiên cứu: 2

5 Phương pháp nghiên cứu: 3

6 Nội dung của luận văn: gồm có 3 chương 3

Chương 1 KHÁI QUÁT VỀ NHẬN DẠNG CHỮ VÀ SỐ VIẾT TAY 4

1.1 Giới thiệu về bài toán nhận dạng chữ viết tay 4

1.1.1 Các giai đoạn phát triển 5

1.1.2 Quá trình nghiện cứu và phát triển 6

1.2 Các bước xử lý ảnh 8

1.2.1 Thu nhận ảnh 8

1.2.2 Xử lý trước (hay tiền xử lý) 9

1.2.3 Phân đoạn (hay phân vùng ảnh) 10

1.2.4 Tích chọn đặc trưng 10

1.2.5 Phân loại ảnh 11

1.3 Một số phương pháp nhận dạng: 11

1.3.1 Đối sánh mẫu: 11

1.3.2 Phương pháp tiếp cận cấu trúc: 12

1.3.3 Mạng Nơron 14

Trang 6

1.3.4 Công thức SVM 15

1.3.5 Mô hình Markov ẩn 19

1.4 Kết hợp các kỹ thuật nhận dạng: 21

1.4.1 Kiến trúc tuần tự 21

1.4.2 Kiến trúc song song 22

1.4.3 Kiến trúc lai ghép 22

1.5 Đánh giá các phương pháp nhận dạng 22

1.6 Kết luận chương 1 25

Chương 2 KỸ THUẬT SVM TRONG NHẬN DẠNG PHIẾU GHI ĐIỂM THI 26

2.1 Kỹ thuật SVM 26

2.1.1 Phân lớp nhị phân 26

2.1.2 Phân nhiều lớp 35

2.2 Các thuật toán huấn luyện SVM 37

2.2.1 Thuật toán chặt khúc 37

2.2.2 Thuật toán phân rã 38

2.2.3 Thuật toán SMO 39

2.3 Nhận dạng phiếu điểm với SVM 42

2.3.1 Đặc trưng của phiếu điểm 42

2.3.2 Nhận dạng phiếu điểm 43

2.4 Kết luận chương 50

Chương 3 THIẾT KẾ CHƯƠNG TRÌNH VÀ KẾT QUẢ THỬ NGHIỆM 51 3.1 Bài toán nhận dạng phiếu ghi điểm thi 51

3.1.1 Đối tượng và phạm vi áp dụng: 52

3.1.2 Quy trình hệ thống nhận dạng phiếu ghi điểm thi: 52

3.1.3 Huấn luyện 53

3.1.4 Nhận dạng 54

Trang 7

3.2 Một số kết quả 57 3.3 Kết luận chương: 58 KẾT LUẬN 60 TÀI LIỆU THAM KHẢO

QUYẾT ĐỊNH GIAO ĐỀ TÀI (Bản sao)

Trang 8

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

CCIR Hội đồng tư vấn quốc tế về vô tuyến điện

Trang 9

DANH MỤC CÁC HÌNH

Hình 1.1 Quá trình xử lý ảnh 8

Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh 8

Hình 1.3 Siêu phẳng phân chia tuyến tính 16

Hình 1.4 Biên độ và siêu phẳng có biên độ cực đại 16

Hình 1.5 Vector hỗ trợ 17

Hình 1.6 Ánh xạ phi tuyến và hàm hạt nhân 17

Hình 1.7 Mô hình nhận dạng ký tự dùng SVM 18

Hình 1.8 Mô hình Markov ẩn 19

Hình 1.9 Đồ thị vô hướng HMM 20

Hình 2.1 Phân lớp tuyến tính 26

Hình 2.2 Siêu phẳng tách tuyến tính 27

Hình 2.3 Lề phân cách 28

Hình 2.4 Lề phân cách lớn nhất 28

Hình 2.5 Khoảng cách từ điểm dữ liệu đến mặt phân cách 29

Hình 2.6 Hình mẫu dữ liệu bị gán nhãn sai 32

Hình 2.7 Biểu diễn các mẫu gán sai nhãn 33

Hình 2.8 Phân nhiều lớp với SVM 35

Hình 2.9 Mẫu phiếu ghi điểm thi 42

Hình 2.10 Mẫu bảng điểm môn học, mô đun 43

Hình 2.11 Nhị phân hóa ảnh 45

Hình 2.12 Lọc nhiễu 45

Hình 2.13 Chuẩn hóa kích thước ảnh các số “4” và “6” 45

Hình 2.14 Làm tròn biên chữ 46

Hình 2.15 Làm mảnh chữ 47

Hình 2.16 Hiệu chỉnh độ nghiêng của phiếu điểm 47

Trang 10

Hình 2.17 Tách thông tin phiếu ghi điểm thi 48

Hình 3.1 Một mẫu dữ liệu huấn luyện 51

Hình 3.2 Huấn luyện Support Vector theo dữ liệu mẫu 54

Hình 3.3 Các support vector 54

Hình 3.4 Nhận dạng các chữ số với SVM 55

Hình 3.5 Nhận dạng số viết tay – số 0 55

Hình 3.6 Nhận dạng số viết tay – số 2 55

Hình 3.7 Nhập phiếu ghi điểm thi 56

Hình 3.8 Xử lý phiếu ghi điểm thi 56

Hình 3.9 Nhận dạng phiếu ghi điểm thi 57

Hình 3.10 Kết quả nhận dạng 57

Trang 11

1 Lý do chọn đề tài:

Việc ứng dụng khoa học kỹ thuật trong các hệ thống trường học giúp choviệc quản lý được đơn giản hóa Quá trình quản lý đào tạo, môn học, giáoviên, học sinh, điểm thi học kì, điểm tốt nghiệp…cũng được rút ngắn thờigian xử lý Tuy nhiên, hệ thống quản lý hiện nay áp dụng nhiều cho các cơ sởthuộc Bộ giáo dục đào tạo, còn các cơ sở đào tạo nghề thì chưa được áp dụngrộng rãi Do mô hình đào tạo nghề chưa đồng bộ, số lượng học sinh, số lượngmôn học/ mô đun, hình thức thi kết thúc môn (thi kết thúc môn học/mô đunlần 1, lần 2, thi tốt nghiệp lý thuyết, thực hành, chính trị,…) tại mỗi cơ sởcũng không giống nhau, do đó gây không ít khó khăn trong quá trình quản lý.Vấn đề đặt ra ở đây là quá trình cập nhật và lưu trữ điểm thi từ phiếu ghi điểmthi của giáo viên vào trong bảng điểm của từng môn học/ mô đun thực sự làmột công việc có khối lượng lớn và dễ gây ra nhầm lẫn Xuất phát từ thực tế

Trang 12

đó, luận văn “Nghiên cứu một số kỹ thuật nhận dạng chữ và số trong phiếughi điểm thi” có tính thời sự và có ý nghĩa thực tiễn cao.

3 Nhiệm vụ nghiên cứu:

Các công đoạn chính của hệ thống nhập điểm tự động bao gồm:

- Nhận dạng và tạo bộ huấn luyện chữ số viết tay vào hệ thống

- Phiếu ghi điểm thi viết tay của giáo viên tại trường Trung cấp nghềDân tộc nội trú tỉnh Kiên Giang qua máy quét thu được hình ảnh sau đó đượcđưa vào máy tính

- Phân vùng ảnh thành 3 vùng: Số phách và điểm số và điểm chữ

- Nhận dạng điểm viết tay tương ứng với số phách dựa trên 2 vùng đượctrích rút từ mẫu Phiếu ghi điểm thi

4 Đối tượng và phạm vi nghiên cứu:

- Đối tượng: Các ảnh đen trắng (có độ phân giải 20 dpi trở lên) của

những phiếu điểm viết tay hiện đang được sử dụng tại trường Trung cấp nghềDân tộc nội trú Kiên Giang

- Phạm vi nghiên cứu: Các phương pháp nhận dạng chữ và số viết tay

Áp dụng kỹ thuật SVM trong việc nhận dạng điểm số viết tay trên các phiếughi điểm thi

Trang 13

5 Phương pháp nghiên cứu:

- Hỏi ý kiến chuyên gia

- Tra cứu tài liệu về các phương pháp phân loại, xử lý, trích rút dữ liệutrên ảnh

- Viết và chỉnh sửa chương trình thực nghiệm

- Chạy thử và kiểm tra độ chính xác của chương trình

6 Nội dung của luận văn: gồm có 3 chương

Chương 1: Khái quát về nhận dạng chữ và số viết tay

Chương 1 giới thiệu khái quát về bài toán nhận dạng chữ và số viết tay,các giai đoạn hình thành và phát triển, các nghiên cứu trong và ngoài nước về

kỹ thuật nhận dạng chữ và số viết tay

Chương I cũng đưa ra một số phương pháp sử dụng để thực hiện bài toánnhận dạng Đồng thời liệt kê các bước nhận dạng chữ và số viết tay

Chương 2: Sử dụng kỹ thuật SVM trong nhận dạng chữ và số viết tay trên phiếu ghi điểm thi

Chương 2 trình bày và hướng dẫn sử dụng kỹ thuật SVM trong nhậndạng chữ và số viết tay trên phiếu ghi điểm thi

Chương 3 Thiết kế chương trình và kết quả thử nghiệm

Chương 3 trình bày về thiết kế “hệ thống nhận dạng số viết tay” và cáckết quả của chương trình thử nghiệm

Kết luận

Tổng kết các kết quả đạt được và định hướng phát triển tiếp theo củaphần mềm trong thời gian tới

Trang 14

Chương 1 KHÁI QUÁT VỀ NHẬN DẠNG CHỮ VÀ SỐ VIẾT TAY 1.1 Giới thiệu về bài toán nhận dạng chữ viết tay

Nhận dạng chữ viết tay (Handwriting recognition - HWR), còn đượcgọi là Nhận dạng văn bản viết tay (Handwriten Text Recognition - HTR), làkhả năng máy tính nhận và giải thích dữ liệu chữ viết tay dễ hiểu từ: tàiliệu giấy, tranh ảnh, màn hình cảm ứng hoặc các thiết bị khác Hình ảnh củavăn bản viết có thể được nhận biết từ một mảnh giấy bằng cách quét quanghọc (nhận dạng ký tự quang học) hoặc nhận dạng từ thông minh Ngoài ra,các chuyển động của đầu bút có thể được cảm nhận trên đường đi của nétviết Một hệ thống nhận dạng chữ viết thực hiện xử lý định dạng, phân đoạnchính xác thành các ký tự và tìm ra các từ hợp lý nhất để trả về kết quả chínhxác

Lĩnh vực nhận dạng chữ là một đã được quan tâm nghiên cứu và ứngdụng từ nhiều năm nay theo hai hướng chính: Một là “Nhận dạng chữ in”:phục vụ cho công việc tự động hóa đọc tài liệu, tăng tốc độ và hiệu quả nhậpthông tin vào máy tính trực tiếp từ các nguồn tài liệu Hai là “Nhận dạng chữviết tay”: với những mức độ ràng buộc khác nhau về cách viết, kiểu chữ, phục

vụ cho các ứng dụng đọc và xử lý chứng từ, hóa đơn, phiếu thông tin, bảnthảo viết tay…

Quá trình nhận dạng chữ viết tay được tách thành hai hướng phát triển:nhận dạng chữ viết tay trực tuyến (on-line) và nhận dạng chữ viết tay ngoạituyến (off-line) Đến thời điểm hiện tại, bài toán về nhận dạng chữ in đã đượcgiải quyết gần như trọn vẹn với các sản phẩm như: FineReader 9.0 của hãngABBYY có thể nhận dạng chữ in theo 20 ngôn ngữ khác nhau, phần mềmnhận dạng chữ Việt in VnDOCR 4.0 của Viện Công nghệ Thông tin Hà Nội

có thể nhận dạng được các tài liệu chứa hình ảnh, bảng và văn bản tiếng Việtvới độ chính xác trên 98%,

Trang 15

Tuy nhiên trên thế giới cũng như ở Việt Nam, bài toán nhận dạng chữviết tay vẫn còn là vấn đề thách thức lớn đối với các nhà nghiên cứu Bài toànnày chưa thể giải quyết trọn vẹn vì nó phụ thuộc quá nhiều vào người viết và

sự biến đổi quá đa dạng trong cách viết và trạng thái tinh thần của từng ngườiviết Đặc biệt đối với việc nghiên cứu nhận dạng chữ viết tay tiếng Việt lạicàng gặp nhiều khó khăn hơn do bộ ký tự tiếng Việt có thêm phần dấu, rất dễnhầm lẫm với các mẫu định sẵn

1.1.1 Các giai đoạn phát triển

Mô hình nhận dạng chữ viết được đề xuất từ năm 1951 do phát minhcủa M Sheppard được gọi là GISMO, một robot đọc - viết

Năm 1954, máy nhận dạng chữ đầu tiên đã được phát triển bởi J.Rainbow dùng để đọc chữ in hoa nhưng rất chậm

Năm 1967, Công ty IBM đã thương mại hóa hệ thống nhận dạng chữ

 Giai đoạn 2: (1980 – 1990)

- Với sự phát triển của các thiết bị phần cứng máy tính và các thiết bịthu nhận dữ liệu, các phương pháp luận nhận dạng đã được phát triển tronggiai đoạn trước đã có được môi trường lý tưởng để triển khai các ứng dụngnhận dạng chữ

Trang 16

- Các hướng tiếp cận theo cấu trúc và đối sánh được áp dụng trongnhiều hệ thống nhận dạng chữ.

- Trong giai đoạn này, các hướng nghiên cứu chỉ tập trung vào các kỹthuật nhận dạng hình dáng chứ chưa áp dụng cho thông tin ngữ nghĩa Điềunày dẫn đến sự hạn chế về hiệu suất nhận dạng, không hiệu quả trong nhiềuứng dụng thực tế

 Giai đoạn 3: (Từ 1990 đến nay)

- Các hệ thống nhận dạng thời gian thực được chú trọng

- Các kỹ thuật nhận dạng kết hợp với các phương pháp luận trong lĩnhvực học máy (Machine Learning) được áp dụng rất hiệu quả

- Một số công cụ học máy hiệu quả như mạng nơron, mô hình Markov

ẩn, SVM (Support Vector Machines) và xử lý ngôn ngữ tự nhiên

1.1.2 Quá trình nghiện cứu và phát triển

 Tình hình nghiên cứu trong nước

Những năm gần đây, lĩnh vực nhận diện chữ viết tay đã và đang đượcnhiều nhà nghiên cứu trong nước đặc biệt quan tâm Một số nhóm nghiên cứuđiển hình như:

- GS.TSKH Hoàng Kiếm và các cộng sự (năm 2001) ở Đại học QuốcGia TP.HCM đã cài đặt và thử nghiệm hệ thống nhận dạng chữ số và chữ viếttay rời rạc trên các phiếu xuất nhập cảnh

- Các tác giả Lê Hoài Bắc và Lê Hoàng Thái (năm 2001) đã nghiên cứubài toán nhận dạng chữ số dựa trên mạng nơron và giải thuật di truyền

- Nhóm nghiên cứu ở phòng nhận dạng và Công nghệ Tri thức củaViện Công nghệ Thông tin với nhiều công trình nghiên cứu về nhận dạng chữviết tay dựa trên mô hình Markov ẩn, mạng nơ ron và SVM

- Nhóm nghiên cứu của TS Nguyễn Việt

Hà và các cộng sự (năm 2005) ở Đại học Quốc

Trang 17

Gia Hà Nội đã nghiên cứu đề xuất giải pháp mô hình liên mạng nrron trongnhận dạng ký tự viết tay Tiếng Việt,…

- Năm 2010, nhóm nghiên cứu Huỳnh Hữu Lộc, Lưu Quốc Hải, ĐinhĐức Anh Vũ (Khoa Khoa học và Kỹ thuật máy tính, Trường Đại học Báchkhoa TP Hồ Chí Minh) đã đạt được những bước tiến đáng kể trong nhận dạng

ký tự viết tay Hướng tiếp cận của nhóm nghiên cứu là nhận dạng dựa trênthông tin tĩnh Dựa trên nền tảng giải thuật rút trích thông tin theo chiều,nhóm tác giả đã cải tiến đa số các bước để đạt được độ chính xác cao hơntrong việc nhận dạng ký tự (khoảng 95%) và có những bước tiến đáng kểtrong nhận dạng cả từ Tuy nhiên sản phẩm vẫn chưa nhận dạng được chữ viếttay tiếng Việt

Như vậy có thể thấy nhận dạng chữ viết tay, đặc biệt chữ viết tay tiếngViệt hiện đang là một hướng nghiên cứu rất được quan tâm hiện nay và đangcòn nhiều vấn đề cần phải hoàn thiện

 Tình hình nghiên cứu ở nước ngoài

Từ những năm 1990 đến nay, các hệ thống nhận dạng thời gian thựcđược xây dựng và phát triển cơ sở các phương pháp luận phân lớp trong lĩnhvực học máy kết hợp với các kỹ thuật xử lý ảnh một cách hiệu quả Một sốphương pháp học máy tiên tiến như mạng nơron, mô hình Markov ẩn, SVM,

đã được các nhà nghiên cứu trong và ngoài nước áp dụng để phát triển cácứng dụng trong lĩnh vực nhận diện chữ viết tay;

Kề từ năm 1999, khi Flatt đề xuất thuật toán SMO để giải các bài toántối ưu trong kỹ thuật phân lớp SVM thì các nhà nghiên cứu tập trung áp dụngphương pháp phân lớp SVM vào các ứng dụng nhận dạng chữ viết tay hoặckết hợp SVM và các phương pháp truyền thống khác như mạng noron…

Trang 18

Sơ đồ tổng quát của một hệ thống xử lý ảnh:

Hình 1.2 Các bước cơ bản trong một hệ thống xử lý ảnh

Sơ đồ này bao gồm các thành phần sau:

1.2.1 Thu nhận ảnh

Đầu tiên, ảnh từ ngoài được thu nhận thông qua các thiết bị thu (nhưCamera, máy chụp ảnh, máy scanner) Trước đây, ảnh thu qua Camera là cácảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng).Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy ra

từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử

Trang 19

lý tiếp theo (máy ảnh số hiện nay là một thí dụ gần gũi) Mặt khác, ảnh cũng

có thể tiếp nhận từ vệ tinh qua các bộ cảm ứng hay ảnh; có thể quét từ ảnhchụp bằng máy quét ảnh scaner Sau đó được lưu trữ trong máy tính Gồm có

2 quá trình:

+ Biến đổi năng lượng quang học sang năng lượng điện

+ Biến đổi năng lượng điện sang dạng ma trận số

1.2.2 Xử lý trước (hay tiền xử lý)

Ảnh sau khi thu nhận có thể bị nhiễu, bị méo, độ tương phản thấp là

do những nguyên nhân khác nhau: có thể do chất lượng thiết bị thu nhận ảnh,

do nguồn sáng hay do nhiễu ảnh có thể bị suy biến Vì vậy cần phải tăngcường và khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, haylàm cho ảnh gần giống nhất với trạng thái gốc (trạng thái trước khi ảnh bị biếndạng) nhằm các mục đích phục vụ cho các bước tiếp theo

Những mục đích riêng biệt có thể đặt ra cho quá trình tiền xử lý là: + Thực hiện điều chỉnh độ chiếu sáng để khắc phục hậu quả của sựchiếu sáng không đồng đều

+ Giảm nhỏ thành phần nhiễu

+ Cải thiện độ tương phản của ảnh màu do khuôn màu không tốt

+ Hiệu chỉnh độ méo giá trị xám

+ Loại bỏ tính không đồng thể của ảnh gây nên từ tính không đồng bộcủa lớp nhạy quang của hệ thống thu nhận ảnh

+ Chuẩn hóa độ lớn, dạng và màu

+ Điều chỉnh bộ lọc để khuyếch đại các tần số với những thông tinquan trọng được khuyếch đại và nén đi các tần số khác

 Các công đoạn tiền xử lý:

Trang 20

Giai đoạn tiền xử lý văn bản là giai đoạn quan trọng, có ảnh hưởng trựctiếp đến độ chính xác của quá trình nhận dạng, tuy nhiên nó cũng làm tăng thờigian chung của cả hệ thống Vì vậy, tùy theo chất lượng ảnh thu nhận được củatừng trường hợp cụ thể, mà chúng ta chọn sử dụng một hoặc một số thủ tục tiền

xử lý Thậm chí, trong trường hợp văn bản đầu vào có chất lượng tốt và cần ưutiên tốc độ xử lý, chúng ta có thể bỏ qua giai đoạn tiền xử lý này Thôngthường, chúng ta vẫn phải thực hiện một số thủ tục quan trọng nhất

1.2.3 Phân đoạn (hay phân vùng ảnh)

Là quá trình phân chia các đối tượng cần khảo sát ra khỏi phần nộidung còn lại của ảnh, phân tách các đối tượng tiếp giáp nhau và phân táchnhững đối tượng riêng biệt thành những đối tượng con Một phương phápphân đoạn ảnh là sử dụng một ngưỡng giá trị xám để phân tách ảnh thành đốitượng và nền (những điểm dưới ngưỡng xám thuộc về nền, ngược lại thuộc vềđối tượng) [1]

1.2.4 Tích chọn đặc trưng

Trích chọn đặc trưng là quá trình tìm ra các thông tin hữu ích và đặctrưng nhất cho mẫu đầu vào để sử dụng cho quá trình nhận dạng Trong lĩnhvực nhận dạng, trích chọn đặc trưng là một bước rất quan trọng, nó có ảnhhưởng lớn đến tốc độ và chất lượng nhận dạng Trích chọn đặc trưng như thếnào để vẫn đảm bảo không mất mát thông tin và thu gọn kích thước đầu vào

là điều vẫn đang được các nhà nghiên cứu quan tâm

Trang 21

1.2.5 Phân loại ảnh

Thực hiện công việc sắp xếp một đối tượng vào một lớp đối tượng chotrước Để giải quyết bài toán này thì các đặc tính có ý nghĩa phải được lựachọn Ta tìm thấy các đặc tính có ý nghĩa khi ta phân tích các mẫu được lựachọn từ những đối tượng khác nhau

1.3 Một số phương pháp nhận dạng:

Hiện nay, việc nhận dạng chữ viết tay có nhiều phương pháp nhậndạng, trong đó phương pháp nhận dạng mẫu được áp dụng rộng rãi Cácphương pháp này có thể được tích hợp trong các hướng tiếp cận sau: Đối sánhmẫu, thống kê, cấu trúc, mạng nơron và SVM, mô hình Markov ẩn …

1.3.1 Đối sánh mẫu:

Một trong những kỹ thuật đơn giản nhất để nhận dạng chữ viết tay đó làphương pháp đối sánh các nguyên mẫu (prototype) với nhau để nhận dạngmột số hay một từ Phương pháp này nhằm xác định mức độ giống nhau giữahai vector (các điểm, hình dạng, độ cong…) trong một không gian đặc trưng.Phương pháp đối sách có thể thực hiện theo ba hướng

 Đối sánh trực tiếp

Một ký tự đầu vào là ảnh đa cấp xám hoặc một ảnh nhị phân được sosánh trực tiếp với một tập mẫu chuẩn đã được lưu trữ Việc so sánh dựa theomột độ đo về sự tương đồng nào đó (độ đo Euclide) để nhận dạng Các kỹthuật đối sánh này có thể đơn giản như việc so sánh một – một hoặc phức tạphơn như phân tích cây quyết định Mặc dù phương pháp đối sánh trực tiếpđơn giản và có một cơ sở toán học vững chắc nhưng kết quả nhận dạng của nórất nhạy cảm với nhiễu

 Các mẫu biến dạng và đối sánh mềm

Trang 22

Phương pháp đối sánh sử dụng các mẫu biến dạng, trong đó một phépbiến dạng ảnh được dùng để đối sánh một ảnh chưa biết với một bộ cơ sở dữliệu ảnh đã biết.

Đối sánh mềm là đối sánh một cách tối ưu mẫu chưa biết với tất cả cácmẫu có thể mà các mẫu này có thể kéo giãn ra hoặc co lại Chỉ một khônggian đặc trưng được thành lập, các vector chưa biết được đối sánh bằng cách

sử dụng quy hoạch động và một hàm biến dạng

 Đối sánh giảm nhẹ

Đây là kỹ thuật đối sánh mẫu ở mức độ tượng trưng, kỹ thuật này sửdụng hình dáng đặc trưng cơ bản của ảnh chứa ký tự Đầu tiên các vùng đốisánh đã được nhận biết Sau đó, trên cơ sở một số vùng đối sánh được đánhgiá tốt, các phần tử của ảnh được so sánh với các vùng đối sánh này Côngviệc này đòi hỏi phải có một kỹ thuật tìm kiếm trong một không gian đa chiều

để tìm cực đại toàn cục của một số hàm

Các kỹ thuật đối sánh này chỉ áp dụng có hiệu quả với việc nhận dạngchữ in, đối với việc nhận dạng các ký tự viết tay thì không hiệu quả

1.3.2 Phương pháp tiếp cận cấu trúc:

Phương pháp này thực hiện tiếp cận dựa vào việc mô tả đối tượng nhờmột số khái niệm biểu diễn đối tượng cơ sở trong ngôn ngữ tự nhiên Để mô

tả đối tượng người ta dùng một số dạng nguyên thủy như đoạn thẳng, cung,…Mỗi đối tượng được mô tả như một sự kết hợp của các dạng nguyên thủy

Quy tắt kết hợp các dạng nguyên thủy được xây dựng giống như việcnghiên cứu văn phạm của ngôn ngữ đó, vì vậy quá trình quyết định nhận dạng

là quá trình phân tích cú pháp Phương pháp này đặt vấn đề để giải quyết bàitoán nhận dạng chữ tổng quát Tuy vậy, cho đến nay còn nhiều vấn đề liênquan đến việc nhận dạng cú pháp chưa được giải quyết độc lập và chưa xâydựng được các thuật toán phổ dụng Hiện nay, nhận dạng theo cấu trúc là trích

Trang 23

chọn các đặc trưng của mẫu học, phân hoạch bảng ký tự dựa trên các đặctrưng này, sau đó ảnh cần nhận dạng sẽ được trích chọn đặc trưng và so sánhtrên bảng phân hoạch để tìm ra ký tự có các đặc trưng phù hợp.

Đối với nhận dạng chữ viết tay dựa theo cấu trúc xương và đường biên,công việc này đòi hỏi phải xây dựng các đặc trưng của chữ, đặc biệt là đặctrưng về các điểm uốn, điểm gấp khúc và đặc trưng của các nét Sau quá trìnhtiền xử lý, công việc tách các nét được tiến hành thông qua các điểm chạc.Sau đó trích chọn đặc trưng cấu trúc xương của các chữ, mỗi nét đặc trưngbởi cặp chỉ số đầu và cuối tương ứng với thứ tự của điểm chạc đầu và điểmchạc cuối Cuối cùng là xây dựng cây tìm kiếm, dựa vào đặc trưng về cấu trúcbiên để phân tập mẫu học thành các lớp Quá trình tìm kiếm để phân lớp đượctiến hành qua hai bước là: Xác định lớp tương ứng với mẫu vào và tìm kiếmtrong lớp đó mẫu nào gần giống với mẫu vào nhất

Các phương pháp cấu trúc áp dụng cho bài toán nhận dạng chữ đượcphát triển theo hai hướng sau:

 Phương pháp ngữ pháp (Grammatical Methods)

Từ giữa thập niên 1960, các nhà nghiên cứu bắt đầu xét các luật củangôn ngữ học để phân tích tiếng nói và chữ viết Sau này, các luật đa dạng vềngữ pháp, chính tả, từ vựng và ngôn ngữ học đã được áp dụng cho các việcnhận dạng Các phương pháp ngữ pháp khởi tạo một số luật sinh để hìnhthành các ký tự từ một tập các công thức ngữ pháp nguyên thủy Các luật sinhnày có thể kết nối bất kỳ kiểu đặc trưng thống kê và đặc trưng hình thái nàodưới một số cú pháp hoặc các luật ngữ nghĩa Giống như lý thuyết ngôn ngữ,các luật sinh cho phép mô tả các cấu trúc câu có thể chấp nhận được và tríchchọn thông tin theo ngữ cảnh về chữ viết bằng cách sử dụng các kiểu ngữpháp khác nhau

Trang 24

Trong các phương pháp này, việc huấn luyện được thực hiện bằng cách

mô tả mỗi ký tự bằng một văn phạm Còn trong pha nhận dạng thì chuỗi, câyhoặc đồ thị của một đơn vị viết bất kỳ (Ký tự, từ và câu) được phân tích đểquyết định văn phạm của mẫu đó thuộc lớp nào Các phương pháp ngữ pháphầu hết được sử dụng trong giai đoạn hậu xử lý để sửa các lỗi mà khối nhậndạng đã thực hiện sai

 Phương pháp đồ thị (Graphical Methods)

Các đơn vị chữ viết được mô tả bởi các cây hoặc các đồ thị Các dạngnguyên thủy của ký tự (các nét) được lựa chọn bởi một hướng tiếp cận cấutrúc Đối với mỗi lớp, một đồ thị hoặc cây được thành lập trong thời gianhuấn luyện để mô tả các nét, các ký tự hoặc các từ Giai đoạn nhận dạng gánmột đồ thị chưa biết vào một trong các lớp bằng cách sử dụng một độ đo để

so sánh các đặc điểm giống nhau giữa các đồ thị

Có rất nhiều hướng tiếp cận khác nhau sử dụng phương pháp đồ thị,tiêu biểu là hướng tiếp cận đồ thị phân cấp được dùng trong việc nhận dạngchữ viết tay Trung Quốc và Hàn Quốc

1.3.3 Mạng Nơron

Một mạng Nơron được định nghĩa như một cấu trúc tính toán bao gồmnhiều bộ xử lý “nơ ron” được kết nối song song lồng ghép với nhau Do bảnchất song song của các nơron nên nó có thể thực hiện các tính toán với mức

độ cao hơn so với các kỹ thuật phân lớp khác Mạng noron chứa nhiều nút,đầu ra của một nút được sử dụng cho một nút khác ở trong mạng và hàmquyết định cuối cùng phụ thuộc vào sự tương tác phức tạp giữa các nút Mặc

dù nguyên lý khác nhau, nhưng hầu hết các kiến trúc mạng nơron đều tươngđương với các phương pháp nhận dạng mẫu thống kê

Các kiến trúc mạng nơron có thể phân thành hai nhóm chính: mạngtruyền thẳng và mạng lan truyền ngược Trong các hệ thống nhận dạng chữ,

Trang 25

các mạng nơron sử dụng phổ biến nhất là mạng perceptron đa lớp thuộc nhómmạng truyền thẳng và mạng SOM (Seft Origanizing Map) của Kohonen thuộcnhóm mạng lan truyền ngược.

Mạng perceptron đa lớp được đề xuất bởi Rosenblatt được nhiều tác giả

sử dụng trong các hệ nhận dạng chữ viết tay Hầu hết các nghiên cứu pháttriển nhận dạng chữ viết tay hiện nay đều tập trung vào mạng SOM SOM kếthợp trích chọn đặc trưng và nhận dạng trên một tập lớn các ký tự huấn luyện.Mạng này chứng tỏ rằng nó tương đương với thuật toán phân cụm k – means

Với thuật toán đơn giản nhưng rất hiệu quả, cùng với thành công của

mô hình này trong các ứng dụng thực tiễn, mạng nơron hiện đang là mộttrong các hướng nghiên cứu của lĩnh vực học máy Mạng nơ ron tỏ ra phù hợpvới các bài toán đối sánh, phân loại mẫu, xấp xỉ hàm, tối ưu hóa, lượng tử hóavector và phân hoạch không gian dữ liệu, trong khi các phương pháp truyềnthống không đủ khả năng thực hiện được

1.3.4 Công thức SVM

Công thức SVM đơn giản nhất là trường hợp tuyến tính khi mà mộtsiêu phẳng quyết định nằm giữa hai tập dữ liệu.Trong trường hợp này, khônggian giả định là một tập các điểm có phương trình là: f(x) =w.x+b SVM đitìm một siêu phẳng tối ưu như một phương án để phân chia hai tập hợp dữliệu và đồng thời có thể sử dụng cho những dữ liệu mới

Có hai phương pháp để tìm siêu phẳng tối ưu Thứ nhất là tìm siêuphẳng nằm giữa 2 tập đóng Thứ hai là cực đại hoá khoảng cách giữa hai mặtphẳng hỗ trợ (cực đại hoá lề) Cả hai phương pháp đều tìm ra một mặt phẳngquyết định và tập hợp những điểm hỗ trợ cho quyết định Chúng được gọi làcác vector hỗ trợ

Trang 26

Hình 1.3 Siêu phẳng phân chia tuyến tính

Hình 1.4 Biên độ và siêu phẳng có biên độ cực đại

Siêu phẳngphân chia

Siêu phẳng có biên đ cực đại ộ cực đại

Trang 27

Hình 1.5 Vector hỗ trợ

Hình 1.6 Ánh xạ phi tuyến và hàm hạt nhân

Việc huấn luyện SVM là việc giải bài toán quy hoạch toàn phương vớicác ràng buộc bằng và không bằng Việc xử lý sau cùng là xử lý các tham sốdương α và rút ra một tập con của tập huấn luyện tương ứng với các tham số.Việc huấn luyện một tập dữ liệu nhỏ (nhỏ hơn 1000 mẫu) có thể được xử lýmột cách nhanh chóng trên một máy tính có cấu hình thích hợp Đối vớinhững tập dữ liệu lớn hơn, việc giải bài toán quy hoạch toàn phương đòi hỏimột máy tính có năng lực lớn và bộ nhớ lớn để lưu trữ ma trận hạt nhân trong

Vector hỗ trợ

Trang 28

suốt quá trình tính toán Bộ nhớ yêu cầu lên đến bình phương kích thước củatập huấn luyện.

Có nhiều phương pháp huấn luyện SVM được phát triển để tận dụng bộnhớ, cải thiện tốc độ huấn luyện và tìm một mô hình tốt nhất bằng cách dùngmột nhân và các siêu tham số thích hợp (Burges, 1988) Lưu ý rằng, SVM cơbản dùng cho hai lớp Để có thể dùng cho nhiều lớp thì ta phải kết hợp nhiều

bộ phân loại hai lớp hoặc xây dựng SVM cho nhiều lớp

Hình 1.7 Mô hình nhận dạng ký tự dùng SVM

SVM thường thực hiện tốt trên các tập dữ liệu khả tách tuyến tính vì cóthể thực hiện việc xác định siêu mặt phẳng phân tích dữ liệu tối ưu, trongtrường hợp này SVM chỉ việc tập trung vào việc cực đại hóa lề

Trang 29

Khả năng giải quyết các vấn đề nêu trên một cách hiệu quả Đặc biệttrong các hệ thống nhận dạng sử dụng mạng nơ ron đã đạt được tỉ lệ nhậndạng khá chính xác, có thể so sánh với các phương pháp nhận dạng cấu trúc,nhận dạng thống kê…

1.3.5 Mô hình Markov ẩn

Mô hình Markov ẩn (Hiden Markov Model - HMM) được giới thiệuvào cuối những năm 1960 Cho đến hiện nay nó có một ứng dụng khá rộngnhư trong nhận dạng giọng nói, tính toán sinh học (Computational Biology),

và xử lý ngôn ngữ tự nhiên… HMM là mô hình máy hữu hạn trạng thái vớicác tham số biểu diễn xác suất chuyển trạng thái và xác suất sinh dữ liệu quansát tại mỗi trạng thái chuyển đổi

Mô hình Markov ẩn là mô hình thống kê trong đó hệ thống được môhình hóa được cho là một quá trình Markov với các tham số không biết trước,nhiệm vụ là xác định các tham số ẩn từ các tham số quan sát được Các tham

số của mô hình được rút ra sau đó có thể sử dụng để thực hiện các phân tích

kế tiếp

Trong một mô hình Markov điển hình, trạng thái được quan sát trựctiếp bởi người quan sát, và vì vậy các xác suất chuyển tiếp trạng thái là cáctham số duy nhất

Hình 1.8 Mô hình Markov ẩn

Trang 30

xi: Các trạng thái trong mô hình Markov

aij: Các xác suất chuyển tiếp

bij: Các xác suất đầu ra

yi: Các dữ liệu quan sát

Mô hình Markov ẩn thêm vào các đầu ra: mỗi trạng thái có xác suấtphân bố trên các biểu hiện đầu ra có thể Vì vậy, nhìn vào dãy của các biểuhiện được sinh ra bởi HMM không trực tiếp chỉ ra dãy các trạng thái Ta cótìm ra được chuỗi các trạng thái mô tả tốt nhất cho chuỗi dữ liệu quan sátđược bằng cách thực hiệu phép tính

) ( / )

| ( )

| (Y X P Y X P X

Hình 1.9 Đồ thị vô hướng HMM

Ở đó Yn là trạng thái tại thời điểm thứ t=n trong chuỗi trạng thái Y, Xn

là dữ liệu quan sát được tại thời điểm thứ t=n trong chuỗi X Do trạng tháihiện tại chỉ phụ thuộc vào trạng thái ngay trước đó với giả thiết rằng dữ liệuquan sát được tại thời điểm t chỉ phụ thuộc và trạng thái t Ta có thể tính:

t t t

t Y P X Y Y

P Y

X P Y P X Y P

2

1 1

1

( ) , (

Một số hạn chế của mô hình Markov để tính được xác suất P(Y,X) thôngthường ta phải liệt kê hết các trường hợp có thể của chuỗi Y và chuỗi X Thực

tế thì chuỗi Y là hữu hạn có thể liệt kê được, còn X (các dữ liệu quan sát) là rấtphong phú Để giải quyết các vấn đề này HMM đưa ra giả thiết về sự độc lậpgiữa các dữ liệu quan sát: Dữ liệu quan sát được tại thời điểm t chỉ phụ thuộcvào trạng thái tại thời điểm đó Hạn chế thứ hai gặp phải là việc sử dụng xác

X

Trang 31

suất đồng thời P(Y, X) đôi khi không chính xác vì với một số bài toán thì việc

sử dụng xác suất điều kiện P(Y | X) cho kết quả tốt hơn rất nhiều

1.4 Kết hợp các kỹ thuật nhận dạng:

Nội dung đã trình bày ở trên cho thấy rằng có nhiều phương pháp phânlớp có thể áp dụng đối với các hệ nhận dạng chữ viết tay Tất cả các phươngpháp trên đều có các ưu và nhược điểm riêng Vì vậy việc làm thế nào để kếthợp các phương pháp lại với nhau nhằm nâng cao chất lượng một cách hiệuquả nhất trong việc nhận dạng chữ viết tay đã và đang là điều các nhà nghiêncứu luôn hướng đến Có nhiều công trình nghiên cứu kiến trúc phân lớp theo

ý tưởng kết hợp các phân lớp đã nêu trên, các hướng đó được chia thành banhóm: Kiến trúc tuần tự, kiến trúc song song và kiến trúc lai ghép

1.4.1 Kiến trúc tuần tự

Kiến trúc này chuyển kết quả đầu ra của một máy phân lớp thành đầuvào của máy phân lớp tiếp theo Có bốn chiến lược cơ bản được sử dụng trongkiến trúc tuần tự đó là dãy, chọn lựa, boosting và thác nước

Trong chiến lược về dãy, mục tiêu của mỗi giai đoạn là thu gọn số lớp

mà mẫu đầu vào có thể thuộc về các lớp đó Số lớp có thể thu gọn tại mỗi giaiđoạn sinh ra nhãn của mẫu ở giai đoạn cuối cùng

Trong chiến lược lựa chọn, đầu tiên máy phân lớp gán mẫu chưa biếtvào một nhóm ký tự gần giống nhau Các nhóm này tiếp tục được phân lớp ởcác giai đoạn sau đó theo một cây phân cấp Tại mỗi mức của cây, nhánh concùng mẹ là giống nhau theo một độ đo nào đó Vì vậy, các máy phân lớp thựchiện phân lớp từ thô đến tinh dần trong các nhóm nhỏ

Đối với chiến lược boosting, mỗi máy phân lớp điều khiển một số lớp,các máy phân lớp ở phía trước không thể điều khiển được các lớp của cácmáy phân lớp ở phía sau

Trang 32

Cuối cùng, trong chiến lược thác nước, các máy phân lớp được kết nối

từ đơn giản đến phức tạp Các mẫu không thỏa mãn ở một mức độ tin cậy nào

đó thì phải thông qua một máy phân lớp mạnh hơn trong một giới hạn nào đócủa các đặc trưng hoặc các chiến lược nhận dạng khác

1.4.2 Kiến trúc song song

Kiến trúc này kết nối kết quả của các thuật toán phân lớp độc lập bằngcách sử dụng nhiều phương pháp khác nhau Trong số các kiến trúc này, tiêubiểu nhất là phương pháp bỏ phiếu và luật quyết định Bayes

1.4.3 Kiến trúc lai ghép

Kiến trúc này là một sự lai ghép giữa hai kiến trúc tuần tự và songsong Ý tưởng chính là kết hợp các điểm mạnh của hai kiến trúc trên và chặnbớt những khó khan trong việc nhận dạng chữ viết

Đối với chữ viết tay thìcác kỹ thuật này tỏ ra kémhiệu quả, kết quản nhậnđược của nó cũng rất nhạycảm với nhiễu

Cho đến nay có nhiều vấn

đề liên quan đến hệ nhậndạng cú pháp chưa được

Trang 33

trong ngôn ngữ tự nhiên Dễthực hiện căn cứ vào quá trìnhphân tích cú pháp

giải quyết độc lập và chưaxây dựng được các thuậttoán phổ dụng

Mạng nơ ron Mạng nơ ron được ứng

dụng nhiều trong các bài toánphân loại mẫu (điển hình làbài toán nhận dạng) bởi ưuđiểm nổi bật của nó là dễ càiđặt cùng với khả năng học vàtổng quát hóa rất cao Vớithuật toán đơn giản nhưng rấthiệu quả, cùng với thành côngcủa mô hình này trong cácứng dụng thực tiễn, mạng nơron hiện đang là một trong cáchướng nghiên cứu của lĩnhvực học máy

Mạng nơ ron tỏ ra phù hợpvới các bài toán đối sánh,phân loại mẫu, xấp xỉ hàm, tối

ưu hóa, lượng tử hóa vector vàphân hoạch không gian dữliệu, trong khi các phươngpháp truyền thống không đủkhả năng để giải quyết các vấn

đề nêu trên một cách hiệu quả

Đặc biệt trong các hệ thống

Tính chậm và sắc xuấtkhông cao không có quy tắctổng quát để xác định cấutrúc mạng và các tham sốhọc tối ưu cho một (lớp) bàitoán nhất định Tiêu chuẩnthu thập cơ sở dữ liệu huấnluyện còn khắt khe Do đó,

để hệ thống có thể ứng dụngtrong thực tế cần phải nớilỏng hơn nữa các tiêu chuẩnnày

Trang 34

nhận dạng sử dụng mạng nơron đã đạt được tỉ lệ nhậndạng khá chính xác, có thể sosánh với các phương phápnhận dạng có cấu trúc, thốngkê,…, thiết kế và coding đơngiản

Việc sử dụng các HMM đểkhử nhiễu và trích chọn đặctrưng cho kết quả tốt, với thờigian thực hiện chấp nhậnđược

Từ việc đặc tả được cấutrúc, bằng kỹ thuật phân lớp

và mã hóa mỗi lớp bằng một

mô hình nhận dạng Cơ sở dữliệu các mô hình nhận dạng cókhả năng tự động loại bỏ sự

dư thừa, giảm thiểu thời giantruy xuất, đạt tốc độ tương đốitốt trong các thử nghiệm, xácsuất cao, coding đơn giản,

Các thuật toán dò biên rấtnhạy cảm khi chữ bị dínhnét hay đứt nét, để khắc phụđiều này, hệ thống phải cókhả năng lường trước cácnét có thể bị dính hay bị đứt

để đưa ra một mẫu phụ dungtrong trường hợp mẫu nhậndạng bị dính nét hay đứt nét.Phương pháp này chỉ cốgắng mô tả tốt nhất cấu trúcchữ mà chưa chú ý đến kíchthước, điều này làm cho hệthống dễ nhầm lẫn chữ hoa

và chữ thường, nhất là đốivới các ký tự mà viết hoahay viết thường chỉ khácnhau về mặt kích thước nhưchữ ‘x’ và ‘X’ hay chữ ‘c’

và ‘C’…Nhược điểm là rất

Trang 35

không dung nhiều bộ nhớ khó để phân lớp dữ liệu.

Phương pháp

máy vector tựa

(SVM)

SVM được đánh giá là mộthướng tiếp cận phân lớp đạt

độ chính xác cao Phươngpháp học máy tiên tiến đãđóng góp nhiều thành côngtrong các lĩnh vực khai phá dữliệu cũng như trong lĩnh vựcnhận dạng Bài toán huấnluyện SVM thật chất là bàitoán QP trên một tập lồi, do

đó SVM luôn có nghiệm toàncục và duy nhất, đây chính làđiểm khác biệt rõ nhất giữaSVM so với phương phápmạng nơ ron, vì mạng nơ ronvốn tồn tại nhiều điểm cực trịđịa phương

Hạn chế lớn nhất củaSVM là tốc độ phân lớp rấtchậm, tùy thuộ và số lượngvector tựa Mặc khác, giaiđoạn huấn luyện SVM đòihỏi bộ nhớ rất lớn, do đó cácbài toán huấn luyện với sốlượng mẫu lớn sẽ gặp trởngại trong vấn đề lưu trữ.Hiệu quả phân lớp của SVMphụ thuộc vào hai yếu tố:giải bài toán QP và lựa chọnhàm nhân

1.6 Kết luận chương 1

Chương 1 đã giới thiệu khái quát về bài toán nhận dạng chữ và số viếttay, các giai đoạn hình thành và phát triển, các nghiên cứu trong và ngoàinước về kỹ thuật nhận dạng chữ và số viết tay Đồng thời cũng đưa ra một sốphương pháp sử dụng để thực hiện bài toán nhận dạng Đồng thời liệt kê cácbước nhận dạng chữ và số viết tay

Chương 2 KỸ THUẬT SVM TRONG NHẬN DẠNG PHIẾU GHI

ĐIỂM THI

Trang 36

Qua tìm hiểu và đánh giá, tôi nhận thấy quá trình nhận dạng ký tự chữ

và số viết tay trong các phương pháp trên luôn tồn tại những ưu và nhượcđiểm riêng Để tiến hành xây dựng một chương trình đảm bảo chất lượng và

sử dụng hiệu quả, trong đề tài tôi sẽ tập trung nghiên cứu kỹ thuật SVM đểứng dụng vào bài toán nhận dạng phiếu ghi điểm thi

Hàm tuyến tính phân biệt hai lớp như sau:

Trang 37

Giả sử tập dữ liệu của ta có thể phân tách tuyến tính hoàn toàn (cácmẫu đều được phân đúng lớp) trong không gian đặc trưng (feature space), do

đó sẽ tồn tại giá trị tham số w và b theo (1) thỏa cho những điểm

Ngày đăng: 19/04/2022, 15:34

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[10]. Andrew W.More, (2001), Support Vector Machines, Associate professor School of Coputer Science Camegie Mellon University Sách, tạp chí
Tiêu đề: Support Vector Machines
Tác giả: Andrew W.More
Năm: 2001
[11]. Rafael C. Gonzalez and Richard E. Woods (2008), Digital Image Processing, 3rd edition, Prentice Hall Sách, tạp chí
Tiêu đề: Digital ImageProcessing
Tác giả: Rafael C. Gonzalez and Richard E. Woods
Năm: 2008
[12]. Christopher J.C. Burges. A Tutorial on Support vector machines for pattern recognition – burges@microsoft.com Sách, tạp chí
Tiêu đề: A Tutorial on Support vector machinesfor pattern recognition
[13]. Yuan Y. Tang, Lo-Ting Tu, Jiming Lium, Seong-Whan Lee, Win-Win Lin, Off-line Recognition of Chinese Handwriting by Multifeature and Multilevel Classification, IEEE Trans. Pattern Analysis and Machine Intelligence, vol.20, no.5, pp.556-561, 1998 Sách, tạp chí
Tiêu đề: Off-line Recognition of Chinese Handwriting byMultifeature and Multilevel Classification
[14]. Nello Cristiannini and John Shawe-Taylor (2000), An Introduction to Support Vector Machines anh other kernel-based learning methods, Cambridge University Press Sách, tạp chí
Tiêu đề: AnIntroduction to Support Vector Machines anh other kernel-based learningmethods
Tác giả: Nello Cristiannini and John Shawe-Taylor
Năm: 2000
[15]. R. Collobert and S. Bengio (2001), SVMtorch: Support Vector Machine for Large-scale Regression Problems, the Journal of Machine Learning Research Sách, tạp chí
Tiêu đề: SVMtorch: Support VectorMachine for Large-scale Regression Problems
Tác giả: R. Collobert and S. Bengio
Năm: 2001

HÌNH ẢNH LIÊN QUAN

Hình IV.3: Giao diện ban đầu - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
nh IV.3: Giao diện ban đầu (Trang 3)
HMM Hiden Markov Model (Mô hình Markov ẩn) - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
iden Markov Model (Mô hình Markov ẩn) (Trang 14)
Hình 1.5. Vector hỗ trợ..................................................................................17 Hình 1.6 - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 1.5. Vector hỗ trợ..................................................................................17 Hình 1.6 (Trang 24)
Hình 2.16. Hiệu chỉnh độ nghiêng của phiếu điểm.....................................49 Hình 2.17 - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.16. Hiệu chỉnh độ nghiêng của phiếu điểm.....................................49 Hình 2.17 (Trang 25)
Hình 1.4. Biên độ và siêu phẳng có biên độ cực đại - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 1.4. Biên độ và siêu phẳng có biên độ cực đại (Trang 41)
Hình 1.3. Siêu phẳng phân chia tuyến tính - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 1.3. Siêu phẳng phân chia tuyến tính (Trang 41)
Hình 1.7. Mô hình nhận dạng ký tự dùng SVM - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 1.7. Mô hình nhận dạng ký tự dùng SVM (Trang 43)
1.3.5. Mô hình Markov ẩn - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
1.3.5. Mô hình Markov ẩn (Trang 44)
Mô hình Markov ẩn - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
h ình Markov ẩn (Trang 49)
Hình 2.1. Phân lớp tuyến tính - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.1. Phân lớp tuyến tính (Trang 51)
Hình 2.2. Siêu phẳng tách tuyến tính - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.2. Siêu phẳng tách tuyến tính (Trang 52)
Hình 2.3. Lề phân cách - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.3. Lề phân cách (Trang 53)
Hình 2.4. Lề phân cách lớn nhất - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.4. Lề phân cách lớn nhất (Trang 54)
Hình 2.6. Hình mẫu dữ liệu bị gán nhãn sai - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.6. Hình mẫu dữ liệu bị gán nhãn sai (Trang 58)
Hình 2.7. Biểu diễn các mẫu gán sai nhãn - LUẬN văn THẠC sĩ NGHIÊN cứu một số PHƯƠNG PHÁP NHẬN DẠNG CHỮ và số VIẾT TAY TRÊN PHIẾU GHI điểm THI
Hình 2.7. Biểu diễn các mẫu gán sai nhãn (Trang 59)

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w