1. Trang chủ
  2. » Luận Văn - Báo Cáo

TÌM HIỂU “ CÔNG NGHỆ NHẬN DẠNG HÌNH ẢNH”

30 824 3

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 30
Dung lượng 4,78 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Anh Nguyễn Quang Trung, Phó phòng Xử lí thông tin, Trung tâm Tin học thống kê khu vực II – Cục Thống kê Tp.HCM, người đã hướng dẫn em trong việc tìm hiểu “Công nghệ nhận dạng hỉnh ảnh

Trang 1

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

Trang 2

TÌM HIỂU

“CÔNG NGHỆ NHẬN DẠNG HÌNH ẢNH”

Trang 3

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

Trước tiên, em xin gửi lời cảm ơn tới Khoa CNTT – trường Cao

Đẳng Kinh tế Công nghệ Tp.HCM đã tạo điều kiện và cho em cơ hội được thực hiện luận văn tốt nghiệp này.

Thầy Trần Đức Hy, người trực tiếp hướng dẫn em trong

thời gian thực hiện báo cáo luận văn tốt nghiệp Cảm ơn thầy đã tạo điều kiện thuận lợi để em hoàn thành tốt bài báo cáo

Cảm ơn thầy đã tận tình chỉ bảo, hướng dẫn và giải đáp các

vướng mắc trong quá trình nghiên cứu đề tài…

Các chị trong Ban thư kí khoa CNTT đã tạo điều kiện

cho em được hoàn thành tốt bài luận của mình trong thời

gian qua.

Qua bài báo cáo này, em cũng xin chân thành cảm ơn :

Trang 4

Các anh chị trong hai phòng Xử lí dữ liệu và Công nghệ phần

mềm thuộc Trung tâm thống kê tin học- Cục Thống Kê

Tp.HCM đã giúp đỡ em rất nhiều trong quá trình nghiên cứu đề tài.

Anh Nguyễn Quang Trung, Phó phòng Xử lí thông tin, Trung tâm Tin học thống kê khu vực II – Cục Thống kê Tp.HCM, người đã

hướng dẫn em trong việc tìm hiểu “Công nghệ nhận dạng hỉnh

ảnh và ứng dụng của nó trong việc nhập và lưu trữ dữ liệu”.

Cũng xin cám ơn các bạn Nguyễn Thiện Lâm, Nguyễn Đức

Tuấn và bạn Lê Quang Đức đã cùng chia sẻ những khó khăn và

kinh nghiệm trong quá trình nghiên cứu và thực hiện luận văn

Cuối cùng em xin gửi tới cha mẹ, cô chú em lời cảm ơn, biết ơn

chân thành nhất Cảm ơn cha mẹ, cô chú đã tạo mọi điều thuận lợi nhất giúp con hoàn thành tốt việc học của mình !

Trang 7

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

LÝ DO LỰA CHỌN ĐỀ TÀI KẾT QUẢ CỤ THỂ ĐẠT ĐƯỢC

MỞ ĐẦU

Trang 8

Ngày nay, kể cả những người không chuyên đều ít nhiều nghe nói đến công nghệ nhận dạng hình ảnh qua các quảng cáo,

giới thiệu các sản phẩm công nghệ số, các sản phẩm kĩ thuật cao(Hi-Tech)

Chúng ta có thể đã quá quen thuộc với những dòng máy ảnh được quảng bá là có tích hợp công nghệ nhận diện hình

ảnh(nhận diện khuôn mặt, nụ cười, ánh mắt…), các dòng máy Laptop(máy tính xách tay) có tích hợp công nghệ nhận diện khuôn mặt, hay dấu vân tay nhằm phục vụ cho cơ chế bảo

mật…

LÝ DO

Trang 9

Tiếp cận khái niêm mạng Nơ-ron và ứng dụng

mạng Nơ-ron lan truyền ngược trong nhận dạng kí

tự quang học…

Trong quá trình nghiên cứu đề tài, em cũng được ôn lại một số kiến thức môn Xác suất thống kê như định luật Bayer…;được hiểu thêm về môn “Trí thông minh nhân tạo”, …

Tiếp cận sử dụng hai phần mềm nhận dạng kí tự :

VNDOCR 4.0 (phiên bản Demo) và Accent

Capture 7.5; và sử dụng tính năng nhận dạng kí tự

quang học của bộ phần mềm ứng dụng văn phòng

Microsoft Office ( phiên bản 2003 profesional )

Trang 11

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

NHẬN DẠNG TIẾNG NÓI

NHẬN DẠNG HÌNH ẢNH

CÔNG NGHỆ NHẬN DẠNG HÌNH ẢNH

NHẬN

DẠNG

MẪU

NHẬN DẠNG THEO MẠNG NƠRON

MẠNG NƠRON LAN TRUYỀN NGƯỢC

Trang 12

NHẬN DẠNG MẪU

Nhận dạng là quá trình phân loại các đối tượng được biểu diễn theo

một mô hình nào đó và gán cho chúng vào một lớp (gán cho đối tượng một tên gọi) dựa theo những quy luật và các mẫu chuẩn.

Nhận dạng mẫu( pattern recognition ) là quá trình nhận dạng dựa

vào mẫu học đã biết trước Ta gọi đó là quá trình Học có giám sát

(supervised learning)

Nhận dạng mẫu nhằm mục đích phân loại dữ liệu (là các

mẫu) dựa trên: hoặc là kiến thức tiên nghiệm (a priori)

hoặc dựa vào thông tin thống kê được trích rút từ các mẫu

có sẵn

Trang 13

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

NHẬN DẠNG TIẾNG NÓI

Nhận dạng tiếng nói là một quá trình nhận dạng mẫu, với

mục đích là phân lớp (classify) thông tin đầu vào là tín hiệu tiếng nói thành một dãy tuần tự các mẫu đã được học trước

đó và lưu trữ trong bộ nhớ

Các mẫu là các đơn vị nhận dạng, chúng có thể là các từ, hoặc các âm vị

Trang 14

NHẬN DẠNG HÌNH ẢNH

Là giai đoạn cuối cùng trong các hệ thống sử lý ảnh và cũng

là đích đến của toàn bộ quá trình xử lý hình ảnh Nhận dạng hình ảnh cũng dựa trên lý thuyết nhận dạng mẫu nói chung

Có 3 phương pháp tiếp cận chính trong Nhận dạng hình ảnh :

1: Phương pháp nhận dạng dựa vào phân hoạch không gian; 2: Phương pháp nhận dạng cấu trúc;

3: Phương pháp nhận dạng dựa vào kĩ thuật mạng Nơ-ron (Neural Networks).

Trang 15

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

NHẬN DẠNG DỰA THEO MẠNG NƠ-RON

Nơron sinh vật có nhiều dạng khác nhau như dạng hình tháp, dạng

tổ ong, dạng rễ cây Tuy khác nhau về hình dạng, chúng có cấu trúc

và nguyên lý hoạt động chung.

Một tế bào nơron gồm bốn phần cơ bản:

- Các nhánh và rễ

- Thân thần kinh (Soma)

- Dây thần kinh (Axon

Trang 16

MẠNG NƠ-RON LAN TRUYỀN NGƯỢC

Thuật học lan truyền ngược là một trong những phát triển

quan trọng trong mạng nơron.Thuật toán này được áp dụng cho các mạng nhiều lớp truyền thẳng (FeedForward) gồm các phần tử xử lý với hàm kích hoạt liên tục Các mạng như vậy kết hợp với thuật toán học lan truyền ngược được gọi là mạng lan truyền

Trang 17

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

Trang 18

SỐ HÓA TÀI LIỆU LÀ

GÌ ?

LỢI ÍCH CỦA SỐ HÓA TÀI LIỆU

NHẬN DẠNG KÍ TỰ QUANG HỌC

CÁC HỆ NHẬN DẠNG CHỮ [OCR]

QUY TRÌNH SỐ HÓA

Trang 19

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

SỐ HÓA TÀI LIỆU LÀ GÌ ?

 Là việc chuyển đổi các loại tài liệu đang được lưu trữ bằng các phương tiện thông thường (tài liệu in, viết tay, hình ảnh, âm thanh, Microfilm, ) sang dạng

dữ liệu số để từ đó có thể dễ dàng ứng dụng Tin học trong các công tác lưu trữ, quản lý, vận chuyển và khai thác

Trang 20

LỢI ÍCH CỦA VIỆC SỐ HÓA DỮ LIỆU

 Tiết kiệm không gian lưu trữ;

 Dễ dàng vận chuyển;

 Khả năng truy xuất dữ liệu nhanh;

 Độ bền và tính an toàn cao hơn;

 Có thể hiệu chỉnh, sửa chữa khi cần thiết;

 Chi phí giảm hơn so với phương pháp truyền thống;

 Dễ dàng ứng dụng công nghệ hiện đại trong quá trình ứng

dụng và khai thác.

Trang 21

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

NHẬN DẠNG KÍ TỰ QUANG HỌC

Nhận dạng ký tự quang học (Optical Character Recognition,

viết tắt là OCR), là loại phần mềm máy tính tạo ra để chuyển các hình

ảnh của chữ viết tay hoặc chữ đánh máy (thường được quét bằng máy

scanner) thành các văn bản tài liệu OCR được hình thành từ một lĩnh

vực nghiên cứu về nhận dạng mẫu, trí tuệ nhân tạo, và machine vision.

Hệ thống nhận dạng yêu cầu phải được huấn luyện với các mẫu của các ký tự cụ thể Các hệ thống "thông minh" với độ chính xác nhận dạng cao đối với hầu hết các phông chữ hiện nay đã trở nên phổ biến

Trang 22

CÁC HỆ NHẬN DẠNG CHỮ

 Bài toán nhận dạng chữ là một bài toán lớn và được quan tâm từ lâu Bài toán này được phân thành 2 nhánh lớn:

 Nhận dạng chữ in để phục vụ cho công tác đọc tự động văn bản, đẩy nhanh việc nhập thông tin vào máy.

 Nhận dạng chữ viết tay với các font chữ khác nhau, phục vụ cho các ứng dụng đọc và xử lý hoá đơn, văn bản,v, ,v.

 Về cơ chế, một hệ thống nhận dạng chữ thường gồm các khối

chính, phù hợp với các giai đoạn xử lý sau:

Trang 23

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

Lưu trữ văn bản

S -File File nén File làm việc

Xử lý sơ bộ Tách vùng chữ ra khỏi văn bản

Tách ký tự ra khỏi từ

Nhận dạng chữ File ASCII của máy Tìm kiếm văn bản

Trình bày lại văn bản theo bản gốc

Văn bản scanner

Học kiểu chữ

Sơ đồ tổng quát hệ thống nhận dạng chữ viết

CÁC HỆ NHẬN DẠNG CHỮ

Trang 24

QUY TRÌNH SỐ HÓA TÀI LIỆU

Trang 25

kí tự quang học

***

Làm sạch ảnh

Kiểm tra và Chứng thực

***

nhập liệu thông thường

***

chứng thực CSDL

***

Xác nhận các bản gốc

Chương trình Tạo PDF

***

Chỉ tạo ảnh các file PDF

***

Tạo ảnh

và chữ của các file PDF

Quét

***

Số hóa giấy tờ

***

Nhập các File

***

Xem lại ảnh

Xtrata Server

***

Vùng Phân loại

***

Phân loại Lớp

***

đăng kí mẫu

Máy chủ Phát tán

***

Chuyển đổi định dạng File

QUY TRÌNH SỐ HÓA TÀI LIỆU

Trang 26

VnDocR 4.0

(Demo Version)

DEMO

Microsoft Office Document Imaging ( MODI )

Accent Capture 7.5

Trang 27

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

Trang 28

ĐÁNH GIÁ KẾT QUẢ HƯỚNG PHÁT TRIỂN

KẾT LUẬN

Trang 29

GVHD : Thầy Trần Đức Hy SVTH :

Vũ Linh

Hiện nay công nghệ này đang được Tổng Cục Thống

Kê Việt Nam ứng dụng vào việc nhập số liệu cuộc

Tổng điều tra Dân Số - Nhà Ở năm 2009 Việc triển

khai ra sao vẫn còn là thông tin bí mật, nhưng đợt tới,

Trung tâm Tin học Thống kê – Cục Thống Kê thành

phố Hồ Chí Minh cần tuyển khoảng 50 người phục

vụ cho việc tiến hành công nghệ này, trong tương lai,

Trung tâm cần tuyển hàng trăm người để triển khai

ứng dụng rộng rãi Các phiếu điều tra dùng cho cuộc

tổng điều tra năm nay được thiết kế đặc biệt, chất

lượng giấy cao, trên đó có các vùng đánh dấu phục vụ

cho việc quét tài liệu và xác định các vùng thông tin

chính xác cần lấy

HƯỚNG PHÁT TRIỂN

Trang 30

CẢM ƠN CÁC THẦY CÔ VÀ CÁC BẠN

ĐÃ QUAN TÂM THEO DÕI

Ngày đăng: 06/10/2014, 10:58

TỪ KHÓA LIÊN QUAN

w