1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nhập môn lý thuyết nhận dạng Nhận dạng mã vạch

15 413 2

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 15
Dung lượng 460,4 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Khái niệm nhận dạng Nhận dạng – đó là việc xếp một đối tượng cụ thể nào đó được thể hiện bằng các thuộc tính của nó vào một trong các lớp cố định cho trước, theo các quy tắc giải quyết n

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN

- -BÀI TẬP LỚN MÔN Nhập môn lý thuyết nhận dạng

ĐỀ TÀI: Nhận dạng mã vạch

Giảng viên hướng dẫn:

Nhóm thực hiện:

Lớp:

Sinh viên thực hiện:

Hà Nội, năm 2018

Trang 2

MỤC LỤC

Trang 3

LỜI NÓI ĐẦU

Xử lý và nhận dạng là một lĩnh vực từ lâu được nhiều người quan tâm Nó đã được ứng dụng vào nhiều lĩnh vực như: y học, thiên văn học, các lĩnh vực công nghiệp, người máy,…

Ngày nay trên thế giới bên cạnh việc tăng trưởng kinh tế là sự phát triển của các ngành khoa học kỹ thuật nói chung, mà trong đó ngành công nghiệp sản xuất là một trong những ngành có tốc độ phát triển cực nhanh Đối với công tác quản lý các mặt hàng sản phẩm tốn khá nhiều thời gian và công sức Mỗi loại mặt hàng yêu cầu cần có mã vạch để phân biệt

Đồng thời với mong muốn có những hiểu biết sâu hơn về lý thuyết nhận dạng nên nhóm em đã chọn đề tài: “Nhận dạng mã vạch”

Em xin chân thành cảm ơn thầy Đỗ Văn Tuấn đã chỉ dạy và hướng dẫn để chúng em hoàn thành bài tập lớn và đã đóng góp ý kiến để bài báo cáo của chúng mình hoàn thiện hơn

Em xin chân thành cảm ơn!

Trang 4

CHƯƠNG I: CƠ SỞ LÝ THUYẾT

1. Khái niệm nhận dạng

Nhận dạng – đó là việc xếp một đối tượng cụ thể nào đó (được thể hiện bằng các thuộc tính của nó) vào một trong các lớp cố định cho trước, theo các quy tắc giải quyết nhất định, tương ứng với mục tiêu đề ra

Khả năng nhận dạng dựa vào sự tương đồng của các đối tượng cùng loại

Ví dụ: Nhận dạng bệnh theo triệu chứng của người bệnh hoặc nhận dạng các hiện tượng xã hội theo thông tin thống kê

2. Trích chọn đặc trưng

Trích chọn đặc trưng là công việc được thực hiện nhằm biến đổi dữ liệu thô biểu diễn các mẫu ban đầu thành các dữ liệu hữu ích hơn, có số chiều ít hơn trước khi đưa vào công đoạn chính của quá trình nhận dạng mà không làm giảm chất lượng dữ liệu

* Ý nghĩa của của việc trích chọn đặc trưng:

- Số chiều của dữ liệu giảm => tăng hiệu quả tính toán trong các công đoạn sau

- Các thuộc tính ít quan trọng (ít ảnh hưởng đến quá trình phân lớp) bị loại bỏ

- Giải quyết được sự quá tải thuộc tính trong một số hệ thống nhận dạng

- Giảm băng thông của dữ liệu đầu vào

Tập dữ liệu ban đầu được biểu diễn dưới dạng các thuộc tính gọi là dữ liệu thô Tập thuộc tính ban đầu có thể rất lớn Việc giảm số lượng chiều của dữ liệu có thể thực hiện bằng cách:

- Lựa chọn thuộc tính

- Trích rút thuộc tính

Theo Isabelle, trích chọn đặc trưng là quá trình chuyển đổi dữ liệu từ dạng biểu diễn thô của các mẫu nhận dạng về một tập thuộc tính phù hợp phục vụ cho quá trình phân loại mẫu Quá trình này gồm 2 công đoạn:

Trang 5

▪ Xây dựng thuộc tính: từ biểu diễn ban đầu của n mẫu, thực hiện các độ đo, các phép biến đổi nhằm tạo ra them các thuộc tính mới

Ví dụ: hai thuộc tính “dài”, “rộng”, ta xây dựng them thuộc tính “diện tích”, khi đó tập thuộc tính mới {dài, rộng, diện tích}

• Lựa chọn thuộc tính: từ tập thuộc tính thu được sau công đoạn xây dựng thuộc tính, ta chon ra các thuộc tính quan trọng, bỏ đi các thuộc tính ít quan trọng

3. Phân lớp theo khoảng cách Euclidean

Phân lớp Bayesian tối ưu được đơn giản hóa với các giả thiết sau:

- Các lớp dữ liệu đều tuân theo phân bố Gaussian

- Dữ liệu trong tất cả các lớp đều tuân theo phân bố Gaussian

- Ma trận hiệp phương sai giống nhau trên tất cả các lớp

- Ma trận hiệp phương sai là ma trận đường chéo và các phần tử đề là hẳng số, nghĩa là S= I với I là ma trận đơn vị

Với tất cả các giả thiết thì phân lớp Bayesian tối ưu tương đương với phân lớp theo khoảng cách Euclidean gần nhất

Nghĩa là x được gán cho lớp wi có khoảng cách theo chuẩn Euclidean gần nhất:

4. Khái niệm mã số mã vạch

Mã vạch (Barcode) là một dãy các vạch và khoảng trống song song xen kẽ được sắp xếp theo một quy tắc mã hóa nhất định để thể hiện mã số (hoặc các dữ

Trang 6

liệu gồm cả chữ và số) Sự thay đổi trong độ rộng của vạch và khoảng trắng biểu diễn thông tin số hay chữ số dưới dạng mà máy vạch có thể đọc có gắn đầu laser (Scanner) nhận và đọc được

Mã số mã vạch được thu nhận bằng một máy quét mã vạch, là một máy thu nhận hình ảnh của mã vạch in trên các bề mặt và chuyển thông tin chứa trong mã vạch đến máy tính hay các thiết bị cần thông tin này Nó thường có một nguồn sáng kèm theo thấu kính, để hội tụ ánh sáng lên mã vạch, rồi thu ánh sáng phản xạ

về một cảm quang chuyển hóa tín hiệu ánh sáng thành tín hiệu điện Ngoài ra, nhiều máy quét mã vạch còn có thêm mạch điện tử xử lý tín hiệu thu được từ cảm quang để chuyển thành tín hiệu phù hợp cho kết nối với máy tính

Mã vạch bao gồm 2 phần:

- Mã số của hàng hóa

- Mã vạch: phần thể hiện mã số bằng vạch để cho máy đọc

5. Một số loại mã vạch phổ biến

Trang 7

6. Có bao nhiêu loại mã vạch

Có thể nói mã vạch cũng giống như một đạo quân các ký hiệu quen thuộc, chúng xuất hiện ở khắp mọi nơi, mọi chỗ, trên hầu hết các sản phẩm lưu hành trên thị trường Ai cũng đều thấy chúng nhưng ít ai hiểu được rõ ràng về chúng Khi được hỏi về mã số mã vạch đa số người ta chỉ biết mã vạch là…Mã vạch Nó là biểu tượng, mã hóa một con số gì đó mà người ta không hiểu Nói như vậy mã vạch chỉ có một loại duy nhất và nó được sử dụng để lưu trữ 1 con số gì đó

Thực ra mã số mã vạch gồm nhiều chủng loại khác nhau Tùy theo dung lượng thông tin, dạng thông tin được mã hóa cũng như mục đích sử dụng mà người

ta chia ra làm nhiều loại, trong đó có các dạng thông dụng trên thị trường mà ta thấy gồm: UPC, EAN, Code 39, Interleaved 2of 5, Codabar và Code 128… Ngoài

ra, trong một số loại mã vạch người ta còn phát triển làm nhiều Version khác nhau,

có mục đích sử dụng khác nhau, thí dụ như UPC có các Version UPC-A, UPC-B, UPC-C, UPC-D và UPC-E; EAN có các Version EAN-8, EAN-13, EAN-14; Code

128 gồm Code 128 Auto, Code 128-A, Code 128-B, Code 128-C

7. Các đặc tính ưu việt của công nghệ mã số vạch

 Hiệu suất : Nhận dạng tự động thay thế ghi chép bằng tay nên giúp: giảm nhân công, tiết kiệm thời gian, dẫn đến tăng hiệu suất công việc

 Chính xác: với cấu trúc được tiêu chuẩn hoá, an toàn và đơn giản Mã số Mã vạch cho phép nhận dạng chính xác vật phẩm và dịch vụ, thay thế khâu

Trang 8

“nhập” và “truy cập” dữ liệu bằng tay, do đó cho “kết quả” chính xác, không nhầm lẫn

 Thông tin nhanh: Mã số mã vạch giúp thu thập và cung cấp thông tin nhanh, giúp cho các nhà kinh doanh và quản lý có thể có những quyết định đúng đắn

và kịp thời trong hoạt động sản xuất kinh doanh và quản lý

 Thoã mãn khách hàng: Do tính hiệu suất, chính xác, thông tin nhanh, Mã số

mã vạch giúp đáp ứng khách hàng về mặt thời gian, số lượng hàng, chủng loại, về chất lượng hàng và dịch vụ, tính tiền nhanh và chính xác, hướng dẫn lựa chọn hàng hoá và dịch vụ theo yêu cầu

Trang 9

CHƯƠNG II: TỔNG QUAN VỀ ĐỀ TÀI

1. Lý do chọn đề tài

Ngày nay, công nghệ mã vạch đã trở nên quá phổ biến được nhiều người tin tưởng và sử dụng, công nghệ này tiếp tục cung cấp nhiều lợi ích trong các lĩnh vực doanh nghiệp Chỉ với một số thiết bị in ấn cơ bản máy in mã vạch và một máy quét mã vạch là doanh nghiệp có thể sử dụng công nghệ mã vạch để cải thiện độ chính xác, tốc độ và hiệu quả mà không cần gia tăng chi phí

Các sản phẩm rất đa dạng, đòi hỏi phải có một hệ thống tiện lợi thích hợp để kiểm kê hàng hóa, đóng nhãn sản phẩm và giúp khách hàng dễ mua đồ hơn Việc có thể điều chỉnh nhãn hiệu và quảng cáo cho doanh nghiệp sẽ mang lại cho bạn nhiều thời gian tập trung vào những nhu cầu cụ thể của khách hàng hơn

2. Nội dung đề tài

 Tìm hiểu thông tin về mã số mã vạch

 Tìm hiểu các công đoạn chính của bài toán nhận dạng mã số mã vạch

3. Yêu cầu bài toán

o Bài toán mã số mã vạch được chia làm các giai đoạn:

 Định vị vùng chứa mã số mã vạch

 Phân vùng mã số và mã vạch

 Tách từng ký tự số

 Nhận dạng từng số

4. Hướng giải quyết bài toán

*Bước 1: Tiền xử lý

- Các ảnh đầu vào sẽ được chuyển thành ảnh xám theo công thức:

- Chuyển sang ảnh nhị phân

*Bước 2: Định vị đối tượng trong ảnh

- Để nhận dạng được mã số, ta phải tách được mã số và mã vạch trong ảnh

Trang 10

- Mỗi dòng văn bản hay ký tự luôn có tọa độ chặn trên và tọa độ chặn dưới, trong khi đó mỗi ký tự có tọa độ chặn dưới, tọa độ chặn trên, giới hạn trái và giới hạn phải

- Thuật toán dò biên tổng quát:

+ Xác định cặp nền vùng xuất phát: Cặp nền vùng xuất phát được xác định bằng cách duyệt ảnh lần lượt từ trên xuống dưới và từ trái sang phải điểm đen đầu tiên gặp được cùng với điểm trắng trước đó ( theo hướng 4 ) để tạo nên cặp nền vùng xuất phát

+ Xác định cặp nền vùng tiếp theo

+ Lựa chọn điểm biên vùng

+ Nếu gặp lại cặp xuất phát thì dừng nếu không quay lại bước 2

*Bước 3 : Nhận dạng ký tự (mã số)

Đối sánh mẫu (Template Matching) là một nhóm kỹ thuật nhằm phân loại đối tượng dựa vào mức độ tương tự giữa những đối tượng xem xét với mẫu cho trước

và một hình bất kì đa mức xám lớn hơn mẫu, xác định xem đối tượng mẫu có xuất hiện trong hình hay không, nếu có thì khoanh vùng khu vực tương ứng đó, nếu không thì báo là không tồn tại đối tượng

Quá trình matching sẽ được tiến hành bằng cách quét hình mẫu lần lượt từ trái sang phải, từ trên xuống dưới sao cho tâm của nó di chuyển qua tất cả các vị trí có

thể trong hình được xem xét và tính giá trị của tham số phân loại tại mỗi vị trí đó,

tham số này sẽ nói lên mức độ khớp của mẫu với đối tượng xuất hiện tại vị trí tương ứng đang tính toán trong hình được cho Đảm bảo rằng hình mẫu luôn nằm lọt trong hình xem xét Như vậy quá trình matching được hoàn tất dựa trên cơ sở xem xét với tọa độ từng điểm ảnh một

Trang 11

*Cách xác định tọa độ mỗi số:

Bắt đầu từ dòng chặn trên vừa tìm được, duyệt theo chiều dọc tới tung độ của dòng chặn dưới, nếu gặp điểm màu đen thì ghi nhận hoành độ điểm đó là hoành độ của cột giới hạn trái, nếu không thấy điểm màu đen thì tiếp tục lại từ đầu cột kế tiếp Tương tự với tọa độ giới hạn phải, bắt đầu dòng chặn trên, duyệt theo chiều dọc tới tung độ của dòng chặn dưới , nếu sau hết cột không tìm thấy điểm màu đen thì hoành độ đang xét là hoành độ cột giới hạn phải của ký tự, nếu tìm thấy thì tiếp tục lại từ đầu cột kế tiếp

- Từ tọa độ ban đầu (0,0) duyệt theo chiều ngang để tìm điểm có màu đen nếu

đã mà vẫn chưa thấy thì bắt đầu duyệt lại từ đầu dòng kế tiếp Nếu tìm thấy điểm

có màu đen thì ghi nhận tung độ điểm đó là tung độ của dòng chặn trên và dừng duyệt

- Với tọa độ chặn dưới thì xuất phát từ điểm có hoành độ là 0 và tung độ bằng tung độ của dòng chặn trên theo chiều ngang, nếu sau khi hết dòng không thấy điểm đen nào thì ghi nhận tung độ dòng đang xét là tung độ của dòng chặn dưới, còn nếu tìm thấy điểm đen thì lại xét lại từ dòng kế tiếp

*Cách tính tham số phân loại:

Trang 12

Chương trình:

Ảnh đầu vào:

Trang 13

Ảnh nhị phân

Đối tượng đã được cắt:

Trang 14

KẾT LUẬN

Với sự giúp đỡ và sự chỉ bảo tận tình của thầy Đỗ Văn Tuấn, trên cơ sở những kiến thức có được trong quá trình học tập và thời gian nghiên cứu vừa qua nhóm em đã hoàn thành bài tập lớn môn Nhập môn lý thuyết nhận dạng của mình đúng tiến độ

Một lần nữa em xin chân thành cám ơn các bạn và đặc biệt là thầy Đỗ Văn Tuấn đã tận tình chỉ bảo, giúp đỡ để nhóm em hoàn thành đề tài này.

Trang 15

TÀI LIỆU THAM KHẢO

scribd.com

2. baigiang.violet.vn

3. Slide Nhập môn lý thuyết nhận dạng

4. Wikipedia.org

Ngày đăng: 02/04/2019, 22:59

TỪ KHÓA LIÊN QUAN

w