1. Trang chủ
  2. » Kỹ Thuật - Công Nghệ

Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template matching

77 510 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 77
Dung lượng 2,8 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Để thực hiện được phương pháp này chúng tôi phải nghiên cứu các nội dung như: Tổng quan về quản lý biển số, kỹ thuật xử lý ảnh cơ bản trong hệ thống.. phân tích thiết kế module thu nhận

Trang 1

bộ giáo dục và đào tạo trường đại học bách khoa hà nội

Trang 2

LÝ LỊCH KHOA HỌC

I Sơ lược lý lịch:

Họ và tên: Trần Minh Hòa Giới tính: Nam

Sinh ngày: 12 tháng 08 năm 1980

Nơi sinh: Hồng Long – Nam Đàn – Nghệ An

Quê quán: Hồng Long – Nam Đàn – Nghệ An

Chức vụ: Giáo viên

Đơn vị công tác: Trường Cao Đẳng Nghề KTCN Việt Nam – Hàn Quốc

Chỗ ở riêng hoặc địa chỉ liên lạc: Khoa Điện Tử - Trường Cao Đẳng Nghề KTCN Việt Nam – Hàn Quốc Đường Hồ Tông Thốc – P Nghi Phú – TP.Vinh – Tỉnh Nghệ An Điện thoại di động: 0986988077

II Quá trình đào tạo:

1 Đại học:

- Hệ đào tạo: Chính quy Thời gian đào tạo: từ 08/1999 đến 04/2004

- Trường đào tạo: Đại Học Giao Thông Vận Tải Hà Nội

- Ngành học: Điều khiển học kỹ thuật Bằng tốt nghiệp đạt loại: TB Khá

2 Thạc sĩ:

- Hệ đào tạo: Thạc sỹ kỹ thuật Thời gian đào tạo: từ 2010 đến 2012

- Chuyên ngành học: Điện tử viễn thông

- Tên luận văn: Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu Template matching

- Người hướng dẫn Khoa học: TS Nguyễn Tiến Dũng

3 Trình độ ngoại ngữ : B1(của khung châu Âu)

III Quá trình công tác chuyên môn kể từ khi tốt nghiệp đại học:

Tôi cam đoan những nội dung viết trên đây là đúng sự thật

Ngày tháng năm

NGƯỜI KHAI KÝ TÊN

ảnh 4x6

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan: Bản luận văn tốt nghiệp này là công trình nghiên cứu thực

sự của cá nhân, được thực hiện trên cơ sở nghiên cứu lý thuyết, kiến thức kinh điển, nghiên cứu khảo sát tình hình thực tiễn và dưới sự hướng dẫn khoa học của Phó GS Tiến sĩ: Nguyễn Tiến Dũng Các số liệu, mô hình toán và những kết quả trong luận văn là trung thực,

Một lần nữa, tôi xin khẳng định về sự trung thực của lời cam kết trên

Người thực hiện

Trần Minh Hòa

Trang 4

MỤC LỤC

MỞ ĐẦU 1

CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG QUẢN LÝ BIỂN SỐ 4

1.1 Tổng quan về xử lí ảnh số .4

1.1.1 Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh số 5

1.1.1.1 Một số khái niệm 5

1.1.1.2 Biểu diễn ảnh .6

1.1.1.3 Tăng cường ảnh - Khôi phục ảnh 7

1.1.1.4 Biến đổi ảnh .7

1.1.1.5 Phân tích ảnh 7

1.1.1.6 Nhận dạng ảnh .7

1.2 Tổng quan về hệ thống nhận dạng biển số xe máy .7

1.3 Giới thiệu về module quản lý cơ sở dữ liệu biển số xe máy .9

1.3.1 Lý thuyết về Camera 9

1.3.1.1 Bộ cảm biến ảnh .9

1.3.1.2 Thiết bị thu nhận ảnh 9

1.3.1.3 Camera 10

1.3.1.4 Màn hình Video .10

1.3.1.5 Máy tính .10

1.3.2 Giới thiệu về Module thu nhận ảnh, phân vùng biển số và tách ký tự 11

1.3.3 Các chức năng chính của phần mềm quản lý cơ sở dữ liệu biển số xe máy 11

CHƯƠNG 2 KỸ THUẬT XỬ LÝ ẢNH CƠ BẢN ỨNG DỤNG TRONG HỆ THỐNG 12

2.1 Cải thiện ảnh sử dụng toán tử điểm 12

2.1.1.Khái niệm về toán tử điểm 12

2.1.2.Tăng độ tương phản (Stretching Contrast) 12

2.1.3 Biến đổi âm bản (Digital Negative) .13

2.1.4 Mô hình hóa và biến đổi lược đồ xám .14

2.2 Ảnh nhị phận 14

2.2.1.Ảnh đen trắng 15

2.2.2.Ảnh màu 15

2.3 Các phương pháp phát hiện biên .16

2.3.1 Giới thiệu biên và kỹ thuật phát hiện biên 16

Trang 5

2.3.1.1 Một số khái niệm 16

2.3.1.2 Phân loại các kỹ thuật phát hiện biên 17

2.3.1.2.1 Phương pháp phát hiện biên trực tiếp .17

2.3.1.2.2 Phương pháp phát hiện biên gián tiếp 17

2.3.1.3 Quy trình phát hiện biên 17

2.3.2 Phương pháp phát hiện biên cục bộ .18

2.3.2.1 Phương pháp Gradient .18

2.3.2.1.1 Kỹ thuật Gradient 19

2.3.2.1.2 Toán tử Robert (1965) .19

2.3.2.1.3 Toán tử (mặt nạ) Sobel .20

2.3.2.1.4 Toán tử 4-lân cận (4-Neighbour Operator) 20

2.3.2.1.5 Toán tử la bàn 22

2.3.2.1.6 Toán tử la bàn Kirsh 22

2.3.2.2 Kỹ thuật Laplace .23

2.3.2.3 Tách sườn ảnh theo phương pháp Canny .24

2.3.2.4 Một số phương pháp khác 25

2.3.2.4.1 Tiếp cận theo mô hình mặt 25

2.3.2.4.2 Tiếp cận tối ưu hóa .26

2.4 Phân vùng ảnh 27

2.4.1 Phân vùng ảnh theo ngưỡng biên độ 27

2.4.2 Phân vùng ảnh theo miền đồng nhất 29

2.4.2.1 Phương pháp tách cây tứ phân 29

2.4.2.2 Phương pháp cục bộ 31

2.4.2.3 Phương pháp tổng hợp 31

2.4.3 Phân vùng ảnh theo kết cấu bề mặt 32

2.4.3.1 Phương pháp thống kê 32

2.4.3.1.1 Lược đồ hiệu mức xám: 34

2.4.3.1.2 Ma trận xuất hiện liên hiệp mức xám 34

2.4.3.2 Phương pháp cấu trúc 35

2.5 Nhận dạng ảnh .36

2.5.1 Không gian biểu diễn đối tượng, không gian diễn dịch 36

2.5.1.1 Không gian biểu diễn đối tượng 36

2.5.1.2 Không gian diễn dịch 36

2.5.1.3 Mô hình của quá trình nhận dạng 37

Trang 6

2.5.1.4 Bản chất của quá trình nhận dạng .38

2.5.2 Nhận dạng theo cấu trúc 40

2.5.2.1 Biểu diễn định tính 40

2.5.2.2 Phương pháp ra quyết định dựa vào cấu trúc 41

2.5.2.3 Phương pháp nhận dạng theo cấu trúc .42

2.5.2.4 Phương pháp khớp mẫu Template Matching 43

CHƯƠNG 3 PHÂN TÍCH THIẾT KẾ MODULE THU NHẬN ẢNH VÀ CÁCH LY KÝ TỰ TRONG HỆ THỐNG QUẢN LÝ BIỂN SỐ XE 48

3.1 Quá trình phân vùng biển số xe 48

3.2 Quá trình tách ký tự biển số 51

3.3 Tích hợp Module vào hệ thống thực nghiệm 53

CHƯƠNG 4 KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ 55

4.1 Thông số làm việc của hệ thống nhận dạng 55

4.2 Thống kê và kết quả Module thu nhận ảnh từ Camera 56

4.3 Thống kê và kết quả Module phân vùng biển số và tách ký tự 56

4.3.1 Với hệ thống chưa tích hợp Camera 56

4.3.2 Với hệ thống tích hợp Camera 59

4.4 Thống kê và kết quả của Module nhận dạng 62

4.5 Kết luận và hướng phát triển tiếp theo của luận văn .63

TÀI LIỆU THAM KHẢO 65

Trang 7

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

CSDL Cơ Sở Dữ Liệu

NNFIR Nơron Netwrok based Flexible Image Retrieval

OBIR Object Based Image Retrieval

PSF Point Spread Function

RDBMS relational database is called a relational database management

system RGB red, green, blue

UFM Unified feature matching

Trang 8

DANH MỤC HÌNH VẼ

Hình 1.1 Sơ đồ tổng quát một hệ thống xử lý ảnh 4

Hình 1.2 Lược đồ mức xám của ảnh xám tương ứng 6

Hình 1.3 Sơ đồ khối của hệ thống và vị trí của Module xử lý cơ sở dữ liệu - điều khiển Barrier 8

Hình 2.1 Dãn đồ tương phản 13

Hình 2.2 Biến đổi âm bản 14

Hình 2.3 Đường bao của ảnh 16

Hình 2.4 Các bước phân tích và xử lý ảnh 17

Hình 2.5 Tính đạo hàm theo Gradient 18

Hình 2.6 Toán tử Robert 19

Hình 2.7: Mặt nạ 4-lân cận 21

Hình 2.8 Mặt nạ 8 hướng theo Kirsh 21

Hinh 2.9 Mô hình tính của phương pháp Canny 25

Hình 2.10 Lược đồ rắn lượn và cách chọn ngưỡng 28

Hình 2.11 Khái niệm 4 liên thông và 8 liên thông 31

Hình 2.12 Phân tích kết cấu sợi bằng dải tương quan 33

Hình 2.13 Sơ đồ tổng quát một hệ thống nhận dạng 39

Hình 2.14 Các từ vựng cơ bản trong ngôn ngữ PLD 42

Hình 2.15 Các phép toán bằng ngôn ngữ PLD 42

Hình 2.16 Hình thể hiện sự tuơng quan lớn 44

Hình 2.17 Hình thể hiện tương quan thấp 44

Hình 2.18 Xác định một vùng ảnh trong một mẫu ảnh lớn 45

Hình 2.19 Các mẫu đối sánh 45

Hình 2.20 Kết quả tương quan của ảnh 1 với mẫu 46

Hình 2.21 Kết quả tương quan của ảnh 2 với mẫu 46

Hình 2.22 Kết quả tương quan của ảnh 3 với mẫu 46

Hình 2.23 Kết quả tương quan của ảnh 4 với mẫu 47

Hình 3.1 Sơ đồ khối của module phân vùng biển số 48

Hình 3.2 Ảnh mức xám và ảnh nhị phân thích nghi 49

Hình 3.3 Lược đồ Histogram & ảnh sử dụng phương pháp dò biên Canny 49

Hình 3.4 Ảnh biển số sau khi đã cắt ngang và lược đồ Histogram 50

Trang 9

Hình 3.5 Biển số sau khi được tách ra khỏi ảnh 50

Hình 3.6 Sơ đồ khối của quá trình tách ký tự 51

Hình 3.7 Lược đồ Histogram theo phương ngang và dọc và vị trí 51

Hình 3.8 Chia biển số xe thành 8 phần 52

Hình 3.9 Sơ đồ chiếu ngang của 8 vùng trên biển số 52

Hình 3.10 Giao tiếp camera 53

Hình 3.11 Giao diện chính của chương trình 54

Hình 3.12 Kết quả xử lý của chương trình 54

Hình 4.1 Ảnh không thể tách được vùng biển số 58

Hình 4.2 Ảnh không tách được các ký tự 59

Hình 4.3 Hệ thống nhận dạng biển số xe 60

Hình 4.4 Module tiền xử lý 61

Hình 4.5 Tách ký tự 61

Hình 4.6 Ảnh nhận dạng ký tự 62

Trang 10

DANH MỤC BẢNG

Bảng 4.1 Thống kê thay đổi tốc độ vật thể chuyển động phía trước Camera 56

Bảng 4.2 Thống kê chất lượng ảnh chụp của Camera tương ứng với mức độ sáng 56

Bảng 4.3 Bảng thống kê kết quả của module phân tách biển số và ký tự 57

Bảng 4.4 Kết quả thống kê của hệ thống đã bao gồm camera 60

Bảng 4.5 Kết quả thống kê quá trình nhận dạng theo chất lượng ký tự 62

Bảng 4.6 Kết quả thống kê quá trình nhận dạng ký tự (số - chữ cái) 63

Trang 11

CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM

Độc lâp – Tự do – Hạnh phúc BẢN NHẬN XÉT LUẬN VĂN THẠC SĨ

- Đề tài: Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template matching

- Tác giả: Trần Minh Hòa – Trường ĐH Bách Khoa Hà Nội

- Chuyên ngành: Kỹ thuật Điện tử Viễn Thông

- Người hướng dẫn 1: TS Nguyễn Tiến Dũng

- Đơn vị: Viện Điện Tử Viễn Thông – Viện Đào Tạo Sau ĐH- Trường ĐH Bách Khoa Hà Nội

- Người hướng dẫn 2:

Nhận xét:

1 Tổng quan chung: Luận văn này trình bày hệ thống nhận dạng biển số sử

dụng phương pháp khớp mẫu Template matching Để thực hiện được phương pháp này chúng tôi phải nghiên cứu các nội dung như: Tổng quan về quản lý biển số, kỹ thuật xử lý ảnh cơ bản trong hệ thống phân tích thiết kế module thu nhận ảnh và cách ly ký tự trong hệ thống quản lý biển số xe và cuối cùng là phần đánh giá kết quả thực nghiệm

2 Ưu điểm, nhược điểm của luận văn về nội dung, hình thức; thái độ, trách nhiệm của tác giả trong quá trình thực hiện luận văn

3 Kết luận:

Tôi đồng ý (không đồng ý) để tác giả ………… được bảo vệ luận văn trước Hội đồng chấm luận văn thạc sĩ

Trang 12

Xác nhận của cơ quan người nhận xét

(dùng cho người nhận xét ngoài trường ĐHBKHN)

Hà Nội, Ngày tháng năm 2012

Người nhận xét

(Ký tên và ghi rõ họ và tên người

hướng dẫn)

Trang 13

Như chúng ta đã biết, ngày nay xe máy là phương tiện giao thông chính và số lượng ngày càng tăng Vì vậy vấn đề quản lý giao thông, bảo đảm an ninh, thu phí giao thông… đòi hỏi và cần thiết có sự hỗ trợ của khoa học kỹ thuật Một trong những sự hỗ trợ đầy hiệu quả đó là làm sao giúp những người quản lý nhận dạng biển số xe được dễ dàng, nhanh chóng và thuận lợi nhất

Nhận dạng biển số xe trở thành một ứng dụng hữu ích, được đưa vào trong những lĩnh vực như: quản lí giao thông, kiểm tra an ninh, thu phí giao thông, trạm gác cổng, quản lý các bãi giữ xe một cách tự động…Nó không chỉ giúp những người quản lý có khả năng bao quát được tất cả khách hàng, đối tượng theo dõi của mình mà còn giúp tiết kiệm thời gian làm việc đáng kể Ngoài ra với phương pháp này sẽ giúp giảm được nhiều người trông giữ xe để phân công họ vào việc khác

Từ những lý do trên chúng tôi quyết định lựa chọn đề tài Xây dựng hệ thống nhận dạng biển số xe máy

1.2 Lịch sử nghiên cứu

Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm

1955 Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi Năm 1964, máy tính đã có

Trang 14

khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của

Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện

xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan

Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy

ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Máy ảnh số hiện nay là một thí dụ gần gũi) Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh

1.3 Mục đích nghiên cứu, đối tượng và phạm vi nghiên cứu của luận văn 1.3.1 Mục đích nghiên cứu

Hệ thống nhận dạng biển số xe là một ứng dụng dựa trên kỹ thuật xử lí ảnh số Mục đích của nhận dạng biển số xe là thực hiện các bước xử lí để từ một ảnh đầu vào, máy tính có thể nhận ra chính xác biển số xe trên ảnh Nhận dạng biển số xe trở thành một ứng dụng hữu ích, được đưa vào trong những lĩnh vực như: quản lí giao thông, kiểm tra an ninh, thu phí giao thông, trạm gác cổng, quản lý các bãi giữ

xe một cách tự động

1.3.2 Đối tượng nghiên cứu

Đây là một trong những ứng dụng xử lí ảnh nhận được nhiều sự quan tâm nghiên cứu về cả hai mặt lý thuyết và thực hiện chương trình Luận văn của chúng tôi bao gồm các quá trình xử lí: phân vùng biển số, tách các ký tự, nhận biết các kí

tự, phần mềm quản lý cơ sở dữ liệu biển số xe máy Mục đích của phần mềm quản

lý cơ sở dữ liệu biển số xe máy là thu nhận chuỗi biển số sau khi đã được nhận dạng, lưu vào cơ sở dữ liệu để người dùng dễ dàng quản lý và theo dõi thông qua các báo cáo chi tiết các lượt xe vào - ra Mục đích của phần mềm quản lý cơ sở dữ liệu là theo dõi số lượt vào - ra, tính tiền lưu bãi

Trang 15

1.3.3 Phạm vi nghiên cứu

Chủ yếu dựa vào các tài liệu và chạy mô phỏng trên máy tính, chưa có mô hình thực tế

Xin chân thành cảm ơn Phó GS Tiến sĩ: Nguyễn Tiến Dũng đã tận tình hướng dẫn

và quý thầy cô khoa Điện tử viễn thông – Trường Đại học Bách Khoa Hà Nội đã truyền dạy những kiến thức quý báu trong chương trình cao học và giúp đỡ kinh nghiệm cho luận văn hoàn thành được thuận lợi

Trang 16

CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG QUẢN LÝ BIỂN SỐ

1.1 Tổng quan về xử lí ảnh số

Ngày nay kỹ thuật xử lí ảnh đã được ứng dụng rộng rãi ở rất nhiều lĩnh vực, trong sản xuất cũng như trong đời sống Ví du các hệ thống xử lí ảnh vệ tinh để phân tích không gian vũ trụ, hệ thống thăm dò địa chất, hệ thống phân tích tế bào sinh học và gần gũi nhất với chúng ta là các phần mềm hiển thị và xử lí ảnh chuyên dụng như Photoshop, ACD See…

Một hệ thống xử lý ảnh là hệ thống thực hiện các chức năng thu nhận ảnh đầu vào, thực hiện phép xử lý để tạo ảnh hoặc kết quả phân tích, nhận dạng ở đầu ra đáp ứng các yêu cầu và các ứng dụng cụ thể

Trong phạm vi đồ án, tôi xin giới hạn trong việc giới thiệu một hệ thống xử lý ảnh ứng dụng nhận dạng và ra quyết định trên thực tế

Hình 1.1 Sơ đồ tổng quát một hệ thống xử lý ảnh

Sơ đồ khối tổng quát của hệ thống này được cho trong hình 1.1, trong đó gồm ba khối chức năng cơ bản:

• Khối thu nhận ảnh: thực hiện chức năng thu nhận ảnh và thực hiện quá trình

số hóa (lưu giữ theo định dạng yêu cầu)

• Khối phân tích ảnh: trước hết hệ thống tiến hành bước tiền xử lý ảnh với mục đích tăng cường, cải thiện chất lượng ảnh, làm nổi các đặc trưng cơ bản của ảnh hay làm cho ảnh gần giống nhất với trạng thái gốc Sau đó, là quá trình

Trang 17

phân tích ảnh và trích chọn đặc trưng của ảnh ví dụ như biên, điểm gấp khúc, điểm kết thúc, điểm chữ thập…

• Khối nhận dạng: dựa vào các đặc trưng đã thu nhận từ quá trình phân tích ảnh trước đó thực hiện quá trình nhận dạng, đưa ra các quyết định ứng với các ứng dụng cụ thể

1.1.1 Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh số

1.1.1.1 Một số khái niệm

• Phần tử ảnh (Pixel – Picture Element)

Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị độ sáng Để có thể xử

lý ảnh bằng máy tính cần thiết phải số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hóa thành phần giá trị Trong quá trình này người ta sử dụng khái niệm Pixel để biểu diễn các phần tử của bức ảnh Ở đây, cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ họa máy tính Để tránh nhầm lẫn ta tạm thời gọi khái niệm pixel này là pixel thiết bị

Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế

độ đồ họa), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel Mỗi pixel bao gồm một cặp tọa độ x, y và màu Cặp tọa độ x, y tạo nên độ phân giải (resolution) Như màn hình máy tính có nhiều độ phân giải khác nhau, hiện tại phổ biến là màn hình VGA có độ phân giải 640x480 hay XSGA độ phân giải 1024x768

• Ảnh màu (Color Image)

Ảnh màu chứa thông tin màu cho mỗi phần tử ảnh Thông thường giá trị màu này dựa trên các không gian màu (color space) trong đó không gian màu thườngđược dùng là RGB tương ứng với ba kênh màu đỏ (Red) – xanh lá cây (Green) – xanh da trời (Blue) Tùy thuộc vào số bit, được sử dụng để lưư trữ màu ta có số lượng màu khác nhau, ví dụ 8 bit, 16 bit, 24 bit (True Color) Nếu ta sử dụng nhỏ hơn 24 bit để lưu trữ màu thì ta phải có 1 bảng Palette màu, nó tương tự như một bảng Lookup Table cho phép ánh xạ giữa một vị trí trong bảng với một tổ hợp của không gian màu RGB Ví dụ như sử dụng 8 bit tương ứng với 256 màu thì ta phải có bảng ánh

xạ 256 màu đó tương ứng với 256 tổ hợp Red – Green – Blue

Trang 18

• Ảnh đa mức xám

Mức xám (Gray level) là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng tử hóa Ảnh đa mức xám là ảnh có sự chuyển dần mức xám từ trắng sang đen Thực tế, một giá trị mức xám chính là sự tổ hợp của ba giá trị RGB (Red- Green – Blue) Thông thường mỗi điểm ảnh trong bức ảnh đa xám thường được mã hóa 8 bit, tương ứng với 256 mức xám

• Lược đồ mức xám

Lược đồ này (Hình 1.2) đơn giản cho ta biết tần suất xuất hiện của mỗi điểm ảnh ( pixel ) trong một bức ảnh ứng với mức xám tương ứng Ví dụ, một ảnh đa mức xám sử dụng 8 bit, có 256 mức xám từ o tới 255 Lược đồ mức xám sẽ có trục hoành chạy từ 0 tới 255 và trục tung chính là tổng số điểm ảnh có mức xám tương ứng Biểu đồ này tuy đơn giản nhưng có nhiều ứng dụng trong các bài toán giãn độ tương phản và phân ngưỡng ảnh ( biến từ ảnh mức xám sang ảnh nhị phân)

Trang 19

kỹ thuật xử lý

Một số mô hình thường được dùng để biểu diễn ảnh như: mô hình toán học,

mô hình thống kê,v.v Trong mô hình toán học, ảnh hai chiều biểu diễn nhờ các hàm hai biến trực giao gọi là hàm cơ sở Với mô hình thống kê, một ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng toán học, hiệp biến, phương sai và mômen

1.1.1.3 Tăng cường ảnh - Khôi phục ảnh

Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh Nó gồm một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu… Khôi phục ảnh nhằm loại bỏ các suy giảm trong ảnh

1.1.1.4 Biến đổi ảnh

Thuật ngữ biến đổi ảnh thường được dùng để nói tới một lớp các ma trận đơn

vị và các kỹ thuật dùng để biến đổi ảnh Cũng như các tín hiệu một chiều được biểu diễn bởi một chuỗi các hàm cơ sở Có nhiều loại biến đổi được dùng như

• Biến đổi Fourier [1]

• Biến đổi KL (Karhuman Loeve )… [2]

1.1.1.5 Phân tích ảnh

Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của ảnh để đưa ra một mô tả đầy đủ về ảnh Một số kỹ thuật hay dùng là dò biên, dán nhãn vùng liên thông, phân vùng ảnh…

1.1.1.6 Nhận dạng ảnh

Nhận dạng là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng

• Mô tả tham số (Nhận dạng theo tham số) [3]

• Mô tả theo cấu trúc (Nhận dạng theo cấu trúc) [4]

Trên thực tế, người ta đã áp dụng kỹ thuật này để nhận dạng khá thành công nhiều đối tượng khác nhau như: nhận dạng vân tay, nhân dạng chữ (chữ cái, chữ sỗ có dấu…)

1.2 Tổng quan về hệ thống nhận dạng biển số xe máy

Hệ thống nhận dạng biển số xe ứng dụng trong quản lý bãi đỗ xe là một hệ

Trang 20

thống khép kín và tự động hệ thống yêu cầu cả phần cứng lẫn phần mềm Phần cứng bao gồm một camera có tác dụng thu nhận ảnh, một mạch điều khiển Barrier (dùng động cơ DC) còn phần mềm sẽ có tác dụng nhận dạng chuyển động chụp hình lấy mẫu ảnh, phân tách, xử lý ảnh đó, đưa sang cơ sở dữ liệu để quản lý và điều khiển Barrier

Camera sẽ được gắn trên một độ cao thích hợp để có thể chụp được biển số xe khi có xe đi vào, camera sẽ chụp ảnh và lưu ảnh vào một mảng Ảnh từ mảng lưu trữ sẽ được đưa vào mudule tách ký tự và chuẩn hoá để thực hiện các kỹ thuật biến đổi ảnh từ các định dạng cơ bản như JPEG, Bitmap, PNG…giãn độ tương phản, thành ảnh mức xám, rồi chuyển thành ảnh nhị phân, dò biên, tách biển số, tách ký tự…Module nhận dạng sẽ nhận các ký tự đã được tách ở module trên và tiến hành nhận dạng dựa trên phương pháp template matching để nhận dạng các ký tự đã được tách ra sau phần tiền xử lý Biển số nhận được từ module nhận dạng sẽ được chuyển thành chuỗi ký tự biển số xe và chuyển vào giao diện quản lý cơ sở dữ liệu biển số

xe, người dùng sẽ tiến hàng in vé xe cho khách hàng gửi xe và tính phí trông xe Cuối cùng phần mạch điều khiển sẽ được kích hoạt để tiến hàng mở Barrier cho khách hàng đi vào bãi gửi xe

Hình 1.3 Sơ đồ khối của hệ thống và vị trí của Module xử lý cơ sở dữ liệu - điều

khiển Barrier

vùng biển số

Chụp hình (lấy mẫu)

Nhận dạng

ký tự

Xử lý kết quả nhận

Trang 21

Với đặc thù các phương tiện giao thông ở Việt Nam chủ yếu là xe máy, nội dung đề tài này tập trung vào xây dựng hệ thống quản lý biển số đăng ký xe máy mang tính ứng dụng thực tiễn cao, với khả năng triển khai thử nghiệm và ứng dụng vào thực tế

1.3 Giới thiệu về module quản lý cơ sở dữ liệu biển số xe máy

1.3.1 Lý thuyết về Camera

1.3.1.1 Bộ cảm biến ảnh

Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp, vidicon trong camera truyền hình) Có nhiều loại máy cảm biến (Sénor) làm việc với ánh sáng nhìn thấy và hồng ngoại như : Micro Densittometers, Image Dissector, Camera Divincon, linh kiện quang điện bằng bán dẫn Các loại cảm biến bằng chụp ảnh Camera divicon và linh kiện bán dẫn quang điện có thể cho ảnh ghi trên băng

từ có thể số hoá

Trong Micro Densitometer phim và ảnh chụp được gắn trên mặt phẳng hoặc cuốn quang trống Việc quét ảnh thông qua tia sáng ( ví dụ tia Laser) trên ảnh đồng thời dịch chuyển mặt phim hoặc quang trống tương đối theo tia sáng Trường hợp dùng phim, tia sáng đi qua phim Bây giớ chúng ta đề cập đến tất cả các khối trong hệ thống

1.3.1.2 Thiết bị thu nhận ảnh

Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tín hiệu truyền hình cung cấp từmột camera, hoặc từ một đầu máy VCR Ảnh số sau đó được lưu trữ trong bộ đệm chính Bộ đệm này có khả năng được địa chỉ hóa (nhờ một PC) đến từng điểm bằng phần mềm Thông thường thiết bị này có nhiều chương trình con điều khiển để

có thể lập trình được thông qua ngôn ngữ lập trình C Khi mua một thiết cần chú ý các điểm sau:

- Thiết bị có khả năng số hóa ảnh ít nhất 8 bit (256 mức xám) và ảnh thu được phải có kích thước ít nhất là 512×512 điểm hoặc hơn

-Thiết bị phải chứa một bộ đệm ảnh để lưu trữ một hoặc nhiều ảnh có độ phân giải 512×512 điểm ảnh

-Thiết bị phải được kèm một bộ đầy đủ thư viện các chương trình con có khả năng giao diện với các chương trình C viết bằng Turbo C hoặc Microsoft C

Trang 22

- Sổ tay hướng dẫn sử dụng phải được kèm theo, gồm cả dạng chứa trên đĩa và khi in

1.3.1.3 Camera

Tổng quát có hai kiểu camera: kiểu camera dùng đèn chân không và kiểu camera chỉ dùng bán dẫn Đặc biệt là trong lĩnh vực này, camera bán dẫn thường hay được dùng hơn camera đèn chân không Camera bán dẫn cũng được gọi là CCD camera do dùng các thanh ghi dịch đặc biệt gọi là thiết bị gộp (Charge-Coupled Devices- CCDs) Các CCD này chuyển các tín hiệu ảnh sang từ bộ cảm nhận ánh sáng bổ trợ ở phía trước camera thành các tín hiệu điện mà sau đó được mã hóa thành tín hiệu TV Loại camera chất lượng cao cho tín hiệu ít nhiễu và có độ nhậy cao với ánh sáng Khi chọn camera cần chú ý đến các thấu kính từ 18 đến 108 mm Sau đây là danh sách các nhà sản xuất:

- Pulnix America Inc, 770 Lucerne Drive, Sunnyvale, CA 84086 Tel 408-773-1550; fax 408-737-2966

- Sony Corp of America, Component Products Co., 10833 Valley View St., Cypress, CA

1.3.1.5 Máy tính

Cần có một máy tính với bộ xử lý Pentium 4 hoặc cấu hình cao hơn Để chắc chắn, các máy này phải có sẵn các khe cắm cho phần xử lý ảnh Các chương trình thiết kế và lọc ảnh có thể chạy trên bất kỳ hệ thống nào Các chương trình con hiển thị ảnh dựng vỉ mạch VGA và có sẵn trên đĩa kèm theo Các chương trình con hiển thị ảnh cũng hỗ trợ cho hầu hết các vi mạch SVGA

Kết quả nhận dạng được lưu dưới dạng chuỗi các ký tự (character string) được đưa vào chương trình quản lý cơ sở dữ liệu biển số xe máy Tại đây cán bộ trông xe sẽ tiến hành các thao tác nghiệp vụ như: in vé xe, thu tiền, lưu vào cơ sở dữ liệu Tuỳ thuộc vào kết quả xử lý của chương trình quản lý hệ thống Barrier sẽ được tiến hành

Trang 23

đóng mở tương ứng

1.3.2 Giới thiệu về Module thu nhận ảnh, phân vùng biển số và tách ký tự

Yêu cầu của bài toán bài là áp dụng các thuật toán thích hợp sử dụng một camera thu nhận hình ảnh nhận dạng chuyển động tự động chụp và ghi nhận hình Tự động trích rút vùng biển số trên ảnh thu nhận được và tách các ký tự trên phân vùng biển số đó; từ đó máy tính có khả năng xử lý và nhận dạng được biển số xe

1.3.3 Các chức năng chính của phần mềm quản lý cơ sở dữ liệu biển số xe máy

- Chức năng “Hệ thống”: sao lưu dữ liệu, phục hồi dữ liệu và thoát

- Chức năng “Thay đổi giá vé”: cho phép người quản trị có thể thay đổi giá vé khi có yêu cầu

- Chức năng “In vé”: In vé xe cho khách hàng gửi xe

- Chức năng “Tính tiền”: Thanh toán phí gửi xe

- Chức năng “Báo cáo”: Thống kê tính hình quản lý lượng xe máy ra vào cùng các thông số khác

Trang 24

CHƯƠNG 2 KỸ THUẬT XỬ LÝ ẢNH CƠ BẢN ỨNG DỤNG

TRONG HỆ THỐNG

2.1 Cải thiện ảnh sử dụng toán tử điểm

2.1.1 Khái niệm về toán tử điểm

Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của chính nó mà không hề dựa vào các điểm ảnh khác Có hai cách tiệm cận với phương pháp này Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác Cách thứ hai là dùng lược đồ mức xám (GrayHistogram) Về mặt toán học, toán tử

điểm là một ánh xạ từ giá trị cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá tri cường độ ánh sáng khác v(m, n) thông qua hàm f(.), tức là:

v(m,n) = f(u(m,n)) (2-1)

Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xác u ∈ [0

, N ] được ánh xạ sang một mức xám v [ 0 , N ] : v = f ( u ) Ứng dụng chính của các toán tử điểm là biến đổi độ tương phản của ảnh Ánh xạ f khác nhau tùy theo

các ứng dụng

2.1.2 Tăng độ tương phản (Stretching Contrast)

Trước tiên cần làm rõ khái niệm độ tương phản Ảnh số là tập hợp các điểm, mỗi điểm có giá trị độ sáng khác nhau Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau Như vậy, độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền Nói một cách khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền Như vậy, nếu ảnh có độ tương phản kém, ta có thể thay đổi tùy ý theo ý muốn Ảnh với độ tương phản thấp có thể do điều kiện sáng không đủ hay không đều, hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh Để điều chỉnh lại độ tương phản của ảnh, cần điều chỉnh lại biên độ trên toàn dải hay trên dải có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm lôgarit)

Trang 25

αu α ≤ u ≤ a

f(u) = β(u - α) + v a ≤ u ≤ b (2-2)

γ (u - b) + v β ≤ u ≤ L

Các cấp độ α,β , γ xác định độ tương phản tương đối L là số mức xám cực đại

Khi dùng hàm tuyến tính các độ dốc α,β, γ phải chọn lớn hơn một trong miền cần dãn Các tham số a và b (các cận) có thể chọn khi xem xét lược đồ xám của ảnh Chú ý, nếu dãn độ tương phản bằng hàm tuyến tính ta có:

α = β = γ =1 ảnh kết quả trùng với ảnh gốc

α, β, γ > 1 dãn độ tương phản

α, β, γ < 1 co độ tương phản

Hình 2.1 Dãn đồ tương phản Hàm mũ thường được dùng để dãn độ tương phản Hàm có dạng:

f(u)=(X[m,n])p (2-3)

với p là bậc thay đổi, thường chọn bằng 2

2.1.3 Biến đổi âm bản (Digital Negative)

Âm bản nhận được bằng phép biến đổi âm Phép biến đổi rất có nhiều hữu ích trong các phim ảnh dùng trong các ảnh y học

Trang 26

Hình 2.2 Biến đổi âm bản

2.1.4 Mô hình hóa và biến đổi lược đồ xám

Về ý nghĩa của lược đồ xám và một số phép biến đổi lược đồ đã được trình bày trong tài liệu này Xét đến một số biến đổi hay dùng sau:

) (

x h

trong đó, h(xi) là lược đồ mức xám xi

Ngoài các biến đổi trên, người ta còn dùng một số biến đổi khác Trong các biến đổi này, mức xám đầu vào u, trước tiên được biến đổi phi tuyến bởi một trong các hàm sau:

1

0

1

1 /

1

) (

) (

x P

Trang 27

2.2.1 Ảnh đen trắng

Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng Người ta phân mức đen trắng đó thành L mức Nếu sử dụng số bit B=8 bít để mã hóa mức đen trắng (hay mức xám) thì L được xác định :

L=2B (trong ví dụ của ta L=28= 256 mức)

Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối Nếu L lớn hơn 2 ta có ảnh đa cấp xám Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit Như vậy, với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và

255 biểu diễn cho mức cường độ sáng nhất

Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác

2.2.2 Ảnh màu

Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục (G),

lơ (B) và thường thu nhận trên các dải băng tần khác nhau Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue) Để biểu diễn cho một điểm ảnh màu cần 24 bit 24 bit này được chia thành ba khoảng 8 bit Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256) Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính

Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi màu lưu trữ như một ảnh đa cấp xám Do đó, không gian nhớ dành cho một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ

Trang 28

2.3 Các phương pháp phát hiện biên

2.3.1 Giới thiệu biên và kỹ thuật phát hiện biên

2.3.1.1 Một số khái niệm

Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột

ngột về mức xám (hoặc màu) Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng

Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một

đường biên hay đường bao

Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một loại đặc

trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt Ngược lại, người ta cũng sử dụng các vùng ảnh để tìm đường phân cách

Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi

người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần vẽ một cách đầy đủ

Mô hình biểu diễn đường biên, theo toán học: điểm ảnh có sự biến đổi mức xám

u(x) một cách đột ngột theo hình dưới

Đường biên lý tưởng Đường biên bậc thang Đường biên thực

Hình 2.3 Đường bao của ảnh Các khái niệm và định nghĩa tóm tắt trên là cơ sở giúp ta hiểu và dùng để hiểu cách xây dựng, thiết kế các kỹ thuật phát hiện biên ảnh

Chú ý: Phát hiện biên là một phần trong phân tích ảnh, sau khi đã lọc ảnh (hay tiền

xử lý ảnh) Các bước của phân tích ảnh có thể mô tả theo sơ đồ dưới đây Việc dò

và tìm biên ảnh là một trong các đặc trưng thuộc khối trích chọn đặc trưng

u

x

Trang 29

ảnh đầu ra của

tiền xử lý ảnh

Hình 2.4 Các bước phân tích và xử lý ảnh

2.3.1.2 Phân loại các kỹ thuật phát hiện biên

Từ định nghĩa toán học của biên người ta sử dụng hai phương pháp phát hiện biên như sau (phương pháp chính)

2.3.1.2.1 Phương pháp phát hiện biên trực tiếp

Phương pháp này chủ yếu dựa vào sự biến thiên độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm

• Nếu lấy đạo hàm bậc nhất của ảnh: ta có phương pháp Gradient

• Nếu lấy đạo hàm bậc hai của ảnh: ta có phương pháp Laplace

Hai phương pháp này được gọi chung là phương pháp dò biên cục bộ

Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa vào công cụ toán học là nguyên lý quy hoạch động và đượng gọi là phương pháp dò biên tổng thể Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu

2.3.1.2.2 Phương pháp phát hiện biên gián tiếp

Nếu bằng cách nào đấy, chúng ta thu đượng các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân vùng Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng nhỏ

Chú ý: Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau

2.3.1.3 Quy trình phát hiện biên

B1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các phương pháp dã tìm hiểu ở các phần trước

B2: Làm nổi biên sử dụng các toán tử phát hiện biên

B3: Định vị biên Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu làm một số biên giả xuất hiện do vậy cần loại bỏ biên giả

Trích chọn Đặc trưng

Giải thích

Trang 30

f( , + ) − ( , )

(2-7) Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế chọn dx= dy=1) Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng x, y

Gradient trong tọa độ góc (r,θ), với r là véc tơ, θ: góc

x f

arctg

r

f

f tg

y x

, , ,

Trang 31

Robert áp dụng công thức tính Gradient tại điểm (x, y) như hình

Với mỗi điểm ảnh I(x,y) đạo hàm theo x, y được ký hiệu tương ứng:

Trang 32

− +

=

− +

=

) , ( ) 1 ,

(

) , ( ) ,

1

(

y x I y

x

I

g

y x I y x

1

1 0

1

1 0

0 0 0

1 1 1

1

2 0

2

1 0

0 0 0

1 2 1

Hướng ngang (x) Hướng dọc (y)

2.3.2.1.4 Toán tử 4-lân cận (4-Neighbour Operator)

Toán tử 4-lân cận được Chaudhuri và Chandor (1984) nêu ra, trong đó mặt nạ có kích thước 3x3 được thay cho mạt nạ 2x2 của toán tử Robert Các mặt nạy này được cho:

Trang 33

Theo hướng x Theo hướng y

tử Gradient và Sobel giảm nhiễu do tác dụng của lọc trung bình các điểm lân cận Như vậy, để đạt được kết quả mong muốn các toán tử Gradient thường được dùng trước dể làm sạch nhiễu

• Các mặt nạ của các toán tử trên có kích thước 2x2 hoặc 3x3 chiều Các mặt

nạ có số chiều lớn hơn cũng được sử dụng Ví dụ trong kỹ thuật phát hiện biên người ta dùng mặt nạ 5x5 cho toán tử Sobel:

1

2

2 1 0

1

2

2 1 0

1

2

2 1 0

1

2

2 1 0

1 1 1 1 1

0 0 0 0 0

1 1 1 1 1

2 2 2 2 2

(2-11)

• Các toán tử kể trên đểu sử dụng các mặt nạ theo hai chiều (x,y) tức là bốn hướng (-x, y; -y, y) Với mục đích cho kết quả tinh và chính xác hơn (khi mà tốc

ĐôTây

Na

Bắc

Tây-

Tây-

Trang 34

Đông-độ và bộ nhớ máy tính tốt)

2.3.2.1.5 Toán tử la bàn

Kirsh đã đề xuất các mặt nạ theo 8 hướng như 8 hướng của la bàn (Compass) Hình 4.8 là mô hình 8 hướng và được đặt tên theo hướng địa lý và theo chiều kim đồng hồ: Đông, Đông-Nam, Nam, Nam-Tây, Tây, Tây-Nam, Tây-Bắc, Bắc, Đông-Bắc; mỗi hướng lệch nhau 450

3 0

3

5 5

5 0 3

5 5 3

5 0 3

5 3 3

5 0 3

3 3 3

3 0 3

3 3 3

3 0 5

3 3 3

5

3 0

5

3 3

3 0 5

3 5 5

Ký hiệu Ai; i= 1, 2, …, 8 là Gradient theo 8 hướng như 8 mặt nạ kể trên, khi đó biên

độ Gradient tại điểm ảnh (x,y) được tính theo

A(x, y) = Max ( g i ( y x, )) i=1, 2, …, 8 (2-12)

1

1 2 1

1 1 1

1 2 1

1 1 1

1 2 1

1 1 1

Trang 35

1 2 1

1 1 1

1 2 1

1 1 1

1 2 1

1 1 1

1

1 2 1

1 1

1 2 1

1 1 1

0

1 2

1 0 1

2 1 0

2 0 2

1 0 1

1 0 1

0 1 2

0 0 0

1 2 1

1 0 1

2 1 0

1

2 0

2

1 0

1 0 1

0 1 2

Trường hợp tổng quát, người ta có thể mở rộng các mặt nạ với n hướng cách đều tương ứng với các mặt Wi; i=1, 2, …, n Khi đó, biên độ tại hướng thứ i với mặt nạ

Wi được xác định:

A(x,y) = Max(W T I ( y x, )

i ) với i=1, 2, …, n (2-13) Tóm lại: Các kỹ thuật sử dụng phương pháp Gradient khá tốt khi độ sáng có tốc độ thay đổi nhanh, khá đơn giản trên cơ sở các mặt nạ theo các hướng Nhược điểm của các kỹ thuật Gradient là nhạy cảm với nhiễu và tạo các biên kép làm chất lượng biên thu được không cao

2.3.2.2 Kỹ thuật Laplace

Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trong đó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace Phương pháp dò biên theo toán tử Laplace hiệu quả hơn

Trang 36

phương pháp toán tử Gradient trong trường hợp mức xám biến đổi chậm, miền chuyển đổi mức xám có độ trải rộng

Toán tử Laplace được đĩnh nghĩa như sau:

0

1 4

1

0 1

1 8 1

1 1 1

1 5 2

1 2 1

Ghi chú: Mặt nạ H1 còn cải biên bằng việc lấy giá trị ở tâm bằng 8 thay vì giá trị 4

Để thấy rõ việc xấp xỉ đạo hàm riêng bậc hai trong không gian hai chiều với mặt nạ

2.3.2.3 Tách sườn ảnh theo phương pháp Canny

Bộ tác sườn ảnh theo Canny (1986) dựa trên cặp đạo hàm riêng bậc nhất với việc làm sạch nhiễu Mục này được để riêng vì đây là phương pháp tách đường biên khá phổ biến được dùng theo toán tử đạo hàm Như đã nói, phương pháp đạo hàm chịu ảnh hưởng lớn của nhiễu Phương pháp đạt hiệu quả cao khi xấp xỉ đạo hàm bậc nhất của Gauss

ƒ

∇ = ∇(G⊗I) = ƒx + ƒy (2-15)

với ƒx ƒy là đạo hàm riêng theo x và y của f

do vậy:

Trang 37

2 σ

σ

y x x

2 σ

σ

y x y

Hinh 2.9 Mô hình tính của phương pháp Canny

Do bộ lọc Gauss là tách được, ta có thể thực hiện riêng biệt các tích chập theo x và y:

Gx(x,y) = Gx(x)⊗G(y) và Gy(x,y) = Gy(y)⊗G(x)

Từ đó ta có

ƒx(x,y) = Gx(x)⊗G(y)⊗I và ƒy(x,y) = Gy(y)⊗G(x)⊗I

Với biên độ và hướng tính theo công thức trên, thuật toán được minh họa trên Hình 2.9

2.3.2.4.1 Tiếp cận theo mô hình mặt

Tư tưởng của phương pháp này là tại lân cận điểm cắt không (điểm biên), ảnh sau khi lọc Laplace có thể được xấp xỉ bởi một đa thức bậc 3 theo hàng và cột Đa thức

Trang 38

thường được dùng là đa thức Trebưchép với kích thước 3x3 Các đa thức này được định nghĩa như sau:

P0(x,y) = 1, P1(x,y) = x, P2(x,y) = y, P3(x,y) = x2 -

3

2, P4(x,y) = xy, P5(x,y) = y2 -

3 2

P6(x,y) = xP5(x,y), P7(x,y) = yP3(x,y), P8(x,y) = P5(x,y)P3(x,y)

Với mỗi điểm cắt không phát hiện tại P(x, y) trong ảnh đã được lọc bởi toán tử Laplace – Gauss, Huertas và Medioni đã cho được tính theo công thức tính xấp xỉ:

j i P

y x I y x P

) , (

) , ( ) , (

2

ở đây, IL-G(x, y) là ký hiệu ảnh đã được lọc bởi toán tử Laplace–Gauss Các hệ số này có thể nhận được bởi chập ảnh IL-G(x, y) với các nhân chập như trung bình có trọng số hay một số nhân chập khác

Các bước cài đặt phương pháp nhày có thể mô tả như sau:

- Chập ảnh gốc kích thước NxM với toán tử Laplac –Gauss kích thước M2, ảnh thu được gọi là IL-G

- Trích chọn các điẻm cắt không của ảnh IL-G, ảnh kết quả ký hiệu là IZCR

- Với mỗi điểm cắt không trong IZCR, thực hiện một xấp xỉ với kích thước 3x3 để suy ra các điểm cắt không theo cách gải tích

- Tạo một ảnh mới của các điểm cắt không kích thước nXxnY mà các đường bao được xác định với độ phân giải n nào đó

2.3.2.4.2 Tiếp cận tối ưu hóa

Ý tưởng của cách tiếp cận này là định vị đúng vị trí bằng cách cực tiểu hóa phương sai σ2 vị trí các điểm cắt không hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao Canny đã đề xuất 3 ràng buộc ứng với 3 điều kiện:

Ngày đăng: 22/07/2017, 22:39

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1.Aforge.Net, http://code.google.com/p/aforge/ Link
2.Henrik Hansen, Ander Wang Kristensen, Morten Porsborg Kohler, Allan Weber Mikkensen, Jens Mejdahl Pedersen and Micheal Trangeled. Automatic Recognition of License Plate - Aalborg University, May 31 2002 Khác
5. Rahul Verma. License Place Recognition System, ECE 532 Digital Image Analysis Project Report, 2000 Khác
7. Lương Mạnh Bá, Nguyễn Thanh Thủy. Nhập môn xử lý ảnh số - Giáo Dục - Đại Học Bách Khoa Hà Nội, 2000 Khác
8. Hồ Đình Duẩn. Phân tích thống kê của ảnh số - Giáo Dục - Hà Nội, 2001 Khác
9. Nguyễn Quang Hoan. Xử lý ảnh - Học viện bưu chính viễn thông - Hà Nội, 2006 10.Nguyễn Ðức Thành, Nguyễn Ðức Minh. Computer Vision Using NeuralNetwork - TPHCM -ĐHBK TPHCM, 1999 Khác

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm