Để thực hiện được phương pháp này chúng tôi phải nghiên cứu các nội dung như: Tổng quan về quản lý biển số, kỹ thuật xử lý ảnh cơ bản trong hệ thống.. phân tích thiết kế module thu nhận
Trang 1bộ giáo dục và đào tạo trường đại học bách khoa hà nội
Trang 2LÝ LỊCH KHOA HỌC
I Sơ lược lý lịch:
Họ và tên: Trần Minh Hòa Giới tính: Nam
Sinh ngày: 12 tháng 08 năm 1980
Nơi sinh: Hồng Long – Nam Đàn – Nghệ An
Quê quán: Hồng Long – Nam Đàn – Nghệ An
Chức vụ: Giáo viên
Đơn vị công tác: Trường Cao Đẳng Nghề KTCN Việt Nam – Hàn Quốc
Chỗ ở riêng hoặc địa chỉ liên lạc: Khoa Điện Tử - Trường Cao Đẳng Nghề KTCN Việt Nam – Hàn Quốc Đường Hồ Tông Thốc – P Nghi Phú – TP.Vinh – Tỉnh Nghệ An Điện thoại di động: 0986988077
II Quá trình đào tạo:
1 Đại học:
- Hệ đào tạo: Chính quy Thời gian đào tạo: từ 08/1999 đến 04/2004
- Trường đào tạo: Đại Học Giao Thông Vận Tải Hà Nội
- Ngành học: Điều khiển học kỹ thuật Bằng tốt nghiệp đạt loại: TB Khá
2 Thạc sĩ:
- Hệ đào tạo: Thạc sỹ kỹ thuật Thời gian đào tạo: từ 2010 đến 2012
- Chuyên ngành học: Điện tử viễn thông
- Tên luận văn: Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu Template matching
- Người hướng dẫn Khoa học: TS Nguyễn Tiến Dũng
3 Trình độ ngoại ngữ : B1(của khung châu Âu)
III Quá trình công tác chuyên môn kể từ khi tốt nghiệp đại học:
Tôi cam đoan những nội dung viết trên đây là đúng sự thật
Ngày tháng năm
NGƯỜI KHAI KÝ TÊN
ảnh 4x6
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan: Bản luận văn tốt nghiệp này là công trình nghiên cứu thực
sự của cá nhân, được thực hiện trên cơ sở nghiên cứu lý thuyết, kiến thức kinh điển, nghiên cứu khảo sát tình hình thực tiễn và dưới sự hướng dẫn khoa học của Phó GS Tiến sĩ: Nguyễn Tiến Dũng Các số liệu, mô hình toán và những kết quả trong luận văn là trung thực,
Một lần nữa, tôi xin khẳng định về sự trung thực của lời cam kết trên
Người thực hiện
Trần Minh Hòa
Trang 4MỤC LỤC
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG QUẢN LÝ BIỂN SỐ 4
1.1 Tổng quan về xử lí ảnh số .4
1.1.1 Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh số 5
1.1.1.1 Một số khái niệm 5
1.1.1.2 Biểu diễn ảnh .6
1.1.1.3 Tăng cường ảnh - Khôi phục ảnh 7
1.1.1.4 Biến đổi ảnh .7
1.1.1.5 Phân tích ảnh 7
1.1.1.6 Nhận dạng ảnh .7
1.2 Tổng quan về hệ thống nhận dạng biển số xe máy .7
1.3 Giới thiệu về module quản lý cơ sở dữ liệu biển số xe máy .9
1.3.1 Lý thuyết về Camera 9
1.3.1.1 Bộ cảm biến ảnh .9
1.3.1.2 Thiết bị thu nhận ảnh 9
1.3.1.3 Camera 10
1.3.1.4 Màn hình Video .10
1.3.1.5 Máy tính .10
1.3.2 Giới thiệu về Module thu nhận ảnh, phân vùng biển số và tách ký tự 11
1.3.3 Các chức năng chính của phần mềm quản lý cơ sở dữ liệu biển số xe máy 11
CHƯƠNG 2 KỸ THUẬT XỬ LÝ ẢNH CƠ BẢN ỨNG DỤNG TRONG HỆ THỐNG 12
2.1 Cải thiện ảnh sử dụng toán tử điểm 12
2.1.1.Khái niệm về toán tử điểm 12
2.1.2.Tăng độ tương phản (Stretching Contrast) 12
2.1.3 Biến đổi âm bản (Digital Negative) .13
2.1.4 Mô hình hóa và biến đổi lược đồ xám .14
2.2 Ảnh nhị phận 14
2.2.1.Ảnh đen trắng 15
2.2.2.Ảnh màu 15
2.3 Các phương pháp phát hiện biên .16
2.3.1 Giới thiệu biên và kỹ thuật phát hiện biên 16
Trang 52.3.1.1 Một số khái niệm 16
2.3.1.2 Phân loại các kỹ thuật phát hiện biên 17
2.3.1.2.1 Phương pháp phát hiện biên trực tiếp .17
2.3.1.2.2 Phương pháp phát hiện biên gián tiếp 17
2.3.1.3 Quy trình phát hiện biên 17
2.3.2 Phương pháp phát hiện biên cục bộ .18
2.3.2.1 Phương pháp Gradient .18
2.3.2.1.1 Kỹ thuật Gradient 19
2.3.2.1.2 Toán tử Robert (1965) .19
2.3.2.1.3 Toán tử (mặt nạ) Sobel .20
2.3.2.1.4 Toán tử 4-lân cận (4-Neighbour Operator) 20
2.3.2.1.5 Toán tử la bàn 22
2.3.2.1.6 Toán tử la bàn Kirsh 22
2.3.2.2 Kỹ thuật Laplace .23
2.3.2.3 Tách sườn ảnh theo phương pháp Canny .24
2.3.2.4 Một số phương pháp khác 25
2.3.2.4.1 Tiếp cận theo mô hình mặt 25
2.3.2.4.2 Tiếp cận tối ưu hóa .26
2.4 Phân vùng ảnh 27
2.4.1 Phân vùng ảnh theo ngưỡng biên độ 27
2.4.2 Phân vùng ảnh theo miền đồng nhất 29
2.4.2.1 Phương pháp tách cây tứ phân 29
2.4.2.2 Phương pháp cục bộ 31
2.4.2.3 Phương pháp tổng hợp 31
2.4.3 Phân vùng ảnh theo kết cấu bề mặt 32
2.4.3.1 Phương pháp thống kê 32
2.4.3.1.1 Lược đồ hiệu mức xám: 34
2.4.3.1.2 Ma trận xuất hiện liên hiệp mức xám 34
2.4.3.2 Phương pháp cấu trúc 35
2.5 Nhận dạng ảnh .36
2.5.1 Không gian biểu diễn đối tượng, không gian diễn dịch 36
2.5.1.1 Không gian biểu diễn đối tượng 36
2.5.1.2 Không gian diễn dịch 36
2.5.1.3 Mô hình của quá trình nhận dạng 37
Trang 62.5.1.4 Bản chất của quá trình nhận dạng .38
2.5.2 Nhận dạng theo cấu trúc 40
2.5.2.1 Biểu diễn định tính 40
2.5.2.2 Phương pháp ra quyết định dựa vào cấu trúc 41
2.5.2.3 Phương pháp nhận dạng theo cấu trúc .42
2.5.2.4 Phương pháp khớp mẫu Template Matching 43
CHƯƠNG 3 PHÂN TÍCH THIẾT KẾ MODULE THU NHẬN ẢNH VÀ CÁCH LY KÝ TỰ TRONG HỆ THỐNG QUẢN LÝ BIỂN SỐ XE 48
3.1 Quá trình phân vùng biển số xe 48
3.2 Quá trình tách ký tự biển số 51
3.3 Tích hợp Module vào hệ thống thực nghiệm 53
CHƯƠNG 4 KẾT QUẢ THỰC NGHIỆM VÀ ĐÁNH GIÁ 55
4.1 Thông số làm việc của hệ thống nhận dạng 55
4.2 Thống kê và kết quả Module thu nhận ảnh từ Camera 56
4.3 Thống kê và kết quả Module phân vùng biển số và tách ký tự 56
4.3.1 Với hệ thống chưa tích hợp Camera 56
4.3.2 Với hệ thống tích hợp Camera 59
4.4 Thống kê và kết quả của Module nhận dạng 62
4.5 Kết luận và hướng phát triển tiếp theo của luận văn .63
TÀI LIỆU THAM KHẢO 65
Trang 7DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
CSDL Cơ Sở Dữ Liệu
NNFIR Nơron Netwrok based Flexible Image Retrieval
OBIR Object Based Image Retrieval
PSF Point Spread Function
RDBMS relational database is called a relational database management
system RGB red, green, blue
UFM Unified feature matching
Trang 8DANH MỤC HÌNH VẼ
Hình 1.1 Sơ đồ tổng quát một hệ thống xử lý ảnh 4
Hình 1.2 Lược đồ mức xám của ảnh xám tương ứng 6
Hình 1.3 Sơ đồ khối của hệ thống và vị trí của Module xử lý cơ sở dữ liệu - điều khiển Barrier 8
Hình 2.1 Dãn đồ tương phản 13
Hình 2.2 Biến đổi âm bản 14
Hình 2.3 Đường bao của ảnh 16
Hình 2.4 Các bước phân tích và xử lý ảnh 17
Hình 2.5 Tính đạo hàm theo Gradient 18
Hình 2.6 Toán tử Robert 19
Hình 2.7: Mặt nạ 4-lân cận 21
Hình 2.8 Mặt nạ 8 hướng theo Kirsh 21
Hinh 2.9 Mô hình tính của phương pháp Canny 25
Hình 2.10 Lược đồ rắn lượn và cách chọn ngưỡng 28
Hình 2.11 Khái niệm 4 liên thông và 8 liên thông 31
Hình 2.12 Phân tích kết cấu sợi bằng dải tương quan 33
Hình 2.13 Sơ đồ tổng quát một hệ thống nhận dạng 39
Hình 2.14 Các từ vựng cơ bản trong ngôn ngữ PLD 42
Hình 2.15 Các phép toán bằng ngôn ngữ PLD 42
Hình 2.16 Hình thể hiện sự tuơng quan lớn 44
Hình 2.17 Hình thể hiện tương quan thấp 44
Hình 2.18 Xác định một vùng ảnh trong một mẫu ảnh lớn 45
Hình 2.19 Các mẫu đối sánh 45
Hình 2.20 Kết quả tương quan của ảnh 1 với mẫu 46
Hình 2.21 Kết quả tương quan của ảnh 2 với mẫu 46
Hình 2.22 Kết quả tương quan của ảnh 3 với mẫu 46
Hình 2.23 Kết quả tương quan của ảnh 4 với mẫu 47
Hình 3.1 Sơ đồ khối của module phân vùng biển số 48
Hình 3.2 Ảnh mức xám và ảnh nhị phân thích nghi 49
Hình 3.3 Lược đồ Histogram & ảnh sử dụng phương pháp dò biên Canny 49
Hình 3.4 Ảnh biển số sau khi đã cắt ngang và lược đồ Histogram 50
Trang 9Hình 3.5 Biển số sau khi được tách ra khỏi ảnh 50
Hình 3.6 Sơ đồ khối của quá trình tách ký tự 51
Hình 3.7 Lược đồ Histogram theo phương ngang và dọc và vị trí 51
Hình 3.8 Chia biển số xe thành 8 phần 52
Hình 3.9 Sơ đồ chiếu ngang của 8 vùng trên biển số 52
Hình 3.10 Giao tiếp camera 53
Hình 3.11 Giao diện chính của chương trình 54
Hình 3.12 Kết quả xử lý của chương trình 54
Hình 4.1 Ảnh không thể tách được vùng biển số 58
Hình 4.2 Ảnh không tách được các ký tự 59
Hình 4.3 Hệ thống nhận dạng biển số xe 60
Hình 4.4 Module tiền xử lý 61
Hình 4.5 Tách ký tự 61
Hình 4.6 Ảnh nhận dạng ký tự 62
Trang 10DANH MỤC BẢNG
Bảng 4.1 Thống kê thay đổi tốc độ vật thể chuyển động phía trước Camera 56
Bảng 4.2 Thống kê chất lượng ảnh chụp của Camera tương ứng với mức độ sáng 56
Bảng 4.3 Bảng thống kê kết quả của module phân tách biển số và ký tự 57
Bảng 4.4 Kết quả thống kê của hệ thống đã bao gồm camera 60
Bảng 4.5 Kết quả thống kê quá trình nhận dạng theo chất lượng ký tự 62
Bảng 4.6 Kết quả thống kê quá trình nhận dạng ký tự (số - chữ cái) 63
Trang 11
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc lâp – Tự do – Hạnh phúc BẢN NHẬN XÉT LUẬN VĂN THẠC SĨ
- Đề tài: Hệ thống nhận dạng biển số sử dụng phương pháp khớp mẫu template matching
- Tác giả: Trần Minh Hòa – Trường ĐH Bách Khoa Hà Nội
- Chuyên ngành: Kỹ thuật Điện tử Viễn Thông
- Người hướng dẫn 1: TS Nguyễn Tiến Dũng
- Đơn vị: Viện Điện Tử Viễn Thông – Viện Đào Tạo Sau ĐH- Trường ĐH Bách Khoa Hà Nội
- Người hướng dẫn 2:
Nhận xét:
1 Tổng quan chung: Luận văn này trình bày hệ thống nhận dạng biển số sử
dụng phương pháp khớp mẫu Template matching Để thực hiện được phương pháp này chúng tôi phải nghiên cứu các nội dung như: Tổng quan về quản lý biển số, kỹ thuật xử lý ảnh cơ bản trong hệ thống phân tích thiết kế module thu nhận ảnh và cách ly ký tự trong hệ thống quản lý biển số xe và cuối cùng là phần đánh giá kết quả thực nghiệm
2 Ưu điểm, nhược điểm của luận văn về nội dung, hình thức; thái độ, trách nhiệm của tác giả trong quá trình thực hiện luận văn
3 Kết luận:
Tôi đồng ý (không đồng ý) để tác giả ………… được bảo vệ luận văn trước Hội đồng chấm luận văn thạc sĩ
Trang 12Xác nhận của cơ quan người nhận xét
(dùng cho người nhận xét ngoài trường ĐHBKHN)
Hà Nội, Ngày tháng năm 2012
Người nhận xét
(Ký tên và ghi rõ họ và tên người
hướng dẫn)
Trang 13Như chúng ta đã biết, ngày nay xe máy là phương tiện giao thông chính và số lượng ngày càng tăng Vì vậy vấn đề quản lý giao thông, bảo đảm an ninh, thu phí giao thông… đòi hỏi và cần thiết có sự hỗ trợ của khoa học kỹ thuật Một trong những sự hỗ trợ đầy hiệu quả đó là làm sao giúp những người quản lý nhận dạng biển số xe được dễ dàng, nhanh chóng và thuận lợi nhất
Nhận dạng biển số xe trở thành một ứng dụng hữu ích, được đưa vào trong những lĩnh vực như: quản lí giao thông, kiểm tra an ninh, thu phí giao thông, trạm gác cổng, quản lý các bãi giữ xe một cách tự động…Nó không chỉ giúp những người quản lý có khả năng bao quát được tất cả khách hàng, đối tượng theo dõi của mình mà còn giúp tiết kiệm thời gian làm việc đáng kể Ngoài ra với phương pháp này sẽ giúp giảm được nhiều người trông giữ xe để phân công họ vào việc khác
Từ những lý do trên chúng tôi quyết định lựa chọn đề tài Xây dựng hệ thống nhận dạng biển số xe máy
1.2 Lịch sử nghiên cứu
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: nâng cao chất lượng ảnh và phân tích ảnh Ứng dụng đầu tiên được biết đến là nâng cao chất lượng ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm 1920 Vấn đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của ảnh Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm
1955 Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh tạo điều kiện cho quá trình xử lý ảnh số thuận lợi Năm 1964, máy tính đã có
Trang 14khả năng xử lý và nâng cao chất lượng ảnh từ mặt trăng và vệ tinh Ranger 7 của
Mỹ bao gồm: làm nổi đường biên, lưu ảnh Từ năm 1964 đến nay, các phương tiện
xử lý, nâng cao chất lượng, nhận dạng ảnh phát triển không ngừng Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu nhiều kết quả khả quan
Để dễ tưởng tượng, xét các bước cần thiết trong xử lý ảnh Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu (như Camera, máy chụp ảnh) Trước đây, ảnh thu qua Camera là các ảnh tương tự (loại Camera ống kiểu CCIR) Gần đây, với sự phát triển của công nghệ, ảnh màu hoặc đen trắng được lấy
ra từ Camera, sau đó nó được chuyển trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo (Máy ảnh số hiện nay là một thí dụ gần gũi) Mặt khác, ảnh cũng có thể tiếp nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh
1.3 Mục đích nghiên cứu, đối tượng và phạm vi nghiên cứu của luận văn 1.3.1 Mục đích nghiên cứu
Hệ thống nhận dạng biển số xe là một ứng dụng dựa trên kỹ thuật xử lí ảnh số Mục đích của nhận dạng biển số xe là thực hiện các bước xử lí để từ một ảnh đầu vào, máy tính có thể nhận ra chính xác biển số xe trên ảnh Nhận dạng biển số xe trở thành một ứng dụng hữu ích, được đưa vào trong những lĩnh vực như: quản lí giao thông, kiểm tra an ninh, thu phí giao thông, trạm gác cổng, quản lý các bãi giữ
xe một cách tự động
1.3.2 Đối tượng nghiên cứu
Đây là một trong những ứng dụng xử lí ảnh nhận được nhiều sự quan tâm nghiên cứu về cả hai mặt lý thuyết và thực hiện chương trình Luận văn của chúng tôi bao gồm các quá trình xử lí: phân vùng biển số, tách các ký tự, nhận biết các kí
tự, phần mềm quản lý cơ sở dữ liệu biển số xe máy Mục đích của phần mềm quản
lý cơ sở dữ liệu biển số xe máy là thu nhận chuỗi biển số sau khi đã được nhận dạng, lưu vào cơ sở dữ liệu để người dùng dễ dàng quản lý và theo dõi thông qua các báo cáo chi tiết các lượt xe vào - ra Mục đích của phần mềm quản lý cơ sở dữ liệu là theo dõi số lượt vào - ra, tính tiền lưu bãi
Trang 151.3.3 Phạm vi nghiên cứu
Chủ yếu dựa vào các tài liệu và chạy mô phỏng trên máy tính, chưa có mô hình thực tế
Xin chân thành cảm ơn Phó GS Tiến sĩ: Nguyễn Tiến Dũng đã tận tình hướng dẫn
và quý thầy cô khoa Điện tử viễn thông – Trường Đại học Bách Khoa Hà Nội đã truyền dạy những kiến thức quý báu trong chương trình cao học và giúp đỡ kinh nghiệm cho luận văn hoàn thành được thuận lợi
Trang 16CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG QUẢN LÝ BIỂN SỐ
1.1 Tổng quan về xử lí ảnh số
Ngày nay kỹ thuật xử lí ảnh đã được ứng dụng rộng rãi ở rất nhiều lĩnh vực, trong sản xuất cũng như trong đời sống Ví du các hệ thống xử lí ảnh vệ tinh để phân tích không gian vũ trụ, hệ thống thăm dò địa chất, hệ thống phân tích tế bào sinh học và gần gũi nhất với chúng ta là các phần mềm hiển thị và xử lí ảnh chuyên dụng như Photoshop, ACD See…
Một hệ thống xử lý ảnh là hệ thống thực hiện các chức năng thu nhận ảnh đầu vào, thực hiện phép xử lý để tạo ảnh hoặc kết quả phân tích, nhận dạng ở đầu ra đáp ứng các yêu cầu và các ứng dụng cụ thể
Trong phạm vi đồ án, tôi xin giới hạn trong việc giới thiệu một hệ thống xử lý ảnh ứng dụng nhận dạng và ra quyết định trên thực tế
Hình 1.1 Sơ đồ tổng quát một hệ thống xử lý ảnh
Sơ đồ khối tổng quát của hệ thống này được cho trong hình 1.1, trong đó gồm ba khối chức năng cơ bản:
• Khối thu nhận ảnh: thực hiện chức năng thu nhận ảnh và thực hiện quá trình
số hóa (lưu giữ theo định dạng yêu cầu)
• Khối phân tích ảnh: trước hết hệ thống tiến hành bước tiền xử lý ảnh với mục đích tăng cường, cải thiện chất lượng ảnh, làm nổi các đặc trưng cơ bản của ảnh hay làm cho ảnh gần giống nhất với trạng thái gốc Sau đó, là quá trình
Trang 17phân tích ảnh và trích chọn đặc trưng của ảnh ví dụ như biên, điểm gấp khúc, điểm kết thúc, điểm chữ thập…
• Khối nhận dạng: dựa vào các đặc trưng đã thu nhận từ quá trình phân tích ảnh trước đó thực hiện quá trình nhận dạng, đưa ra các quyết định ứng với các ứng dụng cụ thể
1.1.1 Một số khái niệm và các vấn đề cơ bản trong xử lý ảnh số
1.1.1.1 Một số khái niệm
• Phần tử ảnh (Pixel – Picture Element)
Ảnh trong thực tế là một ảnh liên tục về không gian và giá trị độ sáng Để có thể xử
lý ảnh bằng máy tính cần thiết phải số hóa ảnh Trong quá trình số hóa, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy mẫu (rời rạc hóa về không gian) và lượng hóa thành phần giá trị Trong quá trình này người ta sử dụng khái niệm Pixel để biểu diễn các phần tử của bức ảnh Ở đây, cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ họa máy tính Để tránh nhầm lẫn ta tạm thời gọi khái niệm pixel này là pixel thiết bị
Khái niệm pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế
độ đồ họa), màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel Mỗi pixel bao gồm một cặp tọa độ x, y và màu Cặp tọa độ x, y tạo nên độ phân giải (resolution) Như màn hình máy tính có nhiều độ phân giải khác nhau, hiện tại phổ biến là màn hình VGA có độ phân giải 640x480 hay XSGA độ phân giải 1024x768
• Ảnh màu (Color Image)
Ảnh màu chứa thông tin màu cho mỗi phần tử ảnh Thông thường giá trị màu này dựa trên các không gian màu (color space) trong đó không gian màu thườngđược dùng là RGB tương ứng với ba kênh màu đỏ (Red) – xanh lá cây (Green) – xanh da trời (Blue) Tùy thuộc vào số bit, được sử dụng để lưư trữ màu ta có số lượng màu khác nhau, ví dụ 8 bit, 16 bit, 24 bit (True Color) Nếu ta sử dụng nhỏ hơn 24 bit để lưu trữ màu thì ta phải có 1 bảng Palette màu, nó tương tự như một bảng Lookup Table cho phép ánh xạ giữa một vị trí trong bảng với một tổ hợp của không gian màu RGB Ví dụ như sử dụng 8 bit tương ứng với 256 màu thì ta phải có bảng ánh
xạ 256 màu đó tương ứng với 256 tổ hợp Red – Green – Blue
Trang 18• Ảnh đa mức xám
Mức xám (Gray level) là kết quả sự mã hóa tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số - kết quả của quá trình lượng tử hóa Ảnh đa mức xám là ảnh có sự chuyển dần mức xám từ trắng sang đen Thực tế, một giá trị mức xám chính là sự tổ hợp của ba giá trị RGB (Red- Green – Blue) Thông thường mỗi điểm ảnh trong bức ảnh đa xám thường được mã hóa 8 bit, tương ứng với 256 mức xám
• Lược đồ mức xám
Lược đồ này (Hình 1.2) đơn giản cho ta biết tần suất xuất hiện của mỗi điểm ảnh ( pixel ) trong một bức ảnh ứng với mức xám tương ứng Ví dụ, một ảnh đa mức xám sử dụng 8 bit, có 256 mức xám từ o tới 255 Lược đồ mức xám sẽ có trục hoành chạy từ 0 tới 255 và trục tung chính là tổng số điểm ảnh có mức xám tương ứng Biểu đồ này tuy đơn giản nhưng có nhiều ứng dụng trong các bài toán giãn độ tương phản và phân ngưỡng ảnh ( biến từ ảnh mức xám sang ảnh nhị phân)
Trang 19kỹ thuật xử lý
Một số mô hình thường được dùng để biểu diễn ảnh như: mô hình toán học,
mô hình thống kê,v.v Trong mô hình toán học, ảnh hai chiều biểu diễn nhờ các hàm hai biến trực giao gọi là hàm cơ sở Với mô hình thống kê, một ảnh được coi như một phần tử của một tập hợp đặc trưng bởi các đại lượng như: kỳ vọng toán học, hiệp biến, phương sai và mômen
1.1.1.3 Tăng cường ảnh - Khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh Nó gồm một loạt các kỹ thuật như: lọc độ tương phản, khử nhiễu, nổi màu… Khôi phục ảnh nhằm loại bỏ các suy giảm trong ảnh
1.1.1.4 Biến đổi ảnh
Thuật ngữ biến đổi ảnh thường được dùng để nói tới một lớp các ma trận đơn
vị và các kỹ thuật dùng để biến đổi ảnh Cũng như các tín hiệu một chiều được biểu diễn bởi một chuỗi các hàm cơ sở Có nhiều loại biến đổi được dùng như
• Biến đổi Fourier [1]
• Biến đổi KL (Karhuman Loeve )… [2]
1.1.1.5 Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của ảnh để đưa ra một mô tả đầy đủ về ảnh Một số kỹ thuật hay dùng là dò biên, dán nhãn vùng liên thông, phân vùng ảnh…
1.1.1.6 Nhận dạng ảnh
Nhận dạng là quá trình liên quan đến các mô tả đối tượng mà người ta muốn đặc tả nó Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc tính chủ yếu của đối tượng Có hai kiểu mô tả đối tượng
• Mô tả tham số (Nhận dạng theo tham số) [3]
• Mô tả theo cấu trúc (Nhận dạng theo cấu trúc) [4]
Trên thực tế, người ta đã áp dụng kỹ thuật này để nhận dạng khá thành công nhiều đối tượng khác nhau như: nhận dạng vân tay, nhân dạng chữ (chữ cái, chữ sỗ có dấu…)
1.2 Tổng quan về hệ thống nhận dạng biển số xe máy
Hệ thống nhận dạng biển số xe ứng dụng trong quản lý bãi đỗ xe là một hệ
Trang 20thống khép kín và tự động hệ thống yêu cầu cả phần cứng lẫn phần mềm Phần cứng bao gồm một camera có tác dụng thu nhận ảnh, một mạch điều khiển Barrier (dùng động cơ DC) còn phần mềm sẽ có tác dụng nhận dạng chuyển động chụp hình lấy mẫu ảnh, phân tách, xử lý ảnh đó, đưa sang cơ sở dữ liệu để quản lý và điều khiển Barrier
Camera sẽ được gắn trên một độ cao thích hợp để có thể chụp được biển số xe khi có xe đi vào, camera sẽ chụp ảnh và lưu ảnh vào một mảng Ảnh từ mảng lưu trữ sẽ được đưa vào mudule tách ký tự và chuẩn hoá để thực hiện các kỹ thuật biến đổi ảnh từ các định dạng cơ bản như JPEG, Bitmap, PNG…giãn độ tương phản, thành ảnh mức xám, rồi chuyển thành ảnh nhị phân, dò biên, tách biển số, tách ký tự…Module nhận dạng sẽ nhận các ký tự đã được tách ở module trên và tiến hành nhận dạng dựa trên phương pháp template matching để nhận dạng các ký tự đã được tách ra sau phần tiền xử lý Biển số nhận được từ module nhận dạng sẽ được chuyển thành chuỗi ký tự biển số xe và chuyển vào giao diện quản lý cơ sở dữ liệu biển số
xe, người dùng sẽ tiến hàng in vé xe cho khách hàng gửi xe và tính phí trông xe Cuối cùng phần mạch điều khiển sẽ được kích hoạt để tiến hàng mở Barrier cho khách hàng đi vào bãi gửi xe
Hình 1.3 Sơ đồ khối của hệ thống và vị trí của Module xử lý cơ sở dữ liệu - điều
khiển Barrier
vùng biển số
Chụp hình (lấy mẫu)
Nhận dạng
ký tự
Xử lý kết quả nhận
Trang 21Với đặc thù các phương tiện giao thông ở Việt Nam chủ yếu là xe máy, nội dung đề tài này tập trung vào xây dựng hệ thống quản lý biển số đăng ký xe máy mang tính ứng dụng thực tiễn cao, với khả năng triển khai thử nghiệm và ứng dụng vào thực tế
1.3 Giới thiệu về module quản lý cơ sở dữ liệu biển số xe máy
1.3.1 Lý thuyết về Camera
1.3.1.1 Bộ cảm biến ảnh
Máy chụp ảnh, camera có thể ghi lại hình ảnh (phim trong máy chụp, vidicon trong camera truyền hình) Có nhiều loại máy cảm biến (Sénor) làm việc với ánh sáng nhìn thấy và hồng ngoại như : Micro Densittometers, Image Dissector, Camera Divincon, linh kiện quang điện bằng bán dẫn Các loại cảm biến bằng chụp ảnh Camera divicon và linh kiện bán dẫn quang điện có thể cho ảnh ghi trên băng
từ có thể số hoá
Trong Micro Densitometer phim và ảnh chụp được gắn trên mặt phẳng hoặc cuốn quang trống Việc quét ảnh thông qua tia sáng ( ví dụ tia Laser) trên ảnh đồng thời dịch chuyển mặt phim hoặc quang trống tương đối theo tia sáng Trường hợp dùng phim, tia sáng đi qua phim Bây giớ chúng ta đề cập đến tất cả các khối trong hệ thống
1.3.1.2 Thiết bị thu nhận ảnh
Chức năng của thiết bị này là số hóa một băng tần số cơ bản của tín hiệu truyền hình cung cấp từmột camera, hoặc từ một đầu máy VCR Ảnh số sau đó được lưu trữ trong bộ đệm chính Bộ đệm này có khả năng được địa chỉ hóa (nhờ một PC) đến từng điểm bằng phần mềm Thông thường thiết bị này có nhiều chương trình con điều khiển để
có thể lập trình được thông qua ngôn ngữ lập trình C Khi mua một thiết cần chú ý các điểm sau:
- Thiết bị có khả năng số hóa ảnh ít nhất 8 bit (256 mức xám) và ảnh thu được phải có kích thước ít nhất là 512×512 điểm hoặc hơn
-Thiết bị phải chứa một bộ đệm ảnh để lưu trữ một hoặc nhiều ảnh có độ phân giải 512×512 điểm ảnh
-Thiết bị phải được kèm một bộ đầy đủ thư viện các chương trình con có khả năng giao diện với các chương trình C viết bằng Turbo C hoặc Microsoft C
Trang 22- Sổ tay hướng dẫn sử dụng phải được kèm theo, gồm cả dạng chứa trên đĩa và khi in
1.3.1.3 Camera
Tổng quát có hai kiểu camera: kiểu camera dùng đèn chân không và kiểu camera chỉ dùng bán dẫn Đặc biệt là trong lĩnh vực này, camera bán dẫn thường hay được dùng hơn camera đèn chân không Camera bán dẫn cũng được gọi là CCD camera do dùng các thanh ghi dịch đặc biệt gọi là thiết bị gộp (Charge-Coupled Devices- CCDs) Các CCD này chuyển các tín hiệu ảnh sang từ bộ cảm nhận ánh sáng bổ trợ ở phía trước camera thành các tín hiệu điện mà sau đó được mã hóa thành tín hiệu TV Loại camera chất lượng cao cho tín hiệu ít nhiễu và có độ nhậy cao với ánh sáng Khi chọn camera cần chú ý đến các thấu kính từ 18 đến 108 mm Sau đây là danh sách các nhà sản xuất:
- Pulnix America Inc, 770 Lucerne Drive, Sunnyvale, CA 84086 Tel 408-773-1550; fax 408-737-2966
- Sony Corp of America, Component Products Co., 10833 Valley View St., Cypress, CA
1.3.1.5 Máy tính
Cần có một máy tính với bộ xử lý Pentium 4 hoặc cấu hình cao hơn Để chắc chắn, các máy này phải có sẵn các khe cắm cho phần xử lý ảnh Các chương trình thiết kế và lọc ảnh có thể chạy trên bất kỳ hệ thống nào Các chương trình con hiển thị ảnh dựng vỉ mạch VGA và có sẵn trên đĩa kèm theo Các chương trình con hiển thị ảnh cũng hỗ trợ cho hầu hết các vi mạch SVGA
Kết quả nhận dạng được lưu dưới dạng chuỗi các ký tự (character string) được đưa vào chương trình quản lý cơ sở dữ liệu biển số xe máy Tại đây cán bộ trông xe sẽ tiến hành các thao tác nghiệp vụ như: in vé xe, thu tiền, lưu vào cơ sở dữ liệu Tuỳ thuộc vào kết quả xử lý của chương trình quản lý hệ thống Barrier sẽ được tiến hành
Trang 23đóng mở tương ứng
1.3.2 Giới thiệu về Module thu nhận ảnh, phân vùng biển số và tách ký tự
Yêu cầu của bài toán bài là áp dụng các thuật toán thích hợp sử dụng một camera thu nhận hình ảnh nhận dạng chuyển động tự động chụp và ghi nhận hình Tự động trích rút vùng biển số trên ảnh thu nhận được và tách các ký tự trên phân vùng biển số đó; từ đó máy tính có khả năng xử lý và nhận dạng được biển số xe
1.3.3 Các chức năng chính của phần mềm quản lý cơ sở dữ liệu biển số xe máy
- Chức năng “Hệ thống”: sao lưu dữ liệu, phục hồi dữ liệu và thoát
- Chức năng “Thay đổi giá vé”: cho phép người quản trị có thể thay đổi giá vé khi có yêu cầu
- Chức năng “In vé”: In vé xe cho khách hàng gửi xe
- Chức năng “Tính tiền”: Thanh toán phí gửi xe
- Chức năng “Báo cáo”: Thống kê tính hình quản lý lượng xe máy ra vào cùng các thông số khác
Trang 24CHƯƠNG 2 KỸ THUẬT XỬ LÝ ẢNH CƠ BẢN ỨNG DỤNG
TRONG HỆ THỐNG
2.1 Cải thiện ảnh sử dụng toán tử điểm
2.1.1 Khái niệm về toán tử điểm
Xử lý điểm ảnh thực chất là biến đổi giá trị một điểm ảnh dựa vào giá trị của chính nó mà không hề dựa vào các điểm ảnh khác Có hai cách tiệm cận với phương pháp này Cách thứ nhất dùng một hàm biến đổi thích hợp với mục đích hoặc yêu cầu đặt ra để biến đổi giá trị mức xám của điểm ảnh sang một giá trị mức xám khác Cách thứ hai là dùng lược đồ mức xám (GrayHistogram) Về mặt toán học, toán tử
điểm là một ánh xạ từ giá trị cường độ ánh sáng u(m, n) tại toạ độ (m, n) sang giá tri cường độ ánh sáng khác v(m, n) thông qua hàm f(.), tức là:
v(m,n) = f(u(m,n)) (2-1)
Nói một cách khác, toán tử điểm là toán tử không bộ nhớ, ở đó một mức xác u ∈ [0
, N ] được ánh xạ sang một mức xám v ∈ [ 0 , N ] : v = f ( u ) Ứng dụng chính của các toán tử điểm là biến đổi độ tương phản của ảnh Ánh xạ f khác nhau tùy theo
các ứng dụng
2.1.2 Tăng độ tương phản (Stretching Contrast)
Trước tiên cần làm rõ khái niệm độ tương phản Ảnh số là tập hợp các điểm, mỗi điểm có giá trị độ sáng khác nhau Ở đây, độ sáng để mắt người dễ cảm nhận ảnh song không phải là quyết định Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau Như vậy, độ tương phản biểu diễn sự thay đổi độ sáng của đối tượng so với nền Nói một cách khác, độ tương phản là độ nổi của điểm ảnh hay vùng ảnh so với nền Như vậy, nếu ảnh có độ tương phản kém, ta có thể thay đổi tùy ý theo ý muốn Ảnh với độ tương phản thấp có thể do điều kiện sáng không đủ hay không đều, hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh Để điều chỉnh lại độ tương phản của ảnh, cần điều chỉnh lại biên độ trên toàn dải hay trên dải có giới hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến tính) hay phi tuyến (hàm mũ hay hàm lôgarit)
Trang 25αu α ≤ u ≤ a
f(u) = β(u - α) + v a ≤ u ≤ b (2-2)
γ (u - b) + v β ≤ u ≤ L
Các cấp độ α,β , γ xác định độ tương phản tương đối L là số mức xám cực đại
Khi dùng hàm tuyến tính các độ dốc α,β, γ phải chọn lớn hơn một trong miền cần dãn Các tham số a và b (các cận) có thể chọn khi xem xét lược đồ xám của ảnh Chú ý, nếu dãn độ tương phản bằng hàm tuyến tính ta có:
α = β = γ =1 ảnh kết quả trùng với ảnh gốc
α, β, γ > 1 dãn độ tương phản
α, β, γ < 1 co độ tương phản
Hình 2.1 Dãn đồ tương phản Hàm mũ thường được dùng để dãn độ tương phản Hàm có dạng:
f(u)=(X[m,n])p (2-3)
với p là bậc thay đổi, thường chọn bằng 2
2.1.3 Biến đổi âm bản (Digital Negative)
Âm bản nhận được bằng phép biến đổi âm Phép biến đổi rất có nhiều hữu ích trong các phim ảnh dùng trong các ảnh y học
Trang 26Hình 2.2 Biến đổi âm bản
2.1.4 Mô hình hóa và biến đổi lược đồ xám
Về ý nghĩa của lược đồ xám và một số phép biến đổi lược đồ đã được trình bày trong tài liệu này Xét đến một số biến đổi hay dùng sau:
) (
x h
trong đó, h(xi) là lược đồ mức xám xi
Ngoài các biến đổi trên, người ta còn dùng một số biến đổi khác Trong các biến đổi này, mức xám đầu vào u, trước tiên được biến đổi phi tuyến bởi một trong các hàm sau:
1
0
1
1 /
1
) (
) (
x P
Trang 272.2.1 Ảnh đen trắng
Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu trắng Người ta phân mức đen trắng đó thành L mức Nếu sử dụng số bit B=8 bít để mã hóa mức đen trắng (hay mức xám) thì L được xác định :
L=2B (trong ví dụ của ta L=28= 256 mức)
Nếu L bằng 2, B=1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh nhị phân Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối Nếu L lớn hơn 2 ta có ảnh đa cấp xám Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit, còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit Như vậy, với ảnh đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có thể biểu diễn được là 256 Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và
255 biểu diễn cho mức cường độ sáng nhất
Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử logic Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối tượng ảnh với nền hay để phân biệt điểm biên với điểm khác
2.2.2 Ảnh màu
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ (R), lục (G),
lơ (B) và thường thu nhận trên các dải băng tần khác nhau Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red), lục (green) và lam (blue) Để biểu diễn cho một điểm ảnh màu cần 24 bit 24 bit này được chia thành ba khoảng 8 bit Mỗi màu cũng phân thành L cấp màu khác nhau (thường L=256) Mỗi khoảng này biểu diễn cho cường độ sáng của một trong các màu chính
Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt, mỗi màu lưu trữ như một ảnh đa cấp xám Do đó, không gian nhớ dành cho một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ
Trang 282.3 Các phương pháp phát hiện biên
2.3.1 Giới thiệu biên và kỹ thuật phát hiện biên
2.3.1.1 Một số khái niệm
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột
ngột về mức xám (hoặc màu) Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên nếu lân cận nó có ít nhất một điểm trắng
Đường biên (đường bao: boundary): tập hợp các điểm biên liên tiếp tạo thành một
đường biên hay đường bao
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một loại đặc
trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh Thứ hai, người ta sử dụng biên làm phân cách các vùng xám (màu) cách biệt Ngược lại, người ta cũng sử dụng các vùng ảnh để tìm đường phân cách
Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau: khi
người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa mà không cần vẽ một cách đầy đủ
Mô hình biểu diễn đường biên, theo toán học: điểm ảnh có sự biến đổi mức xám
u(x) một cách đột ngột theo hình dưới
Đường biên lý tưởng Đường biên bậc thang Đường biên thực
Hình 2.3 Đường bao của ảnh Các khái niệm và định nghĩa tóm tắt trên là cơ sở giúp ta hiểu và dùng để hiểu cách xây dựng, thiết kế các kỹ thuật phát hiện biên ảnh
Chú ý: Phát hiện biên là một phần trong phân tích ảnh, sau khi đã lọc ảnh (hay tiền
xử lý ảnh) Các bước của phân tích ảnh có thể mô tả theo sơ đồ dưới đây Việc dò
và tìm biên ảnh là một trong các đặc trưng thuộc khối trích chọn đặc trưng
u
x
Trang 29ảnh đầu ra của
tiền xử lý ảnh
Hình 2.4 Các bước phân tích và xử lý ảnh
2.3.1.2 Phân loại các kỹ thuật phát hiện biên
Từ định nghĩa toán học của biên người ta sử dụng hai phương pháp phát hiện biên như sau (phương pháp chính)
2.3.1.2.1 Phương pháp phát hiện biên trực tiếp
Phương pháp này chủ yếu dựa vào sự biến thiên độ sáng của điểm ảnh để làm nổi biên bằng kỹ thuật đạo hàm
• Nếu lấy đạo hàm bậc nhất của ảnh: ta có phương pháp Gradient
• Nếu lấy đạo hàm bậc hai của ảnh: ta có phương pháp Laplace
Hai phương pháp này được gọi chung là phương pháp dò biên cục bộ
Ngoài ra, người ta còn sử dụng phương pháp “đi theo đường bao” dựa vào công cụ toán học là nguyên lý quy hoạch động và đượng gọi là phương pháp dò biên tổng thể Phương pháp dò biên trực tiếp có hiệu quả và ít bị tác động của nhiễu
2.3.1.2.2 Phương pháp phát hiện biên gián tiếp
Nếu bằng cách nào đấy, chúng ta thu đượng các vùng ảnh khác nhau thì đường phân cách giữa các vùng đó chính là biên Nói cách khác, việc xác định đường bao của ảnh được thực hiện từ ảnh đã được phân vùng Phương pháp dò biên gián tiếp khó cài đặt nhưng áp dụng tốt khi sự biến thiên độ sáng nhỏ
Chú ý: Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu của nhau
2.3.1.3 Quy trình phát hiện biên
B1: Do ảnh ghi được thường có nhiễu, bước một là phải lọc nhiễu theo các phương pháp dã tìm hiểu ở các phần trước
B2: Làm nổi biên sử dụng các toán tử phát hiện biên
B3: Định vị biên Chú ý rằng kỹ thuật nổi biên gây tác dụng phụ là gây nhiễu làm một số biên giả xuất hiện do vậy cần loại bỏ biên giả
Trích chọn Đặc trưng
Giải thích
Trang 30f( , + ) − ( , )
(2-7) Trong đó dx, dy là khoảng cách giữa 2 điểm kế cận theo hướng x, y tương ứng (thực tế chọn dx= dy=1) Đây là phương pháp dựa theo đạo hàm riêng bậc nhất theo hướng x, y
Gradient trong tọa độ góc (r,θ), với r là véc tơ, θ: góc
x f
arctg
r
f
f tg
y x
, , ,
Trang 31Robert áp dụng công thức tính Gradient tại điểm (x, y) như hình
Với mỗi điểm ảnh I(x,y) đạo hàm theo x, y được ký hiệu tương ứng:
Trang 32⎨
⎧
− +
=
− +
=
) , ( ) 1 ,
(
) , ( ) ,
1
(
y x I y
x
I
g
y x I y x
1
1 0
1
1 0
0 0 0
1 1 1
1
2 0
2
1 0
0 0 0
1 2 1
Hướng ngang (x) Hướng dọc (y)
2.3.2.1.4 Toán tử 4-lân cận (4-Neighbour Operator)
Toán tử 4-lân cận được Chaudhuri và Chandor (1984) nêu ra, trong đó mặt nạ có kích thước 3x3 được thay cho mạt nạ 2x2 của toán tử Robert Các mặt nạy này được cho:
Trang 33Theo hướng x Theo hướng y
tử Gradient và Sobel giảm nhiễu do tác dụng của lọc trung bình các điểm lân cận Như vậy, để đạt được kết quả mong muốn các toán tử Gradient thường được dùng trước dể làm sạch nhiễu
• Các mặt nạ của các toán tử trên có kích thước 2x2 hoặc 3x3 chiều Các mặt
nạ có số chiều lớn hơn cũng được sử dụng Ví dụ trong kỹ thuật phát hiện biên người ta dùng mặt nạ 5x5 cho toán tử Sobel:
1
2
2 1 0
1
2
2 1 0
1
2
2 1 0
1
2
2 1 0
1 1 1 1 1
0 0 0 0 0
1 1 1 1 1
2 2 2 2 2
(2-11)
• Các toán tử kể trên đểu sử dụng các mặt nạ theo hai chiều (x,y) tức là bốn hướng (-x, y; -y, y) Với mục đích cho kết quả tinh và chính xác hơn (khi mà tốc
ĐôTây
Na
Bắc
Tây-
Tây-
Trang 34Đông-độ và bộ nhớ máy tính tốt)
2.3.2.1.5 Toán tử la bàn
Kirsh đã đề xuất các mặt nạ theo 8 hướng như 8 hướng của la bàn (Compass) Hình 4.8 là mô hình 8 hướng và được đặt tên theo hướng địa lý và theo chiều kim đồng hồ: Đông, Đông-Nam, Nam, Nam-Tây, Tây, Tây-Nam, Tây-Bắc, Bắc, Đông-Bắc; mỗi hướng lệch nhau 450
3 0
3
5 5
5 0 3
5 5 3
5 0 3
5 3 3
5 0 3
3 3 3
3 0 3
3 3 3
3 0 5
3 3 3
5
3 0
5
3 3
3 0 5
3 5 5
Ký hiệu Ai; i= 1, 2, …, 8 là Gradient theo 8 hướng như 8 mặt nạ kể trên, khi đó biên
độ Gradient tại điểm ảnh (x,y) được tính theo
A(x, y) = Max ( g i ( y x, )) i=1, 2, …, 8 (2-12)
1
1 2 1
1 1 1
1 2 1
1 1 1
1 2 1
1 1 1
Trang 351 2 1
1 1 1
1 2 1
1 1 1
1 2 1
1 1 1
1
1 2 1
1 1
1 2 1
1 1 1
0
1 2
1 0 1
2 1 0
2 0 2
1 0 1
1 0 1
0 1 2
0 0 0
1 2 1
1 0 1
2 1 0
1
2 0
2
1 0
1 0 1
0 1 2
Trường hợp tổng quát, người ta có thể mở rộng các mặt nạ với n hướng cách đều tương ứng với các mặt Wi; i=1, 2, …, n Khi đó, biên độ tại hướng thứ i với mặt nạ
Wi được xác định:
A(x,y) = Max(W T I ( y x, )
i ) với i=1, 2, …, n (2-13) Tóm lại: Các kỹ thuật sử dụng phương pháp Gradient khá tốt khi độ sáng có tốc độ thay đổi nhanh, khá đơn giản trên cơ sở các mặt nạ theo các hướng Nhược điểm của các kỹ thuật Gradient là nhạy cảm với nhiễu và tạo các biên kép làm chất lượng biên thu được không cao
2.3.2.2 Kỹ thuật Laplace
Để khắc phục hạn chế và nhược điểm của phương pháp Gradient, trong đó sử dụng đạo hàm riêng bậc nhất người ta nghĩ đến việc sử dụng đạo hàm riêng bậc hai hay toán tử Laplace Phương pháp dò biên theo toán tử Laplace hiệu quả hơn
Trang 36phương pháp toán tử Gradient trong trường hợp mức xám biến đổi chậm, miền chuyển đổi mức xám có độ trải rộng
Toán tử Laplace được đĩnh nghĩa như sau:
0
1 4
1
0 1
1 8 1
1 1 1
1 5 2
1 2 1
Ghi chú: Mặt nạ H1 còn cải biên bằng việc lấy giá trị ở tâm bằng 8 thay vì giá trị 4
Để thấy rõ việc xấp xỉ đạo hàm riêng bậc hai trong không gian hai chiều với mặt nạ
2.3.2.3 Tách sườn ảnh theo phương pháp Canny
Bộ tác sườn ảnh theo Canny (1986) dựa trên cặp đạo hàm riêng bậc nhất với việc làm sạch nhiễu Mục này được để riêng vì đây là phương pháp tách đường biên khá phổ biến được dùng theo toán tử đạo hàm Như đã nói, phương pháp đạo hàm chịu ảnh hưởng lớn của nhiễu Phương pháp đạt hiệu quả cao khi xấp xỉ đạo hàm bậc nhất của Gauss
ƒ
∇ = ∇(G⊗I) = ƒx + ƒy (2-15)
với ƒx ƒy là đạo hàm riêng theo x và y của f
do vậy:
Trang 372 σ
σ
y x x
2 σ
σ
y x y
Hinh 2.9 Mô hình tính của phương pháp Canny
Do bộ lọc Gauss là tách được, ta có thể thực hiện riêng biệt các tích chập theo x và y:
Gx(x,y) = Gx(x)⊗G(y) và Gy(x,y) = Gy(y)⊗G(x)
Từ đó ta có
ƒx(x,y) = Gx(x)⊗G(y)⊗I và ƒy(x,y) = Gy(y)⊗G(x)⊗I
Với biên độ và hướng tính theo công thức trên, thuật toán được minh họa trên Hình 2.9
2.3.2.4.1 Tiếp cận theo mô hình mặt
Tư tưởng của phương pháp này là tại lân cận điểm cắt không (điểm biên), ảnh sau khi lọc Laplace có thể được xấp xỉ bởi một đa thức bậc 3 theo hàng và cột Đa thức
Trang 38thường được dùng là đa thức Trebưchép với kích thước 3x3 Các đa thức này được định nghĩa như sau:
P0(x,y) = 1, P1(x,y) = x, P2(x,y) = y, P3(x,y) = x2 -
3
2, P4(x,y) = xy, P5(x,y) = y2 -
3 2
P6(x,y) = xP5(x,y), P7(x,y) = yP3(x,y), P8(x,y) = P5(x,y)P3(x,y)
Với mỗi điểm cắt không phát hiện tại P(x, y) trong ảnh đã được lọc bởi toán tử Laplace – Gauss, Huertas và Medioni đã cho được tính theo công thức tính xấp xỉ:
j i P
y x I y x P
) , (
) , ( ) , (
2
ở đây, IL-G(x, y) là ký hiệu ảnh đã được lọc bởi toán tử Laplace–Gauss Các hệ số này có thể nhận được bởi chập ảnh IL-G(x, y) với các nhân chập như trung bình có trọng số hay một số nhân chập khác
Các bước cài đặt phương pháp nhày có thể mô tả như sau:
- Chập ảnh gốc kích thước NxM với toán tử Laplac –Gauss kích thước M2, ảnh thu được gọi là IL-G
- Trích chọn các điẻm cắt không của ảnh IL-G, ảnh kết quả ký hiệu là IZCR
- Với mỗi điểm cắt không trong IZCR, thực hiện một xấp xỉ với kích thước 3x3 để suy ra các điểm cắt không theo cách gải tích
- Tạo một ảnh mới của các điểm cắt không kích thước nXxnY mà các đường bao được xác định với độ phân giải n nào đó
2.3.2.4.2 Tiếp cận tối ưu hóa
Ý tưởng của cách tiếp cận này là định vị đúng vị trí bằng cách cực tiểu hóa phương sai σ2 vị trí các điểm cắt không hoặc hạn chế số điểm cực trị cục bộ để chỉ tạo ra một đường bao Canny đã đề xuất 3 ràng buộc ứng với 3 điều kiện: