CHU THỊ PHƯƠNG THỦY NGHIÊN CỨU ĐẶC TRƯNG HOG, MÔ HÌNH SVM VÀ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN Vĩnh Long, 7/2018... CHU THỊ PHƯƠNG THỦ
Trang 1CHU THỊ PHƯƠNG THỦY
NGHIÊN CỨU ĐẶC TRƯNG HOG, MÔ HÌNH SVM
VÀ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG
BIỂN SỐ XE
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Vĩnh Long, 7/2018
Trang 2CHU THỊ PHƯƠNG THỦY
NGHIÊN CỨU ĐẶC TRƯNG HOG, MÔ HÌNH SVM
VÀ ỨNG DỤNG TRONG BÀI TOÁN NHẬN DẠNG
BIỂN SỐ XE
Chuyên ngành: Công nghệ thông tin
Mã số: 8480201
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Người hướng dẫn: TS Phan Lê Na
Vĩnh Long, 7/2018
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này được hoàn thành trên các kết quả nghiên cứu của tôi dưới sự hướng dẫn tận tình của TS Phan Lê
Na Các kết quả của nghiên cứu này chưa được dùng cho bất cứ luận văn cùng cấp nào khác Ngoại trừ phần lý thuyết và các kết quả của các công trình nghiên cứu khác được ghi rõ trong luận văn
Cần Thơ, ngày 4 tháng 6 năm 2018
Người cam đoan Chu Thị Phương Thủy
Trang 4LỜI CẢM ƠN
Đề tài này được hoàn thành em xin chân thành cảm ơn sự hướng dẫn tận tình của Cô TS Phan Lê Na trong suốt quá trình thực hiện luận văn Mặc dù bận rộn với công việc nhưng Cô vẫn giành nhiều thời gian
và tâm huyết để chỉ dẫn, định hướng, góp ý cách thực hiện và chia sẻ những kinh nghiệm quý báu cho em, giúp em hoàn thành luận văn của mình Một lần nữa, em xin gửi lời cảm ơn sâu sắc đến Cô
Em xin cảm ơn quý Thầy Cô khoa Công nghệ Thông tin đã giúp
đỡ, hướng dẫn, truyền đạt những kiến thức quan trọng, quý báu trong suốt quá trình học tập Chính nhờ những kiến thức được học từ quý Thầy
Cô mà em có thể thực hiện luận văn này
Tôi cũng xin cảm ơn các anh chị và bạn bè trong lớp Công nghệ thông tin K24 đã giúp đỡ, cổ vũ, động viên tôi trong quá trình học tập
Mặc dù đã cố gắng rất nhiều để thực hiện luận văn trong phạm vi
và khả năng nhưng chắc chắn sẽ không tránh khỏi những thiếu sót Kính mong nhận được sự góp ý, chỉ dẫn tận tình của quý Thầy Cô
Trang 5MỤC LỤC
LỜI CAM ĐOAN 1
LỜI CẢM ƠN 2
MỤC LỤC 3
DANH MỤC CÁC TỪ VIẾT TẮT 6
DANH MỤC CÁC BẢNG 7
DANH MỤC CÁC HÌNH 8
MỞ ĐẦU 9
1 Sự cần thiết của vấn đề nghiên cứu 9
2 Mục tiêu nghiên cứu đề tài 9
3 Đối tượng và phạm vi nghiên cứu 9
3.1 Đối tượng nghiên cứu 10
3.2 Phạm vi nghiên cứu 10
4 Nội dung nghiên cứu 10
4.1 Nghiên cứu lý thuyết 10
4.2 Nghiên cứu thực nghiệm 10
5 Bố cục luận văn 10
CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE 12 1.1 Khái niệm bài toán nhận dạng biển số xe 12
1.2 Phân loại biển số xe 12
1.2.1 Quy định biển số của 64 tỉnh thành 12
1.2.2 Những quy định về màu sắc và chữ số đặc biệt 13
1.3 Một số nghiên cứu ở nước ngoài 15
1.4 Một số nghiên cứu trong nước 16
Trang 61.5 Kết luận chung 16
CHƯƠNG 2: PHƯƠNG PHÁP NHẬN DẠNG BIỂN SỐ XE 18
2.1 Bài toán nhận dạng biển số xe 18
2.2 Các phương pháp phát hiện biên ảnh 22
2.2.1 Phương pháp Gradient 22
2.2.2 Phương pháp Laplace 24
2.2.3 Phương pháp Canny 25
2.3 Phương pháp phát hiện vùng chứa biển số xe 30
2.3.1 Phương pháp nhị phân 30
2.3.2 Phương pháp tách biên 31
2.3.3 Phương pháp biến đổi Hough 32
2.4 Các phương pháp trích chọn đặc trưng ảnh 35
2.4.1 Phương pháp trích chọn đặc trưng ảnh dựa trên màu sắc 35
2.4.2 Phương pháp trích chọn đặc trưng ảnh dựa trên kết cấu 36
2.4.3 Phương pháp trích chọn đặc trưng ảnh dựa trên hình dạng 37
2.5 Đặc trưng HOG 38
2.5.1 Khái niệm 38
2.5.2 Các bước trích chọn đặc trưng HOG trên ảnh 38
2.6 Mô hình SVM 40
2.6.1 Giới thiệu 40
2.6.2 Khái niệm 41
2.6.3 Ý tưởng mô hình 42
2.6.4 Nội dung mô hình 42
2.6.4.1 Cơ sở lý thuyết 42
Trang 72.6.4.2 Bài toán phân 2 lớp với SVM 43
2.6.4.3 Bài toán phân nhiều lớp với SVM 44
2.7 Kết luận chung 45
CHƯƠNG 3: XÂY DỰNG MÔ HÌNH NHẬN DẠNG BIỂN SỐ XE 46
3.1 Sơ đồ giải quyết bài toán nhận dạng biển số xe 46
3.2 Thu thập biển số xe 47
3.3 Tiền xử lý ảnh 47
3.4 Phát hiện vùng chứa biển số xe 48
3.5 Trích chọn đặc trưng HOG 49
3.5.1 Phương pháp thực hiện trích chọng đặc trưng Hog với biển số xe 49 3.5.2 Phát hiện biển số xe với các đặc trưng HOG 52
3.5.3 Áp dụng các bước trích chọn đặc trưng HOG trên vùng ảnh ứng viên 53
3.6 Nhận dạng ảnh bằng mô hình SVM 53
3.7 Kết luận chung 55
Chương 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 56
4.1 Môi trường thực nghiệm 56
4.2 Thực nghiệm 56
4.3 Kết quả thực nghiệm 57
4.4 Đánh giá kết quả 58
4.5 Hướng phát triển bài toán 58
4.6 Kết luận chung 59
KẾT LUẬN 60
TÀI LIỆU THAM KHẢO 61
Trang 8DANH MỤC CÁC TỪ VIẾT TẮT
HOG Histogram of oriented gradients Đặc trƣng của ảnh SVM Support vector machine Máy học hỗ trợ vector
Trang 9DANH MỤC CÁC BẢNG
Bảng 2.1: Bảng kết quả 2 điểm biên lân cận 28
Bảng 4.1: Các tập ảnh nhận dạng biển số xe 55
Bảng 4.2:Tập kiểm tra nhận dạng biển số xe 55
Bảng 4.3: Kết quả thực nghiệm nhận dạng biển số xe 56
Trang 10DANH MỤC CÁC HÌNH
Hình 2.1: Minh họa một hệ thống nhận dạng biển số xe 3
Hình 2.2: Hình mô tả các điểm lân cận của P 21
Hình 2.3: Sơ đồ giải quyết 23
Hình 2.4: TRục tạo độ đề các đi qua 2 điểm 25
Hình 2.5: Trục tọa độ đề các 25
Hình 2.6: Hệ tọa độ cực 26
Hình 2.7: Đường thẳng Hough trong tọa độ cực 26
Hình 2.8: Minh họa bài toán phân 2 lớp bằng phương pháp SVM 35
Hình 3.1: Sơ đồ tóm tắt yêu cầu bài toán 38
Hình 3.2: Minh họa quá trình nhận dạng 38
Hình 3.3: Ảnh input và 2 đạo hàm của nó 41
Hình 4.1: Kết quả nhận dạng biển số xe 57
Trang 11MỞ ĐẦU
1 Sự cần thiết của vấn đề nghiên cứu
Nhận dạng biển số xe là một bài toán có nhiều ứng dụng trong thực tế
và nhận được sự quan tâm lớn từ cộng đồng các nhà khoa học nghiên cứu về lĩnh vực nhận dạng trong thời gian gần đây Đó là một hệ thống có khả năng
“đọc” và hiểu”các biển số xe một cách tự động Hệ thống này đã được sử dụng rộng rãi trên thế giới.Tuy nhiên hiện nay ở Việt Nam những hệ thống quản lý đó chưa nhiều và lĩnh vực nhận dạng còn đang phát triển
Từ những thực tế đó, chúng tôi chọn đề tài “Nghiên cứu đặc trưng HOG, mô hình SVM và ứng dụng trong bài toán nhận dạng biển số xe” với mục đích để tìm hiểu nhằm trợ giúp cho công tác giám sát, quản lý các phương tiện giao thông một cách hiệu quả, dễ dàng và nhanh chóng hơn Nhận dạng biển số xe trở thành một ứng dụng hữu ích, được đưa vào trong những lĩnh vực như: quản lí giao thông, kiểm tra an ninh, thu phí giao thông, trạm gác cổng, quản lý các bãi giữ xe một cách tự động…Nó không chỉ giúp những người quản lý có khả năng bao quát được tất cả khách hàng, đối tượng theo dõi của mình mà còn giúp tiết kiệm thời gian làm việc đáng kể Ngoài ra với phương pháp này sẽ giúp giảm được nhiều người trông giữ xe để phân công họ vào việc khác
2 Mục tiêu nghiên cứu đề tài
Nghiên cứu đặc trưng HOG, mô hình SVM và ứng dụng trong bài toán nhận dạng biển số xe
3 Đối tượng và phạm vi nghiên cứu
Trang 123.1 Đối tượng nghiên cứu
Thu thập hình ảnh biển số xe ở Việt Nam Sau đó tiến hành sử dụng đặc trưng HOG để trích chọn đặc trưng ảnh và nhận dạng ảnh bằng mô hình SVM
4 Nội dung nghiên cứu
4.1 Nghiên cứu lý thuyết
Nghiên cứu đặc trưng HOG, mô hình SVM và ứng dụng vào bài toán nhận dạng biển số xe
Phân tích và nghiên cứu các phương pháp phát hiện biên ảnh, các phương pháp phát hiện vùng chứa biển số xe, phương pháp rút trích đặc trưng HOG, mô hình SVM để nhận dạng biển số xe
4.2 Nghiên cứu thực nghiệm
Thu thập dữ liệu hình ảnh biển số xe từ mạng Internet, video và chụp ngoài thực tiễn, xây dựng mô hình để nhận dạng và đánh giá kết quả đạt được
5 Bố cục luận văn
Cấu trúc luận văn gồm:
Mở đầu: Giới thiệu đề tài bao gồm lý do chọn đề tài; mục tiêu; đối
tượng phạm vi nghiên cứu; nội dung nghiên cứu đề tài; bố cục luận văn
Chương 1: Tổng quan bài toán nhận dạng biển số xe
Trang 13Chương 2: Phương pháp nhận dạng biển số xe Chương 3: Xây dựng mô hình nhận dạng biển số xe Chương 4: Thực nghiệm và đánh giá kết quả
Trang 14CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG BIỂN SỐ XE 1.1 Khái niệm bài toán nhận dạng biển số xe
Hệ thống nhận dạng biển số xe là hệ thống có khả năng phân tích hình ảnh
và xác định biển số trên xe, thông qua video, thiết bị ghi hình và hình ảnh Sau cùng là xác định các thông tin như: chủ sở hữu xe, theo dõi xe với tốc độ chậm
1.2 Phân loại biển số xe[1]
1.2.1 Quy định biển số của 64 tỉnh thành (Biển trắng chữ đen)
Trang 151.2.2 Những quy định về màu sắc và chữ số đặc biệt
1 Màu xanh chữ trắng là biển xe của các cơ quan hành chính sự nghiệp:
- Trực thuộc chính phủ thì là biển xanh 80
- Các tỉnh thành thì theo số tương ứng
2 Màu đỏ chữ trắng là biển xe trong quân đội:
AT: Binh đoàn 12 AD: Quân Đoàn 4, Binh đoàn cửu long BB: bộ binh
BC: Binh chủng Công Binh BH: Binh chủng hoá học BS: Binh đoàn Trường Sơn BT: Binh chủng thông tin liên lạc BP: Bộ tư lệnh biên phòng
HB: Học viện lục quân HH: Học viện quân y KA: Quân khu 1 KB: Quân khu 2 KC: Quân khu 3 KD: Quân khu 4
Trang 16KV: Quân khu 5 KP: Quân khu 7 KK: Quân khu 9 PP: Các quân y viện QH: Quân chủng hải quân
QK, QP: Quân chủng phòng không không quân TC: Tổng cục chính trị
TH: Tổng cục hậu cần TK: Tổng cục công nghiệp quốc phòng TT:Tổng cục kỹ thuật
TM: Bộ tổng tham mưu VT: Viettel
3 Màu trắng 2 chữ, 5 số là biển dành cho người nước ngoài:
Trang 17- Viện kiểm soát nhân dân tối cao
- Toà án nhân dân tối cao
- Đài truyền hình Việt Nam
- Đài tiếng nói Việt Nam
- Thông tấn xã Việt Nam
- Báo nhân dân
- Thanh tra Nhà nước
- Học viện Chính trị quốc gia
- Ban quản lý Lăng, Bảo tàng, khu Di tích lịch sử Hồ Chí Minh
- Trung tâm lưu trữ quốc gia
- Uỷ ban Dân số kế hoạch hoá gia đình
- Tổng công ty Dầu khí Việt Nam
- Các đại sứ quán, tổ chức quốc tế và nhân viên người nước ngoài
- Uỷ ban Chứng khoán Nhà nước
- Cục Hàng không dân dụng Việt Nam
- Kiểm toán nhà nước
5 Các biển A :
Xe của Công An - Cảnh Sát tương ứng với các tỉnh
ví dụ: 31A = xe của Công An - Cảnh Sát thành phố Hà Nội
1.3 Một số nghiên cứu ở nước ngoài
- Hệ thống kiểm soát thu phí được cài đặt lần đầu tiên tại Singapore vào những năm 1990 bằng cách sử dụng một công nghệ của Nhật Bản Gần đây thành phố London – Anh đã đưa ra cách tính thuế mới với hy vọng giảm lưu lượng xe vào thành phố khoảng 15% Hệ thống này hoạt động từ tháng 2 năm
2003 và đã mang lại kết quả đúng như mong muốn của thành phố trong việc
Trang 18quản lý dòng phương tiện vào thành phố Khoảng 800 máy quay video đã được đặt tại lối vào và bên trong một khu vực rộng khoảng 22km2
tại trong tâm của London Các máy quay tự động nhận dạng biển số xe và cũng tự động so sánh chúng với những vé xe đã thanh toán trong cơ sở dữ liệu Hệ thống này không có cửa ra vào hoặc trạm thu phí và được lựa chọn để tránh lãng phí thời gian lái xe khi họ lái xe vào thành phố
- Công nghệ tự động thu phí đã được phát triển một cách rộng rãi và theo những cách khác nhau ở mỗi quốc gia trên toàn thế giới
1.4 Một số nghiên cứu trong nước
- Thời gian gần đây, mô hình trạm thu phí tự động được phát triển rất rộng rãi tại Việt Nam Đã được sử dụng trong rất nhiều các mô hình quản lý
xe ở những điều kiện khác nhau như: các bãi gửi xe tự động, các trạm thu phí,
…
- Bài toán nhận dạng biển số xe được nghiên cứu nhiều trong nước như tác giả Nguyễn Phạm Anh Tuấn với báo cáo khoa học “Nhận dạng biển số xe” Tác giả Bùi Văn Thoảng với đề tài “Nhận dạng và trích biển số xe” luận văn thạc sĩ công nghệ thông tin, trường Đại học Cần Thơ Tác giả Phạm Thị Thanh Thủy với đề tài “Tìm hiểu bài toán nhận dạng biển số xe” đồ án tốt nghiệp ngành công nghệ thông tin, trường Đại học dân lập Hải Phòng, … Với bài toán “Nghiên cứu đặc trưng Hog, mô hình SVM và ứng dụng trong nhận dạng biển số xe” đã được cài đặt và thử nghiệm mô phỏng cho kết quả tốt có thể áp dụng cho các bãi giữ xe
1.5 Kết luận chung
Ở chương này tôi đã tìm hiểu khái niệm về bài toán nhận dạng biển số
xe, quy định và phân loại biển số xe ở Việt Nam Ngoài ra tìm hiểu về các
Trang 19nghiên cứu nhận dạng biển số xe ở trong nước cũng như nước ngoài Từ đó
để có cái nhìn tổng quan về bài toán nhận dạng biển số xe
Trang 20CHƯƠNG 2: PHƯƠNG PHÁP NHẬN DẠNG BIỂN SỐ XE
2.1 Bài toán nhận dạng biển số xe
- Hệ thống tự động nhận diện biển số xe là hệ thống sử dụng camera để thực hiện việc kiểm tra, xác định biển số của phương tiện một cách tự động,
từ đó có khả năng hỗ trợ truy vấn các thông tin chi tiết cấp cao hơn như tên chủ phương tiện, thông tin đăng ký, … Hệ thống này nhằm giải quyết các vấn
đề liên quan đến an ninh, thống kê khảo sát, giám sát và theo vết
- Có rất nhiều giải pháp, thiết kế hệ thống, thiết bị khác nhau để giải quyết các yêu cầu liên quan tới lĩnh vực này tùy theo từng điều kiện áp dụng: ban đêm hay ban ngày, không gian mở hay đóng, ứng dụng chuyên trách (bãi giữ xe,…), hay ứng dụng kết hợp (giám sát giao thông, hệ thống theo dõi an ninh, …), ứng dụng cục bộ hay diện rộng trên phạm vi công cộng, tính địa phương…
* Những yêu cầu đối với hệ thống nhận dạng biển số xe:
Từ những yêu cầu phân loại cụ thể phong phú trên ta có thể rút ra những khó khăn mà một hệ thống nhận dạng biển số xe thông thường phải vượt qua để đạt được độ chính xác chấp nhận được là:
Trang 21- Điều kiện tự nhiên của không gian và thời gian áp dụng hệ thống: ánh sáng, thời tiết, Điều này rất dễ hiểu vì rõ ràng nhận diện biển số của một chiếc xe khi trời đang mưa bao giờ cũng khó khăn hơn khi trời nắng ráo
- Điều kiện bối cảnh: Trong một nơi mà phông nền đơn giản chỉ với các mặt phẳng thì bao giờ việc nhận diện cũng dễ hơn là một nơi mà khung cảnh hỗn độn, người xe tấp nập
- Điều kiện quy định định dạng của biển số: cái này khác nhau tùy theo quy định mỗi quốc gia, khu vực, nơi thì dùng hệ thống chữ tượng hình, nơi thì chữ alphabet, nơi chỉ toàn số, nơi áp dụng cả số lẫn chữ, và nơi thì biển số hình chử nhật 1 hàng, nơi 2 hàng, rồi màu sắc của biển số
- Điều kiện hiện trạng của biển số: bạn nên nhớ rằng không phải mọi biển số đều có hiện trạng mới ra lò, chúng có thể cong vênh, sơn có thể tróc, bạc màu
- Điều kiện về cách thức bố trí thiết bị: cách lắp đặt camera sẽ cho bạn một cơ hội hay thách thức trong quá trình chạy thuật toán Tốc độ di chuyển của xe, tốc độ bắt hình của camera cũng tạo ra những vấn đề không nhỏ
* Các bài toán đặt ra trong hệ thống nhận dạng biển số xe [1, tr.32-35]
+ Bài toán 1: Lựa chọn các khung ảnh trên camera kỹ thuật số hoặc
những đoạn ảnh trích chọn những ảnh chứa biển số xe rồi truyền vào máy tính
+ Bài toán 2: Từ kết quả của bài toán 1 thực hiện dò tìm và phát hiện
ra vùng chứa biển số xe
+ Bài toán 3: Từ những vùng chứa biển số xe của bài toán 2 thực hiện
một số thao tác cơ bản để xác định chính xác vùng con nào chứa biển số xe Kết quả là một tập các ảnh con chứa biển số xe
Trang 22+ Bài toán 4: Giải quyết bài toán nhận dạng ký tự cho tập kết quả từ
Bài toán 3 Bằng cách áp dụng các phương pháp và kỹ thuật của nhận dạng ký
tự
* Một số các bước tiếp cận trước để giải quyết vấn đề:
+ Giải quyết bài toán 1:
Đối với các hệ thống trực tiếp thu ảnh vào camera kỹ thuật số hay các thiết bị ghi hình khác, thì giải pháp là nhờ vào bộ phận tách “khung” gọi là Frame Grabber Hoạt động của bộ phận này là: Cứ 1 khoảng “khung” định trước, hệ thống sẽ gửi ảnh đến vị trí đích mà cụ thể ở đây là máy tính Máy tính sẽ tiếp nhận ảnh này và tiến hành xử lý
Đối với hệ thống mà tín hiệu đầu vào là đoạn phim Giải pháp ở đây là xây dựng một ứng dụng “Capture” vùng nhìn.Tuy nhiên, cách này chỉ là bán thủ công Giải pháp tốt nhất vẫn là kết nối với thiết bị Frame Grabber (thiết bị dùng để thu hình từ camera Analog)
Đối với hệ thống mà tín hiệu đầu vào chỉ là ảnh thì cần trang bị một thư viện đọc và ghi ảnh
+ Giải quyết bài toán 2:
- Phương pháp 1: “Phát triển vùng”
Ý tưởng chính: Ảnh chứa biển số xe sẽ có những vùng đồng nhất mà cụ thể là “màu trắng” và có diện tích nhất định Như vậy ta sẽ áp dụng phương pháp phát triển vùng để tìm ra các vùng thỏa mãn đặc tính trên
- Phương pháp 2: “Phép biến đổi Hough”
Ý tưởng chính: Do biển số xe có chứa các đường viền, nên chúng ta sử dụng phép biến Hough cho việc phát hiện các vùng có đường thẳng đứng và đường thẳng ngang Giao điểm của các đường này sẽ cho ta tọa độ của khung viền
- Phương pháp 3: “Phát hiện biên & Heuristic”
Trang 23Ý tưởng chính: Áp dụng mặt nạ Sobel để dò tìm cạnh trong ảnh, kết quả là ảnh chứa tập các cạnh Sau đó, áp dụng một số Heuristic về biển số xe như kích thước, tỉ lệ chiều cao/ chiều rộng, hoặc sử dụng một cửa sổ di chuyển trên toàn bộ tập các cạnh để tìm ra vùng có số cạnh thỏa mãn điều kiện
+ Giải quyết bài toán 3:
- Nếu đầu vào chính xác chỉ chứa biển số xe hoặc vừa chứa biển số xe vừa chứa 1 phần duy nhất của xe Thì việc chọn lọc trong tập hợp các vùng để đưa ra biển số xe là đơn giản Ta chỉ cần dựa vào kích thước, chiều cao chiều rộng của vùng
- Nhưng nếu ảnh đầu còn chứa các đối tượng khác thì cần phải bổ sung thêm heuristic để chọn lọc Một số heuristic được dùng tại đây là:
+ Tỉ lệ chiều cao/ chiều rộng
+ Số cạnh trong từng vùng
+ Tỉ lệ Pixel ảnh/ Pixel nền
+ Dạng của lược đồ xám theo (Ox, Oy)
- Kết quả của bài toán này là tập ảnh mà mỗi phần tử trong tập hợp chỉ chứa biển số xe
+ Giải quyết bài toán 4:
Đối với bài toán này hiện nay đã có rất nhiều phương án giải quyết gần như hoàn hảo Bộ nhận diện ký tự nhận đầu vào là các ảnh có ký tự riêng rẽ
và cho ra ký tự văn bản tương ứng Hiện nay mạng Neuron là hệ thống máy học được sử dụng phổ biến cho việc phân loại này, ngoài ra các giải thuật so khớp mẫu (Template Matching) cũng được áp dụng tùy theo từng tình huống
Trang 242.2 Các phương pháp phát hiện biên ảnh
Đây là phương pháp dựa vào sự biến thiên về giá trị độ sáng của điểm ảnh Kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm Nếu lấy đạo hàm bậc nhất của ảnh ta có phương pháp Gradient, nếu lấy đạo hàm bậc hai ta có phương pháp Laplace Hai phương pháp trên được gọi là phương pháp dò biên cục bộ
2.2.1 Phương pháp Gradient
Đây là phương pháp sử dụng cực đại hóa của đạo hàm Có nghĩa là, gradient là một vector biểu thị tốc độ thay đổi giá trị của điểm ảnh theo hai hướng x và y Các thành phần của Gradient được tính bởi:
Đổi sang tọa độ cực
Suy ra:
Trong đó dx là khoảng cách giữa các điểm theo hướng x (khoảng cách tính bằng số điểm) và tương tự với dy Trên thực tế người ta hay dùng với dx= dy= 1
Với một ảnh liên tục f(x, y), các đạo hàm riêng của nó cho phép xác định vị trí cục bộ theo hướng của biên Thực vậy, gradient của một ảnh liên tục, được biểu diễn bởi một hàm f(x,y), dọc theo r với góc , được định nghĩa bởi:
Trang 25= fxcos + fysin
Chú ý: khi ta nói lấy đạo hàm của ảnh nhưng thực ra chỉ là mô phỏng
và xấp xỉ đạo hàm bằng các kỹ thuật nhân chập (phép cuộn) Do ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại
Việc tính toán Gradient là sử dụng cặp mặt nạ H1 và H2 trực giao (theo
2 hướng vuông góc) Nếu định nghĩa g1, g2 là gradient tương ứng theo 2 hướng x và y, thì biên độ của gradient, ký hiệu là g tại điểm (m,n) được tính theo công thức:
A0= g(m,n)=
Chú ý: để giảm tính toán, công thức A0= g(m,n) được tính gần đúng bởi:
Các toán tử đạo hàm được áp dụng là khá nhiều, ở đây, ta chỉ xét một
số toán tử tiêu biểu: toán tử Robert, Solbel…[7,tr 33-35]
*) Kỹ thuật Robert
Với mỗi điểm ảnh I(x,y) của I, đạo hàm theo x, theo y được ký hiệu tương ứng bởi gx, gy được tính:
Điều này tương đương với việc chập ảnh với 2 mặt nạ H1 và H2:
Quá trình tính toán được thực hiện qua các bước sau:
● Bước 2: Tính
Trang 26Từ ma trận chọn ra các điểm cao thứ 2, hoặc thứ 3 chiếm đa
số
*) Kỹ thuật PreWitt:
Kỹ thuật này sử dụng hai mặt nạ H1 và H2:
Quá trình tính toán được thực hiện qua 2 bước:
Vậy suy ra ta có:
Trang 27= I(x+1, y+1)- I(x+1, y)
+ I(x+1, y+1)- I(x, y+1)
+ I(x+1, y+1)- I(x+2, y+1)
+ I(x+1, y+1) – I(x+1, y+2)
2.2.3 Phương pháp Canny
Thuật toán Canny được phát triển bởi John F.Canny vào năm 1986, sử dụng một thuật toán đa giai đoạn để phát hiện độ rộng các cạnh trong ảnh
Trang 28Mặc dù thuật toán đã được đưa ra từ lâu nhưng nó đã trở thành phương pháp chuẩn trong việc phát hiện biên của ảnh và thường xuyên được sử dụng trong nghiên cứu
* Các bước thực hiện thuật toán Canny
Bước 1: Giảm nhiễu là làm trơn ảnh để loại bỏ nhiễu bằng cách nhân
chập ảnh với bộ lọc Gauss
Đây là điều không thể tránh khỏi vì tất cả các hình ảnh chụp từ máy quay
sẽ chứa một số nhiễu Để ngăn nhầm lẫn nhiễu với các biên, nhiễu phải được giảm bớt Do đó ảnh trước tiên được làm mịn bằng cách áp dụng một bộ lọc Gauss Cách thức tiến hành giống như ở Laplace of Gauss
Nhân của bộ lọc Gauss với độ lệch chuẩn σ = 1,4 được thể hiện trong phương trình sau (ở đây ta sử dụng một bộ lọc 5 x 5):
Bước 2: Tìm gradient là tính toán góc và chiều dài của gradient Biên
nên được đánh dấu nơi mà gradient của ảnh có chiều dài lớn
Các biên độ gradient (còn được gọi là những cường độ biên) sau đó có thể được xác định như là một thước đo khoảng cách Euclide bằng cách áp dụng luật của Pythagoras như trong phương trình sau:
Đôi khi nó được đơn giản hóa bằng cách áp dụng thước đo khoảng cách Manhattan để giảm bớt sự phức tạp tính toán:
Trang 29trong đó Sx và Sy là gradient theo 2 hướng x và y tương ứng và hướng của biên θ như sau:
Ảnh S’ tìm được là kết quả của bước thứ 2
Bước 3: Thực hiện “Non-maximum suppression”: Chỉ cực đại cục bộ
những điểm được đánh dấu là biên (có mức xám cao)
Tức là loại bỏ một số biên dư thừa: Đối với mỗi điểm ảnh trên ảnh S’ ta tiến hành so sánh giá trị của điểm đó với giá trị của hai điểm lân cận điểm đó Hai điểm lân cận này là hai điểm nằm trên đường thẳng chứa hướng của đường biên θ (công thứ tính hướng của đường biên θ được tính ở bước 2) Giả sử với điểm biên đang xét tại vị trí P(x, y), ta có 8 điểm biên lân cận điểm biên này:
Trang 30Hình 2.2: Hình mô tả các điểm biên lân cận của P Tại điểm biên đó ta tiến hành tính giá trị góc của hướng đường biên θ Nếu hướng của đường biên θ ≤ 22.5o
hoặc θ > 157.5o thì đặt giá trị của θ = 00khi đó hai điểm biên lân cận điểm biên này tại vị trí (x-1, y) và (x+1, y)
Tương tự ta có kết quả hai điểm biên lân cận theo các hướng biên khác nhau như bảng dưới đây:
Giá trị θ Phương
θ ≤ 22,50
hoặc θ > 157,50 θ = 00 (x − 1, y); (x + 1, y) 22,5< θ ≤ 67,50 θ = 450 (x − 1, y − 1); (x + 1, y + 1) 67,5< θ ≤ 112,50 θ = 900 (x − 1, y − 1); (x + 1, y − 1) 112,50< θ ≤ 157,50 θ = 1350 (x, y + 1); (x, y − 1)
Bảng 2.1: Bảng kết quả hai điểm biên lân cận
Trang 31Nếu điểm ảnh P(x, y) có cường độ gradient lớn nhất trong ba điểm ảnh kiểm tra thì được giữ lại điểm biên này Nếu một trong hai điểm ảnh khác có cường độ gradient cao hơn thì điểm ảnh P(x, y) này không có trong "trung tâm" của biên và không nên được phân loại như là một điểm biên (tức là loại
đi – cho giá trị điểm này = 0)
Bước 4: Sử dụng ngưỡng đôi: Những biên tiềm năng được xác định bởi
ngưỡng cao và ngưỡng thấp
Các điểm biên còn lại sau khi thực hiện “Non-maximum suppression”
vẫn được đánh dấu với cường độ pixel-by-pixel của chúng Nhiều điểm trong
số điểm biên này có lẽ sẽ là biên đúng trong ảnh, nhưng một số có thể được gây ra bởi biến đổi nhiễu hay màu sắc do bề mặt thô ráp Cách đơn giản nhất
để phân biệt những điểm biên này với nhau là sử dụng một ngưỡng, vì vậy chỉ có biên mạnh hơn một giá trị nhất định sẽ được bảo toàn
Thuật toán phương pháp phát hiện biên Canny sử dụng ngưỡng đôi gồm có ngưỡng thấp Tl và ngưỡng cao Th:
- Xét điểm ảnh P(x,y)
- So sánh P(x,y) với hai ngưỡng Th và Tl
+ Nếu P(x,y) ≥ Th: đánh dấu và giữ lại điểm biên này (đặt giá trị bằng 1)
+ Nếu P(x,y) < Tl: Loại bỏ điểm biên này (đặt giá trị bằng 0)
+ Nếu Tl ≤ P(x,y) < Th: ta tiến hành so sánh giá trị P(x,y) với giá trị của 8 điểm lân cận :
Nếu một trong 8 điểm lân cận có giá trị > Th: Tiến hành đánh dấu và giữ lại điểm biên này
Ngược lại: Loại bỏ điểm biên này (đặt giá trị bằng 0)