Vi vậy, luân văn đã chọn đẻ tải “Nhận đạng biển báu giao thông đường bệ” để nghiên cửu với mục địch hiểu được nên tảng công nghệ, các lý thuyết cơ bản trong, ‘bai loan xử lý ảnh và áp d
Trang 1xã hội Từ quy mô phát triển dến cơ sở hạ tầng Ý thức tự
giác và cảnh giác của người tham gia giao thông tại Việt Nam lại chưa cao
Theo số liệu thống kẻ của Ủy ban An toàn giao
thông Quốc gia, trong 9 tháng đầu năm 2013, cả nước đã xây ra 23.619 vụ tại nạn, làm chết 6.908 người và 25.002
người bị thương Ti tinh hình thực tế giao thông tại Việt Nam, có nhiều nguyên nhân gây ra các vụ tai nạn giao thêng dường bộ, nhưng phản lớn là do tải xế không làm chủ tốc độ, không quan sát hoặc không kịp nhận ra các
loại biển bảo và lín hiệu giao thông Đây là những nguy
hiểm đã được cánh báo trước nhưng tại nạn vẫn thường, xuyên xây ra, gây không ít thiệt hại vẻ tính mạng và tài
sân của người tham gia giao thông.
Trang 2Cho đến nay van 48 nay được nhiều nghiên cứu
trên thể giới quan tâm Khưng những biến bảo giao thông, dược nghiên cửu không phải dùng cho giao thông dường
bộ tại Việt Nam Trong khi đó tỉnh hình nghiên cứu biển bao giao thông tại Việt Nam vẫn còn nhiều hạn chế và chua đây đủ
Vi vậy, luân văn đã chọn đẻ tải “Nhận đạng biển báu giao thông đường bệ” để nghiên cửu với mục địch
hiểu được nên tảng công nghệ, các lý thuyết cơ bản trong,
‘bai loan xử lý ảnh và áp dụng trong việc nhận dạng biểu
bảo giao thông một cách tự động,
« Mục đích nghiễn cứu
-_ Nghiên cửu tìm hiểu các phương pháp nhận
dang biến bảo giao thông và cải đặt thử nghiệm chương trình phát hiện và nhận đạng biển báo giao thông dường,
bộ từ hình ánh tĩnh và video thu vẻ, sau đó hiển thị thông
tín cảnh bảo dưới đạng hình ảnh
+ Đôi tượng và phạm vi nghiên cứu
Biển báo giao thông dường bộ ở Việt Nam
+ Phương pháp nghiên cứu
Trang 33
- Tim hiểu bộ ánh biển báo giao thông đường bộ tại
'Việt Nam, thu thập hình ảnh, video biển báo giao thông từ
các nguồn khác nhau (google image, tự chụp, .)
- Tìm hiểu phương pháp phát hiện biển bảo giao thông dựa trên trích chọn đặc trưng Haar-like kết hợp với
- Gài đặt chương trình thử nghiệm và đánh giá kết
quê nhận dạng
+ Hổ cục luận văn
Luận vấn chia thành ba phần chính: Phân mở đâu,
phản nội dung và phân kết luận
Phần mử đầu: Nêu lên lý do chợ đối Lượng,
va phạm ví nghiên cửu và phương pháp nghiên cửu của dé
tải
Thần nội dung:
Trang 4Chương 1: Tổng quan về xử lý ảnh Chương này trình bày những lý thuyết cơ ban về xử lý ảnh, tổng quát các phương, pháp phổ biển trong quá trình phát hiện và nhận đạng đối tượng
phan chính PCA và bộ phân lớp SVM
ăng tốc Adaboost, phân tích thành
Chương 3: Cai đặt và thử nghiệm Tác giả sử dụng ngôn ngữ VC++ MEC của bộ Visual Studio 2008, va
bộ thư viện xử lý ảnh mã nguồn mở OteHCV của Intel đe
Trang 55
Chương 1 TỎNG QUAN VẺ XỬ LY ANH
1.1 Một số khái niệm trong xử lý ánh
1.3.2.2 Kỹ thuật phát hiện biên Laplace
1.3.2.3 Kỹ thuật phát hiện biên theo phương pháp Canny 1.3.3 Phát hiện biên giún tiếp
1.34 Phân vùng ănh
1.3.4.1 Phân vũng ảnh theo ngưỡng biên độ
1.3.4.2 Phan ving ảnh theo vùng đồng nhất
1.3.4.3 Phân vũng ảnh theo kết câu bé mat
1.4 Phương pháp trích chọn đặc trưng ãnh
hái niệm
Có thể hiếu trích chọn đặc trưng là quá trình rút
trích cúc đặc trưng đại diện cho ảnh, được gọi là các chỉ
tiết đặc trưng, Các chủ tiết đặc trưng nảy yêu cầu phái có
Trang 6thuộc tính là khá năng, bảo toàn tính đặc thủ để phân biệt
có trong ảnh, đồng thời phải có tinh cô đọng, hỗ trợ chặt chế cho quá trình dối sảnh vả ít bị tác dộng bởi nhiều hoặc sai lệch trong ảnh Ngoài ra, còn yêu cầu phải dễ tính toán
1.4.1 Đặc trưng Haar-iike
1.4.2 Đặc trưng Histogram of Oriented Gradients (HOG)
1.5 Các phương pháp nhận dạng đối tượng
15.1 Phương pháp Neural Networks (NN)
Mang noron nhan tao (Artifical Neural Networks)
mé phéng lai mang noron sinh học là một câu trúc khối gồm cae don vi tink toán đơn giản dược liên kết chặt chế với nhau trong đó các liên kết giữa các noron quyết định
chức răng cửa mạng Về cơ bản mạng Neural là mội mạng
các phản tử (gọi là neuraÐ kết nổi với nhau thông qua các liên kết (các liên kết này được gọi là ọng số liên kế đề
thực hiện một công việc cụ thể nào đó Khả năng xử lý của mạng neural được binh thành thông qua quá trình hiệu
chính trọng số liên kết giữa các netral, nói cách khác là bạc từ tập hợp các mẫu huấn luyện
Ưu điểm: - Dễ cài đặt cùng với khả năng học và tống
qual hod rat cao.
Trang 7- Tếc độ xử lý nhanh
- Linh hoạt và đễ bão trì:
Nhược diễm: - Tình chậm vả xác suất khéng cao không,
cổ quy tắc tổng quát để xác định cấu trúc mạng và các tham số học tôi mm cho một (lớp) bài toán nhật định
- Tiêu chuẩn thu thập cơ sở dữ liệu budn luyện còn
+hất khe
- Đôi hỏi thời gián xử lý cao với mạng một mạng
Neural lon
1.5.2 Phuong phap Support Vector Machine (SVM)
Cho trước một tập luân luyệu, các ảnh dược biểu điển đưới đạng vector Trong không gian vector, mỗi verlor được biểu diễn bởi một điểm Phương pháp SVM sẽ tim một siẻu phẳng quyết định để phân chía không gian
vector thanh hai lớp Chất lượng của siêu phẳng này phụ thuộc vào khoảng cách giữa các vector, tức là phụ thuộc vào các đặo trưng của anh
Ưu điểm: - Cho kết quả nhận dạng với độ chính xác cao
- Bài toàn huản luyện SVM thực chất là bài toán
QP trên một tập lỗi, do đó SVM luồn có nghiệm toàn cục
va duy what, đây chỉnh là điểm khác biệt rõ nhất giữa
Trang 8SVM so với phương phap mang Neural, vi mang Neural
vốn tôn tại nhiều điểm cực trị địa phương
Nhược điểm: - Hạn chế lớn nhất của SVM lả tốc do phân lớp rat chim, thy thuộc vào số lượng các véc tơ hỗ
Trợ
- Giai đoạn huấn luyện §VM dỏi hỏi bộ nhớ rất
lớn, do đỏ các bài toán huấn luyện với số lượng mẫu
lớn sẽ gặp trở ngại trong vấn đề lưu trữ liệu quả phân lớp của SVM phụ thuộc vào hai yếu tổ: giải bài
toán QP và lựa chọn hàm nhân
1.5.3 Phương pháp Linear Discriminant Analysis
Mục dích của LDA - Linear Discriminant
Analysis 1a tim cách phân loại các đối tượng (người, sự vật, ) vào một trong hai hay nhiều lớp đã được xác định
trước đựa vào các đặt trung (feature) đùng để mô tả đối
tượng (vi dụ như các đặc trưng dùng để mô tá đối tượng
khach hàng là giới tính, tuổi, nghề nghiệp, thu nhập ) Uuđiểm: - Dễ dàng hơn để đào tạo, phương sai thập,
hiệu quả hơn nêu mô hình là chính xác
-LDA làm việc tốt khi số mẫu là lớn
Trang 99 Nhược diém: - LDA gặp phái vẫn đẻ khí tổng số mẫu
tuân luyện ít hơn so với kích thước của không gian đặc
trưng,
1.5.4 Phương phap Naive Bayes (NB)
Y tuéng co bin cia cach tiép cận NB là sử dụng
xác suất có điều kiện
Ưu điểm: Cho độ chính xác cao khi kết hợp với các
phương pháp khác
Nhược điểm:- Chỉ phí thời gian đẻ đếm mẫu
- Phâi kết hợp với các phương pháp khác
1.5.3 Phương phap Principal Component Analysis
PCA (Principal Component Analysis) la mét that
toan được sử dụng đề tạo ra một ảnh rưới từ ảnh ban đầu Ảnh mới này có kích thước nhỏ hơn nhiều so với ánh ban đầu nhưng vẫn mang những đặc trưng cơ bân nhất của ảnh cần nhận dạng Nói một cách ngắn gọn, mục liêu cửa PCA là tim một không gian mới (với số chiều nhỏ hơn
không gian cũ) Các trục tọa độ trong không gian mdi
dược xây dựng sao cho trên mỗi trục, dộ biển thiên của dữ
liệu trên đó là lớn nhất có thể
Ưu điểm:
Trang 10- Tim được các đặc tính tiêu biểu của đối tượng cần nhận đạng mà không cân phải xác định các thành phản và mỗi quan hệ giữa các thành phẩn do
- Thuật toán có thể thức hiện tốt với các ảnh có độ
phân giải cao, đo PCA sẽ thu gọn ảnh hành một ảnh có
kich thước nhỏ hơn
- PCA có thể kết hợp với các phương pháp khác đề
nang lại hiệu quả nhận đạng cao hơn
Nhược điểm: - PCA chỉ làm việc với đữ liệu numeric
- ĐCA ri nhạy với nhiều
- Không phủ hợp với các mô hình phi tuyển do
CA hoàn toàn dựa trên cáo biển đổi tuyển tính
- Cái dặt thuật toán phức tạp
ết luận chương 1
Trang 111 Chương 2: PHÁT' HIỆN VÀ NHẬN DANG ANH 2.1 Bài toán nhận dạng đối tượng
2.2 Các nghiên cứu liên quan đến nhận đạng đối tượng
2.3 Bai toàn nhận dạng biển bảo giao thông
3.3.1 Phương pháp phát hiện dựa trên màu sắc
2.3.2 Phương pháp phải biện dựa trên hình dụng
2.3.3 Phương phúp phát biện dựa trên máy hoc
3-4 Trích chụn đặc trưng nh biển hảo giao thông
Đặc trưng Haar-like được sử đụng trong, việc nhận
đạng đối tượng trong ảnh số được phái biểu bồi Viola và Jones|5| gdm 4 đặc trưng cơ bản dẻ xác dịnh một dối tượng trong ảnh Mỗi đặc trưng IIaar-like là sự kết hop gầm 2 hoặc 3 khói chữ nhật mang giá trị “den” hoặc
“trắng” Những khỏi chữ nhật nay thể biện sự liên hệ
tương quan giữa cáo bộ phận trong ảnh mà bản thân từng,
giả trị pixcl không thể điển đạt được
Trang 12i fo) @) đà (1) Đặc trưng theo cạnh
Laar-like: f(x) = 1éng ving (các mức xám cửa pixel) -
Tổng vụng tưng (các mức xá của pixel)
“Integral Imnge” (ảnh chỉa nhỏ}
Integral Image tai vi trí (x,y) bằng tổng các giá trị điểm ảnh phía trên và bên trái của (x,y) Tổng các điểm ảnh trong một hình chữ nhật (kế cá trường hợp xoay 45°)
bất kì đêu có thế được tính nhanh dựa trén integral image tại 4 định của nỗ
Swn (DJ =41 1-(2 + 3)
Trang 13Nguyên lý cơ bản của boosting là sự kết hợp các
phân lớp yếu (weak classification) thanh mét phân lớp
manh (strong classification) Trong 46, phân lớp yếu là
các bộ phân loại đơn giản chỉ cần cỏ đô chính xác trên
50% Bằng cách nảy, chúng ta nói bộ phân loại đã được
“boost”
3.5.2 Thuật toán Adaboost
Thuật toán AdaBoost tuân theo các bước sau: [4]
1 Cho một tập gồm n mẫu cỏ đánh dầu (xạ y1), (Xa, Y›)
(Kms Ya) VOi Xk E (Xia, Xa, Xin) là veetor đặc trưng và
ys €(-1, 1) la nhan ctia mau (1 img voi object, -1 img voi
background)
2 Khởi tạo trọng số ban đâu cho tắt cả các mâu:
Trang 14voi m là số mẫu đúng (ứng với øðjecf và y = 1) và ! là số mẫu sai (ứng với background va y =-1)
1 1
Wik = Tava
3 Xây dựng T phản loại yếu
® Lapt 1, ,T Với mỗi đặc trưng trong vector đặc trưng, xây dựng một phân loại yếu h; với ngưỡng Ú;và
Trang 15l§
2.6 Nhận dạng biển báo giao thông
2.61 Phương pháp phân tích thành phan chinh PCA
2.6.1.1 Giới thiêu phương pháp PCA
2.6.1.2 Thuat toan PCA
Mục tiêu của phương pháp PCA là “giảm số
chiêu” của 1 tập vector sao cho vẫn đảm bảo được “?ối đa
thông tin quan trọng nhất”
Ánh xe tuyển tình T cần im, (phập chiều) Không gian K chiêu (€<<N)
không gian N chiu với Với hệ cơ Sở bị bạ, ức
hệ cơ sở tụy, ức
Hình 2.9 Chuyển vector x ban đầu có N chiều thành
vector y con K chiều Tắt nhiên, khi loại bỏ 1 số thảnh phân của x đề thu được y
thi sé gay ra sai s6 (161), > Phuong pháp PCA sẽ có găng
tìm phép biển đổi tuyén tinh 7 théa: y = 7.x sao cho trung
bình binh phương lỗi (MSE) là bé nhất
s* Cách để tìm được T:
Trang 16Gợi M là vector trung bình cúa tắt cả các vector x trong, tập mẫn Gợi ma trận hiệp phương sai của các phan ti x trong tập mẫu là C C được tính theo công thức sau
1
CEE Ml =A0"
Người ta chứng mình được rằng: “Nếu T là ma trận we
hang, mdi hàng là 1 vector riêng của C, đồng thời m
vector riêng này phải ứng với m trị riêng lớn nhất, Khi
đó T chính là phép biến đối thỏa MSE nhỏ nhất”
> Noi tom lại, phương pháp PCA quy vẻ việc đi
tim tri riéng (eigenvalues) va vector riéng (eigenvectors)
của ma trận hiệp phương sai C của tập mẫu X Sau đó, la chỉ giữ lại K vector niéng ứng với K trị riêng lớn nhất để
làm cơ sở cho không gian mới nảy
26.2 Nhận dạng biển bản giao thông bằng phương pháp máy vecto hỗ trợ (Suppart Lector Machine)
2.6.2.1 SVM trong trưởng hợp tập mẫu phân hoạch tuyên
Trang 17Cực liễu hod (theo w, b) | wlP voi điều kiện
¥ (wx; +B) -1 2 0 (véi moi i = 1, 2 , m)
Chuyển qua giải bài toán đối ngau sau: 7ờm cực đại của:
8) với w = R”, >0, tong đó 802 = inff LI wll - Sl
siêu phẳng phân hoạch
b Giai doan nhận dạng — Bảy giờ gid siz co mot mau dit liệu cẩn nhận dang x* nào đó, thì phân lớp y* của x* (1
hay 1) được xác định thông qua công thúc
ye fA) = sign * 18) = sigan(S 15.5350" 18)
Trang 182.62.2 SVM tuyén tinh trong trường hợp tập mẫu không phân hoạch tryển tính được
Phương pháp này sử dụng các biến bù É, ding dé
do dộ sai lệch của mẫu x,
we, +b>1-& voipy=
>0,ïi=1,2, „m
; wa,—b<<-l + ä với t.=-l; §
Với cách đặt như vậy thì sai số thực nghiệm
Empirieal Raisk là: 5z” Tương tự cách trén ta có thể cực
Vậy bài toán có thể phát biểu như sau:
Cục tiểu: ƒƑ(u,b,#) 4 vì |+CŠ)&
Voi vũm ~b)—T+& >0 1,2, , m Š, >0
Nhu vay bài toán đối ngẫu dược viết lại thành:
Giải bài toán đối ngầu của bài toán này la lìm được u và từ
do tinh được w Vậy đã tìm dược siêu phẳng phân chia một tập đữ liều không thé phân hoạch tuyến tính Siêu phẳng như vậy được gọi là siêu phẳng lễ mềm
2.6.2.3 SVM phi tuyén
Két luận chương 2
Trang 1919
Chương 3 CÀI ĐẶT VÀ THỨ NGHIỆM
3.1 Thu thập dữ liệu
Biển báo giao thông ở Việt Nam được chia thành 5
nhóm: Nhóm biển chỉ dân, nhóm biển hiệu lệnh, nhom
biển báo cấm, nhóm biển bảo nguy hiểm, nhom biển phụ
Trong ứng dụng demo, tác giả chỉ nhận dạng 13
loại biên bảo
Biển | SO | Bien | Số | Bien | SO | Bien | SO
báo | hiệu | báo | hiệu | báo | hiệu | báo | hiệu