Việc ứng dụng PCA trong nhận dạng biển báo giao thông sẽ giúp giảm số chiều của dữ liệu, giảm thông tin dư thừa trong ảnh mà kết quả nhận dạng mang lại khá cao.. Mục tiêu và nhiệm vụ của
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
DAI HOC DA NANG
TRUONG THI MINH HAU
NGHIEN CUU PHUONG PHAP PCA
VA UNG DUNG TRONG NHAN DANG
BIEN BAO GIAO THONG
Chuyén nganh: Khoa hoc may tinh
Ma sé: 60.48.01
TOM TAT LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2013
Trang 2Công trình được hoàn thành tại
DAI HOC DA NANG
Người hướng dẫn khoa học: TS Huỳnh Hữu Hưng
Phản biện 1: TS Nguyễn Trần Quốc Vinh
Phản biện 2: TS Nguyễn Mậu Hân
Luận văn đã bảo vệ tại Hội đông châm Luận văn tôt nghiệp thạc sĩ ngành khoa học máy tính họp tại Đại học Đà Nẵng
vao ngay 16 thang 11 nam 2013
Có thê tìm hiếu luận văn tai:
- Trung Tâm Thông Tin - Học Liệu, Đại học Da Nang
- Trung Tâm Học Liệu, Đại học Đà Nẵng
Trang 3MO DAU
1 Ly do chon dé tai
Xu ly anh số là một lĩnh vực khoa học còn khá mới mẻ, và được quan tâm nhiều hiện nay Phạm vi ứng dụng của xử lý ảnh ngày càng được mở rộng Bài toán nhận dạng ảnh là bài toán lớn và có rất nhiều ý nghĩa trong thực tế đời sống Trong đó có bài toán nhận dạng biển báo giao thông
Biến báo giao thông là cách thức để thông báo cho người tham gia giao thông tình trạng đường, đưa ra những chỉ dẫn, hay cảnh báo giúp người tham gia giao thông xử lý và đưa ra những hành vi hợp
lý, đảm bảo an toàn giao thông Mỗi người tham gia giao thông đòi
hỏi phải nắm bắt và hiểu hết toản bộ ý nghĩa của tất cả các biển báo giao thông Việc này trở nên khá khó khăn khi số lượng biển báo quá
lớn Hơn thế nữa việc phát hiện biển báo trở nên phức tạp khi mà các yếu tố ngoại cảnh tác động: Biển báo có thể bị hư hại khi tiếp xúc
một thời gian đài dưới ánh nắng mặt trời; màu sắc bị thay đối trong
các điều kiện sương mù, ánh sáng yếu ban đêm; biển báo bị che khuất bởi nhà cửa, cây cối Đặc biệt trong các trường hợp người lái
xe đang trong tình trạng say, buồn ngủ, hôn mê hoặc mất tập trung
thì việc phát hiện biển báo sẽ gặp nhiều khó khăn Vì vậy một hệ
thống nhận dạng biên báo giao thông sẽ rất có ích cho con người khi tham gia giao thông Ngoài ra, hệ thống này còn được ứng dụng trong ngành công nghệ xe tự lái
Có nhiều phương pháp để nhận dạng biển báo giao thông như:
kỹ thuật máy hé tro vector (SVM_ Support Vector Machine), mạng nơ-ron nhân tạo, phương phap phan tich thanh phan chinh (PCA_ Principal Component Analysis)
Trang 4Phương pháp phân tích thành phần chính (PCA_ Principal Component Analysis) là một kỹ thuật phân tích biến đổi được nghiên cứu khá rộng rãi và được ứng dụng vào nhiều bài toán nhận dạng khác nhau như: nhận dạng mặt người, nhận dạng cảm xúc khuôn mặt, nhận dạng chữ viết tay Việc ứng dụng PCA trong nhận dạng biển báo giao thông sẽ giúp giảm số chiều của dữ liệu, giảm thông tin dư thừa trong ảnh mà kết quả nhận dạng mang lại khá cao Đó chính là lý do em chọn đề tài này
2 Mục tiêu và nhiệm vụ của đề tài
* Mục tiêu của đề tài
Nghiên cứu về phương pháp nhận dạng PCA và ứng dụng thành công phương pháp PCA vào trong nhận dạng biển báo giao thông
s* Nhiệm vụ chính của đề tài bao gồm
- _ Nghiên cứu tổng quan về biển báo giao thông tại Việt Nam
- Nghiên cứu phương pháp phát hiện biên Camny, đặc trưng
màu của biển báo và đặc trưng nhận dạng hình học để phát hiện biển
báo giao thông có trong ảnh
- _ Nghiên cứu cơ sở lý thuyết về phương pháp PCA
- Sử dụng phương pháp PCA vào việc nhận dạng biển báo giao thông
3 Đối tượng và phạm vỉ nghiên cứu
s* Đối tượng nghiên cứu
- _ Các vấn đề liên quan đến biến báo giao thông tại Việt Nam
- Các vấn đề liên quan đến phương pháp phát hiện biên
Canny; đặc trưng màu và đặc trưng hình học của biến báo
Trang 5- _ Các vấn để liên quan đến các phương pháp nhận dạng biển báo giao thông
- Cac van dé liên quan đến phương pháp PCA
s* Phạm vỉ nghiên cứu
- - Dữ liệu được xử lý là file ảnh tĩnh với ảnh được chụp với
góc nghiêng không đáng kể (không quá 10)
- Ảnh được chụp trong điều kiện ánh sáng bình thường
(không chụp ngược sáng, chụp bằng máy ảnh kỹ thuật số)
- Dữ liệu biển báo giao thông chỉ gồm các biển báo giao
thông đường bộ ở Việt Nam
4 Phương pháp nghiên cứu
s* Phương pháp tài liệu:
- _ Tìm hiểu cách lập trình với Matlab
- _ Cơ sở lý thuyết về biển báo giao thông ở Việt Nam
- Tim hiéu téng quan về bài toán nhận dạng biển báo giao thông
- _ Tìm hiểu phương pháp phát hiện biên Canny
- _ Tìm hiểu đặc trưng nhận đạng hình học
- _ Tìm hiểu các phương pháp nhận dạng biển báo giao thông
- _ Tìm hiểu phương pháp nhận dạng bang PCA
s* Phương pháp thực nghiệm:
- - Xây dựng chương trình thực nghiệm
- _ Xây dựng kho dữ liệu hình dạng mẫu
- _ Xây dựng kho đữ liệu huấn luyện PCA
- _ So sánh và đánh giá kết quả đạt được
mn Ý nghĩa khoa học và thực tiễn
Trang 6* Ý nghĩa khoa học:
- _ Nghiên cứu về hệ thống biển báo giao thông
- - Nghiên cứu phương pháp phát hiện biên Canny
- _ Nghiên cứu về phương pháp nhận dạng biển báo giao thông bằng PCA
- _ Ứng dụng thành công công nghệ xử lý ảnh vào thực tế
- _ Tạo tiền đề cho những nghiên cứu tiếp theo trong tương lai
‹» Ý nghĩa thực tiễn:
- Nhận dạng biển báo giao thông thực sự chưa phố biến tại Việt Nam nó sẽ mở ra một hướng đi mới, ứng dụng mới trong việc nhận dạng biển báo giao thong
- Cung cấp thuật toán hỗ trợ cho việc tạo ra các thiết bị có chức năng phát hiện và nhận dạng biến báo giao thông
- _ Tạo tiền đề cho việc xây dựng hệ thống nhận dạng biển báo giao thông và tích hợp chúng trên các phương tiện tham gia giao thông, giúp cho người tham gia giao thông có thể xử lý các tình huống xảy ra một cách hợp lý, đảm bảo an toàn giao thông
Chương 3 Nhận dạng BBGT dùng phương pháp PCA
Chương 4 Kết quả thử nghiệm và nhận xét
Kết luận và hướng phát triển
Trang 7CHƯƠNG 1
NGHIEN CUU TONG QUAN VE XU LY ANH SO VA
NHAN DANG 1.1 GIỚI THIỆU CHUNG VẺ XỬ LÝ ẢNH SỐ
1.2 CÁC GIAI ĐOẠN CƠ BẢN TRONG XỬ LÝ ẢNH SỐ
Tiên xử lý ảnh \ ⁄ Nhận dạng và nội suy
Cơ sở tri thức (Knowledge based)
‹* Khử nhiễu ngẫu nhiên
b Bộ lọc trong miễn không gian
Trang 81.2.3 Phân đoạn ảnh
a Phan đoạn ảnh dựa trên ngưỡng
b Phân đoạn ảnh dựa trên biên
c Phân đoạn ảnh dựa trên vùng
1.2.4 Biểu diễn và mô tả ảnh
1.2.5 Nhận dạng và nội suy ảnh 1.2.6 Cơ sở tri thức
1.3 CÁC KHÔNG GIAN MÀU
1.3.1 Màu trong xử lý ảnh số
1.3.2 Không gian màu RGB
1.3.3 Không gian màu CMY
1.3.4 Không gian màu HŠV
1.3.5 Không gian màu CIE
1.4 XỬ LÝ HÌNH THAI HQC TREN ANH
1.4.1 Khái niệm cơ bản
Trang 9CHƯƠNG 2 TONG QUAN VE CAC PHUONG PHAP PHAT HIEN VA
NHAN DANG BIEN BAO GIAO THONG
2.1 CAC PHUONG PHAP PHAT HIEN BIEN BAO GIAO THONG
2.1.1 Phát hiện dựa theo đặc trưng màu của biển báo Cách tiếp cận phố biến trong vấn đề phát hiện biển báo giao
thông dựa trên màu sắc là sử đụng phương pháp phân ngưỡng để tìm một vùng ảnh có chứa màu sắc đặc trưng Kết quá của vùng ảnh sau
đó được xem như là biển báo giao thông hoặc là vùng cần quan tâm Khuyết điểm chính của phương pháp này là trong thực tế màu sắc có Xu hướng không đáng tin cậy, mà phụ thuộc vào các thời điểm trong ngày, điều kiện thời tiết, bóng râm Không gian màu RGB được đánh giá là rất nhạy cảm với ánh sáng, do đó nhiều nhà nghiên cứu đã chọn phân ngưỡng đựa trên màu sắc trong các không gian mau khac nhu HSI, HSV
2.1.2 Phát hiện dựa theo đặc trưng hình học của biến báo Phát hiện biển báo giao thông dựa trên hình dạng có nhiều cách tiếp cận đã được công bố trong nhiều tải liệu hiện nay Tuy nhiên, phương pháp dựa trên hình dạng phố biến nhất là sử dụng
phép biến đổi Hough
Hình 2.1 dưới đây là ví dụ minh họa cho trường hợp phát hiện BBGT dựa theo đặc trưng hình học bằng cách sử dụng phép biến đổi Hough Circle Transform
Trang 10a) Ảnh đầu vào b) Kết quả phát hiện Hình 2.4 - Phát hiện BBGT dùng phép biến đối Hough Circle
Transform
2.1.3 Phát hién dwa trén may hoc (machine learning) Với hai phương pháp tiếp cận bên trên (tiếp cận dựa trên màu
sắc và hình dạng) thì để giải quyết bài toán phải tự giải quyết bằng
tay (manualiy) Tuy nhiên, với kiến thức này cũng có thể được phát hiện bằng cách dùng máy học
Nghiên cứu của Viola và Jones [16] là một cột mốc quan trong trong lĩnh vực thị giác máy tính (computer vision) Viola va Jones đã
phát triển một thuật toán có khả năng xác định một đối tượng trong
thời gian thực Bộ phát hiện được huấn luyện bằng cách sử dụng một tập các mẫu tích cực (positive) vả tiêu cực (negative) Nghiên cứu
gốc chỉ dành cho việc phát hiện khuôn mặt, tuy nhiên nhiều nhà
nghiên cứu khác cũng đã ứng dụng thành công bộ phát hiện cho nhiều đối tượng khác Trong số đó, biển báo giao thông cũng được phát hiện thành công
2.2 CÁC PHƯƠNG PHAP NHAN DANG BIEN BAO GIAO
THONG
2.2.1 Mang No-ron
2.2.2 Kỹ thuật Support Vector machine (SVM)
Trang 112.2.3 Phương pháp phân tích thành phần chính (Principal component analysis PCA)
Phương pháp phân tích thành phần chính PCA lần đầu tiên được giới thiệu bởi Karl Pearson (1901), và được phát triển một cách
độc lập bởi Hotelling (1933), và còn được gọi là phép biến đổi
Karhunen-Loeve [6]
Mục đích của phương pháp PCA là loại bỏ đi một số hướng
thành phần trong không gian đữ liệu, và chỉ giữ lại các thành phần
đặc trưng nhất
PCA giúp làm giảm số chiều của đữ liệu Hay nói theo cách
khác thay vì sử dụng các trục tọa độ của không gian cũ, PCA xây
dựng một không gian mới có số chiều ít hơn, nhưng lại có thể biểu
diễn dữ liệu tốt tương đương không gian cũ, nghĩa là đảm bảo độ
biến thiên (variability) của đữ liệu trên mỗi chiều mới
Hình 2.9 là một ví dụ kinh điển hình ảnh của một con lạc đà Cùng một con nhưng với hai góc nhìn khác nhau thì sẽ có được hai thông tin khác nhau [27]
Hình 2.9 - Phép chiếu lên các trục tọa độ khác nhau có thê cho cách
nhìn khác nhau vê cùng một di liệu
Trang 1210
Hoặc một ví dụ khác như hình 2.10 với một tập dữ liệu ban đầu (tập điểm màu xanh) được quan sát trong không gian 3 chiều (trục màu đen), ta dễ đàng nhận thấy 3 trục này không mô tả được dữ liệu một cách tốt nhất PCA sẽ tìm một hệ trục tọa độ mới (là trục màu đỏ), với không gian mới dữ liệu được mô tả rõ ràng hơn (hình bên phải màu đỏ) Rõ ràng hình bên phải chỉ cần 2 trục tọa độ nhưng
cách thể hiện đữ liệu tốt hơn so với hệ trục ban đầu [27]
Hình 2.10 - (Minh họa PCA) Tìm các trục tọa độ mới sao cho dữ
liệu có độ biến thiên cao nhất
Một điểm rất hay nữa của PCA là các trục tọa độ trong không gian mới luôn đảm bảo trực giao đôi một với nhau, mặc dù trong không gian ban đầu, các trục có thể không trực giao
2.3 MỘT SÓ CÔNG TRÌNH NGHIÊN CỨU VÀ KÉT QUÁ
Trang 1311
CHUONG 3 NHAN DANG BIEN BAO GIAO THONG DUNG
PHUONG PHAP PCA 3.1 MO HINH HE THONG NHAN DANG BIEN BAO GIAO THONG
Hệ thống được mô tả bằng sơ đồ ở hình 3.1
giao thông đưa vào > trưng ảnh liệu sau
Ảnh đưa vào Phát hiện biển Rút trích đặc Nhân đ Kết quả
nhậndạng | PP báo giaothông [ | trunganh [7] “#7 C208 nhận dạng
Hình 3.1 - Mô hình hệ thống nhận đạng biển báo giao thông
3.2 PHAT HIEN VUNG CHUA BIEN BAO GIAO THONG TRONG ANH
Mục đích của giai đoạn này là tìm ra có hay không khu vực
chứa biển báo giao thông trên khung ảnh đưa vào nhận dạng Sau đó
sẽ trích xuất ra những khu vực chứa biến báo để chuyến sang giai đoạn rút trích đặc trưng
Phương pháp được sử dụng trong đề tài để phát hiện vùng chứa biển báo giao thông là sử dụng đặc trưng màu của biển báo kết hợp với phương pháp phát hién bién Canny
3.2.1 Đặc trưng của BBGT đường bộ tại Việt Nam
3.2.2 Phương pháp phát hiện biên Canny
3.2.3 Kết hợp phương pháp phát hiện biên Canny và đặc trưng màu của biến báo đề phát hiện vùng chứa BBGT
Trang 1412
3.3 XÂY DỰNG CƠ SỞ DỮ LIỆU
3.3.1 Thu thập hình ảnh biến báo giao thông
3.3.2 Tập cơ sở dữ liệu
Tập cơ sở dữ liệu gồm có 100 ảnh của 10 biển báo giao thông, mỗi biển báo có 10 ảnh khác nhau, kích thước của mỗi ảnh là 150x150 Hình ảnh của các biển báo giao thông được thu thập từ
Internet và chụp từ thực tế bằng máy ảnh kỹ thuật só
RBAA/ARfAAAAA
Hình 3.12 - Lập cơ sở đữ liệu
Trang 15Trong do: T la chuyén VỊ của ma trận X;
81¡ , 82¡ ; 8a¡ , , äx¡ là các giá trị pixel của ảnh thứ 1
Mỗi ảnh là một ma trận cột, ghép M ma trận cột ứng với M ảnh thành một ma trận có kích thước NxM
đ21 + 22 + đ23 tet đ2m PNxM — đ31 + 32 + q33 + -+ 3M (3.7)
N1 + N2 + N3 + -+ CNM Chỉ sô đâu là thành phân của vector, chỉ sô sau là thứ tự của ảnh
Trang 16Hình 3.13 - Ảnh trung bình của tập cơ sở dữ liệu
3.4.3 Trừ mỗi ảnh cho ảnh trung bình
Nhăm mục đích tạo ra sự co giãn tương đôi giá trỊ pIxel của
2M — TT
(NM — TTN
Trang 1715
Xây dựng ma trận từ các ?t„ vừa tìm được
Dat: A= (Nm Nom N3m + Nym) sé duoc ma tran kích
Tinh tri riéng (eigenvalue: A;) va vector riéng (eigenvector: x;) của ma trận Covariance này Đó chính là thành phần đặc trưng, thiết yếu của ảnh
Trang 1816
Trong thực 6, gia su tồn tại một ảnh có kích thước 200x230, thì khi đó kích thước của ma trận cov là 46000x46000 (N?) Vì kích thước này quá lớn nên rất khó để tính trực tiếp trị riêng và vector riêng theo cách này Vì vậy, áp dụng lý thuyết đại số tuyến tinh: A,, x¡ có thể tính bằng cách giải quyết trị riêng, vector riêng của ma trận
ATA (kích thước MXM nhỏ hơn nhiêu so với NXN)
Đặt # và đ, là các trị riêng và vector riêng của ma trận A‘A Khi đó ta có:
ATAd;, = yd;
Nhân mỗi về của công thức trên cho A sẽ được:
AAT(Ad,) = p;(Ad;) voi X = Ad;
Điều này cho thấy: Ad; là vector riêng của ma trận A.AT ứng với trị riêng „; Tức là: các vector riêng (x;) và các trị riêng (Â;) đầu tiên của A.AT tương ứng chính là tích (A với vector riêng d; của
AT.A) và jụ
Thông thường, ta chỉ cần chọn ra tập V gồm Q vector riêng ứng với Q trỊ riêng lớn nhất của ma trận AT.A, khi đó: E=A.V chính
là tập các vector riêng của ma trận A.AT
Sau khi có các vector riêng của ma trận A.AT, ta sẽ chuẩn hóa chúng để thu được một cơ sở trực chuẩn của không gian biển báo (bằng cách chia mỗi vector cho độ đài của vector đó)
Các vector riêng của tập E này là không gian đặc trưng của các biển báo giao thông trong cơ sở đữ liệu ảnh ban đầu Các vector riêng được sắp xếp theo thứ tự từ cao đến thấp theo trị riêng tương ứng Vector riêng có trị riêng cảng cao sẽ mang nhiều đặc trưng thiết yếu nhất trong không gian các biển báo