Cách mạng công nghiệp lần thứ 4 dựa trên nền tảngcông nghệ số và tích hợp tất cả các công nghệ thông minh để tối ưu hóa quy trình,phương thức sản xuất; với những công nghệ đang và sẽ có
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ' ĐẠI HỌC BÀ RỊA - VŨNG TÀU
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÀ RỊA - VŨNG TÀU
BARIA VUNGTAƯ
U H I VEIHITNCAP SAINT JACQUES
NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT MÁY HỌC ĐỂ PHÂN TÍCH HÌNH ẢNH VÀ NHẬN DẠNG PHƯƠNG TIỆN VỀ HÀNH
VI VI PHẠM LUẬT GIAO THÔNG ĐƯỜNG BỘ
LUẬN VĂN THẠC SỸ Chuyên ngành: Công nghệ thông tin
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫncủa TS Phan Ngọc Hoàng Các số liệu, kết quả nêu và trình bày trong Luận văn là trungthực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Qua đây, tôi cũng xin cam đoan rằng trong thời gian hoàn thành Luận văn tôi đãđược một vài đồng nghiệp hỗ trợ, giúp đỡ để hoàn thành đến thời điểm này và cũng đãđược tôi chân thành cảm ơn Các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồngốc
Học viên thực hiện Luận văn
Đỗ Hữu Hiền
Trang 4LỜI CẢM ƠN
Trước tiên, tôi xin chân thành gửi lời tri ân sâu sắc đến Ban giám hiệu Trường Đạihọc Bà Rịa - Vũng Tàu, Ban lãnh đạo Viện Đào tạo Quốc tế và Sau đại học, cùng quýthầy, quý cô thuộc khoa Công nghệ Thông tin - Trường Đại học Bà Rịa - Vũng Tàu đãtận tình quan tâm hỗ trợ, khuyến khích, truyền đạt cho tôi nhiều kiến thức quý báu và đãtạo mọi điều kiện thuận lợi trong suốt quá trình học tập và nghiên cứu tại Trường
Tôi xin tỏ lòng biết ơn sâu sắc đến thầy TS Phan Ngọc Hoàng, người đã quantâm, trách nhiệm, tận tình giúp đỡ và truyền đạt nhiều kinh nghiệm để tôi sớm có thểthực hiện và hoàn thành được đề tài
Xin chân thành ghi ơn người thân trong gia đình, đồng nghiệp trong cơ quan, đơn
vị và các bạn đã thông cảm, tận tình, giúp đỡ, hỗ trợ và động viên tôi rất nhiều trong quátrình thực hiện đề tài
Một lần nữa, tôi thành thật xin chân thành cảm ơn!
Học viên thực hiện Luận văn
Đỗ Hữu Hiền
Trang 5MỤC LỤC
LỜI CAM ĐOAN 3
LỜI CẢM ƠN 4
MỤC LỤC 5
DANH MỤC CÁC TỪ VIẾT TẮT 9
DANH MỤC CÁC HÌNH 10
DANH MỤC BẢNG 13
1 GIỚI THIỆU 14
1.1 Đặt vấn đề: 14
1.2 Tính cấp thiết của đề tài: 18
2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG NGHIÊN CỨU 22
2.1 Mục tiêu của đề tài 22
2.2 Đối tượng 22
2.3 Phạm vi 23
2.4 Nội dung nghiên cứu 23
2.4.1 Về nội dung 23
2.4.2 Về mặt lý thuyết 23
2.4.3 Về mặt thực nghiệm 24
2.5 Phương pháp luận và phương pháp nghiên cứu 24
3 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU 25
3.1 Những hướng nghiên cứu đã được thực hiện 25
3.2 Những kết quả nghiên cứu đã áp dụng vào thực tế 26
3.3 Những phương pháp nghiên cứu đã được áp dụng trên thế giới và Việt Nam 28 3.4 Một số vấn đề còn hạn chế của những nghiên cứu trước và những vấn đề cần được tiếp tục nghiên cứu hoàn thiện 30
3.4.1 Một số vấn đề còn hạn chế của những nghiên cứu trước 30
3.4.2 Những vấn đề cần được tiếp tục nghiên cứu hoàn thiện 30
4 CẤU TRÚC LUẬN VĂN 31
5 NGHIÊN CỨU TỔNG QUAN VÀ PHÂN TÍCH BÀI TOÁN 33
Chương 1 Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật về học máy và kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng 33
Trang 61 Khái niệm chung [6-9, 16, 17, 31] 33
1.1 Xử lý ảnh 33
1.2 Trí tuệ nhận tạo (AI-Artificial Intelligence) 33
1.3 Học máy (Machine Learning) 33
1.4 Học sâu (Deep Learning) 33
1.5 Mạng nơ-ron nhân tạo (Artificial Neural Network) 33
2 Tổng quan về trí tuệ nhân tạo [6-9, 21] 33
2.1 Trí tuệ nhân tạo 33
2.2 Ứng dụng trí tuệ nhân tạo trong hiện tại và tương lai 35
3 Tổng quan về máy học [6-9, 16-17, 21-23] 38
3.1 Học máy (Machine Learning) 38
3.2 Ứng dụng học máy 38
3.3 Các phương thức về máy học 38
4 Các giải thuật về máy học [16-17, 21-23] 41
4.1 Giải thuật Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) 41
4.2 Giải thuật dựa vào thể thức (K-nearest neighbors - KNN) 42
4.3 Giải thuật cây quyết định (Decision tree) 43
4.4 Giải thuật Random forest (RF) 45
4.5 Giải thuật máy hỗ trợ vector (Support vector machine - SVM) 46
4.6 Giải thuật Naive Bayes (NB) 47
4.7 Giải thuật phân cụm K-means clustering 48
5 Kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng [16-17, 21-23, 26-27] 49
5.1 Kỹ thuật phát hiện đối tượng kết hợp nhận dạng khuôn mặt (Viola Jones - Haar) .49
5.2 Kỹ thuật biến đổi đặc trưng bất biến theo tỷ lệ (Scaleinvariant feature transform -SIFT) 52
5.3 Kỹ thuật biểu đồ độ dốc định hướng (Histogram of oriented gradients -HOG) 56
5.4 Kỹ thuật học sâu để nhận dạng và phân loại đối tượng [16-21] 60
5.4.1 Kỹ thuật mạng nơ-ron tích chập 60
5.4.2 Kỹ thuật tìm kiếm xác định vị trí vật thể trong ảnh sử dụng mạng CNN [35 36] 65
5.4.3 Nhận xét, đánh giá và lựa chọn kỹ thuật áp dụng cho bài toán nhận dạng phân loại đối tượng 75
Chương 2 Tổng quan về giao thông 78
1 Các khái niệm 78
1.1 Giao thông 78
Trang 71.2 Đối tượng tham gia giao thông 78
2 Tổng quan về thực trạng giao thông 78
3 Phương pháp phát hiện, nhận dạng đối tượng tham gia giao thông [1, 29-30] 81
3.1 Nhận dạng phân loại đối tượng tham gia giao thông 81
3.2 Khái niệm về hệ thống nhận dạng biển số xe 82
3.2.1 Khái niệm 82
3.2.2 Lịch sử và phát triển 82
3.2.3 Cách thức hoạt động của hệ thống nhận dạng biển số xe 83
3.2.4 Phân loại các ứng dụng nhận dạng biển số xe 84
3.2.5 Ứng dụng thực tiễn tại Việt Nam 85
3.2.6 Phân loại biển số xe 85
3.3 Phương pháp nhận dạng biển số xe từ ảnh chụp của thiết bị ghi hình 87
3.3.1 Phương pháp chuyển đổi Hough 88
3.3.2 Phương pháp hình thái học 88
3.4 Phương pháp nhận dạng ký tự trong biển số xe 89
3.5 Một số đặc điểm để nhận dạng biển số xe tại Việt Nam 89
Chương 3 Áp dụng Yolov3 cho bài toán phát hiện, nhận dạng đối tượng tham gia giao thông vi phạm luật giao thông đường bộ 92
1 Kỹ thuật đề xuất áp dụng cho bài toán 92
1.1 Kỹ thuật áp dụng mạng nơ-ron tích chập (Faster R-CNN) 92
1.2 Kỹ thuật áp dụng nhìn một lần [32-34] 92
3 Mô hình và chức năng hệ thống đề xuất áp dụng cho bài toán 97
3.1 Địa điểm áp dụng thử nghiệm mô hình cho bài toán 97
3.2 Thiết kế mô hình lắp đặt hệ thống cho bài toán 98
3.3 Thiết kế hệ thống trụ đỡ 98
3.4 Hệ thống Camera 98
3.5 Thiết kế mô hình kết nối hệ thống xử lý bài toán 99
3.6 Sơ đồ tổng quan hệ thống áp dụng cho bài toán 99
3.7 Hệ thống xử lý ảnh, phát hiện và nhận diện đối tượng 101
3.7.1 Quy trình xử lý ảnh áp dụng cho bài toán 101
3.7.2 Quy trình phát hiện, nhận dạng và phân loại đối tượng 102
3.7.3 Quy trình phát hiện, nhận dạng biển số xe: 104
Chương 4 Xây dựng chương trình thực nghiệm và đánh giá kết quả 108
Trang 81 Xây dựng chương trình thực nghiệm 108
1.1 Cài đặt chương trình chạy [35] 108
1.1.1 Cài đặt thư viện mã nguồn mở Opencv 108
1.1.2 Cài đặt thư viện CUDA 108
1.1.3 Cài đặt thư viện cuDNN 108
1.1.4 Mô tả cài đặt thư viện 108
1.2 Chạy chương trình 109
1.3 Quy trình huấn luyện và nhận dạng đối tượng vật thể 110
1.4 Quy trình huấn luyện và nhận dạng hành vi vi phạm chở quá số người quy định 117 1.5 Quy trình huấn luyện và nhận dạng hành vi vi phạm không đội mũ bảo hiểm 120
1.6 Quy trình huấn luyện và nhận diện biển số xe của đối tượng tham gia giao thông: .127
6 KẾT LUẬN VÀ KIẾN NGHỊ 135
6.1 Kết luận 135
6.2 Kiến nghị và hướng phát triển 136
TÀI LIỆU THAM KHẢO: 138
Trang 9DANH MỤC CÁC TỪ VIẾT TẮT
18 SMAC Social, Mobile, Analytics & Cloud
DANH MỤC CÁC HÌNH
Hình 1: Mô hình nút giao lộ (ngã tư) triển khai xây dựng mô hình nghiên cứu 22
Hình 2: Sơ đồ nhận dạng biển số xe 25
Hình 3: Nhận dạng khuôn mặt người trong ảnh 26
Hình 4: Ứng dụng công nghệ trí tuệ nhân tạo với bộ nhớ hạn chế 35
Hình 5: Ứng dụng công nghệ trí tuệ nhân tạo tự nhận thức 35
Hình 6: Ứng dụng công nghệ trí tuệ nhân tạoxe tự lái 36
Trang 10Hình 7: Ứng dụng công nghệ trí tuệ nhân tạo cho thiết bị bay không người lái 37
Hình 8: Ứng dụng công nghệ trí tuệ nhân tạo ROBOT trong day học 37
Hình 9: Phương thức học có giám sát 39
Hình 10: Hình mô tả chữ viết tay 40
Hình 11: Phương thức học không giám sát về bài toán phân cụm 40
Hình 12: Phương thức học bán giám sát 40
Hình 13: Minh họa mạng nơ-ron nhân tạo 3 lớp 41
Hình 14: Bản đồ 1NN 43
Hình 15: Quá trình phát triển cây (bên trái) và rừng ngẫu nhiên (bên phải) 45
Hình 16: Bốn loại đặc trưng khu vực hình chữ nhật dùng trong kỹ thuật phát hiện 51 Hình 17: Đặc trưng Haar tương ứng ảnh thực tế 51
Hình 18: Kết quả của thuật toán SIFT 53
Hình 19: Các bước hiện thực giải thuật HOG 59
Hình 20: Kết quả phát hiện người thông qua giải thuật HOG 60
Hình 21: Convolvedfeature khác nhau với ma trận lọc khác nhau 62
Hình 22: Cấu trúc của mạng CNN 63
Hình 23: Trường tiếp nhận cục bộ 63
Hình 24: Các bước tạo ra 1 hidden layer 65
Hình 25: Xây dựng lớp max pooling 65
Hình 26: Xác định vị trí nhiều đối tượng trong ảnh 65
Hình 27: Output sau khi thực hiện Graph Based Image Segmentation [1] 66
Hình 28: Các bước của thuật toán R-CNN [2] 66
Hình 29: Các bước của thuật toán Fast R-CNN [3] 67
Hình 30: Kiến trúc Faster R-CNN [4] 68
Hình 31: Hình chữ nhật region proposal 69
Hình 32: Hệ số IoU đánh giá bounding box dự đoán đối tượng khớp với ảnh thật 69
Hình 33: So sánh thời gian phát hiện đối tượng so với các kỹ thuật khác 70
Hình 34: Mô hình sử dụng mạng VGG16 71
Hình 35: Kết quả mô hình sử dụng mạng VGG16 71
Hình 36: Sơ đồ số chiều của các feature maps 71
Hình 37: Sơ đồ áp dụng thuật toán SSD 72
Hình 38: Chia ảnh thành ma trận ô vuông 73
Hình 39: Sai số phân loại 75
Trang 11Hình 40: Hình ảnh mô tả phương tiện và người tham gia giao thông 78
Hình 41: Hình ảnh mô tả tình trạng không tuân thủ Luật 79
Hình 42: Ảnh xám và lược đồ xám của ảnh 80
Hình 43: Kiến trúc Darknet-53 94
Hình 44: Khung ranh giới xác định đối tượng chim 95
Hình 45: Phát hiện, định vị và phân loại nhiều đối tượng 95
Hình 46: YOLO phiên bản 1 có những hạn chế đối với phát hiện đối tượng nhỏ 95
Hình 47: Kiến trúc Darknet-19 97
Hình 48: Bản vẽ thiết kế mô hình lắp đặt hệ thống 98
Hình 49: Mô hình kết nối-truy xuất hệ thống 99
Hình 50: Cấu trúc phần cứng cho hệ thống 99
Hình 51: Cấu trúc phần mềm xử lý hệ thống 99
Hình 52: Phát hiện đối tượng áp dụng giải thuật YOLOv3 104
Hình 53: Các bước dự đoán áp dụng theo giải thuật YOLOv3 104
Hình 54: Sơ đồ mô hình theo kến trúc áp dụng YOLOv3 theo tỷ lệ 105
Hình 55: Kết quả dự đoán áp dụng giải thuật YOLOv3 105
Hình 56: Bộ dữ liệu gồm 22 hình ảnh trích xuất từ bộ dữ liệu mẫu 112
Hình 57: Kết quả nhận dạng đối tượng tham gia giao thông được gán nhãn (tracking) 115Error! Bookmark not defined Hình 58: Bộ dữ liệu gồm 10 hình ảnh trích xuất từ bộ dữ liệu mẫu 118
Hình 59: Kết quả nhận dạng đối tượng về hành vi vi phạm giao thông được gán nhãn (tracking)về chở quá số người 119
Hình 60: Bộ dữ liệu gồm 22 hình ảnh trích xuất từ bộ dữ liệu mẫu 123
Hình 61: Kết quả nhận dạng đối tượng về hành vi vi phạm giao thông được gán nhãn (tracking) về không đội mũ bảo hiểm 126
Trang 12DANH MỤC BẢNG
•
Bảng 1: Kết quả nhận dạng các đối tượng, vật thể tham gia giao thông 116 Bảng 2: Kết quả nhận dạng đối tượng tham gia giao thông về hành vi vi phạm chở quá số người theo quy định 120 Bảng 3: Kết quả nhận dạng đối tượng tham gia giao thông về hành vi vi phạm chở quá số người theo quy định 127
Trang 131 GIỚI THIỆU
Ngày nay, công nghệ thông tin là một trong những lĩnh vực quan trọng góp phầnthúc đẩy sự phát triển kinh tế của đất nước Ứng dụng của công nghệ thông tin (CNTT)xuất hiện ở rất nhiều lĩnh vực, là nền tảng của các nghiên cứu về công nghệ cao như khoahọc vũ trụ, công nghệ điện tử và tự động hóa, các hệ thống thông minh, Khi Internet rađời vào những năm 90, nó đã kết nối thông tin trên toàn thế giới lại với nhau Chúng tachỉ cần ngồi bất cứ nơi đâu với máy tính được kết nối mạng là có thể truy nhập thông tin
về bất cứ lĩnh vực gì trên thế giới
Tại Việt Nam, từ những năm 70 của thế kỷ 20 đã bắt đầu có các nghiên cứu vềmáy tính cũng như những ứng dụng về CNTT Hiện nay CNTT luôn được xác định làlĩnh vực then chốt được đầu tư không những hiện đại hóa cơ sở hạ tầng mà còn là việcứng dụng sâu rộng vào các lĩnh vực khác của đời sống xã hội [1]
Nghị quyết số 36-NQ/TW ngày 01/7/2014 của Bộ Chính trị về đẩy mạnh ứngdụng, phát triển CNTT đáp ứng yêu cầu phát triển bền vững và hội nhập quốc tế tiếp tụckhẳng định sự quan tâm chỉ đạo sát sao của Đảng đối với công tác ứng dụng, phát triểnCNTT, khẳng định vị trí, vai trò của CNTT trong sự nghiệp xây dựng và bảo vệ Tổ quốcthời kỳ mới Và là một văn bản rất quan trọng, là định hướng xuyên suốt cho chiến lượcứng dụng và phát triển CNTT và truyền thông từ nay đến năm 2030, là tiền đề quan trọng
để CNTT Việt Nam phát triển mạnh mẽ, sâu rộng hơn, đề ra những định hướng lớn cho
sự phát triển ngành CNTT nước nhà trong khoảng 10 - 20 năm tới Đến năm 2030, đưanăng lực nghiên cứu, ứng dụng, phát triển, sản xuất và cung ứng sản phẩm, dịch vụCNTT đạt trình độ tiên tiến thế giới; Việt Nam trở thành quốc gia mạnh về CNTT trongkhu vực
Ngày 27/09/2019 Bộ Chính trị ban hành Nghị quyết số 52-NQ/TW về một số chủtrương, chính sách chủ động tham gia cuộc Cách mạng công nghiệp lần thứ tư (CMCN4.0) với quan điểm chủ động, tích cực tham gia cuộc Cách mạng công nghiệp lần thứ tư
là yêu cầu tất yếu khách quan; là nhiệm vụ có ý nghĩa chiến lược đặc biệt quan trọng, vừacấp bách vừa lâu dài của cả hệ thống chính trị và toàn xã hội, gắn chặt với quá trình hộinhập quốc tế sâu rộng; đồng thời nhận thức đầy đủ, đúng đắn về nội hàm, bản chất củacuộc Cách mạng công nghiệp lần thứ tư để quyết tâm đổi mới tư duy và hành động, coi
đó là giải pháp đột phá với bước đi và lộ trình phù hợp là cơ hội để Việt Nam bứt phá
Trang 14trong phát triển kinh tế - xã hội Xác định mục tiêu đến năm 2030, Việt Nam chúng taduy trì xếp hạng về chỉ số Đổi mới sáng tạo toàn cầu (GII) thuộc nhóm 40 nước dẫn đầuthế giới Mạng di động 5G phủ sóng toàn quốc; mọi người dân được truy cập Internetbăng thông rộng với chi phí thấp Kinh tế số chiếm trên 30% GDP; năng suất lao độngtăng bình quân khoảng 7,5%/năm Hoàn thành xây dựng Chính phủ số Hình thành một
số chuỗi đô thị thông minh tại các khu vực kinh tế trọng điểm phía Bắc, phía Nam vàmiền Trung; từng bước kết nối với mạng lưới đô thị thông minh trong khu vực và thế giới
và tầm nhìn đến năm 2045, Việt Nam trở thành một trong những trung tâm sản xuất vàdịch vụ thông minh, trung tâm khởi nghiệp, đổi mới sáng tạo thuộc nhóm dẫn đầu khuvực Châu Á; có năng suất lao động cao, có đủ năng lực làm chủ và áp dụng công nghệhiện đại trong tất cả các lĩnh vực kinh tế - xã hội, môi trường, quốc phòng, an ninh [2-3]
Bản chất của cuộc cách mạng công nghiệp lần thứ tư (CMCN 4.0) là cuộc cáchmạng thể chế Với sự phát triển mạnh mẽ của công nghệ số tạo ra mô hình mới, lực lượnglao động mới, nhanh chóng, bùng nổ khiến khuôn khổ thể chế truyền thống không cònphù hợp, mà nếu duy trì sẽ kìm hãm sự phát triển của đất nước và ngày 04/7/2017, Thủtướng chính phủ Ban hành Chỉ thị số 16/CT-TTg về tăng cường năng lực tiếp cận cuộccách mạng công nghiệp lần thứ 4 Trên cở sở đó, ngày 03/12/2018 Bộ Khoa học và Côngnghệ ban hành Quyết định số 3685/QĐ-BKHCN về danh mục các công nghệ chủ chốtcủa công nghiệp 4.0 (Trí tuệ nhân tạo - Artificial Intelligence, Chuỗi khối- Blockchain,
Dữ liệu lớn - Big Data, Khai phá dữ liệu và Phân tích dữ liệu - Data Mining and DataAnalytics, Internet vạn vật- Internet of Things, Điện toán đám mây- Cloud computing,Robot tự hành - Autonomous Robots, Robot cộng tác Collaborative robotics, In 3D vàchế tạo cộng - 3D printing and Additive manufacturing, Thực tại ảo - Virtual Reality,Công nghệ chế tạo vật liệu nano - Nano materials, Công nghệ vật liệu mới - Newmaterial technnology, Sinh học tổng hợp - Synthetic biology, Mạng di động thế hệ 5 - 5thGeneration Mobile Network, )
Đặc biệt, cuộc cách mạng công nghiệp lần thư 4 có nhiều tác động đến đời sốngkinh tế - xã hội trên nhiều lĩnh vực Nền kinh tế toàn cầu đang đứng trước một giai đoạnchuyển đổi không thể đảo ngược Cuộc cách mạng này thông qua các công nghệ như trítuệ nhân tạo (AI), Internet vạn vật (IoT), thực tế ảo (VR), tương tác thực tại ảo (AR),mạng xã hội, điện toán đám mây, di động, phân tích dữ liệu lớn (SMAC) để chuyển hóatoàn bộ thế giới thực thành thế giới số
Các công nghệ thông minh sẽ được tích hợp vào mọi khía cạnh của xã hội, xóa bỏ
Trang 15các ranh giới công nghệ thông thường, thay đổi hình dạng mạng lưới công nghệ và sảnxuất, thúc đẩy sự phát triển của thời đại Những phát triển này hứa hẹn sẽ mở ra cơ hộicho Chính phủ, vùng miền các quốc gia thúc đẩy nền kinh tế mở, linh hoạt, nâng cao hiệuquả của nền kinh tế - xã hội và mang lại lợi thế “đi đầu” cho những quốc gia, vùng miềntận dụng tốt các công nghệ mới nhất Cách mạng công nghiệp lần thứ 4 dựa trên nền tảngcông nghệ số và tích hợp tất cả các công nghệ thông minh để tối ưu hóa quy trình,phương thức sản xuất; với những công nghệ đang và sẽ có tác động lớn như (Trí tuệ nhântạo - Artificial Intelligence, Chuỗi khối- Blockchain, Dữ liệu lớn - Big Data, Khai phá dữliệu và Phân tích dữ liệu - Data Mining and Data Analytics, Internet vạn vật- Internet ofThings, Điện toán đám mây- Cloud computing, Robot tự hành - Autonomous Robots, Trong lĩnh vực sản xuất công nghiệp, viễn cảnh các nhà máy thông minh trong đó cácmáy móc được kết nối Internet và liên kết với nhau qua một hệ thống có thể tự hình dungtoàn bộ quy trình sản xuất rồi đưa ra quyết định sẽ không còn xa Có thể thấy, Cách mạngcông nghiệp lần thứ 4 tác động đến tất cả các lĩnh vực kinh tế - xã hội như: công nghiệp,nông nghiệp, tài chính ngân hàng, lao động, việc làm, giao thông vận tải, dệt may, dulịch, y tế, giáo dục và đào tạo Điều đó có nghĩa nó sẽ ảnh hưởng trực tiếp đến các tổchức, cá nhân và các địa phương trong cả nước [4-5].
Theo các nhà nghiên cứu, ứng dụng trí tuệ nhân tạo được huấn luyện tốt có thểthực hiện một số công việc với kỹ năng tương đương như con người Tuy nhiên, trí tuệnhân tạo có lợi thế hơn con người nhờ khả năng mở rộng bằng việc học liên tục khôngnghỉ, thậm chí là tự học mà không cần sự hướng dẫn của con người Trí tuệ nhân tạo cóthể phát hiện ra mẫu trong những dữ liệu phức tạp đến mức các chuyên gia cũng khôngnhận ra Trong đó, đối với một số ứng dụng đặc thù như xử lý hình ảnh, trí tuệ nhân tạo
đã bằng hoặc vượt khả năng của con người Chính vì lẽ đó, khi được ứng dụng vào quátrình điều tiết giao thông, trí tuệ nhân tạo sẽ giúp giảm bớt nhân công nhưng lại tăngcường khả năng xử lý dữ liệu của hệ thống
Vì vậy có thể nói, trí tuệ nhân tạo (Artificial Intelligence - AI) là một hướng
nghiên cứu của lĩnh vực CNTT và Khoa học máy tính nhằm phát triển các hệ thống thôngminh để giải quyết các bài toán trong thực tế giống như hoạt động của bộ não người Trítuệ nhân tạo được bắt đầu nghiên cứu từ những năm 50 của thế kỷ 20 và trong khoảng 30năm trở lại đây đã được cộng đồng các nhà khoa học quan tâm mạnh mẽ Rất nhiều cáchội thảo lớn về lĩnh vực này được tổ chức hàng năm trên thế giới Các ứng dụng tiêu biểucủa trí tuệ nhân tạo vào đời sống xã hội bào gồm: người máy, robot, xử lý ngôn ngữ tự
Trang 16nhiên, nhận dạng, phát hiện dị thường, an ninh quốc phòng, tin sinh học, khoa học vũ trụ
và trái đất,
Những năm gần đây, chúng ta đã chứng kiến được nhiều thành tựu vựợt bậc trong
lĩnh vực thị giác máy tính (Computer Vision) Các hệ thống xử lý ảnh lớn của Facebook,
Google hay Amazon đã đưa vào sản phẩm của mình những chức năng thông minh nhưnhận dạng khuôn mặt người dùng, phát triển xe hơi tự lái hay drone giao hàng tự động
Bên cạnh đó, sự phát triển của mạng nơ-ron đang dần hiện thực hoá khái niệmchúng ta vẫn thường gọi là (Computer Vision) thị giác máy tính Tuy nhiên, việc sử dụngthuật toán mạng nơ-ron vẫn còn gặp nhiều khó khăn Chẳng hạn như: Khi bạn muốn pháthiện nhận dạng một đối tượng trong một bức ảnh và đánh nhãn cho đối tượng đó thì cácphương pháp lúc bấy giờ quá chậm để xử lý theo thời gian thực hoặc là đòi hỏi cần phảiđầu tư trang thiết bị rất mạnh dẫn đến chi phí rất tốn kém,
Chính vì lẻ đó, cho đến khi giải thuật nhìn một lần (You Only Look Once
-YOLO) ra đời You Only Look Once lần lượt có các phiên bản 1, 2 (YOLO Version 1, 2) và hiện nay là You Only Look Once phiên bản 3 (YOLO Version 3) có khả năng gán
nhãn cho toàn bộ đối tượng trong khung hình với chỉ duy nhất một hoạt động Có thể nói,
You Only Look Once đã xây dựng một hướng tiếp cận đầu tiên giúp đưa nhận dạng đối
tượng theo thời gian thực (Real-Time Object Detection) thực sự khả thi áp dụng thực tếtrong cuộc sống
Đối với mạng nơ-ron tích chập (Convolutional Neural Network - CNN) là một trong những mô hình học sâu (Deep Learning) tiên tiến giúp cho chúng ta xây dựng
được những hệ thống thông minh với độ chính xác cao như hiện nay và còn là một môhình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ nơ-ron sinh học Nóđược tạo nên từ một số lượng lớn các phần tử (nơ-ron) kết nối với nhau thông qua cácliên kết (trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụthể nào đó Một mạng nơ-ron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhậndạng mẫu, phân loại dữ liệu, ) thông qua một quá trình học từ tập các mẫu huấn luyện
Về bản chất học chính là quá trình hiệu chỉnh trọng số liên kết giữa các nơ-ron
Trong khuôn khổ luận văn Thạc sỹ của cá nhân, qua việc được trang bị các mônhọc lý thuyết như thuật toán, xử lý ảnh, trí tuệ nhân tạo, tìm kiếm, tôi đã lựa chọn đề tài
“Nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng
phương tiện vi phạm Luật giao thông đường bộ” Chủ đề phân lớp dữ liệu là một
nhánh quan trọng trong lĩnh vực máy học (machine learning) của trí tuệ nhân tạo.
Trang 17Chúng ta có thể kể đến các ứng dụng của máy học trong thực tế như người máy, robot,nhận dạng đối tượng, nhận dạng mặt người, nhận dạng tiếng nói và chữ viết,.Trong đó,
học sâu (Deep learning) với mô hình mạng nơ-ron tích chập theo phương pháp nhìn một lần (Convolutional Neural Network for You Only Look Once - CNNs for YOLO
Object Detection) là một trong những giải thuật của mô hình hệ thống máy học tiên tiến
giúp cho chúng ta xây dựng đựợc những hệ thống thông minh với độ chính xác cao nhưhiện nay Trong khuôn khổ luận văn cao học này, cá nhân tập trung nghiên cứu về mạng
nơ-ron (neural network) cũng như mạng tích chập (Convolution network) theo giải thuật của mô hình mạng nơ-ron tích chập (CNNs) nhằm phân tích lớp ảnh (Image
Classification) và áp dụng trong việc xây dựng hệ thống nhận dạng phương tiện với
phương pháp nhận dạng đối tượng (You Only Look Once) các hành vi vi phạm Luật
giao thông đường bộ [6-9]
1.2 Tính cấp thiết của đề tài
Theo một báo cáo của Liên Hợp Quốc, hơn nửa dân số trái đất hôm nay đã là dân
đô thị, với 54,6% dân số thế giới tương đương 3,6 tỷ người đang sống ở các đô thị,nghiên cứu cho thấy đến năm 2050, tỉ lệ dân cư thành thị sẽ chiếm hơn 70% dân số thếgiới, với 64,1% ở các nước đang phát triển và 85,9% ở các nước phát triển sẽ sống ở cáckhu vực thành thị
Sự tập trung dân số, tốc độ gia tăng của đô thị hóa đã mang lại cho các thành phố
và quốc gia một số thách thức trong việc đáp ứng nhu cầu ngày càng tăng của người dân,như: cơ sở hạ tầng, giao thông, các yêu cầu về nhà ở, năng lượng, an ninh, y tế, giáo dục,môi trường và ứng phó với biến đổi khí hậu, thiên tai cũng như các vấn đề như truyềnthông và giải trí Do đó việc phát triển đô thị trong tương lai có ảnh hưởng lớn tới môitrường, tới việc quản lý và cải thiện chất lượng đô thị, điều này chỉ có thể nắm bắt đượcthông qua việc thay đổi phương thức điều hành của chính quyền, sự tham gia của ngườidân, cũng như sự tham gia của các bên liên quan chịu trách nhiệm quản lý chung Vì vậy,việc định hướng cho phát triển "đô thị truyền thống" hiện nay thành “đô thị thông minh”hơn là một nhu cầu tất yếu mà trong đó bao gồm các ứng dụng về chính quyền điện tử,giao thông thông minh, y tế thông minh, giáo dục thông minh, du lịch thông minh, môitrường thông minh, việc triển khai, áp dụng các hệ thống tự động và kết hợp với Cuộccách mạng công nghiệp lần thứ 4 (CMCN 4.0) bởi các công nghệ chủ chốt của côngnghiệp 4.0 (Trí tuệ nhân tạo - Artificial Intelligence, Chuỗi khối- Blockchain, Dữ liệu lớn
Trang 18- Big Data, Khai phá dữ liệu và Phân tích dữ liệu - Data Mining and Data Analytics,Internet vạn vật- Internet of Things, Điện toán đám mây- Cloud computing, ) [10].
Xét một cách tổng quan, việc triển khai giao thông thông minh sẽ có 3 giai đoạn.Trong đó bao gồm việc thu thập dữ liệu, xử lý dữ liệu và phân phối lại chúng cho ngườitham gia giao thông Để hoạt động của hệ thống được trơn tru, sẽ cần phải có một trungtâm xử lý nhằm tổng hợp thông tin và tiến hành điều tiết Ở giai đoạn ban đầu, nhữngtrung tâm này được điều hành chủ yếu bởi con người Tuy vậy, với các tiến bộ của trí tuệnhân tạo (AI) sẽ được ứng dụng nhằm thay thế con người trong tương lai
Hệ thống giao thông thông minh (Intelligent Transport Systems - ITS) không phải
là điều gì quá mới mẻ Ý tưởng về hệ thống này đã được khởi xướng từ những năm 60,
70 của thế kỷ trước tại Mỹ và các nước Châu Âu Đến nay, mô hình này đã được áp dụngthành công tại nhiều thành phố lớn trên thế giới [11]
Tại các nước châu Á, Hàn Quốc chính là quốc gia đi tiên phong trong việc ứngdụng công nghệ nhằm phát triển Hệ thống giao thông thông minh Seoul (Hàn Quốc)được nhận định là thành phố có hệ thống giao thông thông minh tốt nhất thế giới
Tại thành phố Seoul - Hàn Quốc, chính phủ thiết lập một hệ thống vận hành giaothông có tên TOPIS Khi truy nhập vào hệ thống này, người dân sẽ được cung cấp cácthông tin liên quan đến tình trạng giao thông Với những người đang chờ xe buýt, thôngtin này bao gồm cả vị trí cụ thể của chuyến xe đang tới, thời gian dự kiến sẽ tới bến vàlượng ghế còn trống trên xe là bao nhiêu
Trang 19Tại Việt Nam, cùng với các kinh nghiệm đã triển khai trên thực tế trong các nămvừa qua của các địa phương trong cả nước như thành phố Hà Nội, thành phố Hồ ChíMinh, Đồng Nai, Kiên Giang, Quảng Nam, Đà Nẵng, Thừa Thiên Huế, Quảng Ninh việc trang bị hệ thống Camera giám sát giao thông thông minh nhằm mục đích nâng caonăng lực giám sát, kiểm soát và xử lý các vi phạm trật tự an toàn giao thông đường bộ đãmang lại những hiệu quả tích cực Bên cạnh việc giảm thiểu các tai nạn giao thông, tìnhhình an ninh trật tự được đảm bảo, ý thức tự giác chấp hành pháp luật của người tham giagiao thông được nâng cao.
Tỉnh Bà Rịa - Vũng Tàu là một tỉnh ven biển thuộc vùng Đông Nam Bộ, nằmtrong vùng kinh tế trọng điểm phía Nam, có tổng diện tích tự nhiên là 1.980,98 km2, dân
số khoảng trên 1,3 triệu người, cũng nằm trong xu thế xây dựng đô thị hướng đến thôngminh đang được quan tâm và thúc đẩy Có thể nói, đô thị thông minh được coi là lựachọn tất yếu, phù hợp với xu thế phát triển chung của thế giới cũng như khả năng tiếp cậncủa Việt Nam Bà Rịa - Vũng Tàu được đánh giá là một trong những địa phương có hệthống giao thông đường biển, đường hàng không và đường bộ với kết cấu hạ tầng giaothông khá hiện đại Trong đó, đường bộ là đầu mối giao thông quan trọng với 3 tuyếnquốc lộ chính gồm QL51, QL55, QL56 Quốc lộ 51 và là trục giao thông chính của vùngKinh tế trọng điểm phía Nam, nối liền với phố TP Hồ Chí Minh, Tp Biên Hòa và Tp.Vũng Tàu Quốc lộ 55, chạy từ Tp Bà Rịa đi Tp Phan Thiết nối với các tỉnh duyên hảiĐông Nam Bộ, có giá trị giao thông liên vùng, nối vùng Nam Trung Bộ với miền Đông.Quốc lộ 56 là trục đường giao thông nối Tp Bà Rịa tỉnh Bà Rịa - Vũng Tàu và vùng kinh
tế trọng điểm phía Nam với Tây Nguyên Từ QL56 có thể đi thẳng qua TX Long Khánh
đi Tp Đà Lạt (Lâm Đồng) Ngoài ra tỉnh Bà Rịa - Vũng Tàu có rất nhiều tuyến đườngtỉnh kết nối đi các huyện, thị xã và thành phố
Theo số liệu tổng hợp, đến cuối tháng 9/2020 trên địa bàn tỉnh đã xảy ra 285 vụ tai nạngiao thông, hậu quả làm 120 người chết và 213 người bị thương Trong đó có 28 vụ tainạn giao thông tự gây, làm 31 người chết và 04 người bị thương So với cùng kỳ năm
2018, số vụ tai nạn giao thông giảm 02 vụ, số người chết giảm 06 người, số người bịthương giảm 55 người Tuy số vụ TNGT, số người chết và bị thương đều giảm so vớicùng kỳ nhưng con số thống kê cho thấy vẫn ở mức cao và tiềm ẩn diễn biến phức tạp.Nguyên nhân chủ yếu là do một bộ phận người tham gia giao thông 20
Trang 20chưa ý thức trong việc chấp hành pháp luật giao thông đường bộ, còn đối phó, chưa tựgiác, vi phạm về trật tự - an toàn giao thông (TT-ATGT) vẫn còn phổ biến, đặc biệt là cáchành vi vi phạm như: điều khiển phương tiện tham gia giao thông không đúng tốc độ quyđịnh, điều khiển phương tiện tham gia giao thông không đúng phần làn/chiều đướng theoquy định, không chấp hành hiệu lệnh của tín hiệu giao thông, phương tiện tham gia giaothông quá khổ - quá tải, phương tiện tham gia giao thông chở quá số lượng người quyđịnh [12-13]
Bên cạnh đó, giao thông luôn là một vấn đề được quan tâm nhiều nhất đối với các
đô thị lớn ở các nước nói chung và ở Việt Nam nói riêng Trong những năm gần đây tìnhtrạng tắc đường, kẹt xe, tai nạn và vi phạm Luật giao thông đường bộ vẫn luôn là vấn đềrất nghiêm trọng và cấp bách Đây được xem là vấn đề bức xúc của toàn xã hội, ảnhhưởng đến sự phát triển bền vững về kinh tế, văn hóa, xã hội và hình ảnh của đất nướcViệt Nam với bạn bè Quốc tế
Hiện nay, mặc dù đã có những nghiên cứu, nhiều giải pháp, cũng như các ý tưởngmới của các nhà khoa học, các chuyên gia hàng đầu trong nước và thế giới về việc hỗ trợ,giảm thiểu tình trạng tắc đường, kẹt xe, tai nạn và các hành vi vi phạm Luật giao thôngđường bộ nhưng hiệu quả vẫn chưa cao và tình trạng vẫn diễn ra thường xuyên trên cáctrục đường giao thông, đặc biệt là ở các khu đô thị
Xuất phát từ nhu cầu thực tiễn, vì vậy tôi chọn vấn đề “Nghiên cứu ứng dụng kỹ
thuật máy học để phân tích hình ảnh và nhận dạng phương tiện vi phạm Luật giao thông đường bộ” làm đề tài nghiên cứu nhằm phát hiện, nhận dạng và xử lý các hành vi
vi phạm trật tự an toàn giao thông, góp phần giảm thiểu ùn tắc, tai nạn cho người vàphương tiện tham gia giao thông Đồng thời giúp công tác tuần tra kiểm soát trật tự, anninh và phát hiện kịp thời, có chứng cứ pháp lý về hình ảnh nhằm cung cấp cho lực lượngchức năng khi điều tra các vụ việc xảy ra trên đường góp phần đảm bảo an ninh trật tự xãhội là cần thiết Kết quả thực hiện đề tài dự kiến sẽ được đưa vào áp dụng thực tế trên địabàn tỉnh Bà Rịa - Vũng Tàu sau khi hoàn thành nghiên cứu luận văn
2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG NGHIÊN CỨU
- Mục tiêu tổng quát: Nghiên cứu ứng dụng kỹ thuật máy học để xây dựng mô
hình phục vụ theo dõi, giám sát tình trạng giao thông đường bộ, tự động phát hiện, ghinhận, phân tích hình ảnh đối tượng và nhận dạng phương tiện về các hành vi vi phạm
Trang 21Luật giao thông đường bộ theo thời gian thực với độ chính xác cao tại một nút giao lộ, từ
đó có thể xử phạt nhằm nâng cao ý thức về an toàn giao thông của người dân, đảm bảotrật tự an toàn xã hội
- Mục tiêu cụ thể: Theo dõi, giám sát tình trạng giao thông đường bộ, tự động
phát hiện, ghi nhận, phân tích hình ảnh đối tượng và nhận dạng biển số phương tiện vàcác hành vi vi phạm Luật giao thông đường bộ theo thời gian thực tại một nút giao lộ cụthể sau:
(1) Chở quá số người quy định khi tham gia giao thông
(2) Không đội mũ bảo hiểm khi điều khiển xe mô tô, xe gắn máy
Hình 1: Mô hình nút giao lộ (ngã tư) triển khai xây dựng mô hình nghiên cứu
2.2 Đối tượng
Đối tượng nghiên cứu chính là các loại phương tiện tham gia giao thông đường bộtheo quy định của Luật giao thông đường bộ áp dụng đối với hành vi vi phạm theo mụctiêu đề tài nghiên cứu đề ra đó là:
- Thu thập, xây dựng bộ dữ liệu ảnh các phương tiện giao thông đường bộ cho hệthống giám sát
- Một số mô hình mạng nơ-ron và nơ-ron tích chập đang được sử dụng phổ biếntrong lĩnh vực nhận dạng
- Ứng dụng kỹ thuật máy học trong lĩnh vực trí tuệ nhân tạo để phát hiện, ghi nhận
và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu để phân lớp đối tượng quantâm với các đối tượng ảnh còn lại
- Phương pháp trích xuất điểm đặc trưng đối tượng, phương tiện theo mô hìnhmạng nơ-ron tích chập theo phương pháp phát hiện đối tượng nhìn chỉ một lần
2.3 Phạm vi
- Xây dựng bộ mẫu dữ liệu nghiên cứu, thử nghiệm với số lượng 500 mẫu là ảnh
Trang 22các đối tượng vể phương tiện tham gia giao thông Những ảnh này dùng để phát hiệnvùng chứa biển số theo cách tiếp cận của phương pháp hình thái học để phát hiện vùngbiển số cho các biển đăng ký xe của Việt Nam
- Tập trung nghiên cứu kỹ thuật máy học trong lĩnh vực trí tuệ nhân tạo để pháthiện, ghi nhận và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu nhằm phân lớpđối tượng quan tâm với các đối tượng ảnh còn lại, cụ thể hơn là công việc cần phải giảiquyết vấn đề phát hiện vùng chứa biển số xe và nhận dạng ký tự trong biển số với môhình mạng nơ-ron tích chập để tiến hành nhận dạng biển số xe vi phạm Luật giao thôngđường bộ
2.4 Nội dung nghiên cứu
- Nghiên cứu xây dựng hệ thống phát hiện, ghi nhận và phân vùng đối tượng ảnh
dựa trên các bộ thư viện cài đặt cho mô hình, giải thuật học sâu (deep learning).
- Sử dụng công cụ, mô hình mạng nơ-ron tích chập (CNNs) nhằm phân tích lớp ảnh (Image Classification) áp dụng trong việc xây dựng hệ thống tự động nhận dạng
phương tiện và các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực
- Huấn luyện và xây dựng nhận dạng đối tượng về các hành vi vi phạm Luật giaothông đường bộ
- Tìm hiểu tổng quan về hệ thống kỹ thuật máy học (machine learning) trong lĩnh vực trí tuệ nhân tạo (AI) để phát hiện, ghi nhận và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu (deep learning) để phân lớp đối tượng quan tâm với các đối tượng ảnh
Trang 23cho hệ thống
- Xây dựng phần mềm ứng dụng điều khiển hệ thống thông minh kết hợp quản lý
và in ấn bằng chứng hình ảnh vi phạm chạy trên nền tảng website
- Ứng dụng trí tuệ nhân tạo (AI) để tự động học và nhận diện các lỗi hành vi viphạm giao thông từ các dữ liệu vi phạm ban đầu và nhận dạng các lỗi vi phạm có độchính xác ngày càng cao hơn từ các dữ liệu vi phạm trước đó
- Xây dựng quy trình vận hành khai thác, xây dựng các kịch bản nhằm tổ chứctriển khai thu thập bộ dữ liệu mẫu tại mô hình thực tế
- Xây dựng bộ cơ sở dữ liệu điện toán đám mây có khả năng lưu trữ dữ liệu lớn vềcác hình ảnh bằng chứng vi phạm và thông tin của các phương tiện tham gia giao thông
vi phạm
- Nghiên cứu thực hiện thông qua các hình ảnh thực nhằm xác định, đánh giá kếtquả cuối cùng và đưa ra các dự báo
Để đảm bảo thực hiện xây dựng đầy đủ mô hình hệ thống tự động phát hiện, ghinhận, phân tích hình ảnh đối tượng và nhận dạng phương tiện và các hành vi vi phạmLuật giao thông đường bộ theo thời gian thực Đề tài nghiên cứu đề xuất thực hiện theohai bước cụ thể sau:
- Bước 1- Huấn luyện: Sử dụng bộ dữ liệu trên cơ sở các kịch bản, diễn tập, huấnhuyện và thu thập ảnh đối tượng động từ hệ thống camera lắp sẵn đưa vào huấn luyện,thử nghiệm để đưa ra mô hình nhận dạng và đánh giá kết quả
- Bước 2 - Thử nghiệm: Sử dụng mô hình vừa huấn luyện được ở trên thông quahình ảnh giao thông để thực hiện các giải thuật phân lớp đối tượng trên dữ liệu mới vàđánh giá kết quả
3 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU
Nghiên cứu xây dựng hệ thống giám sát ngã tư thông minh tại 01 điểm giao lộđường Huỳnh Minh Thạnh và 27/4 thuộc thị trấn Phước Bửu, huyện Xuyên Mộc, tỉnh BàRịa - Vũng Tàu đây là dự án sản xuất thử nghiệm cấp tỉnh thực hiện nhiệm vụ khoa học
và công nghệ hàng năm do UBND tỉnh Bà Rịa - Vũng Tàu đặt hàng cho Trung tâm Ứngdụng tiến bộ khoa học và công nghệ chủ trì thực hiện Mục tiêu dự án SXTN đã nêu trênvới giải pháp là thiết kế lắp đặt trên nền tảng công nghệ sẵn có vi xử lý AVR Atmel 8-bit,hoặc ARM Atmel 32-bit thông qua bản mạch Arduino và thực thi chương trình được nạp
Trang 24sẵn cho bộ xử lý trung tâm đặt tại giao lộ cần quan sát, bộ xử lý này tiếp nhận thông tin từcác camera được kết hợp với các cảm biến laser và camera giám sát hình ảnh phương tiệntham gia giao thông Nhận dạng hành vi vi phạm và lưu trữ thông tin trên hệ thống dữliệu điện toán đám mây thông qua sóng 3G Thông qua phần mềm ứng dụng có thể xâydựng kịch bản cho hệ thống tự động điều khiển và xử lý thông tin tiếp nhận từ các thiếtbị
Hệ thống nhận dạng biển số xe: Bộ thư viện OpenCV - đây là bộ thư viện đượcIntel và Itseez phát triển trong hơn 20 năm qua với hơn 2.500 thuật toán nhận dạng khác
nhau, sử dụng máy học (machine learning).
Hình 2: Sơ đồ nhận dạng biển số xe
Trang 25Hệ thống nhận dạng người tham gia giao thông: IOT Core và Azure đảm nhậnviệc có bao nhiên người tham gia giao thông tại thời điểm đó, từ đó biết được trên mộtphương tiện xe máy có bao nhiêu người, đặc điểm của họ, phân tích các hành vi tại thờiđiểm đó để kiểm tra xem họ có chấp hành đúng luật giao thông hay không
Detection Result:
2 faces detected ISON:
[ {
"scores": {
"anger": 0.00901619889,
"contempt": 9.008121588469,
"disgust": 9.9996216889184, "fear": 6.09138592813, "happiness": 8.96891577913, "neutral":
9.992224847, "sadness":
9.89889309449252, "surprise": e.996211
}
Hình 3: Nhận dạng khuôn mặt người trong ảnh
Từ đó, có thể nhận thấy cần phải thay đổi ứng dụng giải pháp công nghệ vào việcgiám sát hành vi của người tham gia giao thông nhằm phát hiện, ghi nhận và phân vùng
đối tượng ảnh dựa trên các giải thuật học sâu (deep learning) để phân lớp đối tượng quan tâm với các đối tượng ảnh còn lại, đặc biệt với thông qua các kỹ thuật học sâu (Deep
learning) với mô hình mạng nơ-ron tích chập theo phương pháp nhìn một lần
(Convolutional Neural Network for You Only Look Once - CNNs for YOLO Object
Detection) nhằm phân tích đối tượng áp dụng trong việc xây dựng hệ thống tự động nhận
dạng phương tiện và các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực làcấp bách và cần thiết phù hợp với xu hướng công nghệ mới, tiên tiến hơn, tốt hon,
Việc ứng dụng của công nghệ phân loại hiện nay đang phát triển rất mạnh ở rấtnhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế ) và các đối tượng (nhà nghiên cứu
xã hội, chính phủ và các tổ chức phi lợi nhuận khác) Vì các tổ chức này sở hữu một
Trang 26lượng lớn dữ liệu không có cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiềunếu như các dữ liệu này được chuẩn hóa bởi các chủ đề/nhãn Nền tảng công nghệ đểthực hiện bài toán phân loại văn bản chính là trí tuệ nhân tạo (Artificial Intelligence - AI)
áp dụng giải thuật học sâu (Deep Learning) với mô hình mạng nơ- ron được áp dụng như:
- Nghiên cứu của ông Andrews Sobral: Ông Andrews Sobral và cộng sự đã
nghiên cứu nhận diện phương tiện qua phương pháp Haar Cascades using OpenCV.Nghiên cứu sử dụng thư viện thị giác máy tính mã nguồn mở JavaScript và OpenCV đểnhận diện hình ảnh được truy cập vào webcam
- Nghiên cứu nhận diện và theo dõi xe sử dụng OpenCV và Kalman Filter: Ông
Ronit Sinha và cộng sự sử dụng OpenCV và Kalman Filter để nhận diện và theo dõi xe từluồng trực tuyến của Camera giao thông Bộ lọc OpenCV và Kalman sẽ phát hiện và theodõi xe ô tô từ video được phát trực tiếp từ camera
- Nghiên cứu về nhận diện vật thể bằng thuật toán YOLO: Yolo được Redmon và
Farhadi phát triển vào năm 2015, trong thời gian học tiến sĩ YOLO (‘You only lookonce”) là một thuật toán nhận diện phổ biến nhờ độ chính xác cao trong thời gian thực,đạt đến 45 khung hình trên giây
- Nghiên cứu nhận diện phương tiện và hướng đi (Vehicle Detection for
Autonomous Driving): Ông Junsheng Fu và cộng sự đã sử dụng các công cụ, bao gồm
OpenCV3, Python3.5, tensorflow, CUDA8 OS: Ubuntu 16.04 Có 2 hướng đi: SVMtuyến tính và mạng nơ-ron
Ở Việt Nam, cộng đồng nghiên cứu trí tuệ nhân tạo xử lý ngôn ngữ tự nhiên để ápdụng vào bài toán xử lý tiếng Việt đang rất phát triển Do đặc thù của tiếng Việt và sựkhác biệt về bộ ngôn ngữ trong các thư viện, công cụ hỗ trợ, nên cộng đồng các nhànghiên cứu trí tuệ nhân tạo (AI) của Việt Nam đã xây dựng và phát triển một số các thuậttoán, thư viện và công cụ dành riêng cho tiếng Việt Một số doanh nghiệp và trường đạihọc hoạt động trong lĩnh vực công nghệ thông tin đã và đang nghiên cứu đưa bài toánphân loại văn bản vào ứng dụng thực tế như: Framgia, Đại học Lê Quý Đôn, FPT, Đạihọc Khoa học Công nghệ thuộc Đại học Quốc gia Việt Nam, Còn trong lĩnh vực quân
sự, do là là môi trường đặc thù, vì vậy, việc thu thập thông tin trên các trang báo điện tử,diễn đàn, mạng xã hội, để theo dõi tình hình, nắm bắt thông tin là một trong nhữngnhiệm vụ mới, quan trọng trên không gian mạng Do lượng thông tin thu thập được quamạng Internet là rất lớn, nên đã đặt ra yêu cầu phân tích và xử lý lượng dữ liệu khổng lồtrên một cách tự động và nhanh chóng
Trang 27Tại các nước châu Á, Hàn Quốc chính là quốc gia đi tiên phong trong việc ứngdụng công nghệ nhằm phát triển Hệ thống giao thông thông minh Seoul (Hàn Quốc)được nhận định là thành phố có hệ thống giao thông thông minh tốt nhất thế giới.
Hoặc như Singapore với chiến lược “Quốc gia thông minh” được khởi động từtháng 11 năm 2014, đề án Quốc gia thông minh của Singapore được xây dựng trên nềntảng đặt người dân làm trung tâm, sử dụng công nghệ để giải quyết các vấn đề và tháchthức của đô thị Sáng kiến này nêu rõ: “Singapore nỗ lực để trở thành một quốc gia thôngminh nhằm hỗ trợ người dân sống tốt hơn, cộng đồng mạnh mẽ hơn và tạo nhiều cơ hộihơn cho tất cả mọi người” Thông qua đề án này, Singapore đã và đang hình thành mộtnền văn hóa quốc gia xung quanh việc khuyến khích thực nghiệm, nuôi dưỡng tinh thầnsáng tạo và triển khai những ý tưởng mới ICT là cốt lõi để thực hiện mục tiêu Quốc gia
thông minh, trong đó tập trung vào 3 ưu tiên: công nghệ hỗ trợ xã hội; di động và giao
thông thông minh; môi trường dữ liệu an toàn Chính phủ cũng cam kết hằng năm đầu
tư khoảng 1% GDP cho nghiên cứu và phát triển
Trải qua hơn 2 năm vận hành, đến nay, Singapore đã triển khai được các giải phápthông minh trong lĩnh vực nhà ở, điều khiển giao thông, xe tự lái, quan trắc môi trường,thanh toán không dùng tiền mặt, các công nghệ hỗ trợ tự hành/người máy, y tế từ xa,công cụ tiếp nhận ý kiến người dân, và hệ thống cơ sở dữ liệu mở Song song đó,Singapore tiếp tục duy trì và mở rộng hoạt động hỗ trợ khởi nghiệp nhằm có thể đảm bảonguồn cung cho các ứng dụng thông minh trong tương lai
Tại Trung Quốc áp dụng mô hình mạng nơ-ron tích chập theo phương pháp nhìn
một lần (Convolutional Neural Network for You Only Look Once - CNNs for
YOLO Object Detection) xây dựng hệ thống theo dõi người dân của Trung Quốc, từ đó
có thể giúp chính quyền xác định được tội phạm lẫn trốn ở đó hay không, hoặc hệ thống
xe tự lái, cũng phải xác định được người đi đường ở đâu từ đó đưa ra quyết định dichuyển tiếp theo
Trang 28Hai là, thực trạng nghiên cứu áp dụng hiện nay tại Việt Nam:
- Việc triển khai nghiên cứu áp dụng trí tuệ nhân tạo (AI) trong việc xây dựngthành phố thông minh đã và đang áp dụng nghiên cứu công nghệ và triển khai cho một sốđịa phương như: thành phố Hà Nội, thành phố Hồ Chí Minh, thành phố Đà Nẵng, BìnhDương, Đồng Nai, Kiên Giang, Quảng Nam, Thừa Thiên Huế, Quảng Ninh, tập trungchủ yếu vào các vấn đề chính cụ thể như: xây dựng hạ tầng mạng kết nối trên toàn thànhphố để phục vụ nhu cầu kết nối, chia sẻ thông tin của chính quyền, doanh nghiệp, ngườidân, du khách và truyền dẫn cho các ứng dụng thành phố thông minh hơn; Hệ thống giaothông thông minh: ứng dụng CNTT-TT vào công tác quản lý giao thông đô thị của thànhphố một cách chủ động và hiệu quả hơn; Hệ thống cấp nước thông minh: ứng dụngCNTT-TT để nâng cao chất lượng xử lý và phân phối nước sạch cho người dân Riêngtỉnh Bà Rịa - Vũng Tàu ngày 13/12/2019 Hội đồng nhân dân tỉnh đã thông qua Nghịquyết số 112/NQ-HĐND về Đề án phát triển đô thị thông minh tỉnh Bà Rịa - Vũng Tàugiai đoạn 2020-2022, định hướng đến 2025, tầm nhìn đến 2030 với mục tiêu phát triển thíđiểm đô thị thông minh bền vững tỉnh Bà Rịa - Vũng tàu giai đoạn đến 2030 hướng tớităng trưởng xanh, phát triển bền vững; ứng dụng thành tựu khoa học công nghệ hiện đại,tối ưu hóa cơ sở dữ liệu hạ tầng kỹ thuật và hạ tầng ICT phát triển đô thị thông minhnhằm phát huy tiềm năng lợi thế, khai thác hiệu quả tài nguyên, con người, nâng cao chấtlượng cuộc sống nhân dân, đồng thời tạo điều kiện để các tổ chức, cá nhân tham gia đầu
tư xây dựng cơ sở vật chất kỹ thuật phát triển đô thị thông minh; hạn chế các rủi ro vànguy cô tiềm năng; nâng cao hiệu quả quản lý nhà nước và các dịch vụ đô thị; nâng caosức cạnh tranh của nền kinh tế và hội nhập, góp phần thắng lợi các mục tiêu kinh tế - xãhội, an ninh quốc phòng tại địa phương
- Nghiên cứu phát hiện làn đường, ôtô và người đi bộ bằng công nghệ ảnh hỗ trợcho ôtô tự hành của hai tác giả Trương Quốc Bảo, Trương Quốc Định - Trường Đại họcCần Thơ
- Các nhà khoa học thuộc Khoa Điện - Điện tử, Trường Đại học Giao thông Vậntải đã nghiên cứu thiết kế và chế tạo thành công hệ thống giám sát giao thông ứng dụngcông nghệ xử lý ảnh Hệ thống bao gồm camera giám sát, camera chụp hình, mạng truyềnthông, video server, phần mềm xử lý ảnh và cơ sở dữ liệu có thể tự động phát hiện và ghinhận các tình huống vi phạm Luật Giao thông nhằm tăng cường giám sát, phát hiện và xử
lý kịp thời các vi phạm, hạn chế tai nạn và nâng cao ý thức chấp hành của người tham giagiao thông[8-11]
Trang 29đề cần được tiếp tục nghiên cứu hoàn thiện
Đầu vào mô hình là một bức ảnh, đối với bài toán nhận dạng, chúng ta không chỉphải phân loại được đối tượng (object) trên bức ảnh mà còn phải định vị được vị trí củađối tượng đó và mỗi lần thực hiện tốn rất nhiều thời gian Do đó:
- Tốn rất nhiều tài nguyên để tính toán cho mọi vùng trên một bức ảnh và do đókhông thể thực hiện theo thời gian thực (realtime) trên các thiết bị yếu
- Ảnh phương tiện lưu thông vào ban đêm hay trong bóng tối nếu thiết bị ghi hìnhkhông có đèn flash thì khả năng nhận dạng thấp do thiếu sáng
- Không thể nhìn thấy các đối tượng nhỏ, các đối tượng quá gần sát nhau; khôngthể khái quát các đối tượng nếu hình ảnh có kích thước khác so với hình ảnh đào tạo,huấn luyện
- Tỷ lệ nhận dạng còn phụ thuộc nhiều vào điều kiện ánh sáng, phản chiếu, độ chebóng và điều kiện môi trường
- Với những biển số trên phương tiện giao thông có đường viền phức tạp thì mức
độ nhận dạng không cao Chỉ giới hạn ảnh chụp trong góc 40 độ để nhận dạng được tốt,nếu góc lớn hơn thì khả năng nhận dạng sẽ giảm
- Đặc biệt, đối với Việt Nam rất đa dạng các loại phương tiện giao thông (ô tô, xemáy, xe lam, xe ba bánh, xe đạp, người đi bộ, ), các vật thể (mũ bảo hiểm, ô dù, điệnthoại, đèn tín hiệu), các hành vi và tình trạng giao thông (tai nạn giao thông, tắc đường,đua xe, lạng lách,.)
- Chuẩn hóa hàng loạt ở các lớp tích chập, làm giảm sự thay đổi giá trị trong cáclớp ẩn, cải thiện tính ổn định của mạng lưới
- Việc tăng kích thước đầu vào của hình ảnh đã cải thiện (độ chính xác trung bình)tăng lên
- Thực hiện phân loại và dự đoán trong một khung duy nhất Các khung tâm vàkhung ranh giới; khung tâm chịu trách nhiệm dự đoán khung ranh giới và các khung tâmđược thiết kế cho một tập dữ liệu nhất định bằng cách sử dụng thuật toán phân cụm (k-means clustering)
- Đối với việc phát hiện các vật nhỏ trên hình ảnh khắc phục bẳng cách chia hìnhảnh thành các ô lưới nhỏ hơn so với nghiên cứu trước đó Điều này cho phép các nghiên
Trang 30dự đoán các đối tượng từ các kích thước đầu vào khác nhau với độ chính xác cao.
- Nghiên cứu theo hướng ứng dụng trong việc sử dụng kiến trúc mạng Darknet 19với 19 lớp chập và 5 lớp max-pooling và một lớp softmax cho việc phân loại đối tượng
- Nâng cao hiệu quả chương trình, tách ly các kí tự trong biển số trong các trườnghợp biển số bị nhiều nhiễu, mất mát thông tin do nhiễu từ điều kiện môi trường, tìm vùngbiển số trong ảnh có độ tương phản giữa biển số và nền thấp Đặc biệt là biển xe có nềnmàu đỏ chữ trắng hoặc nền màu vàng chữ trắng
- Phát triển chương trình thành module phần cứng Có khả năng tương thích vớicác thiết bị quan sát như camera Kết hợp quản lý và in ấn bằng chứng hình ảnh vi phạmchạy trên nền tảng website
- Cần trang bị hệ thống camera có độ phân giải cao cho hình ảnh biển số xe rõ néttrong điều kiện ánh sáng ban ngày, ban đêm hay với thời tiết mưa, bão; Có cấu hình phùhợp cho việc chụp ảnh khi xe di chuyển với tốc độ cao kết hợp công nghệ nhận dạng mộtcách chính xác
4 CẤU TRÚC LUẬN VĂN
Luận văn thạc sỹ cá nhân biên soạn bao gồm 6 mục và 4 chương với nội dung tómtắt như sau:
1 GIỚI THIỆU
2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG
NGHIÊN CỨU
3 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU
4 CẤU TRÚC LUẬN VĂN
- Chương 1 Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật
về kỹ thuật học máy và kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng
- Chương 2 Tổng quan về giao thông
Trang 325 NGHIÊN CỨU TỔNG QUAN VÀ PHÂN TÍCH BÀI TOÁN Chương 1 Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật về học máy và kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng
1 Khái niệm chung [6-9, 16, 17, 31]
Xử lý ảnh là phương pháp chuyển đổi hình ảnh sang dạng số và thực hiện một sốhoạt động trên đó để nâng cao chất lượng hình ảnh hoặc để trích xuất một số thông tinhữu ích từ hình ảnh đó
Có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc
tự động hóa các hành vi thông minh [12]
Học máy là một ứng dụng trí tuệ nhân tạo cung cấp cho hệ thống khả năng tựđộng học hỏi và cải thiện hiệu suất, độ chính xác dựa trên những kinh nghiệm từ dữ liệuđầu vào Máy học là tập trung vào việc phát triển các phần mềm, chương trình máy tính
có thể truy cập vào dữ liệu và tận dụng nguồn dữ liệu đó để tự học
Học sâu là một chức năng của trí tuệ nhân tạo (AI), bắt chước hoạt động của bộnão con người trong việc xử lí dữ liệu và tạo ra các mẫu để sử dụng cho việc ra quyếtđịnh Học sâu là tập con của học máy trong trí tuệ nhân tạo, có các mạng lưới có khảnăng "học" mà không bị giám sát từ dữ liệu không có cấu trúc hoặc không được gắn nhãn[17]
Là một chuỗi các thuật toán được đưa ra để nỗ lực tìm kiếm các mối quan hệ cơbản trong một tập hợp dữ liệu, thông qua quá trình bắt chước cách thức hoạt động của bộnão con người
2 Tổng quan về trí tuệ nhân tạo [6-9, 21]
- Hiện nay cả thế giới đang đứng trên cuộc cách mạng công nghiệp 4.0 và trí tuệnhân tạo biết đến như chiếc chìa khóa để biến những ý nghĩ của con người thành hiện
thực Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial intelligence -AI) là một
Trang 33ngành thuộc lĩnh vực khoa học máy tính (Computer science) Là trí tuệ do con người lập
trình tạo nên với mục tiêu giúp máy tính có thể tự động hóa các hành vi thông minh nhưcon người Trí tuệ nhân tạo khác với việc lập trình logic trong các ngôn ngữ lập trình là ở
việc ứng dụng các hệ thống học máy (machine learning) để mô phỏng trí tuệ của con
người trong các xử lý mà con người làm tốt hơn máy tính Cụ thể, trí tuệ nhân tạo giúpmáy tính có được những trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyếtvấn đề, biết giao tiếp do hiểu ngôn ngữ, tiếng nói, biết học và tự thích nghi, Tuy rằng tríthông minh nhân tạo có nghĩa rộng như là trí thông minh trong các tác phẩm khoa họcviễn tưởng, nó là một trong những ngành trọng yếu của tin học Trí thông minh nhân tạoliên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của máv móc
- Thành phần công nghệ trí tuệ nhân tạo được chia làm 4 nhóm chính cụ thể sau:(1) Nhóm 1: Công nghệ trí tuệ nhân tạo phản ứng có khả năng phân tích nhữngđộng thái khả thi nhất của chính mình và của đối thủ, từ đó, đưa ra được giải pháp tối ưunhất
Ví dụ: Điển hình của công nghệ trí tuệ nhân tạo phản ứng là Deep Blue Đâv làmột chương trình chơi cờ vua tự động, được tạo ra bởi IBM, với khả năng xác định cácnước cờ đồng thời dự đoán những bước đi tiếp theo của đối thủ Thông qua đó, DeepBlue đưa ra những nước đi thích hợp nhất
(2) Nhóm 2: Công nghệ trí tuệ nhân tạo với bộ nhớ hạn chế là khả năng sử dụngnhững kinh nghiệm trong quá khứ để đưa ra những quvết định trong tương lai Côngnghệ AI nàv thường kết hợp với cảm biến môi trường xung quanh nhằm mục đích dựđoán những trường hợp có thể xảv ra và đưa ra quvết định tốt nhất cho thiết bị
Ví dụ: Đối với xe không người lái, nhiều cảm biến được trang bị xung quanh xe
và ở đầu xe để tính toán khoảng cách với các xe phía trước, công nghệ AI sẽ dự đoán khảnăng xảv ra va chạm, từ đó điều chỉnh tốc độ xe phù hợp để giữ an toàn cho xe
Hình 4: Ứng dụng công nghệ trí tuệ nhân tạo với bộ nhớ hạn chế
(3) Nhóm 3: Lý thuyết trí tuệ nhân tạo này có thể học hỏi cũng như tự suy nghĩ,sau đó áp dụng những gì học được để thực hiện một việc cụ thể Hiện nay, công nghệ AI
Trang 34này vẫn chưa trở thành một phương án khả thi.
(4) Nhóm 4: Công nghệ trí tuệ nhân tạo tự nhận thức này có khả năng tự nhậnthức về bản thân, có ý thức và hành xử như con người Thậm chí, chúng còn có thể bộc lộcảm xúc cũng như hiểu được những cảm xúc của con người Đây được xem là bước pháttriển cao nhất của công nghệ AI và đến thời điểm hiện tại, công nghệ này vẫn chưa khảthi
Hình 5: Ứng dụng công nghệ trí tuệ nhân tạo tự nhận thức
- Việc ứng dụng của công nghệ phân loại hiện nay đang phát triển rất mạnh ở rấtnhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế, ) và các đối tượng (nhà nghiên cứu
xã hội, chính phủ và các tổ chức phi lợi nhuận khác) Vì các tổ chức này sở hữu mộtlượng lớn dữ liệu không có cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiềunếu như các dữ liệu này được chuẩn hóa bởi các chủ đề/nhãn Nền tảng công nghệ đểthực hiện bài toán phân loại văn bản chính là trí tuệ nhân tạo áp dụng giải thuật học sâuvới mô hình mạng nơ-ron điển hình như:
(1) Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản, giao
tiếp người - máy
(2) Nhận dạng (Patten recognition): nhận dạng tiếng nói, chữ viết tay, vân tay,
thị giác máy, thiên văn học
(3) Máy tìm kiếm như Google, Yahoo, You tube: các hệ thống này sử dụng cáccông cụ của học máy để phát triển hệ thống
(4) Chẩn đoán trong y tế: trợ giúp phân tích ảnh X-quang, các hệ chuyên giachẩn đoán tự động
(5) Tin sinh học: phân loại và dự đoán chuỗi gene, dự đoán tính chất của thuốcmới
(6) Phát hiện gian lận tài chính, gian lận thẻ tín dụng, phát hiện dị thường.(7) Phân tích thị trường chứng khoán
Trang 35(8) Trò chơi: máy tính chơi cờ Deep blue của IBM chế tạo năm 1998.
(9) Người máy: là tổng hợp của rất nhiều ngành khoa học, trong đó học máy tạonên hệ thần kinh và bộ não của người máy
- Ví dụ như:
(1) Trong ngành vận tải: Trí tuệ nhân tạo được ứng dụng trên những phương
tiện vận tải tự lái, điển hình là ô tô Sự ứng dụng này góp phần mang lại lợi ích kinh tếcao hơn nhờ khả năng cắt giảm chi phí cũng như hạn chế những tai nạn nguy hiểm đếntính mạng Vào năm 2016, Otto, hãng phát triển xe tự lái thuộc Uber đã vận chuyển thànhcông 50.000 lon bia Budweisers bằng xe tự lái trên quãng đường dài 193 km Theo dựđoán của công ty tư vấn công nghệ thông tin Gartner, trong tương lai, những chiếc xe cóthể kết nối với nhau thông qua Wifi để đưa ra những lộ trình vận tải tốt nhất
Hình 6: Ứng dụng công nghệ trí tuệ nhân tạo xe tự lái
(2) Trong sản xuất: Trí tuệ nhân tạo được ứng dụng để xây dựng những quy trình
sản xuất tối ưu hơn Công nghệ AI có khả năng phân tích cao, làm cơ sở định hướng choviệc ra quyết định trong sản xuất
(3) Trong y tế: Ứng dụng tiêu biểu của trí tuệ nhân tạo trong lĩnh vực y tế là máy
bay thiết bị bay không người lái được sử dụng trong những trường hợp cứu hộ khẩn cấp.Thiết bị bay không người lái có tốc độ nhanh hơn xe chuyên dụng đến 40% và vô cùngthích hợp để sử dụng ở những nơi có địa hình hiểm trở
Trang 36Hình 7: Ứng dụng công nghệ trí tuệ nhân tạo cho thiết bị bay không người lái (4) Trong giáo dục: Sự ra đời của trí tuệ nhân tạo giúp tạo ra những thay đổi lớn
trong lĩnh vực giáo dục Các hoạt động giáo dục như chấm điểm hay dạy kèm học sinh cóthể được tự động hóa nhờ công nghệ AI Nhiều trò chơi, phần mềm giáo dục ra đời đápứng nhu cầu cụ thể của từng học sinh, giúp học sinh cải thiện tình hình học tập theo tốc
độ riêng của mình Trí tuệ nhân tạo còn có thể chỉ ra những vấn đề mà các khóa học cầnphải cải thiện Chẳng hạn như khi nhiều học sinh được phát hiện là gửi đáp án sai cho bàitập, hệ thống sẽ thông báo cho giáo viên đồng thời gửi thông điệp đến học sinh để chỉnhsửa đáp án phù hợp Công nghệ AI còn có khả năng theo dõi sự tiến bộ của học sinh vàthông báo đến giáo viên khi phát hiện ra vấn đề đối với kết quả học tập của học sinh
Hình 8: Ứng dụng công nghệ trí tuệ nhân tạo ROBOT trong day học
Hơn nữa, sinh viên còn có thể học hỏi từ bất cứ nơi nào trên thế giới thông quaviệc sử dụng những phần mềm có hỗ trợ AI Công nghệ AI cũng cung cấp dữ liệu nhằmgiúp sinh viên lựa chọn được những khóa học tốt nhất cho mình
(5) Trong truyền thông: Đối với lĩnh vực truyền thông, sự phát triển của trí tuệ
nhân tạo góp phần làm thay đổi cách thức tiếp cận đối với khách hàng mục tiêu Nhờnhững ưu điểm của công nghệ AI, các công ty có thể cung cấp quảng cáo vào đúng thờiđiểm, đúng khách hàng tiềm năng, dựa trên việc phân tích các đặc điểm về nhân khẩuhọc, thói quen hoạt động trực tuyến và những nội dung mà khách hàng thường xem trênquảng cáo
(6) Trong ngành dịch vụ: Công nghệ AI giúp ngành dịch vụ hoạt động tối ưu hơn
và góp phần mang đến những trải nghiệm mới mẻ hơn và tốt hơn cho khách hàng Thôngqua việc thu thập và phân tích dữ liệu, công nghệ AI có thể nắm bắt thông tin về hành vi
sử dụng dịch vụ của khách hàng, từ đó mang lại những giải pháp phù hợp với nhu cầucủa từng khách hàng [2,7,9]
3 Tổng quan về học máy [6-9, 16-17, 21-23]
Trang 373.1 Học máy (Machine Learning)
Là một bộ phận của của trí tuệ nhân tạo (AI), các hệ thống mà sau khi được cungcấp một lượng dữ liệu và thực hiện một hoặc một số thao tác dựa trên những dữ liệu đãđược cung cấp để máy có thể học Machine Learning thường được dùng trong việc xử lýcác tác vụ tương tự con người mà khó có thể mô phỏng thành công thức cụ thể, ví dụ nhưnhận diện, đánh giá lựa chọn,
Học máy thường được áp dùng trong việc xử lý các tác vụ tương tự con người màkhó có thể mô phỏng thành công thức cụ thể, ví dụ như nhận diện, đánh giá lựa chọn,
- Học có giám sát (dạy học): Học có giám sát là một hướng tiếp cận của máy học
để làm cho máy tính có khả năng "học" Trong hướng tiếp cận này, người ta "huấn luyện"máy tính dựa trên những quan sát có dán nhãn Ta có thể hình dung những quan sát nàynhư là những câu hỏi, và nhãn của chúng là những câu trả lời Ý tưởng của học có giámsát là: bằng việc ghi nhớ và tổng quát hóa một số quy tắc từ một tập câu hỏi có đáp ántrước, máy tính sẽ có thể trả lời được những câu hỏi dù chưa từng gặp phải, nhưng cómối liên quan
Ví dụ ta dạy máy tính "1 + 1 = 2" và hy vọng nó sẽ học được phép tính cộng x + 1
và trả lời được là "2 + 1 = 3" Học có giám sát mô phỏng việc con người học bằng cáchđưa ra dự đoán của mình cho một câu hỏi, sau đó đối chiếu với đáp án Sau đó con ngườirút ra phương pháp để trả lời đúng không chỉ câu hỏi đó, mà cho những câu hỏi có dạngtương tự Trong học có giám sát, các quan sát bắt buộc phải được dán nhãn trước Đâychính là một trong những nhược điểm của phương pháp này, bởi vì không phải lúc nàoviệc dán nhãn chính xác cho quan sát cũng dễ dàng Ví dụ như trong dịch thuật, từ mộtcâu của ngôn ngữ gốc có thể dịch thành rất nhiều phiên bản khác nhau trong ngôn ngữcần dịch sang Tuy nhiên, việc quan sát được dán nhãn cũng lại chính là ưu điểm của học
có giám sát bởi vì một khi đã thu thập được một bộ dữ liệu lớn được dán nhãn chuẩn xác,thì việc huấn luyện trở nên dễ dàng hơn rất nhiều so với khi dữ liệu không được dánnhãn
Trang 38Hình 9: Phương thức học có giám sát
Ví dụ: Trong nhận dạng chữ viết tay,
ta có ảnh của hàng nghìn ví dụ của mỗi chữ
số được viết bởi nhiều người khác nhau
Chúng ta đưa các bức ảnh này vào trong một
thuật toán và chỉ cho nó biết mỗi bức ảnh
tương ứng với chữ số nào Sau khi thuật toán
tạo ra một mô hình, tức một hàm số mà đầu vào là một bức ảnh và đầu ra là một chữ số,khi nhận được một bức ảnh mới mà mô hình chưa nhìn thấy bao giờ, nó sẽ dự đoán bứcảnh đó chứa chữ số nào
6 -g r I ự I b q * 7 ô I 7 3 1 13 / \946í97??
àíê3?3/ế H448-7\O3n?«\/8/7t-Z- ó' 3 3 % á
V Z-ữ Ũ 3 X k / * o Í3 />44JSÌOỚ5 ( ì 3 1 6 / 8
7 7 ỊSt»ịrẠÌiÌ4j9Ìty'Ị lìllĩíĩĩOi-OlĩmL
1l1ỊlrÝìrtìỊi.ịi>33 /03 3 ti>ĩ fry 4 ^7 3/7 X
^(ÍL^34Ị 13 13/ \J/I 5 Ũ7 1 4 8 ỳ X <4 si' 2 J" ụ 0 7 l / ?lĩSĩđílìí3SS5tl)ef <0 4 88 02/ o
6 08 ẽ 7 3 0 2 <í )3fj6i<ì/ 667877 / f</ỹ
Trang 39Hình 10: Hình mô tả chữ viết tay
Ví dụ này khá giống với cách học của con người khi còn nhỏ Ta đưa bảng chữ cáicho một đứa trẻ và chỉ cho chúng đây là chữ A, đây là chữ B Sau một vài lần được dạythì trẻ có thể nhận biết được đâu là chữ A, đâu là chữ B trong một cuốn sách mà chúngchưa nhìn thấy bao giờ
- Học không giám sát (tự học): Trong thuật toán này, chúng ta không biết được dữ
liệu đầu ra hay nhãn mà chỉ có dữ liệu đầu vào Thuật toán Học không giám sát dựa vào
cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm hoặc giảm
số chiều của dữ liệu để thuận tiện trong việc lưu trữ và tính toán
Một cách toán học, Học không giám sát là khi chúng ta chỉ có dữ liệu vào X mà không
biết nhãn Y tương ứng Những thuật toán loại này được gọi là Học không giám sát vì
không giống như Học có giám sát, chúng ta không biết câu trả lời chính xác cho mỗi dữliệu đầu vào Giống như khi ta học, không có thầy cô giáo nào chỉ cho ta biết đó là chữ A
hay chữ B Cụm không giám sát được đặt tên theo nghĩa này.
A
Hình 11: Phương thức học không giám sát về bài toán phân cụm
- Học bán giám sát (vừa học vừa tự học): Nằm ở đâu đó giữa học tập được giámsát và không giám sát, vì chúng sử dụng cả dữ liệu được gắn nhãn và không dán nhãn đểđào tạo - thường là một lượng nhỏ dữ liệu có nhãn và một lượng lớn dữ liệu không đượcdán nhãn Các hệ thống sử dụng phương pháp này có thể cải thiện đáng kể độ chính xáccủa việc học Thông thường, việc học bán giám sát được chọn khi dữ liệu được dán nhãnđược yêu cầu đòi hỏi tài nguyên có kỹ năng và có liên quan để đào tạo/học hỏi từ nó Nếukhông, dữ liệu được gắn nhãn thường không yêu cầu tài nguyên bổ sung
Trang 404 Các giải thuật về máy học [16-17, 21-23]
4.1 Giải thuật Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN)
- Mạng nơ-ron nhân tạo là sự mô phỏng chức năng của hệ thần kinh con ngườivới vô số các nơ-ron được liên kết và truyền thông với nhau Giống như mạng nơ-ron củanão người, ANN học và lưu những kinh nghiệm và sử dụng trong những tình huống phùhợp Mạng nơ-ron đã áp dụng thành công trong nhiều vấn đề liên quan đến dự báo, phânloại và điều khiển thuộc nhiều lĩnh vực khác nhau, như tài chính, y tế, địa chất và vật lý
Ví dụ như khả năng nhận dạng mặt người, dự báo thời tiết và thiên tai, tự động điềukhiển hệ thống lái tàu, hệ thống dự báo sự cố, v.v
- Kiến trúc chung của một mạng nơ-ron nhân tạo gồm 3 thành phần đó là: inputlayer, hidden layer và output layer Trong đó, hidden layer gồm các thần kinh nhận dữliệu input từ các neural ở lớp trước đó và chuyển đổi các input này cho các lớp xử lý tiếptheo Trong một ANN có thể có nhiều lớp ẩn
Hình 13: Minh họa mạng nơ-ron nhân tạo 3 lớp
- Quá trình xử lý thông tin của một mạng nơ-ron nhân tạo liên quan đến:
(1) Lớp Inputs: Dữ liệu nhập tương ứng các thuộc tính của dữ liệu
(2) Lớp Outputs: Kết quả là một giải pháp cho một vấn đề
(3) Lớp Weights: Trọng số liên kết là thành phần quan trọng thể hiện mức
độ quan trọng (độ mạnh) của dữ liệu nhập đối với quá trình xử lý thông tin (quá trìnhchuyển đổi dữ liệu từ lớp này sang lớp khác) Quá trình học của ANN thực ra là quá trìnhđiều chỉnh các trọng số của các dữ liệu nhập để có được kết quả mong muốn Trong đó: