1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng phương tiện về hành vi vi phạm luật giao thông đường bộ

139 26 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Luận Văn Nghiên Cứu Ứng Dụng Kỹ Thuật Máy Học Để Phân Tích Hình Ảnh Và Nhận Dạng Phương Tiện Về Hành Vi Vi Phạm Luật Giao Thông Đường Bộ
Tác giả Đỗ Hữu Hiền
Người hướng dẫn TS. Phan Ngọc Hoàng
Trường học Trường Đại học Bà Rịa - Vũng Tàu
Chuyên ngành Công nghệ thông tin
Thể loại luận văn thạc sĩ
Năm xuất bản 2021
Thành phố Bà Rịa - Vũng Tàu
Định dạng
Số trang 139
Dung lượng 2,74 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Cách mạng công nghiệp lần thứ 4 dựa trên nền tảngcông nghệ số và tích hợp tất cả các công nghệ thông minh để tối ưu hóa quy trình,phương thức sản xuất; với những công nghệ đang và sẽ có

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ' ĐẠI HỌC BÀ RỊA - VŨNG TÀU

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC BÀ RỊA - VŨNG TÀU

BARIA VUNGTAƯ

U H I VEIHITNCAP SAINT JACQUES

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT MÁY HỌC ĐỂ PHÂN TÍCH HÌNH ẢNH VÀ NHẬN DẠNG PHƯƠNG TIỆN VỀ HÀNH

VI VI PHẠM LUẬT GIAO THÔNG ĐƯỜNG BỘ

LUẬN VĂN THẠC SỸ Chuyên ngành: Công nghệ thông tin

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi dưới sự hướng dẫncủa TS Phan Ngọc Hoàng Các số liệu, kết quả nêu và trình bày trong Luận văn là trungthực và chưa từng được ai công bố trong bất kỳ công trình nào khác

Qua đây, tôi cũng xin cam đoan rằng trong thời gian hoàn thành Luận văn tôi đãđược một vài đồng nghiệp hỗ trợ, giúp đỡ để hoàn thành đến thời điểm này và cũng đãđược tôi chân thành cảm ơn Các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồngốc

Học viên thực hiện Luận văn

Đỗ Hữu Hiền

Trang 4

LỜI CẢM ƠN

Trước tiên, tôi xin chân thành gửi lời tri ân sâu sắc đến Ban giám hiệu Trường Đạihọc Bà Rịa - Vũng Tàu, Ban lãnh đạo Viện Đào tạo Quốc tế và Sau đại học, cùng quýthầy, quý cô thuộc khoa Công nghệ Thông tin - Trường Đại học Bà Rịa - Vũng Tàu đãtận tình quan tâm hỗ trợ, khuyến khích, truyền đạt cho tôi nhiều kiến thức quý báu và đãtạo mọi điều kiện thuận lợi trong suốt quá trình học tập và nghiên cứu tại Trường

Tôi xin tỏ lòng biết ơn sâu sắc đến thầy TS Phan Ngọc Hoàng, người đã quantâm, trách nhiệm, tận tình giúp đỡ và truyền đạt nhiều kinh nghiệm để tôi sớm có thểthực hiện và hoàn thành được đề tài

Xin chân thành ghi ơn người thân trong gia đình, đồng nghiệp trong cơ quan, đơn

vị và các bạn đã thông cảm, tận tình, giúp đỡ, hỗ trợ và động viên tôi rất nhiều trong quátrình thực hiện đề tài

Một lần nữa, tôi thành thật xin chân thành cảm ơn!

Học viên thực hiện Luận văn

Đỗ Hữu Hiền

Trang 5

MỤC LỤC

LỜI CAM ĐOAN 3

LỜI CẢM ƠN 4

MỤC LỤC 5

DANH MỤC CÁC TỪ VIẾT TẮT 9

DANH MỤC CÁC HÌNH 10

DANH MỤC BẢNG 13

1 GIỚI THIỆU 14

1.1 Đặt vấn đề: 14

1.2 Tính cấp thiết của đề tài: 18

2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG NGHIÊN CỨU 22

2.1 Mục tiêu của đề tài 22

2.2 Đối tượng 22

2.3 Phạm vi 23

2.4 Nội dung nghiên cứu 23

2.4.1 Về nội dung 23

2.4.2 Về mặt lý thuyết 23

2.4.3 Về mặt thực nghiệm 24

2.5 Phương pháp luận và phương pháp nghiên cứu 24

3 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU 25

3.1 Những hướng nghiên cứu đã được thực hiện 25

3.2 Những kết quả nghiên cứu đã áp dụng vào thực tế 26

3.3 Những phương pháp nghiên cứu đã được áp dụng trên thế giới và Việt Nam 28 3.4 Một số vấn đề còn hạn chế của những nghiên cứu trước và những vấn đề cần được tiếp tục nghiên cứu hoàn thiện 30

3.4.1 Một số vấn đề còn hạn chế của những nghiên cứu trước 30

3.4.2 Những vấn đề cần được tiếp tục nghiên cứu hoàn thiện 30

4 CẤU TRÚC LUẬN VĂN 31

5 NGHIÊN CỨU TỔNG QUAN VÀ PHÂN TÍCH BÀI TOÁN 33

Chương 1 Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật về học máy và kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng 33

Trang 6

1 Khái niệm chung [6-9, 16, 17, 31] 33

1.1 Xử lý ảnh 33

1.2 Trí tuệ nhận tạo (AI-Artificial Intelligence) 33

1.3 Học máy (Machine Learning) 33

1.4 Học sâu (Deep Learning) 33

1.5 Mạng nơ-ron nhân tạo (Artificial Neural Network) 33

2 Tổng quan về trí tuệ nhân tạo [6-9, 21] 33

2.1 Trí tuệ nhân tạo 33

2.2 Ứng dụng trí tuệ nhân tạo trong hiện tại và tương lai 35

3 Tổng quan về máy học [6-9, 16-17, 21-23] 38

3.1 Học máy (Machine Learning) 38

3.2 Ứng dụng học máy 38

3.3 Các phương thức về máy học 38

4 Các giải thuật về máy học [16-17, 21-23] 41

4.1 Giải thuật Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN) 41

4.2 Giải thuật dựa vào thể thức (K-nearest neighbors - KNN) 42

4.3 Giải thuật cây quyết định (Decision tree) 43

4.4 Giải thuật Random forest (RF) 45

4.5 Giải thuật máy hỗ trợ vector (Support vector machine - SVM) 46

4.6 Giải thuật Naive Bayes (NB) 47

4.7 Giải thuật phân cụm K-means clustering 48

5 Kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng [16-17, 21-23, 26-27] 49

5.1 Kỹ thuật phát hiện đối tượng kết hợp nhận dạng khuôn mặt (Viola Jones - Haar) .49

5.2 Kỹ thuật biến đổi đặc trưng bất biến theo tỷ lệ (Scaleinvariant feature transform -SIFT) 52

5.3 Kỹ thuật biểu đồ độ dốc định hướng (Histogram of oriented gradients -HOG) 56

5.4 Kỹ thuật học sâu để nhận dạng và phân loại đối tượng [16-21] 60

5.4.1 Kỹ thuật mạng nơ-ron tích chập 60

5.4.2 Kỹ thuật tìm kiếm xác định vị trí vật thể trong ảnh sử dụng mạng CNN [35 36] 65

5.4.3 Nhận xét, đánh giá và lựa chọn kỹ thuật áp dụng cho bài toán nhận dạng phân loại đối tượng 75

Chương 2 Tổng quan về giao thông 78

1 Các khái niệm 78

1.1 Giao thông 78

Trang 7

1.2 Đối tượng tham gia giao thông 78

2 Tổng quan về thực trạng giao thông 78

3 Phương pháp phát hiện, nhận dạng đối tượng tham gia giao thông [1, 29-30] 81

3.1 Nhận dạng phân loại đối tượng tham gia giao thông 81

3.2 Khái niệm về hệ thống nhận dạng biển số xe 82

3.2.1 Khái niệm 82

3.2.2 Lịch sử và phát triển 82

3.2.3 Cách thức hoạt động của hệ thống nhận dạng biển số xe 83

3.2.4 Phân loại các ứng dụng nhận dạng biển số xe 84

3.2.5 Ứng dụng thực tiễn tại Việt Nam 85

3.2.6 Phân loại biển số xe 85

3.3 Phương pháp nhận dạng biển số xe từ ảnh chụp của thiết bị ghi hình 87

3.3.1 Phương pháp chuyển đổi Hough 88

3.3.2 Phương pháp hình thái học 88

3.4 Phương pháp nhận dạng ký tự trong biển số xe 89

3.5 Một số đặc điểm để nhận dạng biển số xe tại Việt Nam 89

Chương 3 Áp dụng Yolov3 cho bài toán phát hiện, nhận dạng đối tượng tham gia giao thông vi phạm luật giao thông đường bộ 92

1 Kỹ thuật đề xuất áp dụng cho bài toán 92

1.1 Kỹ thuật áp dụng mạng nơ-ron tích chập (Faster R-CNN) 92

1.2 Kỹ thuật áp dụng nhìn một lần [32-34] 92

3 Mô hình và chức năng hệ thống đề xuất áp dụng cho bài toán 97

3.1 Địa điểm áp dụng thử nghiệm mô hình cho bài toán 97

3.2 Thiết kế mô hình lắp đặt hệ thống cho bài toán 98

3.3 Thiết kế hệ thống trụ đỡ 98

3.4 Hệ thống Camera 98

3.5 Thiết kế mô hình kết nối hệ thống xử lý bài toán 99

3.6 Sơ đồ tổng quan hệ thống áp dụng cho bài toán 99

3.7 Hệ thống xử lý ảnh, phát hiện và nhận diện đối tượng 101

3.7.1 Quy trình xử lý ảnh áp dụng cho bài toán 101

3.7.2 Quy trình phát hiện, nhận dạng và phân loại đối tượng 102

3.7.3 Quy trình phát hiện, nhận dạng biển số xe: 104

Chương 4 Xây dựng chương trình thực nghiệm và đánh giá kết quả 108

Trang 8

1 Xây dựng chương trình thực nghiệm 108

1.1 Cài đặt chương trình chạy [35] 108

1.1.1 Cài đặt thư viện mã nguồn mở Opencv 108

1.1.2 Cài đặt thư viện CUDA 108

1.1.3 Cài đặt thư viện cuDNN 108

1.1.4 Mô tả cài đặt thư viện 108

1.2 Chạy chương trình 109

1.3 Quy trình huấn luyện và nhận dạng đối tượng vật thể 110

1.4 Quy trình huấn luyện và nhận dạng hành vi vi phạm chở quá số người quy định 117 1.5 Quy trình huấn luyện và nhận dạng hành vi vi phạm không đội mũ bảo hiểm 120

1.6 Quy trình huấn luyện và nhận diện biển số xe của đối tượng tham gia giao thông: .127

6 KẾT LUẬN VÀ KIẾN NGHỊ 135

6.1 Kết luận 135

6.2 Kiến nghị và hướng phát triển 136

TÀI LIỆU THAM KHẢO: 138

Trang 9

DANH MỤC CÁC TỪ VIẾT TẮT

18 SMAC Social, Mobile, Analytics & Cloud

DANH MỤC CÁC HÌNH

Hình 1: Mô hình nút giao lộ (ngã tư) triển khai xây dựng mô hình nghiên cứu 22

Hình 2: Sơ đồ nhận dạng biển số xe 25

Hình 3: Nhận dạng khuôn mặt người trong ảnh 26

Hình 4: Ứng dụng công nghệ trí tuệ nhân tạo với bộ nhớ hạn chế 35

Hình 5: Ứng dụng công nghệ trí tuệ nhân tạo tự nhận thức 35

Hình 6: Ứng dụng công nghệ trí tuệ nhân tạoxe tự lái 36

Trang 10

Hình 7: Ứng dụng công nghệ trí tuệ nhân tạo cho thiết bị bay không người lái 37

Hình 8: Ứng dụng công nghệ trí tuệ nhân tạo ROBOT trong day học 37

Hình 9: Phương thức học có giám sát 39

Hình 10: Hình mô tả chữ viết tay 40

Hình 11: Phương thức học không giám sát về bài toán phân cụm 40

Hình 12: Phương thức học bán giám sát 40

Hình 13: Minh họa mạng nơ-ron nhân tạo 3 lớp 41

Hình 14: Bản đồ 1NN 43

Hình 15: Quá trình phát triển cây (bên trái) và rừng ngẫu nhiên (bên phải) 45

Hình 16: Bốn loại đặc trưng khu vực hình chữ nhật dùng trong kỹ thuật phát hiện 51 Hình 17: Đặc trưng Haar tương ứng ảnh thực tế 51

Hình 18: Kết quả của thuật toán SIFT 53

Hình 19: Các bước hiện thực giải thuật HOG 59

Hình 20: Kết quả phát hiện người thông qua giải thuật HOG 60

Hình 21: Convolvedfeature khác nhau với ma trận lọc khác nhau 62

Hình 22: Cấu trúc của mạng CNN 63

Hình 23: Trường tiếp nhận cục bộ 63

Hình 24: Các bước tạo ra 1 hidden layer 65

Hình 25: Xây dựng lớp max pooling 65

Hình 26: Xác định vị trí nhiều đối tượng trong ảnh 65

Hình 27: Output sau khi thực hiện Graph Based Image Segmentation [1] 66

Hình 28: Các bước của thuật toán R-CNN [2] 66

Hình 29: Các bước của thuật toán Fast R-CNN [3] 67

Hình 30: Kiến trúc Faster R-CNN [4] 68

Hình 31: Hình chữ nhật region proposal 69

Hình 32: Hệ số IoU đánh giá bounding box dự đoán đối tượng khớp với ảnh thật 69

Hình 33: So sánh thời gian phát hiện đối tượng so với các kỹ thuật khác 70

Hình 34: Mô hình sử dụng mạng VGG16 71

Hình 35: Kết quả mô hình sử dụng mạng VGG16 71

Hình 36: Sơ đồ số chiều của các feature maps 71

Hình 37: Sơ đồ áp dụng thuật toán SSD 72

Hình 38: Chia ảnh thành ma trận ô vuông 73

Hình 39: Sai số phân loại 75

Trang 11

Hình 40: Hình ảnh mô tả phương tiện và người tham gia giao thông 78

Hình 41: Hình ảnh mô tả tình trạng không tuân thủ Luật 79

Hình 42: Ảnh xám và lược đồ xám của ảnh 80

Hình 43: Kiến trúc Darknet-53 94

Hình 44: Khung ranh giới xác định đối tượng chim 95

Hình 45: Phát hiện, định vị và phân loại nhiều đối tượng 95

Hình 46: YOLO phiên bản 1 có những hạn chế đối với phát hiện đối tượng nhỏ 95

Hình 47: Kiến trúc Darknet-19 97

Hình 48: Bản vẽ thiết kế mô hình lắp đặt hệ thống 98

Hình 49: Mô hình kết nối-truy xuất hệ thống 99

Hình 50: Cấu trúc phần cứng cho hệ thống 99

Hình 51: Cấu trúc phần mềm xử lý hệ thống 99

Hình 52: Phát hiện đối tượng áp dụng giải thuật YOLOv3 104

Hình 53: Các bước dự đoán áp dụng theo giải thuật YOLOv3 104

Hình 54: Sơ đồ mô hình theo kến trúc áp dụng YOLOv3 theo tỷ lệ 105

Hình 55: Kết quả dự đoán áp dụng giải thuật YOLOv3 105

Hình 56: Bộ dữ liệu gồm 22 hình ảnh trích xuất từ bộ dữ liệu mẫu 112

Hình 57: Kết quả nhận dạng đối tượng tham gia giao thông được gán nhãn (tracking) 115Error! Bookmark not defined Hình 58: Bộ dữ liệu gồm 10 hình ảnh trích xuất từ bộ dữ liệu mẫu 118

Hình 59: Kết quả nhận dạng đối tượng về hành vi vi phạm giao thông được gán nhãn (tracking)về chở quá số người 119

Hình 60: Bộ dữ liệu gồm 22 hình ảnh trích xuất từ bộ dữ liệu mẫu 123

Hình 61: Kết quả nhận dạng đối tượng về hành vi vi phạm giao thông được gán nhãn (tracking) về không đội mũ bảo hiểm 126

Trang 12

DANH MỤC BẢNG

Bảng 1: Kết quả nhận dạng các đối tượng, vật thể tham gia giao thông 116 Bảng 2: Kết quả nhận dạng đối tượng tham gia giao thông về hành vi vi phạm chở quá số người theo quy định 120 Bảng 3: Kết quả nhận dạng đối tượng tham gia giao thông về hành vi vi phạm chở quá số người theo quy định 127

Trang 13

1 GIỚI THIỆU

Ngày nay, công nghệ thông tin là một trong những lĩnh vực quan trọng góp phầnthúc đẩy sự phát triển kinh tế của đất nước Ứng dụng của công nghệ thông tin (CNTT)xuất hiện ở rất nhiều lĩnh vực, là nền tảng của các nghiên cứu về công nghệ cao như khoahọc vũ trụ, công nghệ điện tử và tự động hóa, các hệ thống thông minh, Khi Internet rađời vào những năm 90, nó đã kết nối thông tin trên toàn thế giới lại với nhau Chúng tachỉ cần ngồi bất cứ nơi đâu với máy tính được kết nối mạng là có thể truy nhập thông tin

về bất cứ lĩnh vực gì trên thế giới

Tại Việt Nam, từ những năm 70 của thế kỷ 20 đã bắt đầu có các nghiên cứu vềmáy tính cũng như những ứng dụng về CNTT Hiện nay CNTT luôn được xác định làlĩnh vực then chốt được đầu tư không những hiện đại hóa cơ sở hạ tầng mà còn là việcứng dụng sâu rộng vào các lĩnh vực khác của đời sống xã hội [1]

Nghị quyết số 36-NQ/TW ngày 01/7/2014 của Bộ Chính trị về đẩy mạnh ứngdụng, phát triển CNTT đáp ứng yêu cầu phát triển bền vững và hội nhập quốc tế tiếp tụckhẳng định sự quan tâm chỉ đạo sát sao của Đảng đối với công tác ứng dụng, phát triểnCNTT, khẳng định vị trí, vai trò của CNTT trong sự nghiệp xây dựng và bảo vệ Tổ quốcthời kỳ mới Và là một văn bản rất quan trọng, là định hướng xuyên suốt cho chiến lượcứng dụng và phát triển CNTT và truyền thông từ nay đến năm 2030, là tiền đề quan trọng

để CNTT Việt Nam phát triển mạnh mẽ, sâu rộng hơn, đề ra những định hướng lớn cho

sự phát triển ngành CNTT nước nhà trong khoảng 10 - 20 năm tới Đến năm 2030, đưanăng lực nghiên cứu, ứng dụng, phát triển, sản xuất và cung ứng sản phẩm, dịch vụCNTT đạt trình độ tiên tiến thế giới; Việt Nam trở thành quốc gia mạnh về CNTT trongkhu vực

Ngày 27/09/2019 Bộ Chính trị ban hành Nghị quyết số 52-NQ/TW về một số chủtrương, chính sách chủ động tham gia cuộc Cách mạng công nghiệp lần thứ tư (CMCN4.0) với quan điểm chủ động, tích cực tham gia cuộc Cách mạng công nghiệp lần thứ tư

là yêu cầu tất yếu khách quan; là nhiệm vụ có ý nghĩa chiến lược đặc biệt quan trọng, vừacấp bách vừa lâu dài của cả hệ thống chính trị và toàn xã hội, gắn chặt với quá trình hộinhập quốc tế sâu rộng; đồng thời nhận thức đầy đủ, đúng đắn về nội hàm, bản chất củacuộc Cách mạng công nghiệp lần thứ tư để quyết tâm đổi mới tư duy và hành động, coi

đó là giải pháp đột phá với bước đi và lộ trình phù hợp là cơ hội để Việt Nam bứt phá

Trang 14

trong phát triển kinh tế - xã hội Xác định mục tiêu đến năm 2030, Việt Nam chúng taduy trì xếp hạng về chỉ số Đổi mới sáng tạo toàn cầu (GII) thuộc nhóm 40 nước dẫn đầuthế giới Mạng di động 5G phủ sóng toàn quốc; mọi người dân được truy cập Internetbăng thông rộng với chi phí thấp Kinh tế số chiếm trên 30% GDP; năng suất lao độngtăng bình quân khoảng 7,5%/năm Hoàn thành xây dựng Chính phủ số Hình thành một

số chuỗi đô thị thông minh tại các khu vực kinh tế trọng điểm phía Bắc, phía Nam vàmiền Trung; từng bước kết nối với mạng lưới đô thị thông minh trong khu vực và thế giới

và tầm nhìn đến năm 2045, Việt Nam trở thành một trong những trung tâm sản xuất vàdịch vụ thông minh, trung tâm khởi nghiệp, đổi mới sáng tạo thuộc nhóm dẫn đầu khuvực Châu Á; có năng suất lao động cao, có đủ năng lực làm chủ và áp dụng công nghệhiện đại trong tất cả các lĩnh vực kinh tế - xã hội, môi trường, quốc phòng, an ninh [2-3]

Bản chất của cuộc cách mạng công nghiệp lần thứ tư (CMCN 4.0) là cuộc cáchmạng thể chế Với sự phát triển mạnh mẽ của công nghệ số tạo ra mô hình mới, lực lượnglao động mới, nhanh chóng, bùng nổ khiến khuôn khổ thể chế truyền thống không cònphù hợp, mà nếu duy trì sẽ kìm hãm sự phát triển của đất nước và ngày 04/7/2017, Thủtướng chính phủ Ban hành Chỉ thị số 16/CT-TTg về tăng cường năng lực tiếp cận cuộccách mạng công nghiệp lần thứ 4 Trên cở sở đó, ngày 03/12/2018 Bộ Khoa học và Côngnghệ ban hành Quyết định số 3685/QĐ-BKHCN về danh mục các công nghệ chủ chốtcủa công nghiệp 4.0 (Trí tuệ nhân tạo - Artificial Intelligence, Chuỗi khối- Blockchain,

Dữ liệu lớn - Big Data, Khai phá dữ liệu và Phân tích dữ liệu - Data Mining and DataAnalytics, Internet vạn vật- Internet of Things, Điện toán đám mây- Cloud computing,Robot tự hành - Autonomous Robots, Robot cộng tác Collaborative robotics, In 3D vàchế tạo cộng - 3D printing and Additive manufacturing, Thực tại ảo - Virtual Reality,Công nghệ chế tạo vật liệu nano - Nano materials, Công nghệ vật liệu mới - Newmaterial technnology, Sinh học tổng hợp - Synthetic biology, Mạng di động thế hệ 5 - 5thGeneration Mobile Network, )

Đặc biệt, cuộc cách mạng công nghiệp lần thư 4 có nhiều tác động đến đời sốngkinh tế - xã hội trên nhiều lĩnh vực Nền kinh tế toàn cầu đang đứng trước một giai đoạnchuyển đổi không thể đảo ngược Cuộc cách mạng này thông qua các công nghệ như trítuệ nhân tạo (AI), Internet vạn vật (IoT), thực tế ảo (VR), tương tác thực tại ảo (AR),mạng xã hội, điện toán đám mây, di động, phân tích dữ liệu lớn (SMAC) để chuyển hóatoàn bộ thế giới thực thành thế giới số

Các công nghệ thông minh sẽ được tích hợp vào mọi khía cạnh của xã hội, xóa bỏ

Trang 15

các ranh giới công nghệ thông thường, thay đổi hình dạng mạng lưới công nghệ và sảnxuất, thúc đẩy sự phát triển của thời đại Những phát triển này hứa hẹn sẽ mở ra cơ hộicho Chính phủ, vùng miền các quốc gia thúc đẩy nền kinh tế mở, linh hoạt, nâng cao hiệuquả của nền kinh tế - xã hội và mang lại lợi thế “đi đầu” cho những quốc gia, vùng miềntận dụng tốt các công nghệ mới nhất Cách mạng công nghiệp lần thứ 4 dựa trên nền tảngcông nghệ số và tích hợp tất cả các công nghệ thông minh để tối ưu hóa quy trình,phương thức sản xuất; với những công nghệ đang và sẽ có tác động lớn như (Trí tuệ nhântạo - Artificial Intelligence, Chuỗi khối- Blockchain, Dữ liệu lớn - Big Data, Khai phá dữliệu và Phân tích dữ liệu - Data Mining and Data Analytics, Internet vạn vật- Internet ofThings, Điện toán đám mây- Cloud computing, Robot tự hành - Autonomous Robots, Trong lĩnh vực sản xuất công nghiệp, viễn cảnh các nhà máy thông minh trong đó cácmáy móc được kết nối Internet và liên kết với nhau qua một hệ thống có thể tự hình dungtoàn bộ quy trình sản xuất rồi đưa ra quyết định sẽ không còn xa Có thể thấy, Cách mạngcông nghiệp lần thứ 4 tác động đến tất cả các lĩnh vực kinh tế - xã hội như: công nghiệp,nông nghiệp, tài chính ngân hàng, lao động, việc làm, giao thông vận tải, dệt may, dulịch, y tế, giáo dục và đào tạo Điều đó có nghĩa nó sẽ ảnh hưởng trực tiếp đến các tổchức, cá nhân và các địa phương trong cả nước [4-5].

Theo các nhà nghiên cứu, ứng dụng trí tuệ nhân tạo được huấn luyện tốt có thểthực hiện một số công việc với kỹ năng tương đương như con người Tuy nhiên, trí tuệnhân tạo có lợi thế hơn con người nhờ khả năng mở rộng bằng việc học liên tục khôngnghỉ, thậm chí là tự học mà không cần sự hướng dẫn của con người Trí tuệ nhân tạo cóthể phát hiện ra mẫu trong những dữ liệu phức tạp đến mức các chuyên gia cũng khôngnhận ra Trong đó, đối với một số ứng dụng đặc thù như xử lý hình ảnh, trí tuệ nhân tạo

đã bằng hoặc vượt khả năng của con người Chính vì lẽ đó, khi được ứng dụng vào quátrình điều tiết giao thông, trí tuệ nhân tạo sẽ giúp giảm bớt nhân công nhưng lại tăngcường khả năng xử lý dữ liệu của hệ thống

Vì vậy có thể nói, trí tuệ nhân tạo (Artificial Intelligence - AI) là một hướng

nghiên cứu của lĩnh vực CNTT và Khoa học máy tính nhằm phát triển các hệ thống thôngminh để giải quyết các bài toán trong thực tế giống như hoạt động của bộ não người Trítuệ nhân tạo được bắt đầu nghiên cứu từ những năm 50 của thế kỷ 20 và trong khoảng 30năm trở lại đây đã được cộng đồng các nhà khoa học quan tâm mạnh mẽ Rất nhiều cáchội thảo lớn về lĩnh vực này được tổ chức hàng năm trên thế giới Các ứng dụng tiêu biểucủa trí tuệ nhân tạo vào đời sống xã hội bào gồm: người máy, robot, xử lý ngôn ngữ tự

Trang 16

nhiên, nhận dạng, phát hiện dị thường, an ninh quốc phòng, tin sinh học, khoa học vũ trụ

và trái đất,

Những năm gần đây, chúng ta đã chứng kiến được nhiều thành tựu vựợt bậc trong

lĩnh vực thị giác máy tính (Computer Vision) Các hệ thống xử lý ảnh lớn của Facebook,

Google hay Amazon đã đưa vào sản phẩm của mình những chức năng thông minh nhưnhận dạng khuôn mặt người dùng, phát triển xe hơi tự lái hay drone giao hàng tự động

Bên cạnh đó, sự phát triển của mạng nơ-ron đang dần hiện thực hoá khái niệmchúng ta vẫn thường gọi là (Computer Vision) thị giác máy tính Tuy nhiên, việc sử dụngthuật toán mạng nơ-ron vẫn còn gặp nhiều khó khăn Chẳng hạn như: Khi bạn muốn pháthiện nhận dạng một đối tượng trong một bức ảnh và đánh nhãn cho đối tượng đó thì cácphương pháp lúc bấy giờ quá chậm để xử lý theo thời gian thực hoặc là đòi hỏi cần phảiđầu tư trang thiết bị rất mạnh dẫn đến chi phí rất tốn kém,

Chính vì lẻ đó, cho đến khi giải thuật nhìn một lần (You Only Look Once

-YOLO) ra đời You Only Look Once lần lượt có các phiên bản 1, 2 (YOLO Version 1, 2) và hiện nay là You Only Look Once phiên bản 3 (YOLO Version 3) có khả năng gán

nhãn cho toàn bộ đối tượng trong khung hình với chỉ duy nhất một hoạt động Có thể nói,

You Only Look Once đã xây dựng một hướng tiếp cận đầu tiên giúp đưa nhận dạng đối

tượng theo thời gian thực (Real-Time Object Detection) thực sự khả thi áp dụng thực tếtrong cuộc sống

Đối với mạng nơ-ron tích chập (Convolutional Neural Network - CNN) là một trong những mô hình học sâu (Deep Learning) tiên tiến giúp cho chúng ta xây dựng

được những hệ thống thông minh với độ chính xác cao như hiện nay và còn là một môhình xử lý thông tin phỏng theo cách thức xử lý thông tin của các hệ nơ-ron sinh học Nóđược tạo nên từ một số lượng lớn các phần tử (nơ-ron) kết nối với nhau thông qua cácliên kết (trọng số liên kết) làm việc như một thể thống nhất để giải quyết một vấn đề cụthể nào đó Một mạng nơ-ron nhân tạo được cấu hình cho một ứng dụng cụ thể (nhậndạng mẫu, phân loại dữ liệu, ) thông qua một quá trình học từ tập các mẫu huấn luyện

Về bản chất học chính là quá trình hiệu chỉnh trọng số liên kết giữa các nơ-ron

Trong khuôn khổ luận văn Thạc sỹ của cá nhân, qua việc được trang bị các mônhọc lý thuyết như thuật toán, xử lý ảnh, trí tuệ nhân tạo, tìm kiếm, tôi đã lựa chọn đề tài

“Nghiên cứu ứng dụng kỹ thuật máy học để phân tích hình ảnh và nhận dạng

phương tiện vi phạm Luật giao thông đường bộ” Chủ đề phân lớp dữ liệu là một

nhánh quan trọng trong lĩnh vực máy học (machine learning) của trí tuệ nhân tạo.

Trang 17

Chúng ta có thể kể đến các ứng dụng của máy học trong thực tế như người máy, robot,nhận dạng đối tượng, nhận dạng mặt người, nhận dạng tiếng nói và chữ viết,.Trong đó,

học sâu (Deep learning) với mô hình mạng nơ-ron tích chập theo phương pháp nhìn một lần (Convolutional Neural Network for You Only Look Once - CNNs for YOLO

Object Detection) là một trong những giải thuật của mô hình hệ thống máy học tiên tiến

giúp cho chúng ta xây dựng đựợc những hệ thống thông minh với độ chính xác cao nhưhiện nay Trong khuôn khổ luận văn cao học này, cá nhân tập trung nghiên cứu về mạng

nơ-ron (neural network) cũng như mạng tích chập (Convolution network) theo giải thuật của mô hình mạng nơ-ron tích chập (CNNs) nhằm phân tích lớp ảnh (Image

Classification) và áp dụng trong việc xây dựng hệ thống nhận dạng phương tiện với

phương pháp nhận dạng đối tượng (You Only Look Once) các hành vi vi phạm Luật

giao thông đường bộ [6-9]

1.2 Tính cấp thiết của đề tài

Theo một báo cáo của Liên Hợp Quốc, hơn nửa dân số trái đất hôm nay đã là dân

đô thị, với 54,6% dân số thế giới tương đương 3,6 tỷ người đang sống ở các đô thị,nghiên cứu cho thấy đến năm 2050, tỉ lệ dân cư thành thị sẽ chiếm hơn 70% dân số thếgiới, với 64,1% ở các nước đang phát triển và 85,9% ở các nước phát triển sẽ sống ở cáckhu vực thành thị

Sự tập trung dân số, tốc độ gia tăng của đô thị hóa đã mang lại cho các thành phố

và quốc gia một số thách thức trong việc đáp ứng nhu cầu ngày càng tăng của người dân,như: cơ sở hạ tầng, giao thông, các yêu cầu về nhà ở, năng lượng, an ninh, y tế, giáo dục,môi trường và ứng phó với biến đổi khí hậu, thiên tai cũng như các vấn đề như truyềnthông và giải trí Do đó việc phát triển đô thị trong tương lai có ảnh hưởng lớn tới môitrường, tới việc quản lý và cải thiện chất lượng đô thị, điều này chỉ có thể nắm bắt đượcthông qua việc thay đổi phương thức điều hành của chính quyền, sự tham gia của ngườidân, cũng như sự tham gia của các bên liên quan chịu trách nhiệm quản lý chung Vì vậy,việc định hướng cho phát triển "đô thị truyền thống" hiện nay thành “đô thị thông minh”hơn là một nhu cầu tất yếu mà trong đó bao gồm các ứng dụng về chính quyền điện tử,giao thông thông minh, y tế thông minh, giáo dục thông minh, du lịch thông minh, môitrường thông minh, việc triển khai, áp dụng các hệ thống tự động và kết hợp với Cuộccách mạng công nghiệp lần thứ 4 (CMCN 4.0) bởi các công nghệ chủ chốt của côngnghiệp 4.0 (Trí tuệ nhân tạo - Artificial Intelligence, Chuỗi khối- Blockchain, Dữ liệu lớn

Trang 18

- Big Data, Khai phá dữ liệu và Phân tích dữ liệu - Data Mining and Data Analytics,Internet vạn vật- Internet of Things, Điện toán đám mây- Cloud computing, ) [10].

Xét một cách tổng quan, việc triển khai giao thông thông minh sẽ có 3 giai đoạn.Trong đó bao gồm việc thu thập dữ liệu, xử lý dữ liệu và phân phối lại chúng cho ngườitham gia giao thông Để hoạt động của hệ thống được trơn tru, sẽ cần phải có một trungtâm xử lý nhằm tổng hợp thông tin và tiến hành điều tiết Ở giai đoạn ban đầu, nhữngtrung tâm này được điều hành chủ yếu bởi con người Tuy vậy, với các tiến bộ của trí tuệnhân tạo (AI) sẽ được ứng dụng nhằm thay thế con người trong tương lai

Hệ thống giao thông thông minh (Intelligent Transport Systems - ITS) không phải

là điều gì quá mới mẻ Ý tưởng về hệ thống này đã được khởi xướng từ những năm 60,

70 của thế kỷ trước tại Mỹ và các nước Châu Âu Đến nay, mô hình này đã được áp dụngthành công tại nhiều thành phố lớn trên thế giới [11]

Tại các nước châu Á, Hàn Quốc chính là quốc gia đi tiên phong trong việc ứngdụng công nghệ nhằm phát triển Hệ thống giao thông thông minh Seoul (Hàn Quốc)được nhận định là thành phố có hệ thống giao thông thông minh tốt nhất thế giới

Tại thành phố Seoul - Hàn Quốc, chính phủ thiết lập một hệ thống vận hành giaothông có tên TOPIS Khi truy nhập vào hệ thống này, người dân sẽ được cung cấp cácthông tin liên quan đến tình trạng giao thông Với những người đang chờ xe buýt, thôngtin này bao gồm cả vị trí cụ thể của chuyến xe đang tới, thời gian dự kiến sẽ tới bến vàlượng ghế còn trống trên xe là bao nhiêu

Trang 19

Tại Việt Nam, cùng với các kinh nghiệm đã triển khai trên thực tế trong các nămvừa qua của các địa phương trong cả nước như thành phố Hà Nội, thành phố Hồ ChíMinh, Đồng Nai, Kiên Giang, Quảng Nam, Đà Nẵng, Thừa Thiên Huế, Quảng Ninh việc trang bị hệ thống Camera giám sát giao thông thông minh nhằm mục đích nâng caonăng lực giám sát, kiểm soát và xử lý các vi phạm trật tự an toàn giao thông đường bộ đãmang lại những hiệu quả tích cực Bên cạnh việc giảm thiểu các tai nạn giao thông, tìnhhình an ninh trật tự được đảm bảo, ý thức tự giác chấp hành pháp luật của người tham giagiao thông được nâng cao.

Tỉnh Bà Rịa - Vũng Tàu là một tỉnh ven biển thuộc vùng Đông Nam Bộ, nằmtrong vùng kinh tế trọng điểm phía Nam, có tổng diện tích tự nhiên là 1.980,98 km2, dân

số khoảng trên 1,3 triệu người, cũng nằm trong xu thế xây dựng đô thị hướng đến thôngminh đang được quan tâm và thúc đẩy Có thể nói, đô thị thông minh được coi là lựachọn tất yếu, phù hợp với xu thế phát triển chung của thế giới cũng như khả năng tiếp cậncủa Việt Nam Bà Rịa - Vũng Tàu được đánh giá là một trong những địa phương có hệthống giao thông đường biển, đường hàng không và đường bộ với kết cấu hạ tầng giaothông khá hiện đại Trong đó, đường bộ là đầu mối giao thông quan trọng với 3 tuyếnquốc lộ chính gồm QL51, QL55, QL56 Quốc lộ 51 và là trục giao thông chính của vùngKinh tế trọng điểm phía Nam, nối liền với phố TP Hồ Chí Minh, Tp Biên Hòa và Tp.Vũng Tàu Quốc lộ 55, chạy từ Tp Bà Rịa đi Tp Phan Thiết nối với các tỉnh duyên hảiĐông Nam Bộ, có giá trị giao thông liên vùng, nối vùng Nam Trung Bộ với miền Đông.Quốc lộ 56 là trục đường giao thông nối Tp Bà Rịa tỉnh Bà Rịa - Vũng Tàu và vùng kinh

tế trọng điểm phía Nam với Tây Nguyên Từ QL56 có thể đi thẳng qua TX Long Khánh

đi Tp Đà Lạt (Lâm Đồng) Ngoài ra tỉnh Bà Rịa - Vũng Tàu có rất nhiều tuyến đườngtỉnh kết nối đi các huyện, thị xã và thành phố

Theo số liệu tổng hợp, đến cuối tháng 9/2020 trên địa bàn tỉnh đã xảy ra 285 vụ tai nạngiao thông, hậu quả làm 120 người chết và 213 người bị thương Trong đó có 28 vụ tainạn giao thông tự gây, làm 31 người chết và 04 người bị thương So với cùng kỳ năm

2018, số vụ tai nạn giao thông giảm 02 vụ, số người chết giảm 06 người, số người bịthương giảm 55 người Tuy số vụ TNGT, số người chết và bị thương đều giảm so vớicùng kỳ nhưng con số thống kê cho thấy vẫn ở mức cao và tiềm ẩn diễn biến phức tạp.Nguyên nhân chủ yếu là do một bộ phận người tham gia giao thông 20

Trang 20

chưa ý thức trong việc chấp hành pháp luật giao thông đường bộ, còn đối phó, chưa tựgiác, vi phạm về trật tự - an toàn giao thông (TT-ATGT) vẫn còn phổ biến, đặc biệt là cáchành vi vi phạm như: điều khiển phương tiện tham gia giao thông không đúng tốc độ quyđịnh, điều khiển phương tiện tham gia giao thông không đúng phần làn/chiều đướng theoquy định, không chấp hành hiệu lệnh của tín hiệu giao thông, phương tiện tham gia giaothông quá khổ - quá tải, phương tiện tham gia giao thông chở quá số lượng người quyđịnh [12-13]

Bên cạnh đó, giao thông luôn là một vấn đề được quan tâm nhiều nhất đối với các

đô thị lớn ở các nước nói chung và ở Việt Nam nói riêng Trong những năm gần đây tìnhtrạng tắc đường, kẹt xe, tai nạn và vi phạm Luật giao thông đường bộ vẫn luôn là vấn đềrất nghiêm trọng và cấp bách Đây được xem là vấn đề bức xúc của toàn xã hội, ảnhhưởng đến sự phát triển bền vững về kinh tế, văn hóa, xã hội và hình ảnh của đất nướcViệt Nam với bạn bè Quốc tế

Hiện nay, mặc dù đã có những nghiên cứu, nhiều giải pháp, cũng như các ý tưởngmới của các nhà khoa học, các chuyên gia hàng đầu trong nước và thế giới về việc hỗ trợ,giảm thiểu tình trạng tắc đường, kẹt xe, tai nạn và các hành vi vi phạm Luật giao thôngđường bộ nhưng hiệu quả vẫn chưa cao và tình trạng vẫn diễn ra thường xuyên trên cáctrục đường giao thông, đặc biệt là ở các khu đô thị

Xuất phát từ nhu cầu thực tiễn, vì vậy tôi chọn vấn đề “Nghiên cứu ứng dụng kỹ

thuật máy học để phân tích hình ảnh và nhận dạng phương tiện vi phạm Luật giao thông đường bộ” làm đề tài nghiên cứu nhằm phát hiện, nhận dạng và xử lý các hành vi

vi phạm trật tự an toàn giao thông, góp phần giảm thiểu ùn tắc, tai nạn cho người vàphương tiện tham gia giao thông Đồng thời giúp công tác tuần tra kiểm soát trật tự, anninh và phát hiện kịp thời, có chứng cứ pháp lý về hình ảnh nhằm cung cấp cho lực lượngchức năng khi điều tra các vụ việc xảy ra trên đường góp phần đảm bảo an ninh trật tự xãhội là cần thiết Kết quả thực hiện đề tài dự kiến sẽ được đưa vào áp dụng thực tế trên địabàn tỉnh Bà Rịa - Vũng Tàu sau khi hoàn thành nghiên cứu luận văn

2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG NGHIÊN CỨU

- Mục tiêu tổng quát: Nghiên cứu ứng dụng kỹ thuật máy học để xây dựng mô

hình phục vụ theo dõi, giám sát tình trạng giao thông đường bộ, tự động phát hiện, ghinhận, phân tích hình ảnh đối tượng và nhận dạng phương tiện về các hành vi vi phạm

Trang 21

Luật giao thông đường bộ theo thời gian thực với độ chính xác cao tại một nút giao lộ, từ

đó có thể xử phạt nhằm nâng cao ý thức về an toàn giao thông của người dân, đảm bảotrật tự an toàn xã hội

- Mục tiêu cụ thể: Theo dõi, giám sát tình trạng giao thông đường bộ, tự động

phát hiện, ghi nhận, phân tích hình ảnh đối tượng và nhận dạng biển số phương tiện vàcác hành vi vi phạm Luật giao thông đường bộ theo thời gian thực tại một nút giao lộ cụthể sau:

(1) Chở quá số người quy định khi tham gia giao thông

(2) Không đội mũ bảo hiểm khi điều khiển xe mô tô, xe gắn máy

Hình 1: Mô hình nút giao lộ (ngã tư) triển khai xây dựng mô hình nghiên cứu

2.2 Đối tượng

Đối tượng nghiên cứu chính là các loại phương tiện tham gia giao thông đường bộtheo quy định của Luật giao thông đường bộ áp dụng đối với hành vi vi phạm theo mụctiêu đề tài nghiên cứu đề ra đó là:

- Thu thập, xây dựng bộ dữ liệu ảnh các phương tiện giao thông đường bộ cho hệthống giám sát

- Một số mô hình mạng nơ-ron và nơ-ron tích chập đang được sử dụng phổ biếntrong lĩnh vực nhận dạng

- Ứng dụng kỹ thuật máy học trong lĩnh vực trí tuệ nhân tạo để phát hiện, ghi nhận

và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu để phân lớp đối tượng quantâm với các đối tượng ảnh còn lại

- Phương pháp trích xuất điểm đặc trưng đối tượng, phương tiện theo mô hìnhmạng nơ-ron tích chập theo phương pháp phát hiện đối tượng nhìn chỉ một lần

2.3 Phạm vi

- Xây dựng bộ mẫu dữ liệu nghiên cứu, thử nghiệm với số lượng 500 mẫu là ảnh

Trang 22

các đối tượng vể phương tiện tham gia giao thông Những ảnh này dùng để phát hiệnvùng chứa biển số theo cách tiếp cận của phương pháp hình thái học để phát hiện vùngbiển số cho các biển đăng ký xe của Việt Nam

- Tập trung nghiên cứu kỹ thuật máy học trong lĩnh vực trí tuệ nhân tạo để pháthiện, ghi nhận và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu nhằm phân lớpđối tượng quan tâm với các đối tượng ảnh còn lại, cụ thể hơn là công việc cần phải giảiquyết vấn đề phát hiện vùng chứa biển số xe và nhận dạng ký tự trong biển số với môhình mạng nơ-ron tích chập để tiến hành nhận dạng biển số xe vi phạm Luật giao thôngđường bộ

2.4 Nội dung nghiên cứu

- Nghiên cứu xây dựng hệ thống phát hiện, ghi nhận và phân vùng đối tượng ảnh

dựa trên các bộ thư viện cài đặt cho mô hình, giải thuật học sâu (deep learning).

- Sử dụng công cụ, mô hình mạng nơ-ron tích chập (CNNs) nhằm phân tích lớp ảnh (Image Classification) áp dụng trong việc xây dựng hệ thống tự động nhận dạng

phương tiện và các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực

- Huấn luyện và xây dựng nhận dạng đối tượng về các hành vi vi phạm Luật giaothông đường bộ

- Tìm hiểu tổng quan về hệ thống kỹ thuật máy học (machine learning) trong lĩnh vực trí tuệ nhân tạo (AI) để phát hiện, ghi nhận và phân vùng đối tượng ảnh dựa trên các giải thuật học sâu (deep learning) để phân lớp đối tượng quan tâm với các đối tượng ảnh

Trang 23

cho hệ thống

- Xây dựng phần mềm ứng dụng điều khiển hệ thống thông minh kết hợp quản lý

và in ấn bằng chứng hình ảnh vi phạm chạy trên nền tảng website

- Ứng dụng trí tuệ nhân tạo (AI) để tự động học và nhận diện các lỗi hành vi viphạm giao thông từ các dữ liệu vi phạm ban đầu và nhận dạng các lỗi vi phạm có độchính xác ngày càng cao hơn từ các dữ liệu vi phạm trước đó

- Xây dựng quy trình vận hành khai thác, xây dựng các kịch bản nhằm tổ chứctriển khai thu thập bộ dữ liệu mẫu tại mô hình thực tế

- Xây dựng bộ cơ sở dữ liệu điện toán đám mây có khả năng lưu trữ dữ liệu lớn vềcác hình ảnh bằng chứng vi phạm và thông tin của các phương tiện tham gia giao thông

vi phạm

- Nghiên cứu thực hiện thông qua các hình ảnh thực nhằm xác định, đánh giá kếtquả cuối cùng và đưa ra các dự báo

Để đảm bảo thực hiện xây dựng đầy đủ mô hình hệ thống tự động phát hiện, ghinhận, phân tích hình ảnh đối tượng và nhận dạng phương tiện và các hành vi vi phạmLuật giao thông đường bộ theo thời gian thực Đề tài nghiên cứu đề xuất thực hiện theohai bước cụ thể sau:

- Bước 1- Huấn luyện: Sử dụng bộ dữ liệu trên cơ sở các kịch bản, diễn tập, huấnhuyện và thu thập ảnh đối tượng động từ hệ thống camera lắp sẵn đưa vào huấn luyện,thử nghiệm để đưa ra mô hình nhận dạng và đánh giá kết quả

- Bước 2 - Thử nghiệm: Sử dụng mô hình vừa huấn luyện được ở trên thông quahình ảnh giao thông để thực hiện các giải thuật phân lớp đối tượng trên dữ liệu mới vàđánh giá kết quả

3 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU

Nghiên cứu xây dựng hệ thống giám sát ngã tư thông minh tại 01 điểm giao lộđường Huỳnh Minh Thạnh và 27/4 thuộc thị trấn Phước Bửu, huyện Xuyên Mộc, tỉnh BàRịa - Vũng Tàu đây là dự án sản xuất thử nghiệm cấp tỉnh thực hiện nhiệm vụ khoa học

và công nghệ hàng năm do UBND tỉnh Bà Rịa - Vũng Tàu đặt hàng cho Trung tâm Ứngdụng tiến bộ khoa học và công nghệ chủ trì thực hiện Mục tiêu dự án SXTN đã nêu trênvới giải pháp là thiết kế lắp đặt trên nền tảng công nghệ sẵn có vi xử lý AVR Atmel 8-bit,hoặc ARM Atmel 32-bit thông qua bản mạch Arduino và thực thi chương trình được nạp

Trang 24

sẵn cho bộ xử lý trung tâm đặt tại giao lộ cần quan sát, bộ xử lý này tiếp nhận thông tin từcác camera được kết hợp với các cảm biến laser và camera giám sát hình ảnh phương tiệntham gia giao thông Nhận dạng hành vi vi phạm và lưu trữ thông tin trên hệ thống dữliệu điện toán đám mây thông qua sóng 3G Thông qua phần mềm ứng dụng có thể xâydựng kịch bản cho hệ thống tự động điều khiển và xử lý thông tin tiếp nhận từ các thiếtbị

Hệ thống nhận dạng biển số xe: Bộ thư viện OpenCV - đây là bộ thư viện đượcIntel và Itseez phát triển trong hơn 20 năm qua với hơn 2.500 thuật toán nhận dạng khác

nhau, sử dụng máy học (machine learning).

Hình 2: Sơ đồ nhận dạng biển số xe

Trang 25

Hệ thống nhận dạng người tham gia giao thông: IOT Core và Azure đảm nhậnviệc có bao nhiên người tham gia giao thông tại thời điểm đó, từ đó biết được trên mộtphương tiện xe máy có bao nhiêu người, đặc điểm của họ, phân tích các hành vi tại thờiđiểm đó để kiểm tra xem họ có chấp hành đúng luật giao thông hay không

Detection Result:

2 faces detected ISON:

[ {

"scores": {

"anger": 0.00901619889,

"contempt": 9.008121588469,

"disgust": 9.9996216889184, "fear": 6.09138592813, "happiness": 8.96891577913, "neutral":

9.992224847, "sadness":

9.89889309449252, "surprise": e.996211

}

Hình 3: Nhận dạng khuôn mặt người trong ảnh

Từ đó, có thể nhận thấy cần phải thay đổi ứng dụng giải pháp công nghệ vào việcgiám sát hành vi của người tham gia giao thông nhằm phát hiện, ghi nhận và phân vùng

đối tượng ảnh dựa trên các giải thuật học sâu (deep learning) để phân lớp đối tượng quan tâm với các đối tượng ảnh còn lại, đặc biệt với thông qua các kỹ thuật học sâu (Deep

learning) với mô hình mạng nơ-ron tích chập theo phương pháp nhìn một lần

(Convolutional Neural Network for You Only Look Once - CNNs for YOLO Object

Detection) nhằm phân tích đối tượng áp dụng trong việc xây dựng hệ thống tự động nhận

dạng phương tiện và các hành vi vi phạm Luật giao thông đường bộ theo thời gian thực làcấp bách và cần thiết phù hợp với xu hướng công nghệ mới, tiên tiến hơn, tốt hon,

Việc ứng dụng của công nghệ phân loại hiện nay đang phát triển rất mạnh ở rấtnhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế ) và các đối tượng (nhà nghiên cứu

xã hội, chính phủ và các tổ chức phi lợi nhuận khác) Vì các tổ chức này sở hữu một

Trang 26

lượng lớn dữ liệu không có cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiềunếu như các dữ liệu này được chuẩn hóa bởi các chủ đề/nhãn Nền tảng công nghệ đểthực hiện bài toán phân loại văn bản chính là trí tuệ nhân tạo (Artificial Intelligence - AI)

áp dụng giải thuật học sâu (Deep Learning) với mô hình mạng nơ- ron được áp dụng như:

- Nghiên cứu của ông Andrews Sobral: Ông Andrews Sobral và cộng sự đã

nghiên cứu nhận diện phương tiện qua phương pháp Haar Cascades using OpenCV.Nghiên cứu sử dụng thư viện thị giác máy tính mã nguồn mở JavaScript và OpenCV đểnhận diện hình ảnh được truy cập vào webcam

- Nghiên cứu nhận diện và theo dõi xe sử dụng OpenCV và Kalman Filter: Ông

Ronit Sinha và cộng sự sử dụng OpenCV và Kalman Filter để nhận diện và theo dõi xe từluồng trực tuyến của Camera giao thông Bộ lọc OpenCV và Kalman sẽ phát hiện và theodõi xe ô tô từ video được phát trực tiếp từ camera

- Nghiên cứu về nhận diện vật thể bằng thuật toán YOLO: Yolo được Redmon và

Farhadi phát triển vào năm 2015, trong thời gian học tiến sĩ YOLO (‘You only lookonce”) là một thuật toán nhận diện phổ biến nhờ độ chính xác cao trong thời gian thực,đạt đến 45 khung hình trên giây

- Nghiên cứu nhận diện phương tiện và hướng đi (Vehicle Detection for

Autonomous Driving): Ông Junsheng Fu và cộng sự đã sử dụng các công cụ, bao gồm

OpenCV3, Python3.5, tensorflow, CUDA8 OS: Ubuntu 16.04 Có 2 hướng đi: SVMtuyến tính và mạng nơ-ron

Ở Việt Nam, cộng đồng nghiên cứu trí tuệ nhân tạo xử lý ngôn ngữ tự nhiên để ápdụng vào bài toán xử lý tiếng Việt đang rất phát triển Do đặc thù của tiếng Việt và sựkhác biệt về bộ ngôn ngữ trong các thư viện, công cụ hỗ trợ, nên cộng đồng các nhànghiên cứu trí tuệ nhân tạo (AI) của Việt Nam đã xây dựng và phát triển một số các thuậttoán, thư viện và công cụ dành riêng cho tiếng Việt Một số doanh nghiệp và trường đạihọc hoạt động trong lĩnh vực công nghệ thông tin đã và đang nghiên cứu đưa bài toánphân loại văn bản vào ứng dụng thực tế như: Framgia, Đại học Lê Quý Đôn, FPT, Đạihọc Khoa học Công nghệ thuộc Đại học Quốc gia Việt Nam, Còn trong lĩnh vực quân

sự, do là là môi trường đặc thù, vì vậy, việc thu thập thông tin trên các trang báo điện tử,diễn đàn, mạng xã hội, để theo dõi tình hình, nắm bắt thông tin là một trong nhữngnhiệm vụ mới, quan trọng trên không gian mạng Do lượng thông tin thu thập được quamạng Internet là rất lớn, nên đã đặt ra yêu cầu phân tích và xử lý lượng dữ liệu khổng lồtrên một cách tự động và nhanh chóng

Trang 27

Tại các nước châu Á, Hàn Quốc chính là quốc gia đi tiên phong trong việc ứngdụng công nghệ nhằm phát triển Hệ thống giao thông thông minh Seoul (Hàn Quốc)được nhận định là thành phố có hệ thống giao thông thông minh tốt nhất thế giới.

Hoặc như Singapore với chiến lược “Quốc gia thông minh” được khởi động từtháng 11 năm 2014, đề án Quốc gia thông minh của Singapore được xây dựng trên nềntảng đặt người dân làm trung tâm, sử dụng công nghệ để giải quyết các vấn đề và tháchthức của đô thị Sáng kiến này nêu rõ: “Singapore nỗ lực để trở thành một quốc gia thôngminh nhằm hỗ trợ người dân sống tốt hơn, cộng đồng mạnh mẽ hơn và tạo nhiều cơ hộihơn cho tất cả mọi người” Thông qua đề án này, Singapore đã và đang hình thành mộtnền văn hóa quốc gia xung quanh việc khuyến khích thực nghiệm, nuôi dưỡng tinh thầnsáng tạo và triển khai những ý tưởng mới ICT là cốt lõi để thực hiện mục tiêu Quốc gia

thông minh, trong đó tập trung vào 3 ưu tiên: công nghệ hỗ trợ xã hội; di động và giao

thông thông minh; môi trường dữ liệu an toàn Chính phủ cũng cam kết hằng năm đầu

tư khoảng 1% GDP cho nghiên cứu và phát triển

Trải qua hơn 2 năm vận hành, đến nay, Singapore đã triển khai được các giải phápthông minh trong lĩnh vực nhà ở, điều khiển giao thông, xe tự lái, quan trắc môi trường,thanh toán không dùng tiền mặt, các công nghệ hỗ trợ tự hành/người máy, y tế từ xa,công cụ tiếp nhận ý kiến người dân, và hệ thống cơ sở dữ liệu mở Song song đó,Singapore tiếp tục duy trì và mở rộng hoạt động hỗ trợ khởi nghiệp nhằm có thể đảm bảonguồn cung cho các ứng dụng thông minh trong tương lai

Tại Trung Quốc áp dụng mô hình mạng nơ-ron tích chập theo phương pháp nhìn

một lần (Convolutional Neural Network for You Only Look Once - CNNs for

YOLO Object Detection) xây dựng hệ thống theo dõi người dân của Trung Quốc, từ đó

có thể giúp chính quyền xác định được tội phạm lẫn trốn ở đó hay không, hoặc hệ thống

xe tự lái, cũng phải xác định được người đi đường ở đâu từ đó đưa ra quyết định dichuyển tiếp theo

Trang 28

Hai là, thực trạng nghiên cứu áp dụng hiện nay tại Việt Nam:

- Việc triển khai nghiên cứu áp dụng trí tuệ nhân tạo (AI) trong việc xây dựngthành phố thông minh đã và đang áp dụng nghiên cứu công nghệ và triển khai cho một sốđịa phương như: thành phố Hà Nội, thành phố Hồ Chí Minh, thành phố Đà Nẵng, BìnhDương, Đồng Nai, Kiên Giang, Quảng Nam, Thừa Thiên Huế, Quảng Ninh, tập trungchủ yếu vào các vấn đề chính cụ thể như: xây dựng hạ tầng mạng kết nối trên toàn thànhphố để phục vụ nhu cầu kết nối, chia sẻ thông tin của chính quyền, doanh nghiệp, ngườidân, du khách và truyền dẫn cho các ứng dụng thành phố thông minh hơn; Hệ thống giaothông thông minh: ứng dụng CNTT-TT vào công tác quản lý giao thông đô thị của thànhphố một cách chủ động và hiệu quả hơn; Hệ thống cấp nước thông minh: ứng dụngCNTT-TT để nâng cao chất lượng xử lý và phân phối nước sạch cho người dân Riêngtỉnh Bà Rịa - Vũng Tàu ngày 13/12/2019 Hội đồng nhân dân tỉnh đã thông qua Nghịquyết số 112/NQ-HĐND về Đề án phát triển đô thị thông minh tỉnh Bà Rịa - Vũng Tàugiai đoạn 2020-2022, định hướng đến 2025, tầm nhìn đến 2030 với mục tiêu phát triển thíđiểm đô thị thông minh bền vững tỉnh Bà Rịa - Vũng tàu giai đoạn đến 2030 hướng tớităng trưởng xanh, phát triển bền vững; ứng dụng thành tựu khoa học công nghệ hiện đại,tối ưu hóa cơ sở dữ liệu hạ tầng kỹ thuật và hạ tầng ICT phát triển đô thị thông minhnhằm phát huy tiềm năng lợi thế, khai thác hiệu quả tài nguyên, con người, nâng cao chấtlượng cuộc sống nhân dân, đồng thời tạo điều kiện để các tổ chức, cá nhân tham gia đầu

tư xây dựng cơ sở vật chất kỹ thuật phát triển đô thị thông minh; hạn chế các rủi ro vànguy cô tiềm năng; nâng cao hiệu quả quản lý nhà nước và các dịch vụ đô thị; nâng caosức cạnh tranh của nền kinh tế và hội nhập, góp phần thắng lợi các mục tiêu kinh tế - xãhội, an ninh quốc phòng tại địa phương

- Nghiên cứu phát hiện làn đường, ôtô và người đi bộ bằng công nghệ ảnh hỗ trợcho ôtô tự hành của hai tác giả Trương Quốc Bảo, Trương Quốc Định - Trường Đại họcCần Thơ

- Các nhà khoa học thuộc Khoa Điện - Điện tử, Trường Đại học Giao thông Vậntải đã nghiên cứu thiết kế và chế tạo thành công hệ thống giám sát giao thông ứng dụngcông nghệ xử lý ảnh Hệ thống bao gồm camera giám sát, camera chụp hình, mạng truyềnthông, video server, phần mềm xử lý ảnh và cơ sở dữ liệu có thể tự động phát hiện và ghinhận các tình huống vi phạm Luật Giao thông nhằm tăng cường giám sát, phát hiện và xử

lý kịp thời các vi phạm, hạn chế tai nạn và nâng cao ý thức chấp hành của người tham giagiao thông[8-11]

Trang 29

đề cần được tiếp tục nghiên cứu hoàn thiện

Đầu vào mô hình là một bức ảnh, đối với bài toán nhận dạng, chúng ta không chỉphải phân loại được đối tượng (object) trên bức ảnh mà còn phải định vị được vị trí củađối tượng đó và mỗi lần thực hiện tốn rất nhiều thời gian Do đó:

- Tốn rất nhiều tài nguyên để tính toán cho mọi vùng trên một bức ảnh và do đókhông thể thực hiện theo thời gian thực (realtime) trên các thiết bị yếu

- Ảnh phương tiện lưu thông vào ban đêm hay trong bóng tối nếu thiết bị ghi hìnhkhông có đèn flash thì khả năng nhận dạng thấp do thiếu sáng

- Không thể nhìn thấy các đối tượng nhỏ, các đối tượng quá gần sát nhau; khôngthể khái quát các đối tượng nếu hình ảnh có kích thước khác so với hình ảnh đào tạo,huấn luyện

- Tỷ lệ nhận dạng còn phụ thuộc nhiều vào điều kiện ánh sáng, phản chiếu, độ chebóng và điều kiện môi trường

- Với những biển số trên phương tiện giao thông có đường viền phức tạp thì mức

độ nhận dạng không cao Chỉ giới hạn ảnh chụp trong góc 40 độ để nhận dạng được tốt,nếu góc lớn hơn thì khả năng nhận dạng sẽ giảm

- Đặc biệt, đối với Việt Nam rất đa dạng các loại phương tiện giao thông (ô tô, xemáy, xe lam, xe ba bánh, xe đạp, người đi bộ, ), các vật thể (mũ bảo hiểm, ô dù, điệnthoại, đèn tín hiệu), các hành vi và tình trạng giao thông (tai nạn giao thông, tắc đường,đua xe, lạng lách,.)

- Chuẩn hóa hàng loạt ở các lớp tích chập, làm giảm sự thay đổi giá trị trong cáclớp ẩn, cải thiện tính ổn định của mạng lưới

- Việc tăng kích thước đầu vào của hình ảnh đã cải thiện (độ chính xác trung bình)tăng lên

- Thực hiện phân loại và dự đoán trong một khung duy nhất Các khung tâm vàkhung ranh giới; khung tâm chịu trách nhiệm dự đoán khung ranh giới và các khung tâmđược thiết kế cho một tập dữ liệu nhất định bằng cách sử dụng thuật toán phân cụm (k-means clustering)

- Đối với việc phát hiện các vật nhỏ trên hình ảnh khắc phục bẳng cách chia hìnhảnh thành các ô lưới nhỏ hơn so với nghiên cứu trước đó Điều này cho phép các nghiên

Trang 30

dự đoán các đối tượng từ các kích thước đầu vào khác nhau với độ chính xác cao.

- Nghiên cứu theo hướng ứng dụng trong việc sử dụng kiến trúc mạng Darknet 19với 19 lớp chập và 5 lớp max-pooling và một lớp softmax cho việc phân loại đối tượng

- Nâng cao hiệu quả chương trình, tách ly các kí tự trong biển số trong các trườnghợp biển số bị nhiều nhiễu, mất mát thông tin do nhiễu từ điều kiện môi trường, tìm vùngbiển số trong ảnh có độ tương phản giữa biển số và nền thấp Đặc biệt là biển xe có nềnmàu đỏ chữ trắng hoặc nền màu vàng chữ trắng

- Phát triển chương trình thành module phần cứng Có khả năng tương thích vớicác thiết bị quan sát như camera Kết hợp quản lý và in ấn bằng chứng hình ảnh vi phạmchạy trên nền tảng website

- Cần trang bị hệ thống camera có độ phân giải cao cho hình ảnh biển số xe rõ néttrong điều kiện ánh sáng ban ngày, ban đêm hay với thời tiết mưa, bão; Có cấu hình phùhợp cho việc chụp ảnh khi xe di chuyển với tốc độ cao kết hợp công nghệ nhận dạng mộtcách chính xác

4 CẤU TRÚC LUẬN VĂN

Luận văn thạc sỹ cá nhân biên soạn bao gồm 6 mục và 4 chương với nội dung tómtắt như sau:

1 GIỚI THIỆU

2 MỤC TIÊU, ĐỐI TƯỢNG, PHẠM VI, NỘI DUNG VÀ HƯỚNG

NGHIÊN CỨU

3 TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU

4 CẤU TRÚC LUẬN VĂN

- Chương 1 Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật

về kỹ thuật học máy và kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng

- Chương 2 Tổng quan về giao thông

Trang 32

5 NGHIÊN CỨU TỔNG QUAN VÀ PHÂN TÍCH BÀI TOÁN Chương 1 Các khái niệm, tổng quan về trí tuệ nhân tạo, học máy, các giải thuật về học máy và kỹ thuật áp dụng cho phát hiện, nhận dạng đối tượng

1 Khái niệm chung [6-9, 16, 17, 31]

Xử lý ảnh là phương pháp chuyển đổi hình ảnh sang dạng số và thực hiện một sốhoạt động trên đó để nâng cao chất lượng hình ảnh hoặc để trích xuất một số thông tinhữu ích từ hình ảnh đó

Có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc

tự động hóa các hành vi thông minh [12]

Học máy là một ứng dụng trí tuệ nhân tạo cung cấp cho hệ thống khả năng tựđộng học hỏi và cải thiện hiệu suất, độ chính xác dựa trên những kinh nghiệm từ dữ liệuđầu vào Máy học là tập trung vào việc phát triển các phần mềm, chương trình máy tính

có thể truy cập vào dữ liệu và tận dụng nguồn dữ liệu đó để tự học

Học sâu là một chức năng của trí tuệ nhân tạo (AI), bắt chước hoạt động của bộnão con người trong việc xử lí dữ liệu và tạo ra các mẫu để sử dụng cho việc ra quyếtđịnh Học sâu là tập con của học máy trong trí tuệ nhân tạo, có các mạng lưới có khảnăng "học" mà không bị giám sát từ dữ liệu không có cấu trúc hoặc không được gắn nhãn[17]

Là một chuỗi các thuật toán được đưa ra để nỗ lực tìm kiếm các mối quan hệ cơbản trong một tập hợp dữ liệu, thông qua quá trình bắt chước cách thức hoạt động của bộnão con người

2 Tổng quan về trí tuệ nhân tạo [6-9, 21]

- Hiện nay cả thế giới đang đứng trên cuộc cách mạng công nghiệp 4.0 và trí tuệnhân tạo biết đến như chiếc chìa khóa để biến những ý nghĩ của con người thành hiện

thực Trí tuệ nhân tạo hay trí thông minh nhân tạo (Artificial intelligence -AI) là một

Trang 33

ngành thuộc lĩnh vực khoa học máy tính (Computer science) Là trí tuệ do con người lập

trình tạo nên với mục tiêu giúp máy tính có thể tự động hóa các hành vi thông minh nhưcon người Trí tuệ nhân tạo khác với việc lập trình logic trong các ngôn ngữ lập trình là ở

việc ứng dụng các hệ thống học máy (machine learning) để mô phỏng trí tuệ của con

người trong các xử lý mà con người làm tốt hơn máy tính Cụ thể, trí tuệ nhân tạo giúpmáy tính có được những trí tuệ của con người như: biết suy nghĩ và lập luận để giải quyếtvấn đề, biết giao tiếp do hiểu ngôn ngữ, tiếng nói, biết học và tự thích nghi, Tuy rằng tríthông minh nhân tạo có nghĩa rộng như là trí thông minh trong các tác phẩm khoa họcviễn tưởng, nó là một trong những ngành trọng yếu của tin học Trí thông minh nhân tạoliên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thông minh của máv móc

- Thành phần công nghệ trí tuệ nhân tạo được chia làm 4 nhóm chính cụ thể sau:(1) Nhóm 1: Công nghệ trí tuệ nhân tạo phản ứng có khả năng phân tích nhữngđộng thái khả thi nhất của chính mình và của đối thủ, từ đó, đưa ra được giải pháp tối ưunhất

Ví dụ: Điển hình của công nghệ trí tuệ nhân tạo phản ứng là Deep Blue Đâv làmột chương trình chơi cờ vua tự động, được tạo ra bởi IBM, với khả năng xác định cácnước cờ đồng thời dự đoán những bước đi tiếp theo của đối thủ Thông qua đó, DeepBlue đưa ra những nước đi thích hợp nhất

(2) Nhóm 2: Công nghệ trí tuệ nhân tạo với bộ nhớ hạn chế là khả năng sử dụngnhững kinh nghiệm trong quá khứ để đưa ra những quvết định trong tương lai Côngnghệ AI nàv thường kết hợp với cảm biến môi trường xung quanh nhằm mục đích dựđoán những trường hợp có thể xảv ra và đưa ra quvết định tốt nhất cho thiết bị

Ví dụ: Đối với xe không người lái, nhiều cảm biến được trang bị xung quanh xe

và ở đầu xe để tính toán khoảng cách với các xe phía trước, công nghệ AI sẽ dự đoán khảnăng xảv ra va chạm, từ đó điều chỉnh tốc độ xe phù hợp để giữ an toàn cho xe

Hình 4: Ứng dụng công nghệ trí tuệ nhân tạo với bộ nhớ hạn chế

(3) Nhóm 3: Lý thuyết trí tuệ nhân tạo này có thể học hỏi cũng như tự suy nghĩ,sau đó áp dụng những gì học được để thực hiện một việc cụ thể Hiện nay, công nghệ AI

Trang 34

này vẫn chưa trở thành một phương án khả thi.

(4) Nhóm 4: Công nghệ trí tuệ nhân tạo tự nhận thức này có khả năng tự nhậnthức về bản thân, có ý thức và hành xử như con người Thậm chí, chúng còn có thể bộc lộcảm xúc cũng như hiểu được những cảm xúc của con người Đây được xem là bước pháttriển cao nhất của công nghệ AI và đến thời điểm hiện tại, công nghệ này vẫn chưa khảthi

Hình 5: Ứng dụng công nghệ trí tuệ nhân tạo tự nhận thức

- Việc ứng dụng của công nghệ phân loại hiện nay đang phát triển rất mạnh ở rấtnhiều lĩnh vực (học thuật, kinh doanh, bảo mật, y tế, ) và các đối tượng (nhà nghiên cứu

xã hội, chính phủ và các tổ chức phi lợi nhuận khác) Vì các tổ chức này sở hữu mộtlượng lớn dữ liệu không có cấu trúc và việc xử lý dữ liệu sẽ trở nên dễ dàng hơn rất nhiềunếu như các dữ liệu này được chuẩn hóa bởi các chủ đề/nhãn Nền tảng công nghệ đểthực hiện bài toán phân loại văn bản chính là trí tuệ nhân tạo áp dụng giải thuật học sâuvới mô hình mạng nơ-ron điển hình như:

(1) Xử lý ngôn ngữ tự nhiên (Natural Language Processing): xử lý văn bản, giao

tiếp người - máy

(2) Nhận dạng (Patten recognition): nhận dạng tiếng nói, chữ viết tay, vân tay,

thị giác máy, thiên văn học

(3) Máy tìm kiếm như Google, Yahoo, You tube: các hệ thống này sử dụng cáccông cụ của học máy để phát triển hệ thống

(4) Chẩn đoán trong y tế: trợ giúp phân tích ảnh X-quang, các hệ chuyên giachẩn đoán tự động

(5) Tin sinh học: phân loại và dự đoán chuỗi gene, dự đoán tính chất của thuốcmới

(6) Phát hiện gian lận tài chính, gian lận thẻ tín dụng, phát hiện dị thường.(7) Phân tích thị trường chứng khoán

Trang 35

(8) Trò chơi: máy tính chơi cờ Deep blue của IBM chế tạo năm 1998.

(9) Người máy: là tổng hợp của rất nhiều ngành khoa học, trong đó học máy tạonên hệ thần kinh và bộ não của người máy

- Ví dụ như:

(1) Trong ngành vận tải: Trí tuệ nhân tạo được ứng dụng trên những phương

tiện vận tải tự lái, điển hình là ô tô Sự ứng dụng này góp phần mang lại lợi ích kinh tếcao hơn nhờ khả năng cắt giảm chi phí cũng như hạn chế những tai nạn nguy hiểm đếntính mạng Vào năm 2016, Otto, hãng phát triển xe tự lái thuộc Uber đã vận chuyển thànhcông 50.000 lon bia Budweisers bằng xe tự lái trên quãng đường dài 193 km Theo dựđoán của công ty tư vấn công nghệ thông tin Gartner, trong tương lai, những chiếc xe cóthể kết nối với nhau thông qua Wifi để đưa ra những lộ trình vận tải tốt nhất

Hình 6: Ứng dụng công nghệ trí tuệ nhân tạo xe tự lái

(2) Trong sản xuất: Trí tuệ nhân tạo được ứng dụng để xây dựng những quy trình

sản xuất tối ưu hơn Công nghệ AI có khả năng phân tích cao, làm cơ sở định hướng choviệc ra quyết định trong sản xuất

(3) Trong y tế: Ứng dụng tiêu biểu của trí tuệ nhân tạo trong lĩnh vực y tế là máy

bay thiết bị bay không người lái được sử dụng trong những trường hợp cứu hộ khẩn cấp.Thiết bị bay không người lái có tốc độ nhanh hơn xe chuyên dụng đến 40% và vô cùngthích hợp để sử dụng ở những nơi có địa hình hiểm trở

Trang 36

Hình 7: Ứng dụng công nghệ trí tuệ nhân tạo cho thiết bị bay không người lái (4) Trong giáo dục: Sự ra đời của trí tuệ nhân tạo giúp tạo ra những thay đổi lớn

trong lĩnh vực giáo dục Các hoạt động giáo dục như chấm điểm hay dạy kèm học sinh cóthể được tự động hóa nhờ công nghệ AI Nhiều trò chơi, phần mềm giáo dục ra đời đápứng nhu cầu cụ thể của từng học sinh, giúp học sinh cải thiện tình hình học tập theo tốc

độ riêng của mình Trí tuệ nhân tạo còn có thể chỉ ra những vấn đề mà các khóa học cầnphải cải thiện Chẳng hạn như khi nhiều học sinh được phát hiện là gửi đáp án sai cho bàitập, hệ thống sẽ thông báo cho giáo viên đồng thời gửi thông điệp đến học sinh để chỉnhsửa đáp án phù hợp Công nghệ AI còn có khả năng theo dõi sự tiến bộ của học sinh vàthông báo đến giáo viên khi phát hiện ra vấn đề đối với kết quả học tập của học sinh

Hình 8: Ứng dụng công nghệ trí tuệ nhân tạo ROBOT trong day học

Hơn nữa, sinh viên còn có thể học hỏi từ bất cứ nơi nào trên thế giới thông quaviệc sử dụng những phần mềm có hỗ trợ AI Công nghệ AI cũng cung cấp dữ liệu nhằmgiúp sinh viên lựa chọn được những khóa học tốt nhất cho mình

(5) Trong truyền thông: Đối với lĩnh vực truyền thông, sự phát triển của trí tuệ

nhân tạo góp phần làm thay đổi cách thức tiếp cận đối với khách hàng mục tiêu Nhờnhững ưu điểm của công nghệ AI, các công ty có thể cung cấp quảng cáo vào đúng thờiđiểm, đúng khách hàng tiềm năng, dựa trên việc phân tích các đặc điểm về nhân khẩuhọc, thói quen hoạt động trực tuyến và những nội dung mà khách hàng thường xem trênquảng cáo

(6) Trong ngành dịch vụ: Công nghệ AI giúp ngành dịch vụ hoạt động tối ưu hơn

và góp phần mang đến những trải nghiệm mới mẻ hơn và tốt hơn cho khách hàng Thôngqua việc thu thập và phân tích dữ liệu, công nghệ AI có thể nắm bắt thông tin về hành vi

sử dụng dịch vụ của khách hàng, từ đó mang lại những giải pháp phù hợp với nhu cầucủa từng khách hàng [2,7,9]

3 Tổng quan về học máy [6-9, 16-17, 21-23]

Trang 37

3.1 Học máy (Machine Learning)

Là một bộ phận của của trí tuệ nhân tạo (AI), các hệ thống mà sau khi được cungcấp một lượng dữ liệu và thực hiện một hoặc một số thao tác dựa trên những dữ liệu đãđược cung cấp để máy có thể học Machine Learning thường được dùng trong việc xử lýcác tác vụ tương tự con người mà khó có thể mô phỏng thành công thức cụ thể, ví dụ nhưnhận diện, đánh giá lựa chọn,

Học máy thường được áp dùng trong việc xử lý các tác vụ tương tự con người màkhó có thể mô phỏng thành công thức cụ thể, ví dụ như nhận diện, đánh giá lựa chọn,

- Học có giám sát (dạy học): Học có giám sát là một hướng tiếp cận của máy học

để làm cho máy tính có khả năng "học" Trong hướng tiếp cận này, người ta "huấn luyện"máy tính dựa trên những quan sát có dán nhãn Ta có thể hình dung những quan sát nàynhư là những câu hỏi, và nhãn của chúng là những câu trả lời Ý tưởng của học có giámsát là: bằng việc ghi nhớ và tổng quát hóa một số quy tắc từ một tập câu hỏi có đáp ántrước, máy tính sẽ có thể trả lời được những câu hỏi dù chưa từng gặp phải, nhưng cómối liên quan

Ví dụ ta dạy máy tính "1 + 1 = 2" và hy vọng nó sẽ học được phép tính cộng x + 1

và trả lời được là "2 + 1 = 3" Học có giám sát mô phỏng việc con người học bằng cáchđưa ra dự đoán của mình cho một câu hỏi, sau đó đối chiếu với đáp án Sau đó con ngườirút ra phương pháp để trả lời đúng không chỉ câu hỏi đó, mà cho những câu hỏi có dạngtương tự Trong học có giám sát, các quan sát bắt buộc phải được dán nhãn trước Đâychính là một trong những nhược điểm của phương pháp này, bởi vì không phải lúc nàoviệc dán nhãn chính xác cho quan sát cũng dễ dàng Ví dụ như trong dịch thuật, từ mộtcâu của ngôn ngữ gốc có thể dịch thành rất nhiều phiên bản khác nhau trong ngôn ngữcần dịch sang Tuy nhiên, việc quan sát được dán nhãn cũng lại chính là ưu điểm của học

có giám sát bởi vì một khi đã thu thập được một bộ dữ liệu lớn được dán nhãn chuẩn xác,thì việc huấn luyện trở nên dễ dàng hơn rất nhiều so với khi dữ liệu không được dánnhãn

Trang 38

Hình 9: Phương thức học có giám sát

Ví dụ: Trong nhận dạng chữ viết tay,

ta có ảnh của hàng nghìn ví dụ của mỗi chữ

số được viết bởi nhiều người khác nhau

Chúng ta đưa các bức ảnh này vào trong một

thuật toán và chỉ cho nó biết mỗi bức ảnh

tương ứng với chữ số nào Sau khi thuật toán

tạo ra một mô hình, tức một hàm số mà đầu vào là một bức ảnh và đầu ra là một chữ số,khi nhận được một bức ảnh mới mà mô hình chưa nhìn thấy bao giờ, nó sẽ dự đoán bứcảnh đó chứa chữ số nào

6 -g r I ự I b q * 7 ô I 7 3 1 13 / \946í97??

àíê3?3/ế H448-7\O3n?«\/8/7t-Z- ó' 3 3 % á

V Z-ữ Ũ 3 X k / * o Í3 />44JSÌOỚ5 ( ì 3 1 6 / 8

7 7 ỊSt»ịrẠÌiÌ4j9Ìty'Ị lìllĩíĩĩOi-OlĩmL

1l1ỊlrÝìrtìỊi.ịi>33 /03 3 ti>ĩ fry 4 ^7 3/7 X

^(ÍL^34Ị 13 13/ \J/I 5 Ũ7 1 4 8 ỳ X <4 si' 2 J" ụ 0 7 l / ?lĩSĩđílìí3SS5tl)ef <0 4 88 02/ o

6 08 ẽ 7 3 0 2 <í )3fj6i<ì/ 667877 / f</ỹ

Trang 39

Hình 10: Hình mô tả chữ viết tay

Ví dụ này khá giống với cách học của con người khi còn nhỏ Ta đưa bảng chữ cáicho một đứa trẻ và chỉ cho chúng đây là chữ A, đây là chữ B Sau một vài lần được dạythì trẻ có thể nhận biết được đâu là chữ A, đâu là chữ B trong một cuốn sách mà chúngchưa nhìn thấy bao giờ

- Học không giám sát (tự học): Trong thuật toán này, chúng ta không biết được dữ

liệu đầu ra hay nhãn mà chỉ có dữ liệu đầu vào Thuật toán Học không giám sát dựa vào

cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm hoặc giảm

số chiều của dữ liệu để thuận tiện trong việc lưu trữ và tính toán

Một cách toán học, Học không giám sát là khi chúng ta chỉ có dữ liệu vào X mà không

biết nhãn Y tương ứng Những thuật toán loại này được gọi là Học không giám sát vì

không giống như Học có giám sát, chúng ta không biết câu trả lời chính xác cho mỗi dữliệu đầu vào Giống như khi ta học, không có thầy cô giáo nào chỉ cho ta biết đó là chữ A

hay chữ B Cụm không giám sát được đặt tên theo nghĩa này.

A

Hình 11: Phương thức học không giám sát về bài toán phân cụm

- Học bán giám sát (vừa học vừa tự học): Nằm ở đâu đó giữa học tập được giámsát và không giám sát, vì chúng sử dụng cả dữ liệu được gắn nhãn và không dán nhãn đểđào tạo - thường là một lượng nhỏ dữ liệu có nhãn và một lượng lớn dữ liệu không đượcdán nhãn Các hệ thống sử dụng phương pháp này có thể cải thiện đáng kể độ chính xáccủa việc học Thông thường, việc học bán giám sát được chọn khi dữ liệu được dán nhãnđược yêu cầu đòi hỏi tài nguyên có kỹ năng và có liên quan để đào tạo/học hỏi từ nó Nếukhông, dữ liệu được gắn nhãn thường không yêu cầu tài nguyên bổ sung

Trang 40

4 Các giải thuật về máy học [16-17, 21-23]

4.1 Giải thuật Mạng nơ-ron nhân tạo (Artificial Neural Network - ANN)

- Mạng nơ-ron nhân tạo là sự mô phỏng chức năng của hệ thần kinh con ngườivới vô số các nơ-ron được liên kết và truyền thông với nhau Giống như mạng nơ-ron củanão người, ANN học và lưu những kinh nghiệm và sử dụng trong những tình huống phùhợp Mạng nơ-ron đã áp dụng thành công trong nhiều vấn đề liên quan đến dự báo, phânloại và điều khiển thuộc nhiều lĩnh vực khác nhau, như tài chính, y tế, địa chất và vật lý

Ví dụ như khả năng nhận dạng mặt người, dự báo thời tiết và thiên tai, tự động điềukhiển hệ thống lái tàu, hệ thống dự báo sự cố, v.v

- Kiến trúc chung của một mạng nơ-ron nhân tạo gồm 3 thành phần đó là: inputlayer, hidden layer và output layer Trong đó, hidden layer gồm các thần kinh nhận dữliệu input từ các neural ở lớp trước đó và chuyển đổi các input này cho các lớp xử lý tiếptheo Trong một ANN có thể có nhiều lớp ẩn

Hình 13: Minh họa mạng nơ-ron nhân tạo 3 lớp

- Quá trình xử lý thông tin của một mạng nơ-ron nhân tạo liên quan đến:

(1) Lớp Inputs: Dữ liệu nhập tương ứng các thuộc tính của dữ liệu

(2) Lớp Outputs: Kết quả là một giải pháp cho một vấn đề

(3) Lớp Weights: Trọng số liên kết là thành phần quan trọng thể hiện mức

độ quan trọng (độ mạnh) của dữ liệu nhập đối với quá trình xử lý thông tin (quá trìnhchuyển đổi dữ liệu từ lớp này sang lớp khác) Quá trình học của ANN thực ra là quá trìnhđiều chỉnh các trọng số của các dữ liệu nhập để có được kết quả mong muốn Trong đó:

Ngày đăng: 24/07/2021, 15:16

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[11] Viện Hàn lâm Khoa học xã hội Việt Nam (2017), “Cuộc cách mạng công nghiệp lần thứ tư: Đặc trưng, tác động và hàm ý chính sách”, Báo cáo Chính phủ Sách, tạp chí
Tiêu đề: Cuộc cách mạng côngnghiệp lần thứ tư: Đặc trưng, tác động và hàm ý chính sách
Tác giả: Viện Hàn lâm Khoa học xã hội Việt Nam
Năm: 2017
[21] Tran Duc Duan, Duong Anh Duc, Tran Le Hong Du, “Combining Hough Transform and Contour Algorithm for detecting Vehicles License-Plates”, University of Natural Sciences, 2004 Sách, tạp chí
Tiêu đề: Combining HoughTransform and Contour Algorithm for detecting Vehicles License-Plates
[1] Trích dẫn bài đăng trên cổng thông tin điển tử Quốc Gia (http://www2.chinhphu.vn/portal/page/portal/chinhphu/)” và trên các trang thông tin điện tử của các báo mạng như: Vietnamnet, vnexpress, thanhnien, tuoitre Link
[2] Wikipedia - Bách khoa toàn thư mở - Lịch sử ngành Trí tuệ nhân tạo http://en.wikipedia.org/wiki/Artificial_intelligence Link
[4] Đồng chí Nguyễn Văn Bình - Trưởng Ban kinh tế Trung ương: Phát biểu tại Diễn đàn cấp cao công nghiệp 4.0 về chủ trương, chính sách của Việt Nam chủ động tham gia cuộc cách mạng công nghiệp lần thứ 4 diễn ra tại Hà Nội ngày 3/10/2019 Khác
[5] Đỗ Hữu Hiền: Bài viết đăng trên Đặc san Báo xuân của Ban Tuyên giáo tỉnh ủy Bà Rịa - Vũng Tàu về một số vấn đề phát triển khoa học và công nghệ của tỉnh trước tình hình cuộc cách mạng công nghiệp lần thứ 4 Khác
[6] Nhâp môn Trí tuệ nhân tạo của Tiến sĩ Ngô Hữu Phúc - Học viện kĩ thuật quân sự Khác
[7] Tài liệu giảng dạy môn Trí tuệ nhân tạo của GS.TSKH Võ Hoàng Kiếm - nguyên Hiệu trưởng trường Đại học Bà Rịa - Vũng Tàu Khác
[8] Bùi Xuân Toại - Trương Gia Việt (Biên dịch) - Trí tuệ nhân tạo - Các cấu trúc và chiến lược giải quyết vấn đề - NXB Thống kê, 2000 (Phần I) Khác
[9] PTS. Nguyễn Thanh Thủy - Trí tuệ nhân tạo - Các phương pháp giải quyết vấn đề và kỹ thuật xử lý tri thức - NXB Giáo dục, 1995 (Chương 1) Khác
[10] Bộ Kế hoạch và Đầu tư (2018) Dự thảo: Chiến lược Cách mạng công nghiệp 4.0: Đánh giá và đề xuất chính sách Khác
[12] Dự án đầu tư hệ thống giao thông thông minh, giám sát tự động bằng Camera trên địa bàn tỉnh Bà Rịa - Vũng Tàu Khác
[13] Số liệu báo cáo tình hình phat triển kinh tế-xã hội 9 tháng đầu năm 2019 và Khác
[14] Báo cáo: Kết quả Nghiên cứu xây dựng hệ thống giám sát ngã tư thông minh tại 01 điểm giao lộ đường Huỳnh Minh Thạnh và 27/4 thuộc thị trấn Phước Bửu, huyện Xuyên Mộc, tỉnh Bà Rịa - Vũng Tàu Khác
[15] Tài liệu báo cáo thực hiện đề án phát triển đô thị thông minh tại TP. Hồ Chí Minh, Đà Nẵng, Bình Dương Khác
[22] Các tài liệu về EmguCV tại www.emgucv.com OPenCV tại www.opencv.com Khác
[23] Yan S., Xia Y., Smith J.S., et al. (2017). Multiscale Convolutional Neural Networks Khác
[26] . Krizhevsky A., Sutskever I., and Hinton G.E. (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems 25. Curran Associates, Inc., 1097-1105 Khác
[27] . Object detection based on HOG features: Faces and dual-eyes augmentedreality - IEEE Conference Publication.&lt;https://ieeexplore.ieee.org/document/6618716/&gt;, accessed:05/20/2018 Khác
[28] . Real-Time Hand Gesture Detection and Recognition Using Bag-of- Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w