Hệ thống được ứng dụng khoa học kỹ thuật công nghệ, gồm các thiết bị như cảm biến, điện tử, tin học, viễn thông để điều khiển, điều hành và quản lý các hệ thống giao thông vận tải tối ưu
Trang 1TRƯỜNGĐẠI HỌC GIAO THÔNG VẬN TẢI TP HỒ CHÍ MINH
KHOA CÔNG NGH Ệ THÔNG TIN
TI ỂU LUẬN CHUYÊN ĐỀ HỆ THỐNG GIAO THÔNG THÔNG MINH
ĐỀ TÀI: “Tổng quan hệ thống giao thông thông minh dựa trên dữ liệu”
Trang 2Table of Contents
CH ƯƠNG I: MỞ ĐẦU 1
CH ƯƠNG II KIẾN TRÚC CỦA VIỆC TIẾN HÀNH PHÂN TÍCH DỮ LIỆU LỚN TRONG ITS 2
1 Đặc điểm dữ liệu lớn trong ITS 2
2 Ki ến trúc của việc tiến hành phân tích dữ liệu lớn trong ITS 3
Ch ươngIII Tổng quan về các giải pháp 4
I, Các gi ải pháp thu thập dữ liệu lớn trong ITS 5
1 D ữ liệu lớn từ thẻ thông tin 5
2 D ự liệu lớn từ GPS 5
3 D ữ liệu lớn từ video 5
4 D ữ liệu cảm ứng biến 6
5 D ữ liệu lớn từ CAV and VANET 6
6 D ữ liệu lớn từ thu thập thụ động 7
7 D ữ liệu lớn từ các nguồn khác 7
II.Ph ương pháp phân tích dữ liệu lớn trong ITS 7
1 Supervised Learning 7
2 Unsupervised Learning 9
3 Reinforcement Learning 11
4.Deep Learning 12
5 Ontology Based Methods 13
Ch ương IV: Ứng dụng dữ liệu lớn trong ITS 15
1 Road Traffic Accidents Analysis 15
2 Road Traffic Flow Prediction 16
3 Public Transportation Services Planning 16
4 Personal Travel Route Planning 17
5 Rail Transportation Management and Control 18
6 Asset Maintenance 19
CH ƯƠNG V NỀN TẢNG DỮ LIỆU LỚN TRONG NÓ 21
CH ƯƠNG VI: THỬ THÁCH MỚI 24
CH ƯƠNG VII: KẾT LUẬN 26
Trang 3CHƯƠNG I: MỞ ĐẦU
Hệ thống giao thông thông minh ITS có tên tiếng Anh là Intelligent transportation system- ITS Hiện nay đây là một ứng dụng tiên tiến nhằm cung cấp các dịch vụ sáng tạo liên quan đến các phương thức vận tải và quản lý giao thông khác nhau, đồng thời cho phép người dùng được cung cấp thông tin tốt hơn và sử dụng mạng lưới giao thông an toàn hơn, phối hợp hơn và thông minh hơn
Hệ thống được ứng dụng khoa học kỹ thuật công nghệ, gồm các thiết bị như cảm biến, điện tử, tin học, viễn thông để điều khiển, điều hành và quản lý các hệ thống giao thông vận tải tối ưu nhất nhằm giảm thiểu ùn tắc giao thông, giảm tại nạn, giảm tiêu hao nhiên liệu làm hạn chế ô nhiễm môi trường.[1]
Dữ liệu lớn đang trở thành trọng tâm nghiên cứu trong các hệ thống giao thông thông minh (ITS), có thể thấy ở nhiều dự án trên thế giới Hệ thống giao thông thông minh sẽ tạo ra một lượng lớn dữ liệu Dữ liệu lớn được tạo ra sẽ có tác động sâu sắc đến việc thiết kế và ứng dụng các hệ thống giao thông thông minh, giúp ITS an toàn hơn, hiệu quả hơn và có lợi hơn Nghiên cứu phân tích dữ liệu lớn trong ITS là một lĩnh vực đang
nở rộ Bài viết này trước tiên xem xét lịch sử và đặc điểm của dữ liệu lớn và hệ thống giao thông thông minh Khung tiến hành phân tích dữ liệu lớn trong ITS sẽ được thảo luận tiếp theo, trong đó nguồn dữ liệu và phương pháp thu thập, phương pháp và nền tảng phân tích dữ liệu cũng như các danh mục ứng dụng phân tích dữ liệu lớn được tóm
tắt Một số nghiên cứu điển hình về các ứng dụng phân tích dữ liệu lớn trong hệ thống giao thông thông minh, bao gồm phân tích tai nạn giao thông đường bộ, dự đoán lưu lượng giao thông đường bộ, kế hoạch dịch vụ giao thông công cộng, kế hoạch tuyến đường du lịch cá nhân, quản lý và kiểm soát giao thông đường sắt và bảo trì tài sản được giới thiệu Cuối cùng, bài báo này thảo luận về một số thách thức mở của việc sử dụng phân tích dữ liệu lớn trong ITS
Trang 4CHƯƠNG II KIẾN TRÚC CỦA VIỆC TIẾN HÀNH PHÂN TÍCH D Ữ LIỆU LỚN TRONG ITS
1 Đặc điểm dữ liệu lớn trong ITS
Hệ thống Giao thông thông minh (lntelligent Transport System - ITS) là việc ứng
dụng kỹ thuật công nghệ, bao gồm các thiết bị cảm biến, điều khiển, điện tử, công nghệ thông tin và viễn thông trong lĩnh vực giao thông để điều hành và quản lý hệ thống giao thông vận tải
ITS là công nghệ mới phát triển trên thế giới, được sử dụng để giải quyết các vấn
đề của giao thông, bao gồm tai nạn, ùn tắc giao thông, thông tin giao thông ITS sử dụng các tiến bộ của công nghệ thông tin và viễn thông để liên kết giữa con người, hệ thống đường giao thông và phương tiện giao thông lưu thông trên đường thành một mạng lưới thông tin và viễn thông phục vụ cho việc lưu thông tối ưu trên đường Đánh giá các tài liệu và tham khao nhiều các phương tiện thì chú trọng hầu hết vào phương tiện đường bộ
Năm 2012 Gartner đã định nghĩa: “Dữ liệu lớn được mô tả là dung lượng lớn, tốc
độ cao và loại hình thông tin đa dạng mà yêu cầu phương thức xử lý mới để cho phép tăng cường ra quyết định, khám phá bên trong và xử lý tối ưu”
Đây được coi là 3 đặc trưng cơ bản để mô tả cho dữ liệu lớn:
Dung lượng (Volume) – Dữ liệu lớn:
• Số lượng dữ liệu được tạo ra và lưu trữ
• Với dữ liệu lớn, bạn sẽ phải xử lý khối lượng lớn dữ liệu phi cấu trúc, mật độ thấp
Đó có thể là dữ liệu có giá trị không xác định, chẳng hạn như nạp tải dữ liệu Twitter, lượt truy cập web hoặc ứng dụng trên thiết bị di động
• Đối với một số tổ chức khối lượng dữ liệu có thể lên tới hàng chục terabyte hay hàng trăm terabyte
Vận tốc (Velocity) – Dữ liệu lớn:
• Tốc độ các dữ liệu được tạo ra và xử lý theo thời gian thực
• Một số sản phẩm thông minh tích hợp internet hoạt động trong thời gian thực hoặc
gần thời gian thực sẽ yêu cầu đánh giá và hành động theo thời gian thực
Tính đa dạng (Variety) – Dữ liệu lớn:
• Các dạng và kiểu loại của dữ liệu có sẵn
• Các kiểu dữ liệu truyền thống có cấu trúc và kiểu dữ liệu mới phi cấu trúc và bán cấu trúc (văn bản, âm thanh, video)
Ngoài ra, trong những năm trở lại đây, dữ liệu lớn có thêm 2 đặc trưng V khác đó là:
Giá trị (Value): một phần lớn giá trị của các công ty công nghệ lớn nhất thế giới đến từ
quá trình phân tích dữ liệu của họ
Trang 5Tính xác thực (Veracity): chất lượng của dữ liệu thu được có thể khác nhau rất nhiều ảnh
hưởng đến việc phân tích chính xác.[2]
2 Ki ến trúc của việc tiến hành phân tích dữ liệu lớn trong ITS
Kiến trúc phân tích dữ liệu lớn trong ITS được thể hiện qua hình 1 Nó chia làm 3 lớp,
đó là lớp thu thâp dữ liệu, phân tích dữ liệu và lớp ứng dụng thì đầu tiên sẽ là lớp thu thập
dữ liệu
• Lớp thu thập dữ liệu: lớp thu thập dữ liệu là lớp đầu tiền cũng là lớp cơ sở để của kiến trúc, là vì nó cung cấp dữ liệu cho các lớp trên Dữ liệu thì được lấy nhiều nguồn nhiều chỗ khác nhau như: máy vòng cảm ứng, GPS giám sát video,…
• Lớp phân tích dữ liệu: lớp phân tích dữ liệu được coi là lớp quan trọng nhất của kiến trúc Lớp này nhận dữ liệu từ lớp thu thập dữ liệu, sau đó tiến hành áp dụng phương pháp phân tích dữ liệu lớn để hoàn thành việc phân tích và chia sẻ dữ liệu
• Tầng ứng dụng: là tầng trên cùng của kiến trúc Nó áp dụng xử lí các dữ liệu từ lớp phân thích dữ liệu với các nhiều tình huống khác nhau vd: lưu lượng giao thông, điều tiết giao thông chống ùn tắc, điều khiển đội cứu hộ khẩn cấp ,…
Hình 1: Ki ến trúc tiến hành phân tích dữ liệu lớn
Trang 6ChươngIII Tổng quan về các giải pháp
Mọi người tham gia một cách vô thức vào việc thu thập, truyền tải và ứng dụng Dữ
liệu lớn trong ITS Sự phát triển công nghệ trong ITS đã dẫn đến sự gia tăng về độ phức tạp, tính đa dạng và lượng dữ liệu được tạo và thu thập từ phương tiện và chuyển động của con người Theo các nguồn khác nhau trong ITS, Dữ liệu lớn trong ITS có thể được phân loại chủ yếu thành các loại sau và dữ liệu thu thập được minh họa trong Bảng
Hình 2: Dữ liệu lớn trong nó
Trang 7I, Các gi ải pháp thu thập dữ liệu lớn trong ITS
1 D ữ liệu lớn từ thẻ thông tin
Trong giao thông công cộng đô thị, dữ liệu thẻ thông minh được sử dụng ngày càng nhiều để thu tiền vé tự động Họ cho phép hành khách tiếp cận hầu hết tất cả các
loại phương thức hệ thống giao thông công cộng (xe buýt, xe lửa, xe điện, đường sắt leo núi, LRT, tàu điện ngầm và phà) bằng một thẻ duy nhất có giá trị cho toàn bộ hành trình Mặc dù thẻ thông minh tập trung chủ yếu vào việc thu doanh thu, nhưng chúng cũng tạo ra một lượng lớn dữ liệu thụ động từ các thiết bị công nghệ được cài đặt để kiểm soát hoạt động của chúng Dữ liệu được tạo có thể có lợi cho các nhà hoạch định quá cảnh, giúp hiểu rõ hơn về các kiểu hành vi của hành khách để lập kế hoạch dịch vụ ngắn hạn và dài hạn Tuy nhiên, một trong những thách thức lớn là cơ sở hạ tầng và phương pháp truyền thống không hiệu quả khi xử lý hoặc phân tích một khối lượng lớn dữ liệu Như vậy, như một giải pháp thay thế, công nghệ dữ liệu lớn có thể được sử dụng để tăng cường thu thập, lưu trữ, xử lý và phân tích dữ liệu Hơn nữa, động lực chính sẽ là
hiệu quả chi phí của phương pháp này vì chi phí xử lý và phân tích dữ liệu quy mô lớn là rất lớn Kinh nghiệm này chứng minh rằng sự kết hợp giữa kiến thức lập kế hoạch, dữ liệu lớn và công cụ khai thác dữ liệu cho phép tạo ra các chỉ số về hành vi đi lại, chính sách giao thông công cộng, hiệu suất hoạt động và chính sách giá vé.[3]
2 D ự liệu lớn từ GPS
GPS là công cụ, hệ thống xác định vị trí Dữ liệu giao thông có thể được thu thập
hiệu quả và an toàn hơn với tính năng theo dõi vị trí qua GPS Kết hợp với đó là hệ thống thông tin địa lý (GIS) , GPS cung cấp một công cụ đầy để thu thập dữ liệu và dữ liệu được thu thập có thể được sử dụng để giải quyết nhiều vấn đề về giao thông, chẳng hạn như chế độ di chuyển phát hiện , đo độ trễ hành trình và giám sát giao thông phát hiện, đo
độ trễ hành trình và giám sát giao thông
3 D ữ liệu lớn từ video
Video là phương tiện điện tử để ghi, sao chép, phát lại, phát sóng và hiển thị hình ảnh chuyển động được lưu trữ trong các phương tiện Như đã thấy trong các hệ thống quản lý giao thông tiên tiến (ATMS), hệ thống phát hiện hình ảnh video (VIDS) là những lựa chọn thay thế tốt so với các cảm biến thông thường cho các tác vụ như nhận dạng phương tiện và phát hiện luồng giao thông Chi phí rẻ đó là một ưu điểm tốt Sử dụng dữ
liệu video lớn đã được triển khai thành công để thực hiện phát hiện sự cố và cho thấy độ chính xác cao trong một số trường hợp nhất định Ngoài quản lý giao thông chung , các kỹ
sư và nhà quy hoạch giao thông thu thập dữ liệu video phương tiện chính xác hơn có thể cải thiện hệ thống xử lý hình ảnh để đáp ứng tốt hơn nhu cầu giao thông chung liên quan đến các mô hình phát thải của phương tiện
Trang 84 D ữ liệu cảm ứng biến
Các cảm biến sẽ được lắp đặt trên mặt đường để thu thập các thông tin về luồng giao thông, khí hậu, thời tiết,… Các thông tin này được hệ thống máy tính phân tích và
xử lý, sau đó cung cấp trở lại cho tài xế về tình hình giao thông trên đường (tai nạn, ùn
tắc giao thông, thời tiết…) để tài xế chọn giải pháp giao thông tối ưu, giúp hạn chế tối đa tai nạn và ùn tắc giao thông, đảm bảo thời gian đi lại ngắn nhất và an toàn nhất cho các phương tiện đang lưu thông trên đường Về việc thu thập dữ liệu từ cảm biến có thể chia làm 3 nguồn: dữ liệu bên đường, dữ liệu ô tô nổi và dữ liệu diện rộng
• Dữ liệu bên đường: đề cập đến thu thập bởi các cảm biến nằm dọc bên đường Các cảm biến bên đường thế hệ mới như hệ thống cảm biến siêu
âm và âm thanh, thiết bị phát hiện xe từ kế, hệ thống hồng ngoại, phát hiện zánh sáng và phạm vi (LIDAR), hệ thống phát hiện và xử lý hình ảnh video dần dần xuất hiện cùng với sự phát triển của công nghệ tiên tiến gần đây
• Dữ liệu ô tô nổi (FCD) : chủ yếu là đề chủ yếu đề cập đến dữ liệu di chuyển của phương tiện tại các vị trí khác nhau trong ITS Một số cảm biến tàu cung cấp thông tin tin cậy và hiệu quả để ước tính là lựa chọn được lộ trình
đi hợp lí Với sự phát triển của kỹ thuật cảm biến phương tiện, các kỹ thuật
cảm biến FCD phổ biến bao gồm: nhận dạng phương tiện tự động (AVI), nhận dạng biển số xe (LPR) và các bộ tiếp sóng như phương tiện thăm dò
và thẻ thu phí điện tử
• Dữ liệu diện rộng: dữ liệu lưu thông giao thông diện rộng thu thậ được từ các kỹ thuật thoe dõi cảm ứng biến như xử lí hình ảnh, ghi âm, video, dựa trên không gian
5 D ữ liệu lớn từ CAV and VANET
Các phương tiện kết nối và tự động (CAV) là các công nghệ mới trong lĩnh vực ITS kết hợp những thay đổi cơ bản về thiết kế phương tiện và tương tác của chúng với cơ
sở hạ tầng đường bộ
Xe kết nối và xe tự hành kết hợp nhiều công nghệ khác nhau, tạo điều kiện thuận lợi cho việc di chuyển người và hàng hóa an toàn, hiệu quả Hệ thống giao thông hỗ trợ CAV đã chứng tỏ tiềm năng to lớn trong việc giảm thiểu tắc nghẽn, giảm chậm trễ trong hành trình và nâng cao hiệu suất an toàn CAV có thể tạo ra một lượng lớn dữ liệu giao thông thời gian thực phù hợp với môi trường, chẳng hạn như tọa độ, tốc độ, gia tốc, dữ liệu an toàn Bằng cách sử dụng các công nghệ mạng mới nhất như Mạng do phần mềm xác định, dữ liệu có thể được thu thập hiệu quả hơn Những dữ liệu này có thể được sử dụng để tạo thông tin có thể hành động nhằm hỗ trợ và tạo điều kiện thuận lợi cho các lựa chọn cổng chuyển đổi xanh và áp dụng cho điều khiển tín hiệu thích ứng thời gian thực
Trang 9VANET (Vehicular Ad Hoc Network), tiếng Việt gọi là Mạng xe cộ bất định, là
hệ thống mạng không cần cơ sở hạ tầng được tạo thành từ các phương tiện xe cộ lưu thông trên đường Chúng được trang bị thiết bị thu/phát để có thể liên lạc, chia sẻ và trao đổi thông tin lẫn nhau giống như một nút trong mạng bất định (ad hoc) Thông tin trao đổi trong mạng VANET bao gồm thông tin về lưu lượng xe cộ, tình trạng kẹt xe, tai nạn giao thông, nguy hiểm cần tránh và cả những dịch vụ thông thường như dịch vụ đa phương tiện, Internet
6 D ữ liệu lớn từ thu thập thụ động
Thu thập dữ liệu thụ động được sử dụng để phân tích cạnh tranh cùng với đánh giá trước và sau phẫu thuật Điều đó nói rằng, một số quốc gia hoặc tiểu bang có bộ luật cụ thể của riêng họ, cho phép người dùng chọn không cung cấp dữ liệu nhạy cảm của họ
Trong những tình huống như vậy, việc thu thập dữ liệu thụ động đóng một vai trò quan trọng Sử dụng dữ liệu thụ động, khách hàng có thể thu thập thông tin về khách hàng/người dùng của họ bằng các phương pháp khác nhau như:
Một nguồn dữ liệu quan trọng khác là dữ liệu từ thử nghiệm chuyên dụng trong ITS Ví
dụ, trong công việc trước đây của chúng tôi, chúng tôi thực hiện các thử nghiệm thực địa trong một hệ thống thông tin liên lạc trên mặt đất thực tế trong giao thông đường sắt đô
thị Hệ thống điều khiển tàu hỏa dựa trên thông tin liên lạc (CBTC) Một lượng lớn dữ liệu khuếch đại kênh thu được từ thử nghiệm hiện trường Dữ liệu được xử lý để mô hình hóa đặc tính ngẫu nhiên của trạng thái kênh và mô hình được sử dụng để tối ưu hóa hiệu suất hệ thống CBTC
II Phương pháp phân tích dữ liệu lớn trong ITS
1 Supervised Learning
Dữ liệu huấn luyện được dán nhãn được sử dụng trong thuật toán học có giám sát Các mô hình sử dụng dữ liệu đầu vào và đầu ra mục tiêu (nhãn) để tìm hiểu chức năng hoặc ánh xạ giữa chúng Kết hợp với mô hình đã học và dữ liệu đầu vào, có thể dự đoán
Trang 10kết quả đầu ra chưa từng thấy Trong số tất cả các mô hình học có giám sát, hồi quy tuyến tính, cây quyết định, mạng thần kinh và máy vectơ hỗ trợ, được sử dụng thường xuyên nhất trong ITS
Chức năng của hồi quy là giải thích mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập Hồi quy tuyến tính là phương pháp học siêu thị được sử dụng phổ biến nhất Hồi quy tuyến tính cực kỳ đơn giản, mạnh mẽ, dễ diễn giải và dễ viết mã
Mặc dù đơn giản, hồi quy tuyến tính đặc biệt thành công trong các kịch bản ITS khác nhau, chẳng hạn như dự đoán lưu lượng giao thông, ước tính tốc độ giao thông và đánh giá tuyến đường vận chuyển
Neural Network đọc tiếng việt là Mạng nơ-ron nhân tạo, đây là một chuỗi những thuật toán được đưa ra để tìm kiếm các mối quan hệ cơ bản trong tập hợp các dữ liệu Thông qua việc bắt bước cách thức hoạt động từ não bộ con người Nói cách khác, mạng
nơ ron nhân tạo được xem là hệ thống của các tế bào thần kinh nhân tạo Đây thường có thể là hữu cơ hoặc nhân tạo về bản chất Neural Network có khả năng thích ứng được với mọi thay đổi từ đầu vào Do vậy, nó có thể đưa ra được mọi kết quả một cách tốt nhất có thể mà bạn không cần phải thiết kế lại những tiêu chí đầu ra Khái niệm này có nguồn gốc
từ trí tuệ nhân tạo, đang nhanh chóng trở nên phổ biến hơn trong sự phát triển của những
Máy vectơ hỗ trợ (SVM) là một thuật toán học siêu thị phổ biến khác sử dụng dữ liệu được gắn nhãn để hồi quy và phân loại Trong số tất cả các công cụ mô hình phân tích Dữ liệu lớn trong ITS, SVM đã thu hút được sự quan tâm lớn trong lĩnh vực nghiên cứu Nó đã được sử dụng thành công trong dự đoán thời gian di chuyển, dự đoán thời gian đến của xe buýt và phát hiện tai nạn giao thông[6]
Ví dụ điển hình về việc sử dụng học có giám sát trong ITS được giới thiệu trong , trong đó SVM được sử dụng để dự đoán các sự cố lưu lượng Cho tập con huấn luyện {(x1, y1), (x2, y2), , (xi, yi) }, trong đó xi là đầu vào của mẫu đào tạo bao gồm các giá trị của tham số luồng giao thông như lưu lượng, tốc độ, tỷ lệ lấp đầy, v.v và yi là nhãn lớp của xi Với hàm hạt nhân K(x, x’ ), theo lý thuyết phân loại SVM, vectơ hỗ trợ
αi có thể thu được là,
Trang 11Sau đó chúng ta lấy hàm quyết định g(x) để tĩnh nhãn cho mẫu x
Nếu x là mẫu ngẫu nhiên, g(x) = 1 Ngược lại, ta có g(x) = 1 [6]
2 Unsupervised Learning
Học không giám sát, còn được gọi là học máy không giám sát , sử dụng các thuật toán học máy để phân tích và phân cụm các tập dữ liệu không được gắn nhãn Các thuật toán này khám phá các mẫu hoặc nhóm dữ liệu ẩn mà không cần sự can thiệp của con người Khả năng khám phá những điểm tương đồng và khác biệt trong thông tin khiến nó trở thành giải pháp lý tưởng để phân tích dữ liệu khám phá, chiến lược bán chéo, phân khúc khách hàng và nhận dạng hình ảnh.[7]
Với một bộ dữ liệu lịch sử, các tác giả của đưa ra một ví dụ cổ điển về việc sử dụng học tập không giám sát để dự đoán thời gian di chuyển Các quy trình tính như sau:
Bước 1: Tần suất của mỗi lần di chuyển được đo bằng cách đếm số lần lặp lại của lần di chuyển đó trong các bản ghi khác nhau
Bước 2: Xác định quan hệ Dự đoán chứa ba thuộc tính là Tần suất, Thời gian đi lại
và Vận tốc Mỗi bản ghi của quan hệ Dự đoán phải chứa thời gian di chuyển riêng biệt
Bước 3: Tìm giá trị lớn nhất từ thuộc tính Tần số (fmax) Một bộ P (xp , yp , zp) là được chọn làm trọng tâm của cụm, trong đó xp là tần số cực đại, yp là tần số tương ứng travel_time liên quan đến xp và zp là vận tốc liên quan đến travel_time yp Nếu hai hoặc nhiều hơn bộ dữ liệu chứa giá trị lớn nhất sau đó biến các bộ dữ liệu đó thành trọng tâm, mỗi bộ cho một cụm Do đó, chúng tôi nhận được một tập hợp các trọng tâm, P trong đó
mỗi trọng tâm có tần số tối đa
Bước 4:
So sánh từng bộ Ti (xi, yi, zi) của quan hệ Dự đoán với Pk từng trọng tâm được chọn(xp,
yp, zp) bằng cách sử dụng công thức sau:
COST (Pk, Ti) = |xp-xi | + |yp-yi | + |zp-zi | (1)
Trang 12Trong đó, chỉ số k, là số trọng tâm và có thể nằm trong khoảng từ 1 đến n, tùy thuộc vào trùng lặp số tần số Chọn bộ Qk (xq, yq, zq) làm trọng tâm của cụm khác, trong đó COST (Pk, Qk) là tối đa Bằng cách này, chúng ta cũng có được một tập hợp trọng tâm khác, Q Bây giờ, để chọn các trọng tâm cuối cùng, chúng tôi thực hiện thao tác giao nhau, tức là P
∩ Q Vì vậy, số lượng bộ hay các phần tử trong tập (P ∩ Q) là tổng số cụm
Bước 5: Xây dựng các cụm sao cho tâm của mỗi cụm là phần tử riêng biệt của tập hợp (P ∩ Q)
Bước 6: Xác định tư cách thành viên cụm của các bộ dữ liệu bằng cách gán chúng cho cụm gần nhất
bộ đại diện Chi phí được đưa ra bởi phương trình.(1)
Bước 7: Ước tính lại trung tâm cụm bằng giá trị trung bình số học
Bước 8: Bước 6 và Bước 7 được lặp lại cho đến khi không có thay đổi nào trong
cụm
Bước 9: Sau khi chuẩn bị xong các cụm, thời gian dự đoán mong muốn được tính riêng cho
mỗi cụm bằng cách sử dụng công thức sau:
Tr là thời gian di chuyển thu được từ cụm thứ r, N là tổng số bộ trong liên kết cụm, fi là Tần số của bộ thứ i và ti là Travel_time của bộ thứ i
Bước 10: Nếu số phần tử của (P ∩ Q) là R tức là |P ∩ Q| =R, sau đó dự đoán cuối cùng thời gian di chuyển gần đúng, T cho đoạn đường của nhóm thời gian và nhóm ngày
cụ thể có thể là được xác định bởi công thức sau:
[8]
Trang 13Hình 3: Học tăng cường
Sử dụng học tăng cường trong ITS yêu cầu xây dựng bài toán tối ưu hóa và điều khiển ITS bằng ngôn ngữ của học tăng cường, cụ thể là xác định không gian trạng thái S, không gian hành động A và phần thưởng R Một ví dụ cổ điển về việc sử dụng học tăng cường trong tín hiệu giao thông ITS kiểm soát được xây dựng trong Trạng thái giao
Trang 14thông tại giao lộ có n làn xe được định nghĩa chính thức là mã hóa trạng thái giao thông
rời rạc (DTSE) Đối với mỗi làn đường tiếp cận giao lộ, DTSE phân chia độ dài l của đoạn làn đường, bắt đầu từ vạch dừng, thành các ô có độ dài c Việc lựa chọn c sẽ thay đổi hành vi của hệ thống DTSE bao gồm ba vectơ Vectơ đầu tiên B đại diện cho sự hiện diện của một chiếc xe hoặc không có trong ô Vectơ thứ hai R biểu thị tốc độ của phương tiện và vectơ thứ ba P là pha tín hiệu giao thông hiện tại (nghĩa là hành động gần đây nhất được chọn) Do đó, các trạng thái của hệ thống có thể được định nghĩa là, S (B R)
Sau khi tác nhân đã quan sát trạng thái của môi trường, nó phải chọn một hành động từ tập hợp tất cả các hành động có sẵn Các hành động có thể là Lục hướng Bắc-Nam (a1), Lục hướng Đông-Tây (a2)), Lục hướng trái tiến Bắc-Nam (a3)), Lục hướng Đông-Tây hướng trái (a4)) Tập hợp tất cả các hành động có thể A được định nghĩa là A
= {a1, a2, a3, a4} Tại thời điểm t, tác nhân chọn một hành động a(t), trong đó a(t) Sau khi tác nhân đã quan sát trạng thái của môi trường st , nó thực hiện một hành động a(t) và nhận phần thưởng Phần thưởng rt+1 là kết quả của việc thực hiện một hành động đã chọn từ một trạng thái cụ thể Trong công thức này, phần thưởng được định nghĩa là sự thay đổi về độ trễ xe tích lũy giữa các hành động
Thuật toán học tăng cường được sử dụng trong mô phỏng này là Q-Learning , được sử dụng để phát triển chính sách lựa chọn hành động tối ưu Chính sách tối ưu đạt được bằng cách sử dụng mạng thần kinh tích chập để tính gần đúng hàm giá trị hành động Hàm giá trị hành động Q(st, at) ánh xạ các trạng thái tới các tiện ích hành động (nghĩa là giá trị của mỗi hành động từ một trạng thái nhất định là bao nhiêu) Cơ sở của Q-learning là cập nhật lặp lại giá trị được định nghĩa là,
Q(st, at) = Q(st, at) + α(rt+1 + γ max A Q(st+1, at) − Q(st, at))
Trong trường hợp tốc độ học tập α kiểm soát mức độ mà các ước tính giá trị hành động mới được cân nhắc so với các ước tính cũ và hệ số chiết khấu γ xác định mức
độ quan trọng của phần thưởng ngay lập tức so với phần thưởng trong tương lai Sau khi hàm giá trị hành động đã được học đầy đủ, chính sách tối ưu có thể được xác định bằng cách chọn hành động có giá trị cao nhất.[9]
4.Deep Learning
Hiểu được tắc nghẽn tại một địa điểm có thể gây ra những gợn sóng trong mạng lưới giao thông quy mô lớn như thế nào là rất quan trọng đối với các nhà nghiên cứu và thực hành giao thông vận tải để xác định chính xác các tắc nghẽn giao thông để giảm thiểu tắc nghẽn Các nghiên cứu truyền thống dựa trên các phương trình toán học hoặc kỹ thuật mô phỏng để mô hình hóa các động lực tắc nghẽn giao thông Tuy nhiên, hầu hết các phương pháp đều có những hạn chế, phần lớn là do các giả định không thực tế và quy
Trang 15trình hiệu chuẩn tham số rườm rà Với sự phát triển của Hệ thống giao thông thông minh (ITS) và Internet vạn vật (IoT), dữ liệu giao thông ngày càng trở nên phổ biến Điều này kích hoạt một loạt nghiên cứu dựa trên dữ liệu để điều tra các hiện tượng vận chuyển Trong số đó, lý thuyết học sâu được coi là một trong những kỹ thuật hứa hẹn nhất để xử lý dữ liệu chiều cao khổng lồ Nghiên cứu này cố gắng mở rộng lý thuyết học sâu vào phân tích mạng lưới giao thông quy mô lớn Kiến trúc Mạng thần kinh tái phát và máy Boltzmann bị hạn chế sâu được sử dụng để lập mô hình và dự đoán sự tiến triển của
tắc nghẽn giao thông dựa trên dữ liệu Hệ thống định vị toàn cầu (GPS) từ taxi Một nghiên cứu số ở Ninh Ba, Trung Quốc được thực hiện để xác nhận hiệu lực và hiệu quả của phương pháp đề xuất Kết quả cho thấy độ chính xác của dự đoán có thể đạt tới 88% trong vòng chưa đầy 6 phút khi mô hình được triển khai trong môi trường điện toán song song dựa trên Bộ xử lý đồ họa (GPU) Các mô hình tiến hóa tắc nghẽn được dự đoán có thể được trực quan hóa theo thời gian và không gian thông qua một nền tảng dựa trên bản
đồ để xác định các liên kết dễ bị tổn thương nhằm giảm thiểu tắc nghẽn một cách chủ động [10]
Dữ liệu được thu thập từ tất cả các đường cao tốc được sử dụng làm đầu vào Xem xét mối quan hệ thời gian của lưu lượng giao thông, dữ liệu lưu lượng giao thông ở các khoảng thời gian trước đó, tức là, χt1, χt2,…χtn, được sử dụng để đoán lưu lượng giao thông vận tải tại khoảng thời gian t Mô hình được đề xuất giải thích cho các mối tương quan thời gian trên đất liền của lưu lượng giao thông vốn có
5 Ontology Based Methods
Số lượng máy tính được cài đặt trong các mạng đô thị và giao thông đã tăng lên rất nhiều trong những năm gần đây, cũng như khả năng xử lý cục bộ và mạng kỹ thuật số
hiện có Tuy nhiên, sự không đồng nhất của các thiết bị hiện có trong lĩnh vực ITS (Hệ thống giao thông thông minh) và khối lượng lớn thông tin mà chúng xử lý, cản trở rất nhiều khả năng tương tác của thiết bị và thiết kế các ứng dụng hợp tác giữa các thiết bị hiện được lắp đặt trong mạng đô thị Mặc dù việc khám phá thông tin, thành phần và yêu cầu dịch vụ thông qua các tác nhân thông minh là một giải pháp tiềm năng cho những vấn
đề này, nhưng tất cả các công nghệ này đều yêu cầu quản lý luồng thông tin thông minh Đặc biệt, cần phải loại bỏ các luồng thông tin này khỏi các công nghệ được sử dụng, cho phép khả năng tương tác phổ quát giữa các máy tính, bất kể bối cảnh mà chúng được đặt Mục tiêu chính của bài viết này là đề xuất mộtphương pháp hệ thống để tạo ra các bản thể luận, sử dụng các phương pháp như thuật toán phân cụm ngữ nghĩa để truy xuất và biểu diễn thông tin Sử dụng phương pháp được đề xuất, một ontology sẽ được phát triển trong miền ITS Bản thể luận này sẽ đóng vai trò là cơ sở của thông tin ngữ nghĩa cho SS (Dịch vụ ngữ nghĩa) cho phép kết nối thiết bị mới với mạng đô thị SS sử