1. Trang chủ
  2. » Giáo Dục - Đào Tạo

ĐỀ tài tổng quan hệ thống giao thông thông minh dựa trên dữ liệu

31 5 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tổng quan hệ thống giao thông thông minh dựa trên dữ liệu
Tác giả Phạm Trọng Lương
Trường học Trường Đại Học Giao Thông Vận Tải TP. Hồ Chí Minh
Chuyên ngành Khoa Công Nghệ Thông Tin
Thể loại Tiểu luận chuyên đề
Năm xuất bản 2022
Thành phố TP. Hồ Chí Minh
Định dạng
Số trang 31
Dung lượng 291,72 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Cấu trúc

  • CHƯƠNG I: MỞ ĐẦU (3)
  • CHƯƠNG II. KIẾN TRÚC CỦA VIỆC TIẾN HÀNH PHÂN TÍCH DỮ LIỆU LỚN TRONG ITS (4)
    • 1. Đặc điểm dữ liệu lớn trong ITS (4)
    • 2. Kiến trúc của việc tiến hành phân tích dữ liệu lớn trong ITS (5)
    • I, Các giải pháp thu thập dữ liệu lớn trong ITS (7)
      • 1. Dữ liệu lớn từ thẻ thông tin (7)
      • 2. Dự liệu lớn từ GPS (7)
      • 3. Dữ liệu lớn từ video (7)
      • 4. Dữ liệu cảm ứng biến (8)
      • 5. Dữ liệu lớn từ CAV and VANET (8)
      • 6. Dữ liệu lớn từ thu thập thụ động (9)
      • 7. Dữ liệu lớn từ các nguồn khác (9)
      • II. Phương pháp phân tích dữ liệu lớn trong ITS (9)
        • 1. Supervised Learning (9)
        • 2. Unsupervised Learning (11)
        • 3. Reinforcement Learning (13)
        • 5. Ontology Based Methods (15)
  • Chương IV: Ứng dụng dữ liệu lớn trong ITS (17)
    • 1. Road Traffic Accidents Analysis (17)
    • 2. Road Traffic Flow Prediction (18)
    • 3. Public Transportation Services Planning (18)
    • 4. Personal Travel Route Planning (19)
    • 5. Rail Transportation Management and Control (20)
    • 6. Asset Maintenance (21)
  • CHƯƠNG V. NỀN TẢNG DỮ LIỆU LỚN TRONG NÓ (23)
  • CHƯƠNG VI: THỬ THÁCH MỚI (26)
  • CHƯƠNG VII: KẾT LUẬN (28)

Nội dung

Hệ thống được ứng dụng khoa học kỹ thuật công nghệ, gồm các thiết bị như cảm biến,điện tử, tin học, viễn thông để điều khiển, điều hành và quản lý các hệ thống giao thôngvận tải tối ưu n

KIẾN TRÚC CỦA VIỆC TIẾN HÀNH PHÂN TÍCH DỮ LIỆU LỚN TRONG ITS

Đặc điểm dữ liệu lớn trong ITS

Hệ thống Giao thông thông minh (ITS - Intelligent Transport System) là tập hợp các công nghệ và phương pháp được ứng dụng trong lĩnh vực giao thông nhằm tối ưu hóa việc điều hành và quản lý giao thông vận tải ITS kết hợp các thiết bị cảm biến, hệ thống điều khiển, điện tử và các công nghệ thông tin, viễn thông để cải thiện hiệu suất, an toàn và khả năng giám sát của mạng lưới giao thông. -**Support Pollinations.AI:**🌸 **Quảng cáo** 🌸 Bạn tạo nội dung về hệ thống giao thông thông minh? [Ủng hộ sứ mệnh của chúng tôi](https://pollinations.ai/redirect/kofi) để AI luôn hỗ trợ sáng tạo của bạn!

ITS (Intelligent Transportation Systems) là công nghệ mới phát triển trên toàn cầu nhằm giải quyết các vấn đề giao thông như tai nạn, ùn tắc và cung cấp thông tin giao thông kịp thời ITS liên kết con người, hệ thống đường và phương tiện tham gia giao thông bằng các tiến bộ của công nghệ thông tin và viễn thông để hình thành một mạng lưới thông tin và viễn thông phục vụ cho việc lưu thông tối ưu trên đường Đánh giá tài liệu và tham khảo nhiều nguồn cho thấy nội dung chủ yếu tập trung vào ứng dụng cho phương tiện đường bộ, đồng thời mở rộng sang các lĩnh vực liên quan nhằm nâng cao an toàn, hiệu quả và khả năng dự báo lưu lượng Nhờ mạng lưới thông tin tích hợp, ITS cho phép giám sát, điều phối và tối ưu lưu lượng giao thông trên đường bộ, giảm thời gian di chuyển và cải thiện thông tin cho người tham gia giao thông.

Năm 2012 Gartner đã định nghĩa: “Dữ liệu lớn được mô tả là dung lượng lớn, tốc độ cao và loại hình thông tin đa dạng mà yêu cầu phương thức xử lý mới để cho phép tăng cường ra quyết định, khám phá bên trong và xử lý tối ưu”. Đây được coi là 3 đặc trưng cơ bản để mô tả cho dữ liệu lớn:

Dung lượng (Volume) – Dữ liệu lớn:

 Số lượng dữ liệu được tạo ra và lưu trữ.

 Với dữ liệu lớn, bạn sẽ phải xử lý khối lượng lớn dữ liệu phi cấu trúc, mật độ thấp. Đó có thể là dữ liệu có giá trị không xác định, chẳng hạn như nạp tải dữ liệu Twitter, lượt truy cập web hoặc ứng dụng trên thiết bị di động.

 Đối với một số tổ chức khối lượng dữ liệu có thể lên tới hàng chục terabyte hay hàng trăm terabyte.

Vận tốc (Velocity) – Dữ liệu lớn:

 Tốc độ các dữ liệu được tạo ra và xử lý theo thời gian thực.

Một số sản phẩm thông minh tích hợp Internet hoạt động theo thời gian thực hoặc gần thời gian thực, đòi hỏi hệ thống đánh giá dữ liệu và thực thi hành động ngay khi có sự kiện Việc xử lý thông tin tức thì giúp tối ưu hiệu suất, nâng cao độ chính xác và cải thiện trải nghiệm người dùng Để thiết kế các giải pháp IoT hiệu quả, cần tập trung vào khả năng xử lý thời gian thực, đảm bảo phản hồi nhanh chóng và an toàn cho người dùng và thiết bị.

Tính đa dạng (Variety) – Dữ liệu lớn:

 Các dạng và kiểu loại của dữ liệu có sẵn.

 Các kiểu dữ liệu truyền thống có cấu trúc và kiểu dữ liệu mới phi cấu trúc và bán cấu trúc (văn bản, âm thanh, video).

Ngoài ra, trong những năm trở lại đây, dữ liệu lớn có thêm 2 đặc trưng V khác đó là:

Giá trị (Value): một phần lớn giá trị của các công ty công nghệ lớn nhất thế giới đến từ quá trình phân tích dữ liệu của họ.

Tính xác thực (Veracity): chất lượng của dữ liệu thu được có thể khác nhau rất nhiều ảnh hưởng đến việc phân tích chính xác.[2]

Kiến trúc của việc tiến hành phân tích dữ liệu lớn trong ITS

Kiến trúc phân tích dữ liệu lớn trong ITS được thể hiện qua hình 1 và được chia thành ba lớp chính: lớp thu thập dữ liệu, lớp phân tích dữ liệu và lớp ứng dụng Lớp thu thập dữ liệu là bước đầu tiên, tập trung thu thập và tích hợp dữ liệu từ nhiều nguồn để đảm bảo độ đầy đủ và tin cậy cho quá trình phân tích tiếp theo Lớp phân tích dữ liệu chịu trách nhiệm xử lý, khai thác và trích xuất thông tin giá trị từ dữ liệu thu được nhằm hỗ trợ các quyết định và tối ưu hóa hoạt động của hệ thống ITS Lớp ứng dụng triển khai các kết quả phân tích vào các dịch vụ và hệ thống ITS, giúp cải thiện quản lý giao thông và trải nghiệm người dùng.

Lớp thu thập dữ liệu là lớp đầu tiên và là nền tảng của kiến trúc, vì nó cung cấp dữ liệu cho các lớp phía trên Dữ liệu được thu thập từ nhiều nguồn khác nhau như máy vòng cảm ứng, GPS và hệ thống giám sát video.

Lớp phân tích dữ liệu được xem là thành phần quan trọng nhất của kiến trúc hệ thống Lớp này nhận dữ liệu từ lớp thu thập dữ liệu và áp dụng các phương pháp phân tích dữ liệu lớn để thực hiện việc phân tích và chia sẻ dữ liệu với các thành phần khác của hệ thống, đảm bảo thông tin được khai thác hiệu quả và hỗ trợ quyết định kinh doanh.

Tầng ứng dụng là tầng trên cùng của kiến trúc hệ thống, đảm nhận xử lý dữ liệu từ lớp phân tích dữ liệu và triển khai các giải pháp cho nhiều tình huống thực tế Các ứng dụng điển hình của tầng này gồm quản lý lưu lượng giao thông, điều tiết giao thông để giảm ùn tắc và điều khiển đội cứu hộ khẩn cấp khi có sự cố, đồng thời tích hợp dữ liệu để tối ưu hóa hiệu suất hoạt động và đảm bảo an toàn.

Hình 1: Kiến trúc tiến hành phân tích dữ liệu lớn.

ChươngIII Tổng quan về các giải pháp

Mọi người tham gia một cách vô thức vào việc thu thập, truyền tải và ứng dụng Dữ liệu lớn trong ITS Sự phát triển của công nghệ ITS đã làm tăng độ phức tạp, tính đa dạng và lượng dữ liệu được sinh ra từ phương tiện và từ chuyển động của con người Theo các nguồn khác nhau trong ITS, Dữ liệu lớn có thể được phân loại chủ yếu thành các loại chính và dữ liệu thu thập được được minh họa trong Bảng.

Hình 2: Dữ liệu lớn trong nó

Các giải pháp thu thập dữ liệu lớn trong ITS

1 Dữ liệu lớn từ thẻ thông tin

Trong giao thông công cộng đô thị, dữ liệu từ thẻ thông minh ngày càng được dùng để thu vé tự động, cho phép một thẻ duy nhất tiếp cận hầu hết các loại phương thức hệ thống giao thông công cộng như xe buýt, tàu hỏa, tàu điện ngầm, đường sắt leo núi, LRT và phà Dữ liệu thẻ mang tính thụ động từ các thiết bị kiểm soát vận hành, có thể giúp các nhà hoạch định quá cảnh hiểu hành vi hành khách để lên kế hoạch dịch vụ ngắn hạn và dài hạn Tuy nhiên cơ sở hạ tầng và phương pháp truyền thống không hiệu quả khi xử lý hoặc phân tích khối lượng dữ liệu lớn Như một giải pháp thay thế, công nghệ dữ liệu lớn (Big Data) có thể được sử dụng để tăng cường thu thập, lưu trữ, xử lý và phân tích dữ liệu Động lực chính là hiệu quả chi phí của phương pháp này, vì chi phí xử lý và phân tích dữ liệu quy mô lớn là rất lớn nhưng có thể được tối ưu bằng Big Data Kinh nghiệm cho thấy sự kết hợp giữa kiến thức lập kế hoạch, dữ liệu lớn và công cụ khai thác dữ liệu cho phép tạo ra các chỉ số về hành vi đi lại, chính sách giao thông công cộng, hiệu suất vận hành và chính sách giá vé.

2 Dự liệu lớn từ GPS

GPS là công cụ xác định vị trí giúp thu thập dữ liệu giao thông một cách hiệu quả và an toàn nhờ tính năng theo dõi vị trí Khi được tích hợp với hệ thống thông tin địa lý (GIS), GPS trở thành một công cụ mạnh mẽ để thu thập dữ liệu và biến chúng thành thông tin có thể phân tích sâu cho các bài toán giao thông Dữ liệu thu thập được từ GPS và GIS có thể được sử dụng để giải quyết nhiều vấn đề về giao thông, như phát hiện chế độ di chuyển, đo độ trễ hành trình và giám sát tình hình giao thông Nhờ đó, các tổ chức và nhà quản lý có thể tối ưu quy hoạch, quản lý lưu lượng và giảm ùn tắc, đồng thời tăng cường an toàn giao thông Việc tích hợp GPS với GIS cho phép thu thập dữ liệu liên tục và có hệ thống, từ đó hỗ trợ quyết định dựa trên dữ liệu thực tế.

3 Dữ liệu lớn từ video

Video là phương tiện điện tử ghi hình, sao chép, phát lại, phát sóng và hiển thị hình ảnh chuyển động được lưu trữ trên các phương tiện Trong các hệ thống quản lý giao thông tiên tiến (ATMS), hệ thống phát hiện hình ảnh video (VIDS) là một lựa chọn thay thế hiệu quả so với các cảm biến truyền thống cho các tác vụ như nhận dạng phương tiện và phát hiện luồng giao thông, với chi phí thấp là một lợi thế đáng kể Việc tận dụng khối dữ liệu video lớn đã được triển khai thành công để thực hiện phát hiện sự cố và cho thấy độ chính xác cao ở những trường hợp nhất định Ngoài quản lý giao thông chung, các kỹ sư và nhà quy hoạch giao thông còn có thể thu thập dữ liệu video phương tiện có độ chính xác cao để cải thiện hệ thống xử lý hình ảnh, đáp ứng tốt hơn nhu cầu giao thông và liên quan đến các mô hình phát thải của phương tiện.

4 Dữ liệu cảm ứng biến

Các cảm biến được lắp đặt trên mặt đường nhằm thu thập thông tin về luồng giao thông, khí hậu và thời tiết, với dữ liệu này được hệ thống máy tính phân tích và xử lý để cung cấp cho tài xế thông tin về tình hình giao thông như tai nạn, ùn tắc và thời tiết, từ đó giúp tài xế chọn giải pháp di chuyển tối ưu, giảm thiểu tai nạn và ùn tắc và đảm bảo thời gian đi lại ngắn nhất, an toàn nhất cho các phương tiện đang lưu thông Việc thu thập dữ liệu từ cảm biến có thể chia làm 3 nguồn: dữ liệu bên đường, dữ liệu ô tô nổi và dữ liệu diện rộng.

Dữ liệu bên đường đề cập tới việc thu thập dữ liệu từ các cảm biến được đặt dọc theo tuyến đường, nhằm hỗ trợ giám sát và vận hành giao thông hiệu quả Các cảm biến bên đường thế hệ mới gồm cảm biến siêu âm và âm thanh, thiết bị radar nhận diện phương tiện, cảm biến hồng ngoại, cảm biến ánh sáng và cảm biến LIDAR, cùng với hệ thống phát hiện và xử lý hình ảnh/video ngày càng phổ biến nhờ những tiến bộ công nghệ gần đây.

Dữ liệu ô tô nổi (FCD) chủ yếu là dữ liệu di chuyển của phương tiện tại các vị trí khác nhau trong ITS Các cảm biến trên phương tiện cung cấp thông tin đáng tin cậy và hiệu quả để ước tính và lựa chọn lộ trình hợp lý Với sự phát triển của kỹ thuật cảm biến phương tiện, các kỹ thuật FCD phổ biến hiện nay bao gồm nhận dạng phương tiện tự động (AVI), nhận dạng biển số xe (LPR) và các bộ tiếp sóng như phương tiện thăm dò và thẻ thu phí điện tử.

Dữ liệu diện rộng cho lưu thông giao thông được thu thập từ các cảm biến và kỹ thuật theo dõi biến động như xử lý hình ảnh, ghi âm và video, dựa trên dữ liệu không gian Với nguồn dữ liệu diện rộng, các hệ thống phân tích trạng thái giao thông ở quy mô lớn có thể nắm bắt luồng di chuyển, mật độ phương tiện và các sự kiện bất thường từ nhiều nguồn camera và thiết bị cảm biến Việc kết hợp các nguồn dữ liệu này cho phép đánh giá chất lượng lưu thông, tối ưu tuyến đường và lên kế hoạch hạ tầng giao thông hiệu quả dựa trên phân tích không gian và thời gian Các phương pháp này hỗ trợ quản trị giao thông thời gian thực và dự báo lưu lượng, đồng thời cải thiện an toàn và hiệu quả di chuyển cho người dùng.

5 Dữ liệu lớn từ CAV and VANET

Các phương tiện kết nối và tự động (CAV) là công nghệ mới nổi trong lĩnh vực ITS Chúng kết hợp các thay đổi căn bản về thiết kế phương tiện với cách chúng tương tác với cơ sở hạ tầng đường bộ.

Xe kết nối và xe tự hành kết hợp nhiều công nghệ tiên tiến, tạo điều kiện thuận lợi cho việc di chuyển người và hàng hóa an toàn, hiệu quả Hệ thống giao thông hỗ trợ do CAV quản lý có tiềm năng lớn trong việc giảm tắc nghẽn, rút ngắn thời gian di chuyển và nâng cao hiệu suất an toàn CAV có thể tạo ra lượng lớn dữ liệu giao thông thời gian thực phù hợp với môi trường, như tọa độ, tốc độ, gia tốc và dữ liệu an toàn, từ đó hình thành thông tin có thể hành động để hỗ trợ và tạo điều kiện thuận lợi cho các quyết định chuyển đổi xanh và áp dụng điều khiển tín hiệu thích ứng thời thực Việc sử dụng các công nghệ mạng mới nhất như Mạng do phần mềm xác định (SDN) cho phép thu thập và xử lý dữ liệu hiệu quả hơn Những dữ liệu này có thể được sử dụng để tối ưu hóa luồng giao thông, cải thiện chất lượng môi trường đô thị và nâng cao hiệu quả di chuyển của cả người và hàng hóa.

VANET (Vehicular Ad Hoc Network), hay được Việt hóa là Mạng xe cộ bất định, là mạng không cần cơ sở hạ tầng được hình thành từ các phương tiện giao thông đang lưu thông trên đường Các xe được trang bị thiết bị thu‑phát để liên lạc, chia sẻ và trao đổi thông tin với các nút mạng ad hoc, giúp truyền tải dữ liệu một cách linh hoạt giữa các phương tiện Thông tin trong VANET bao gồm lưu lượng xe, tình trạng kẹt xe, tai nạn giao thông và các nguy hiểm cần tránh, đồng thời hỗ trợ các dịch vụ thông tin phổ biến như dịch vụ đa phương tiện và Internet.

6 Dữ liệu lớn từ thu thập thụ động

Thu thập dữ liệu thụ động được sử dụng để phân tích cạnh tranh và hỗ trợ đánh giá trước và sau phẫu thuật, giúp hiểu rõ hành vi người dùng và kết quả điều trị Tuy nhiên, một số quốc gia hoặc bang có khung luật riêng cho phép người dùng từ chối cung cấp dữ liệu nhạy cảm, nhằm tăng cường quyền riêng tư và tuân thủ các quy định về bảo vệ dữ liệu.

Trong những tình huống như vậy, thu thập dữ liệu thụ động đóng vai trò quan trọng để hiểu khách hàng và tối ưu trải nghiệm người dùng Bằng cách tận dụng dữ liệu thụ động, doanh nghiệp có thể thu thập thông tin về khách hàng/người dùng từ nhiều nguồn và phương pháp khác nhau, như dữ liệu hành vi trên website, log máy chủ, dữ liệu tương tác ứng dụng, dữ liệu vị trí khi có sự đồng ý, và các tín hiệu từ thiết bị, từ đó xây dựng hồ sơ người dùng, nhận diện xu hướng và cá nhân hóa nội dung, quảng cáo cũng như cải thiện hiệu quả tiếp thị và quản lý sản phẩm.

• Dữ liệu thiết bị di động

7 Dữ liệu lớn từ các nguồn khác

Một nguồn dữ liệu quan trọng khác là dữ liệu thu được từ thử nghiệm chuyên dụng trong ITS Ví dụ từ các dự án trước, chúng tôi đã thực hiện thử nghiệm thực địa với hệ thống thông tin liên lạc trên mặt đất dành cho giao thông đường sắt đô thị, nơi hệ thống điều khiển tàu hỏa dựa trên thông tin liên lạc (CBTC) được triển khai Số lượng lớn dữ liệu kênh thu được từ các thử nghiệm hiện trường cho phép phân tích và mô hình hóa đặc tính ngẫu nhiên của trạng thái kênh Dữ liệu này được xử lý để xây dựng các mô hình mô phỏng kênh liên lạc và từ đó tối ưu hóa hiệu suất hoạt động của CBTC Việc tích hợp dữ liệu thử nghiệm chuyên sâu giúp đánh giá độ tin cậy và hiệu quả của hệ thống CBTC trong điều kiện thực tế.

II.Phương pháp phân tích dữ liệu lớn trong ITS

Trong học máy có giám sát, dữ liệu huấn luyện được dán nhãn và được dùng để học một ánh xạ giữa đầu vào và đầu ra mục tiêu Các mô hình học có giám sát kết hợp dữ liệu đầu vào với nhãn để học chức năng dự đoán và có thể dự đoán kết quả đầu ra cho dữ liệu chưa từng thấy khi được kết hợp với mô hình đã học Trong số các mô hình học có giám sát được áp dụng phổ biến, hồi quy tuyến tính, cây quyết định, mạng thần kinh và máy vectơ hỗ trợ thường được sử dụng nhiều nhất trong ITS Việc hiểu và áp dụng các mô hình này giúp tối ưu hóa dự đoán và phân tích dữ liệu nhãn cho các hệ thống giao thông thông minh.

Chức năng của hồi quy là giải thích mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập Hồi quy tuyến tính là phương pháp học có giám sát được sử dụng phổ biến nhất nhờ tính đơn giản, mạnh mẽ, dễ diễn giải và dễ viết mã Mặc dù đơn giản, hồi quy tuyến tính vẫn đạt được thành công lớn trong các kịch bản ITS như dự đoán lưu lượng giao thông, ước tính tốc độ giao thông và đánh giá tuyến đường vận chuyển.

Ứng dụng dữ liệu lớn trong ITS

Road Traffic Accidents Analysis

Toàn cầu ghi nhận khoảng 1,2 triệu người tử vong và 50 triệu người bị thương do tai nạn giao thông mỗi năm, cho thấy tác động nghiêm trọng của vấn đề này Việc phân tích dữ liệu tai nạn giao thông một cách chính xác có thể cung cấp những thông tin quan trọng cho các cơ quan giao thông để xây dựng và điều chỉnh các chính sách ngăn ngừa tai nạn hiệu quả.

Phân tích thống kê đa biến tuyến tính và phi tuyến được áp dụng để xác định cách các loại tai nạn trên các đường cao tốc ở Nam California liên quan đến luồng giao thông và điều kiện ánh sáng, thời tiết và môi trường xung quanh Lưu lượng giao thông được đo bằng chuỗi quan sát 30 giây từ các cảm biến vòng quanh khu vực vụ tai nạn trước thời điểm xảy ra Kết quả cho thấy loại va chạm có liên quan mạnh tới tốc độ trung bình và sự biến thiên của tốc độ theo thời gian ở các làn trái và làn trong Các vụ va chạm liên quan đến nhiều phương tiện và va chạm do thao tác thay làn đường có khả năng xảy ra nhiều trên đường ướt, trong khi va chạm phía sau có xu hướng xảy ra trên đường khô vào ban ngày Việc kiểm soát điều kiện thời tiết và ánh sáng cho thấy mức độ nghiêm trọng của tai nạn bị ảnh hưởng nhiều hơn so với tốc độ.

Các mô hình thống kê như hồi quy Poisson hoặc hồi quy nhị thức âm được sử dụng để phân tích tần suất tai nạn xe cộ trong nhiều năm, nhưng chúng dựa trên các giả định và mối quan hệ giữa biến phụ thuộc và biến độc lập được xác định trước; khi các giả định này bị vi phạm, ước tính về xác suất tai nạn có thể bị lệch CART (cây phân loại và hồi quy) là một kỹ thuật khai thác dữ liệu phổ biến trong quản trị kinh doanh, công nghiệp và kỹ thuật, không yêu cầu mối quan hệ cơ bản xác định trước giữa biến mục tiêu và biến dự đoán và được xem là công cụ mạnh cho dự báo và phân loại Nghiên cứu này sử dụng dữ liệu tai nạn năm 2001–2002 trên Quốc lộ 1 tại Đài Loan; CART và mô hình hồi quy nhị thức âm được phát triển để thiết lập mối quan hệ thực nghiệm giữa tai nạn giao thông và các biến hình học trên đường cao tốc, đặc điểm giao thông và các yếu tố môi trường.

Road Traffic Flow Prediction

Hình 4: Một mô hình dự đoán lưu lượng giao thông điển hình

Public Transportation Services Planning

Phân tích dữ liệu lớn về giao thông công cộng giúp hiểu sâu các mô hình hành trình của người dùng trên mạng lưới giao thông công cộng Các mẫu hành trình của hành khách từ dữ liệu này có thể được sử dụng để hỗ trợ các nhà khai thác vận tải trong việc lập kế hoạch dịch vụ, tối ưu hóa lịch trình và tuyến đường, cải thiện tần suất phục vụ và chất lượng trải nghiệm người đi lại.

Quá trình đô thị hóa nhanh chóng khiến lưu lượng du lịch ngày càng tăng và thách thức các chính sách quy hoạch giao thông hiệu quả Dữ liệu di động nổi lên như nguồn dữ liệu lớn nhất cho quy hoạch, nhưng chưa được tích hợp đầy đủ vào các mô hình quy hoạch giao thông và bản đồ lưu lượng hành khách trên các mạng lưới vận tải đa phương thức Hiện tại, các cơ quan quản lý vận tải thiếu một bức tranh tổng thể về lưu lượng hành khách hàng ngày và bài toán suy ra luồng Điểm gốc-Đích theo chế độ vận chuyển từ dữ liệu mạng di động vẫn chưa được giải quyết Trong nghiên cứu này, chúng tôi đề xuất phương pháp đầu tiên để suy ra luồng Điểm gốc-Đích động theo các chế độ vận chuyển sử dụng dữ liệu mạng di động, ví dụ: Bản ghi chi tiết cuộc gọi, và xử lý trước 360 triệu quỹ đạo cho hơn 2 triệu thiết bị từ Greater Paris làm khu vực nghiên cứu điển hình Mô hình kết hợp định vị mạng di động với mạng giao thông dựa trên dữ liệu không gian địa lý, khảo sát du lịch, điều tra dân số và dữ liệu thẻ du lịch Các chế độ vận chuyển của quỹ đạo được xác định thông qua thuật toán bán giám sát hai bước, với bước thứ nhất là phân cụm khu vực mạng di động và bước hai là suy luận Bayes để tạo ra xác suất vận chuyển cho các quỹ đạo Sau khi gán chế độ có xác suất cao nhất cho từng quỹ đạo, chúng tôi xây dựng ma trận Điểm gốc-Đích theo chế độ vận chuyển và mở rộng lưu lượng sang tổng dân số bằng các hệ số mở rộng hiện đại Mô hình cho ra các luồng hành khách đường bộ và đường sắt biến đổi theo thời gian cho toàn khu vực, cho thấy sự khác biệt mô hình di chuyển giữa đường bộ và đường sắt cũng như giữa Paris và vùng ngoại thành Kết quả được xác thực rộng rãi dựa trên khảo sát du lịch và dữ liệu thẻ du lịch ở quy mô không gian khác nhau [15].

Việc sử dụng dữ liệu điện thoại di động từ các kho dữ liệu mã nguồn mở cho phép triển khai các mô hình nhu cầu du lịch một cách hiệu quả Dữ liệu này có thể được dùng để xác định mạng lưới đường đi, ma trận định tuyến và bảng hành trình thông qua phân tích dữ liệu từ Bản ghi cuộc gọi (CDR) bằng các mô hình phù hợp Công việc này đóng vai trò như một hướng dẫn chung giúp các nhà khai thác vận tải thực hiện quy hoạch giao thông công cộng một cách có căn cứ và bền vững.

Personal Travel Route Planning

Các ứng dụng vận chuyển bắt đầu với tầm nhìn cung cấp thông tin vận chuyển theo thời gian thực cho các phương tiện như xe buýt, tàu điện ngầm và đường sắt nhẹ và hiện diện tại nhiều thành phố trên thế giới ở nhà ga, trung tâm vận chuyển và các điểm dừng lớn; tuy nhiên, việc lắp đặt và duy trì màn hình thời gian thực tại từng điểm dừng tốn kém Nhờ sự phổ biến của thiết bị di động và dữ liệu lịch trình quá cảnh ở định dạng máy đọc được, nhiều công cụ đã được phát triển để cung cấp thông tin này qua nhiều giao diện, kể cả trên điện thoại di động, và các hệ thống này thường rẻ hơn so với màn hình cố định tại nhiều điểm dừng Thêm vào đó, các hệ thống di động có thể hỗ trợ chức năng bổ sung được cá nhân hóa, như cảnh báo tùy chỉnh Một trong những hệ thống theo dõi xe buýt trực tuyến sớm nhất là Busview, do Daniel Tweetsey và các đồng sự phát triển [16].

Google Transit vừa mở rộng khả năng lên kế hoạch chuyến đi cho hơn 400 thành phố trên toàn cầu, dù dữ liệu chưa được cập nhật theo thời gian thực Dịch vụ này cho phép người dùng xây dựng lộ trình di chuyển giữa các điểm đến bằng cách kết hợp nhiều phương thức vận chuyển khác nhau, giúp tối ưu hóa thời gian và sự thuận tiện Mặc dù không cung cấp thông tin thời gian thực, phạm vi phủ sóng rộng của Google Transit mang lại lựa chọn hữu ích cho người dùng khi lên kế hoạch hành trình ở nhiều quốc gia và khu vực trên thế giới.

GTFS là một tiêu chuẩn dữ liệu vận chuyển công khai cho lịch trình và dữ liệu liên quan, cho phép các cơ quan vận tải chia sẻ thông tin ở định dạng chuẩn và giúp Google Transit thiết lập nền tảng trao đổi dữ liệu vận chuyển giữa nhiều bên Nhiều cơ quan vận tải tham gia chương trình Google Transit đã phát hành dữ liệu lịch trình ở định dạng GTFS để các nhà phát triển bên thứ ba xây dựng ứng dụng, tạo ra một hệ sinh thái phát triển từ dữ liệu công khai và xuất hiện nhiều người được gọi là transit hackers sáng tạo tận dụng dữ liệu này Trang ứng dụng của Portland TriMet liệt kê hơn 20 ứng dụng sử dụng dữ liệu vận chuyển của Portland, nhiều ứng dụng nhắm tới người dùng di động và khai thác khả năng địa phương hóa trên thiết bị Các hệ sinh thái tương tự cũng tồn tại ở San Francisco Bay Area, Chicago và các thành phố lớn khác Một số nhà nghiên cứu đã xem xét cách các ứng dụng di động có thể cải thiện tính khả dụng của dịch vụ vận chuyển cho cả người đi lại nói chung và các nhóm mục tiêu như người có nhận thức bị suy yếu OneBusAway nhắm tới tính dễ sử dụng phổ quát bằng cách cung cấp một loạt giao diện người dùng thân thiện, đồng thời dựa vào mã nguồn mở và mô hình làm việc nhóm nhằm thúc đẩy truy cập mở vào dữ liệu vận chuyển.

Rail Transportation Management and Control

Những thập kỷ nghiên cứu vận hành đường sắt cho thấy các mô hình kính hiển vi hiệu quả trong việc hỗ trợ quản lý các khu vực điều phối, nhưng tính toán cho mạng lưới lớn thường quá dài và khó áp dụng rộng rãi Vấn đề kiểm soát lưu lượng tàu ở cấp quốc gia vẫn còn bỏ ngỏ do việc phối hợp giữa các khu vực địa phương khó thực hiện nhanh chóng và có nhiều sự phụ thuộc giữa các chuyến tàu trên toàn mạng lưới Vì vậy, mục tiêu là phát triển các mô hình vĩ mô mới có thể tích hợp các quyết định quản lý giao thông để tối ưu hóa vận hành và hiệu quả của hệ thống đường sắt.

Phân tích dữ liệu lớn trong giao thông công cộng giúp hiểu rõ hơn cách mọi người di chuyển đến thành phố và phát triển mô hình du lịch của hành khách để đánh giá chất lượng dịch vụ Dữ liệu điện thoại di động ẩn danh từ hàng triệu người có thể được dùng để dự đoán các hành trình đi ô tô một cách thường xuyên Các cuộc thăm dò địa phương và quốc gia có thể chứng thực sự khả thi của các mô hình này Để tính thời gian lên tàu và xuống tàu, dữ liệu vị trí của Metro và IBUS có thể được kết hợp với thông tin từ thẻ thông minh Phân tích dữ liệu lớn cho quản lý giao thông có thể được lợi từ các phát hiện này Dữ liệu thẻ thông minh được khai thác để tạo ma trận dòng chảy và tuyến xe buýt cho cả chuyến đi BRT và không BRT Chính sách BRT dựa trên bằng chứng có thể được định hình bằng cách tham khảo bộ phận quản lý dịch vụ Với một nền tảng quản lý được cập nhật dễ sử dụng, các nhà hoạch định và vận hành giao thông đường sắt có thể nhận phản hồi gần thời gian thực về nhiều khía cạnh dịch vụ Để xây dựng mô hình nhu cầu dựa trên điện thoại di động, có thể khai thác các nguồn dữ liệu mở; dữ liệu hồ sơ cuộc gọi (CDR) có thể được dùng để tái tạo mạng lưới đường, ma trận OD được xác thực và bảng chuyến đi, hỗ trợ cho các nhà hoạch định giao thông công cộng trên toàn thế giới.

Hou và cộng sự đề xuất ba thuật toán điều khiển dừng tàu, trong đó dữ liệu vị trí phanh ban đầu, dữ liệu lực phanh và sự kết hợp của chúng được chọn làm đầu vào điều khiển Phương pháp điều khiển học lặp đầu cuối (TILC) lần đầu tiên được ứng dụng vào lĩnh vực điều khiển điểm dừng tại ga và ba thuật toán dựa trên TILC được đề xuất trong nghiên cứu này Phương pháp điều khiển dừng ga tàu dựa trên TILC sử dụng lỗi vị trí dừng cuối cùng từ quá trình phanh trước đó để cập nhật cấu hình điều khiển hiện tại Vị trí phanh ban đầu, lực phanh hoặc sự kết hợp của chúng được chọn làm đầu vào điều khiển và các luật học tương ứng được phát triển Lỗi vị trí dừng đầu cuối của mỗi thuật toán được đảm bảo hội tụ về một vùng nhỏ liên quan đến độ lệch ban đầu của vị trí phanh bằng phân tích nghiêm ngặt [19].

Asset Maintenance

Hình 5: Một khuôn khổ điển hình của việc sử dụng phân tích dữ liệu lớn để bảo trì tài sản

Trong hệ thống ITS, các tài sản quan trọng phụ thuộc vào một lượng lớn dữ liệu để vận hành và bảo trì Phương pháp bảo trì tài sản phù hợp dựa trên phân tích dữ liệu lớn giúp phát hiện vấn đề nhanh chóng, tối ưu chi phí và bảo vệ vốn ITS Một khuôn khổ điển về cách dùng phân tích dữ liệu lớn để ra quyết định bảo trì có thể được hình dung từ dữ liệu thu thập từ cảm biến trên tàu và cơ sở hạ tầng Dữ liệu vật lý như xuống cấp mặt đường, lão hóa dằn và hình dạng đường ray có thể được sử dụng trực tiếp, trong khi dữ liệu văn bản từ kinh nghiệm quản lý và báo cáo bảo trì có thể được xử lý để trích xuất thông tin quan trọng Việc kết hợp cả dữ liệu cảm biến và văn bản cho phép phân tích toàn diện, nhanh hơn và tiết kiệm chi phí, từ đó nâng cao hiệu quả và độ bền của hệ thống ITS.

Dữ liệu trạng thái từ cơ sở hạ tầng và thiết bị, như nhiệt độ và độ ẩm, được thu thập và xử lý bằng hệ thống quản lý dữ liệu để tạo ra các chỉ báo tình trạng cho cơ sở hạ tầng và phương tiện Kết quả từ sự tích hợp của ba phương pháp quy trình cho phép chẩn đoán chính xác tình trạng tài sản và ước tính thời gian sử dụng hữu ích còn lại (RUL) Thông tin này có thể được cung cấp cho người dùng cuối để đưa ra quyết định về bảo trì và vận hành, từ đó tối ưu hóa hiệu suất và giảm chi phí bảo dưỡng.

Một phương pháp ra quyết định bảo trì dựa trên mờ cho cơ sở hạ tầng đường sắt để giải quyết vấn đề về một lỗi mỏi tiếp xúc lăn cụ thể được gọi là ngồi xổm được trình bày Dựa vào các phép đo Gia tốc hộp trục (ABA) để phát hiện các ô vuông, một mô hình mạnh mẽ được sử dụng để dự đoán sự phát triển của các ô vuông được phát hiện theo ba kịch bản tăng trưởng khác nhau (nhanh, trung bình, chậm) Khi một đường đua là ứng cử viên để bảo trì phòng ngừa, để tạo điều kiện thuận lợi cho các hoạt động mài, chúng tôi đề xuất một phương pháp phân cụm mờ để nhóm các ô vuông nhẹ là những ứng cử viên tốt để được xử lý cùng nhau vì chúng ở gần nhau Sử dụng phương pháp α% mới dựa trên phân cụm, các mặt trận Pareto được phân tích để cho thấy sự đánh đổi giữa số lượng squats không được xử lý và tỷ lệ phần trăm bao phủ liên quan đến α% Dựa trên mô hình dự đoán, bốn chỉ số hiệu suất chính ở cấp độ kỹ thuật được kết hợp bằng cách sử dụng một hệ thống chuyên gia mờ để ước tính tình trạng sức khỏe toàn cầu của từng cụm ngồi xổm Hiệu quả chi phí ước tính của các hành động bảo trì khác nhau được so sánh Do đó, các nhà quản lý cơ sở hạ tầng sẽ có thể ước tính tình trạng theo dõi trên mỗi cụm, sau đó dễ dàng xếp hạng các cụm light squats theo tầm quan trọng của chúng Ngoài ra, các chỉ báo dự đoán cho phép các nhà quản lý cơ sở hạ tầng quyết định phần nào của đường ray cần được thay thế khi phát hiện có chỗ ngồi nghiêm trọng trong đường đua Để minh họa cho phương pháp được đề xuất, đường ray Groningen-Assen của mạng lưới đường sắt Hà Lan được sử dụng Do đó, các nhà quản lý cơ sở hạ tầng sẽ có thể ước tính tình trạng theo dõi trên mỗi cụm, sau đó dễ dàng xếp hạng các cụm light squats theo tầm quan trọng của chúng Ngoài ra, các chỉ báo dự đoán cho phép các nhà quản lý cơ sở hạ tầng quyết định phần nào của đường ray cần được thay thế khi phát hiện có chỗ ngồi nghiêm trọng trong đường đua Để minh họa cho phương pháp được đề xuất, đường ray Groningen-Assen của mạng lưới đường sắt Hà Lan được sử dụng Do đó, các nhà quản lý cơ sở hạ tầng sẽ có thể ước tính tình trạng theo dõi trên mỗi cụm, sau đó dễ dàng xếp hạng các cụm light squats theo tầm quan trọng của chúng Ngoài ra, các chỉ báo dự đoán cho phép các nhà quản lý cơ sở hạ tầng quyết định phần nào của đường ray cần được thay thế khi phát hiện có chỗ ngồi nghiêm trọng trong đường đua Để minh họa cho phương pháp được đề xuất, đường ray Groningen-Assen của mạng lưới đường sắt Hà Lan được sử dụng.[20]

NỀN TẢNG DỮ LIỆU LỚN TRONG NÓ

Phân tích Dữ liệu lớn trong ITS đã và đang phát triển với sự trợ giúp từ các nền tảng Dữ liệu lớn tiên tiến Nền tảng Dữ liệu lớn tận dụng hệ thống tệp phân tán và khả năng tính toán song song để cho phép xử lý dữ liệu nhanh Nó có khả năng hiểu Dữ liệu lớn cũng như hỗ trợ tối ưu hóa hệ thống quy mô lớn.

Hình 6: Khung điển hình sử dụng nền tảng Apache Spark trong ITS

Apache Hadoop là khung phần mềm nguồn mở phổ biến nhất cho lưu trữ và xử lý số lượng lớn tập dữ liệu bằng cách phân tán nhiệm vụ trên nhiều máy Là nền tảng xử lý dữ liệu lớn đa năng, Hadoop cho phép thực hiện nhiều loại hoạt động xử lý và phân tích dữ liệu khác nhau Nhờ khả năng xử lý phân tán, Hadoop trở thành lựa chọn tối ưu cho phân tích dữ liệu trong ITS (hệ thống giao thông thông minh) cũng như các nguồn dữ liệu đa dạng như thẻ thông minh, cảm biến, mạng xã hội và dữ liệu GPS.

Apache Spark là nền tảng nguồn mở mới nhất để xử lý số lượng lớn tập dữ liệu, đặc biệt được tối ưu cho các tác vụ học máy Spark áp dụng công nghệ lưu trữ phân tán giống như Hadoop, cho phép người dùng tải dữ liệu vào bộ nhớ của cụm và thực hiện các truy vấn lặp đi lặp lại với hiệu suất cao Spark rất phù hợp với các phương pháp học máy và các kỹ thuật phân tích dữ liệu lớn mà chúng tôi đã giới thiệu ở tiểu mục trước, và những phương pháp này chắc chắn có thể được triển khai trên cả nền tảng Hadoop và Spark.

Khung điển hình cho ITS Dữ liệu sử dụng nền tảng Apache Spark để thu thập dữ liệu từ nhiều nguồn thông qua API HBase (Cơ sở dữ liệu Hadoop) và đẩy về trung tâm dữ liệu Spark Streaming xử lý dữ liệu theo thời gian thực, cho phép thực hiện các tác vụ như phát hiện tốc độ xe, nhận dạng xe và cảnh báo thời gian thực HBase là một cơ sở dữ liệu nguồn mở phân tán, thực hiện trích xuất tính năng cấp cao và xây dựng chỉ mục cho các tập dữ liệu lớn nhằm cải thiện hiệu quả và tốc độ truy xuất dữ liệu.

Spark Core là nền tảng cốt lõi của hệ thống Spark, cho phép thực hiện các tác vụ ngoại tuyến thông qua khả năng tính toán phân tán mạnh mẽ Nhờ động cơ Spark Core, các nhiệm vụ quan trọng như quản lý và kiểm soát giao thông, phân tích tai nạn và nhiều tác vụ xử lý dữ liệu khác có thể được thực thi hiệu quả trên nền tảng này.

Bài viết trình bày cách dữ liệu lớn có thể được sử dụng để chuẩn bị cho các thành phố thông minh, nơi các quyết định được thực hiện trong thời gian thực và xử lý khối lượng dữ liệu lớn Một thành phần quan trọng của thành phố thông minh trong các ứng dụng ITS là sử dụng các kỹ thuật trí tuệ nhân tạo phụ thuộc nhiều vào môi trường mô phỏng để đánh giá và thử nghiệm các chiến lược ITS Trong bài này, chúng tôi trình bày một mô hình cho mạng lưới giao thông GTA Mặc dù mô hình cho phép các ứng dụng vận chuyển dữ liệu lớn chạy trong thời gian thực, quá trình xây dựng của nó đòi hỏi làm việc chuyên sâu với dữ liệu lớn; chúng tôi chỉ ra cấu trúc, hiệu chuẩn và kết quả đầu ra của mô hình, cùng với một số ứng dụng được trình bày từ mô hình đề xuất Những ứng dụng dữ liệu lớn này là một bước tiến tới thành phố thông minh Toronto và đề xuất một nền tảng để thực hiện phân tích dữ liệu giao thông đô thị nhằm hiểu rõ hơn các kiểu lưu lượng Nền tảng bao gồm các lớp dữ liệu, phân tích và quản lý, và có thể được tận dụng bởi các ứng dụng lưu lượng truy cập hoặc trực tiếp bởi các nhà nghiên cứu, kỹ sư lưu lượng và nhà lập kế hoạch Nền tảng dựa trên cụm và tận dụng đám mây để đạt được độ tin cậy, khả năng mở rộng và khả năng thích ứng với điều kiện hoạt động thay đổi, đồng thời phù hợp với cả phân tích trực tuyến và hồi cứu Chúng tôi đã xác thực một số trường hợp sử dụng, chẳng hạn như xác định tốc độ trung bình và các đoạn tắc nghẽn trên các tuyến cao tốc chính ở Vùng Greater Toronto (GTA).

Bài viết cho thấy nhiều hạn chế của trung tâm dữ liệu truyền thống về chi phí, tối ưu hóa tài nguyên và tiêu thụ điện năng, đồng thời làm rõ xu hướng phát triển của trung tâm dữ liệu ảo và những ưu điểm kỹ thuật của nó, từ đó đề xuất sơ đồ hệ thống ảo cho trung tâm dữ liệu giao thông thông minh trên nền VMware vSphere nhằm nâng cao hiệu quả vận hành và tính mở rộng Đồng thời bài viết hướng tới quản lý luồng dữ liệu giao thông trong hệ thống đô thị thông minh trong môi trường điện toán đám mây, với luồng dữ liệu lớn, đa nguồn, thời gian thực và có tính không chắc chắn được gửi từ các nguồn dữ liệu chuyên sâu xuyên khu vực Bên cạnh đó, bài phân tích đặc tính và mối tương quan giữa hoạt động giao thông thực tế của thành phố và luồng dữ liệu giao thông, nghiên cứu cơ chế hình thành dữ liệu không chắc chắn, xây dựng mô hình luồng dữ liệu lưu lượng dựa trên ontology, metadata cốt lõi và lý thuyết về các ràng buộc; trên cơ sở này kết hợp ảo hóa và xử lý dữ liệu lớn ở mức song song, cân bằng tải và cơ chế thích ứng, đồng thời kết hợp lý thuyết mờ và lý thuyết đa đối tượng động với lý thuyết quyết định đa ràng buộc để tìm kiếm thuật toán truy vấn hiệu quả cho vận tải động, phức tạp và liên tục của dòng dữ liệu.

Trong nền tảng xử lý Dữ liệu lớn cho ITS, xử lý luồng dữ liệu thời gian thực là yếu tố thiết yếu cho các ứng dụng như giám sát và kiểm soát giao thông cũng như lịch trình giao thông công cộng Dựa trên hệ thống xử lý Dữ liệu lớn truyền thống, các hệ thống giao thông thông minh đã đề xuất các kiến trúc xử lý dữ liệu thời gian thực để đáp ứng yêu cầu từ nguồn dữ liệu đa dạng Guerreiro và cộng sự đề xuất một kiến trúc ETL (trích xuất, biến đổi và tải) cho các hệ thống giao thông thông minh, tập trung vào kịch bản thu phí động cho đường cao tốc Kiến trúc này cho phép xử lý cả dữ liệu lịch sử và dữ liệu thời gian thực bằng cách sử dụng các công nghệ Dữ liệu lớn như Apache Spark trên Hadoop và MongoDB.

Nền tảng xử lý luồng dữ liệu được đề xuất nhằm hỗ trợ cơ chế chia sẻ nguồn dữ liệu giữa nhiều bên, chia sẻ thành phần phần mềm và thậm chí cả kết quả trung gian Nền tảng này được minh họa bằng một ví dụ về quản lý lưu lượng, cho thấy cách thu thập, định tuyến và điều phối dữ liệu một cách hiệu quả Kiến trúc toàn diện và linh hoạt dựa trên nền tảng tính toán phân tán nhằm kiểm soát lưu lượng thời gian thực được đề xuất, giúp tối ưu hóa quy trình xử lý dữ liệu Một phần kiến trúc đã được hiện thực hóa trong một nền tảng nguyên mẫu sử dụng Kafka, công cụ Dữ liệu lớn hiện đại, để xây dựng các đường dẫn dữ liệu và xử lý luồng.

Các hệ thống vận chuyển được kết nối (CTS) đòi hỏi một hạ tầng có khả năng xử lý tín hiệu thời gian thực đồng thời đảm bảo khả năng mở rộng Bên cạnh việc thu thập dữ liệu, CTS phải hỗ trợ phân tích dữ liệu ở quy mô lớn, ví dụ sử dụng dữ liệu không gian địa lý để phát hiện các mối quan tâm về an toàn trong khu vực lân cận của phương tiện thông qua xử lý hàng loạt và luồng Chương này xem xét các hệ thống cơ sở hạ tầng dữ liệu hiện có và vai trò của chúng trong các hệ thống CTS.

Ngày đăng: 21/12/2022, 20:24

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w