DỮ LIỆU GPS TỪ DI ĐỘNG
Dữ liệu bản đồ số
Bản đồ số OpenStreetMap (OSM) sẽ được áp dụng trong nghiên cứu này Với tính chất mở, OSM cho phép thao tác dễ dàng hơn so với các bản đồ có bản quyền Bản đồ nền cho hệ thống giao thông sẽ bao gồm tất cả các tuyến đường trong đô thị, với các dữ liệu cụ thể cần thiết.
Điểm Node là các tọa độ cụ thể (kinh độ và vĩ độ) trên bản đồ, đóng vai trò quan trọng trong việc hình thành các phân đoạn đường và tuyến đường.
Phân đoạn đường, hay còn gọi là Segment, là một phần của tuyến đường được xác định bởi hai điểm đầu và điểm cuối, bao gồm cả kinh độ và vĩ độ Độ rộng của phân đoạn này phụ thuộc vào từng loại phân đường, chẳng hạn như phân đoạn chính (primary) hay phân đoạn thứ cấp (secondary).
• Tuyến đường – Street: Là tập hợp của các phân đoạn đường liên tiếp nhau Tuyến đường có tên và có phân loại
Ô - Cell là một công cụ được thiết kế để phân chia bản đồ thành các khu vực nhỏ nhằm tối ưu hóa quá trình tính toán Mỗi ô Cell có hình dạng vuông với kích thước đã được xác định trước, bao phủ toàn bộ bản đồ thành phố.
Phân hoạch Cell là quá trình tổ chức dựa trên các ô Cell và segment hiện có Mỗi ô Cell chứa một tập hợp các segment liên quan, được xác định dựa trên kết quả tính toán từ tọa độ trên bản đồ Mục tiêu chính là tối ưu hóa việc tìm kiếm dữ liệu, giúp giảm thiểu thời gian truy xuất dữ liệu lớn trên bản đồ.
Bản đồ nền OpenStreetMap, tải về dưới dạng file OSM, là một bản đồ số nguồn mở miễn phí cho tất cả người dùng Mặc dù dữ liệu này do cộng đồng đóng góp, mức độ chi tiết và chính xác phụ thuộc vào sự tích cực của người dùng Tại Việt Nam, bản đồ đường phố của OpenStreetMap đã được cập nhật khá đầy đủ nhờ vào sự hỗ trợ của cộng đồng, nhưng vẫn còn một số dữ liệu chưa chính xác và cần thêm sự giúp đỡ để hoàn thiện hơn.
2.1.1 Tổ chức dữ liệu OSM
Phạm vi thu thập dữ liệu bao gồm toàn bộ Việt Nam, với các file OSM được tải về từ khu vực này Sau khi có được các file OSM chứa dữ liệu bản đồ Việt Nam, chúng ta có thể áp dụng các tiêu chuẩn chuẩn hóa dữ liệu của OpenStreetMap để phân tích và trích xuất những thông tin cần thiết cho hệ thống.
The data extracted from OSM files includes Nodes, Streets, and Segments Additionally, new data models such as Cells and Segment Cells are created using the information derived from Nodes, Streets, and Segments.
Một đoạn thông tin của một Node từ file OSM:
Những thông tin được lấy dùng làm dữ liệu nền: node id, node latitude, node longitude
Một đoạn thông tin của một con đường từ file OSM:
Các thuộc tính là Node id trong file OSM
The foundational data utilized includes street ID, street name, and street type The segment is derived from the information of a street and node mentioned above.
Những thông tin được lấy dùng làm dữ liệu nền: street id, node id 1, node id 2 Ô - Cell
Cell là dữ liệu tự định nghĩa Bản đồ được chia thành nhiều ô vuông nhỏ như
Đặc điểm của dữ liệu GPS từ các thiết bị di động
Ngày nay, thiết bị di động, đặc biệt là điện thoại thông minh, ngày càng được trang bị nhiều cảm biến và module tiên tiến Không chỉ dừng lại ở chức năng liên lạc, các smartphone hiện đại tích hợp nhiều tính năng như cảm biến gia tốc, camera và định vị GPS Kèm theo đó, các thư viện hỗ trợ xử lý và phân tích dữ liệu từ các module này đã được công khai và phát triển dưới dạng mã nguồn mở, cho phép người dùng trích xuất thông tin hữu ích từ thiết bị di động.
Với sự phát triển của module GPS, độ chính xác của thiết bị di động ngày càng cao, cho phép trích xuất nhiều thông tin hữu ích như tọa độ địa lý, thời gian UTC, tốc độ tức thời và độ cao so với mực nước biển Bên cạnh đó, các module cảm biến gia tốc cùng với thư viện hỗ trợ giúp xác định trạng thái hoạt động của thiết bị Nhờ thư viện DetectedActivity do Google phát triển, chúng ta có thể xác định chính xác xác suất trạng thái của thiết bị, chẳng hạn như đang di chuyển bằng xe ô tô, xe đạp, đi bộ, chạy bộ, đứng yên, hoặc không xác định được trạng thái hiện tại.
Hình 2.2-1: Thống kê tín hiệu gửi về hệ thống thử nghiệm từ ngày 04/10/2017-01/11/2017
Trong khoảng thời gian từ ngày 4/10/2017 đến 3/11/2017, hệ thống thử nghiệm đã nhận được trung bình hơn 19.000 tín hiệu mỗi ngày từ 54 thiết bị di động khác nhau, như được thể hiện trong Hình 2.2-1.
Với dữ liệu từ các thiết bị di động, chúng ta phải đối mặc với 2 loại nhiễu độ chính xác và nhiễu ý nghĩa
• Đối với nhiễu về độ chính xác, tín hiệu GPS có thể bị sai sót do nhiều lý do khác nhau:
Tín hiệu GPS có thể bị sai lệch do sai số kỹ thuật từ thiết bị định vị tích hợp trong điện thoại di động hoặc do sự cố phần mềm khi hệ thống thay đổi Đặc biệt, các thiết bị Android đã ROOT thường gặp phải độ chính xác tín hiệu GPS thấp hơn.
Ngoài các yếu tố nội tại, môi trường xung quanh như thời tiết, độ cao so với mực nước biển và tính chất đô thị cũng có thể ảnh hưởng đáng kể đến độ chính xác của tín hiệu, dẫn đến việc tín hiệu thu được trở nên vô giá trị.
+ Hiện tượng mất gói, hoặc sai khắc khi dữ liệu truyền trên đường truyền, đặc biệt là đối với trường hợp sử dung UDP để truyền gói
• Đối với nhiễu về ý nghĩa cũng xảy ra do nhiều nguyên do khác nhau:
Tình trạng trễ gói trong giao thức TCP khi truyền nhận dữ liệu với server có thể làm mất ý nghĩa của tín hiệu GPS, do tín hiệu bị lệch khỏi khung thời gian của nó Hệ quả là tín hiệu không thể được sử dụng để tính toán và ước lượng vận tốc, từ đó làm giảm hiệu năng sử dụng dữ liệu của hệ thống và thiết bị di động.
Khi sử dụng thiết bị di động để thu thập dữ liệu, việc thời gian trên thiết bị không chính xác có thể dẫn đến việc nội dung các gói tin gửi đến server cũng sai lệch Điều này gây ra nhiễu thông tin và làm cho kết quả tính toán không phản ánh đúng trạng thái giao thông tại từng thời điểm.
Trong thời gian gần đây, nhiều tuyến đường và công trình tại thành phố đang được thi công và sửa chữa, dẫn đến sự sai lệch giữa thực trạng và bản đồ nền Điều này khiến thông tin trên bản đồ không còn chính xác, gây ra việc diễn giải sai lệch cho nhiều tín hiệu GPS.
Do thiết bị di động là thiết bị cầm tay, người dùng có thể thu thập dữ liệu khi không tham gia giao thông, như khi đi bộ ven đường hoặc ở nhà Nếu không lọc tín hiệu đúng cách, kết quả ước lượng sẽ bị ảnh hưởng và mất tính chính xác Cần phân biệt giữa các trường hợp này và tình trạng kẹt xe, vì chúng đều có tốc độ di chuyển thấp và tín hiệu GPS có thể nằm trên đường giao thông.
2.2.2 Tài nguyên thiết bị thu dữ liệu
Khi phát triển ứng dụng di động, đặc biệt là ứng dụng chạy nền và thu thập dữ liệu GPS, cần chú ý đến ba vấn đề chính: Pin, Memory và CPU Ứng dụng sẽ tiêu tốn nhiều pin, nhất là khi kết nối mạng và liên tục cập nhật dữ liệu lên server Do đó, việc xây dựng cơ chế thu thập dữ liệu thông minh là cần thiết, bao gồm việc điều chỉnh khoảng cách giữa các lần lấy mẫu và quản lý hoạt động thu thập dữ liệu hợp lý để tiết kiệm tài nguyên Cần nới rộng khoảng cách lấy mẫu khi dữ liệu không có nhiều ý nghĩa, đồng thời quản lý các tác vụ tính toán và giao tiếp với server để tránh lãng phí tài nguyên Nếu không quản lý tốt, ứng dụng có thể tiêu tốn nhiều memory và CPU, ảnh hưởng đến hiệu suất máy và làm giảm tuổi thọ pin.
Vì vậy cần xây dựng ứng dụng thu dữ liệu hợp lý để tránh gây ảnh hưởng đến người dùng.
Thu thập dữ liệu thử nghiệm
Để thu thập dữ liệu thử nghiệm phục vụ cho việc phân tích đánh giá từ thiết bị di động, một ứng dụng Android đã được phát triển với giao diện như Hình 2.3-1 Ứng dụng cho phép người dùng đánh dấu loại phương tiện sử dụng, thông tin này sẽ hỗ trợ trong việc đánh giá độ chính xác của thuật toán phân loại dữ liệu sau này Dữ liệu thử nghiệm thu thập sẽ được kiểm tra qua giao diện web, nơi mà các dữ liệu bị gán sai nhãn trong quá trình sử dụng ứng dụng sẽ được chỉnh sửa Để đảm bảo tương thích với nguồn dữ liệu GPS từ các phương tiện giao thông, thông tin gửi về hệ thống được chuẩn hóa theo định dạng quy định bởi Cục Đường bộ.
Device Id: Mã phân biệt trên từng thiết bị định vị
Latitude: Vĩ độ tại điểm thu nhận GPS
Longitude: Kinh độ tại điểm thu nhận GPS
Speed: Tốc độ tức thời ghi nhận được tại điểm thu nhận tín hiệu (km/h)
Reliability: Độ tin cậy của dữ liệu thu nhận
Number of statellites: Số vệ tinh thiết bị nhận được
Type: Quy ước dựa vào từng đối tượng dùng thiết bị: 1 – xe buýt, 2 – xe hơi, 3 – điện thoại
Lock: Áp dụng cho các đối tượng có động cơ như: xe buýt, xe hơi 1 – chìa khóa đang khởi động, 2 – xe đang tắt máy (chỉ dùng cho phương tiện)
Date Time: Thời gian thu nhận được tín hiệu từ vệ tinh
Option: Thông tin khác ngoài các thông tin trên, các thông tin tùy chọn
Hình 2.3-1: Ứng dụng thu thập dữ liệu thử nghiệm
Dữ liệu mẫu thu thập được thể hiện ở Hình 2.3-2
Hình 2.3-2: Mẫu tín hiệu gửi từ thiết bị di động
Tính đến ngày 08/11/2017, tổng số lượng dữ liệu thu thập được là 363972 dòng, được ghi nhận liên tục từ nhiều loại thiết bị Android khác nhau trong nhiều ngày Dữ liệu này bao gồm nhiều trường hợp như đi bộ, đi xe đạp, xe máy, xe bus, xe khách, cũng như hoạt động ở nhà hoặc tại các quán ven đường Các thống kê cho thấy rằng khi vận tốc và xác suất sử dụng phương tiện giao thông tăng cao, tín hiệu sẽ rơi vào các segment nằm ở những tuyến đường quan trọng Ngược lại, xác suất đi bộ, chạy bộ hoặc khoảng cách đến segment gần nhất sẽ giảm, đồng nghĩa với việc xác suất tham gia giao thông tăng lên Do đó, việc tìm ra công thức hoặc mối quan hệ giữa các giá trị là cần thiết để đánh giá chính xác trạng thái tham gia hoặc không tham gia giao thông dựa trên tín hiệu thu được từ thiết bị.
Tiền xử lý dữ liệu
Dữ liệu GPS thu thập từ thiết bị di động thường gặp phải tình trạng nhiễu và sai số, đồng thời có nhiều trường hợp thiết bị không tham gia giao thông Để sử dụng hiệu quả, dữ liệu cần trải qua quá trình làm sạch, lọc nhiễu và điều chỉnh trước khi tiến hành tính toán Quá trình tiền xử lý dữ liệu được minh họa trong Hình.
Hình 2.4-1: Các bước tiền xử lý số liệu
2.4.1 Xác vị trí của thiết bị trên tuyến đường phù hợp cho giao thông
Sau khi phân tích dữ liệu từ Openstreetmap, nhóm khảo sát nhận thấy các loại đường như footway, steps, bridleway và sidewalk chủ yếu dành cho người đi bộ và không có phương tiện giao thông lưu thông Do đó, nhóm quyết định loại bỏ các tín hiệu thuộc những loại đường này khỏi quá trình tính toán vận tốc, chỉ giữ lại dữ liệu từ các loại đường khác để đảm bảo tính chính xác trong việc phân tích lưu lượng giao thông.
• trunk: Đường quốc lộ lơn, xa lộ như Quốc lộ 1A, Xa lộ Hà Nội, Quốc lộ
• primary: Đường chính, thường là các đường nối các thành phố lớn như Quốc lộ 13, Đại lộ Võ Văn Kiệt
• secondary: tương tự đường primary nhưng nhỏ hơn ví dụ như Tỉnh lộ 43
(Quốc lộ 1A - Đại Lộ Bình Dương), đường Mỹ Phước Tân Vạn (Hồ Chí Minh - Bình Dương)
Đường thứ cấp là loại đường ít quan trọng hơn so với đường chính, thường kết nối các đô thị nhỏ hơn, ví dụ như đường Phan Văn Trị, Lạc Long Quân và Thành Thái tại thành phố Hồ Chí Minh.
• residential: loại đường nhỏ di chuyển trong các khu dân cư lớn ví dụ đường Đồng Nai, Bạch Mã (Quận 10, Hồ Chí Minh)
• unclassified: đường trong khu dân cư nhưng nhỏ hơn các loại đường trên và để nối các thôn, làng, ấp
Các đường có mục đích đặc biệt thường ít người qua lại và có thể do cá nhân hoặc tổ chức xây dựng Những con đường này thường là các đường hẻm, kiệt, hoặc ngách, phục vụ cho nhu cầu cụ thể của cộng đồng hoặc các hoạt động nhất định.
• motorway_link: là loại đường thường có chức năng nối các đường loại motoway với nhau hoặc nồi motoway với các loại đường khác
• trunk_link: tương tự motoway_link, loại đường này thường dùng để nối các đường loại trunk với nhau hoặc trunk với các loại đường khác
• primary_link: tương tự, để nối primary với nhau và với các loại đường khác
• secondary_link: tương tự, để nối secondary với nhau và với các loại đường khác
• tertiary_link: tương tự, để nối tertiary với nhau và với các loại đường khác
2.4.2 Xác định trạng thái tham gia giao thông
Trong tín hiệu từ thiết bị di động, ngoài thông tin về vị trí giống như dữ liệu từ hộp đen ô tô, còn có các trường bổ sung như số lượng vệ tinh mà thiết bị nhận được, độ dời tín hiệu theo kinh độ và vĩ độ so với tín hiệu trước đó, cùng với các thông số xác định trạng thái di chuyển của thiết bị như đi bộ, đi xe đạp hoặc đi ô tô.
Nhóm đã thử nghiệm một số phương pháp lọc dựa trên giải thuật cây quyết định, sử dụng các ngưỡng thu được từ thống kê dữ liệu thực tế Tuy nhiên, kết quả không khả quan, thường dẫn đến việc nhận sai trạng thái của thiết bị.
Nhóm nghiên cứu đã sử dụng mạng nơ-ron để huấn luyện dữ liệu tín hiệu từ thiết bị di động, nhằm phân loại dữ liệu thành hai loại: tham gia và không tham gia giao thông.
Dữ liệu đã được điều chỉnh nhãn sẽ được sử dụng làm đầu vào cho Weka để huấn luyện tập dữ liệu Cụ thể, đầu vào và đầu ra của mạng nơ-ron sẽ được xác định rõ ràng.
• speed (1): tốc độ di chuyển của thiết bị gửi về
• satelite (2): số lượng vệ tinh
• inVehicle (3): độ tin cậy đang di chuyển bằng ô tô (0-100)
• threadhold_inVehicle (4): là 1 nếu inVehicle >= 75 và là 0 nếu inVehicle <
• maxinVehicle (5): 1 nếu inVehicle là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• onBicycle (6): độ tin cậy đang di chuyển bằng xe đạp (0-1)
• threadhold_onBicycle (7): là 1 nếu onBicycle >= 75 và là 0 nếu onBicycle
• maxonBicycle (8): 1 nếu onBicycle là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• onFoot (9): độ tin cậy đang đi bộ hoặc chạy bộ (0-100)
• threadhold_onFoot (10): là 1 nếu onFoot>= 75 và là 0 nếu onFoot < 75
• maxonFoot (11): 1 nếu onFoot là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• running (12): độ tin cậy đang thiết bị di chuyển bằng cách chạy (0-1)
• threadhold_running (13): là 1 nếu onFoot>= 75 và là 0 nếu onFoot < 75
• maxRunning (14): 1 nếu running là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• still (15): độ tin cậy đang đứng yên(0-1)
• threadhold_still (16): là 1 nếu still >= 75 và là 0 nếu still < 75
• maxStill (17): 1 nếu still là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• tilting (18): đang đổi trạng thái (0-1)
• threadhold_tilting (19): là 1 nếu tilting >= 75 và là 0 nếu tilting < 75
• maxTilting (20): 1 nếu tilting là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• unknown (21): không xác định được hoạt động của người dùng (0-1)
• threadhold_unknown (22): là 1 nếu unknown >= 75 và là 0 nếu unknown <
• maxUnknown (23): 1 nếu unknown là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• walking (24): độ tin cậy đang thiết bị di chuyển bằng cách đi bộ (0-1)
• threadhold_walking (25): là 1 nếu walking >= 75 và là 0 nếu walking < 75
• maxWalking (26): 1 nếu walking là giá trị lớn nhất trong các trường sau: inVehicle, onBicycle, onFoot, running, still, tilting, unknown, ngược là thì có giá trị là 0
• signal_distance (27): khoảng cách của tín hiệu đến đèn đỏ gần nhất (0- 40m)
• accuracy (29): độ chính xác của tín hiệu GPS (m)
• distance (32): khoảng cách của tín hiệu so với đường
• distanceTwoPoint (33): khoảng cách giữa tín hiệu hiện tại và tín hiệu trước đó
• typeSegment (34): loại đường mà tín hiệu rơi vào
• Trạng thái: 1 (tham gia giao thông) hoặc 0 (không tham gia)
Sau khi tiến hành tiền xử lý và chuẩn hóa các trường dữ liệu, thuật toán multiple perceptron của Weka đã được áp dụng, cho ra kết quả đầu ra của mạng nơ ron.
Bảng 2.4-1 trình bày kết quả thử nghiệm xác định trạng thái giao thông với độ chính xác cao, cho thấy nhiều chỉ số giao thông khác nhau Các dữ liệu cho thấy tỷ lệ tham gia và không tham gia giao thông của các đối tượng được khảo sát, với tỷ lệ giao thông dao động từ 0.01 đến 0.3 Số năm tham gia giao thông của các đối tượng cũng được ghi nhận, với độ tuổi trung bình từ 8 đến 18 năm Những thông tin này có ý nghĩa quan trọng trong việc đánh giá và cải thiện tình hình giao thông hiện tại.
Sau khi đánh giá hiệu suất và độ chính xác, nhóm đã chọn model thứ 25 làm bộ lọc tín hiệu cho việc phân loại tham gia và không tham gia giao thông từ thiết bị di động, nhờ vào độ chính xác và hiệu năng tính toán tốt của nó.
2.4.3 Lọc tín hiệu có giá trị vận tốc bằng không
Do đặc thù dữ liệu xe máy không có lộ trình cụ thể và không yêu cầu chạy liên tục, xe có thể dừng lại trong khi giao thông vẫn di chuyển, dẫn đến thiết bị báo tốc độ bằng 0 Tình trạng này có thể xảy ra do sai số hoặc lỗi thiết bị, mặc dù phương tiện vẫn đang di chuyển Ngoài ra, khi xe dừng lại do kẹt xe hoặc di chuyển chậm, tốc độ cũng có thể ghi nhận là 0 Do đó, cần thiết phải có giải pháp để phân biệt và loại bỏ những trường hợp tốc độ bằng 0 nhưng giao thông vẫn diễn ra bình thường khỏi dữ liệu tính toán.
Khảo sát trên gần 23 tuyến đường quan trọng thường xuyên xảy ra kẹt xe tại thành phố Hồ Chí Minh, như Điện Biên Phủ, cho thấy tình trạng ùn tắc giao thông đang trở thành vấn đề nghiêm trọng cần được giải quyết.
Tổng số lượng segment khảo sát là 775, bao gồm Võ Thị Sáu, Cách Mạng Tháng Tám và Âu Cơ Dữ liệu được thu thập và lưu trữ liên tục trong 2 tuần, từ 23/11/2017 đến 8/12/2017, với tổng cộng 4.326.508 tín hiệu thu được.
Biểu đồ histogram trong Hình 2.4-2 cho thấy số lần đoạn đường có vận tốc nhỏ hơn hoặc bằng 5km/h, với độ tin cậy luôn đạt từ 75% trở lên trong suốt quá trình thu thập dữ liệu Dữ liệu được phân chia thành các bin với khoảng thời gian 5 giây.
TÍNH VẬN TỐC DI CHUYỂN CỦA DÒNG GIAO THÔNG
Các phương pháp ước lượng vận tốc dòng giao thông
3.1.1 Phương pháp tính trung bình
Phương pháp trung bình được áp dụng bởi hệ thống ITS trên trang web https://traffic.hcmut.edu.vn Hệ thống này sử dụng khái niệm khung thời gian để thể hiện vận tốc khác nhau của mỗi segment tại các thời điểm khác nhau Mỗi khung thời gian (frame) kéo dài 15 phút và có công thức tính cụ thể để xác định các giá trị vận tốc.
Frame = gi ờ *4 + ph ầ n nguyên (phút/15)
Sau khi hoàn tất quá trình tiền xử lý để loại bỏ các tín hiệu lỗi, vận tốc trung bình của từng phân đoạn đường trên bản đồ được tính bằng cách lấy tổng tất cả các mẫu vận tốc của phân đoạn đó chia cho tổng số mẫu tại thời điểm tính toán, với dữ liệu vận tốc được thu thập trong khoảng thời gian 15 phút.
Nhiều nghiên cứu đã áp dụng phương pháp trung bình, kết hợp với yếu tố vị trí của đoạn đường gần các giao lộ để sử dụng công thức khắc Công thức trong giải thuật dựa trên bình quân có trọng số, với trọng số được đánh giá theo độ đóng góp của khoảng cách giữa hai tín hiệu gần nhau, từ đó xác định vận tốc trung bình Ưu điểm của phương pháp này là khả năng cải thiện độ chính xác trong việc tính toán vận tốc.
- Độ phức tạp tính toán thấp
Việc sử dụng công thức tính trung bình cho một khung thời gian có thể dẫn đến những kết quả thiếu chính xác Điều này không phản ánh được ảnh hưởng của yếu tố thời gian từ từng mẫu vận tốc đến vận tốc trung bình tại thời điểm hiện tại.
- Không nói lên được sự khác biệt về mức độ ảnh hưởng của từng loại phương tiện khác nhau
3.1.2 Phương pháp dựa trên mô hình toán học
Việc sử dụng các phương trình toán học để ước lượng và dự đoán vận tốc trong giao thông đã được triển khai từ lâu Nhiều kỹ thuật ước lượng vận tốc đã được phát triển dựa trên mô hình mật độ cơ bản như phương trình vi phân Lighthill-Whitham-Richards (LWR) và rời rạc hóa nó thông qua lịch trình Godunov, còn được biết đến với tên gọi Mô hình Truyền tải Tế bào (CTM) Mô hình này chia đường thành các tế bào có đặc tính tương tự nhau và thường được đề cập trong các tài liệu về giao thông Các nghiên cứu liên quan đến phương pháp này áp dụng mô hình luồng giao thông với các trạng thái khác nhau để giải quyết bài toán hệ thống thời gian thực.
Trong đấy, LWR là phương pháp tính toán của mô hình giao thông, dưới cách nhìn vĩ mô Phương pháp này tính toán dựa trên phương trình:
Với ρ là mật độ phương tiện trên một đơn vị diện tích (thường tính là trên một Cell)
Với f luồng tuôn ra của giao thông được tính bằng ρ*v với v là vận tốc trung bình của các ô tô trong đơn vị diện tích đấy
Phương trình này tuân theo định luật bảo toàn phi tuyến và không liên tục trong thời gian hữu hạn, dẫn đến việc hình thành hàng đợi trong xử lý tính toán LWR là phương pháp cổ điển trong toán học, nhưng để cải thiện độ chính xác, người ta áp dụng thêm các phương trình vi phân hoặc sử dụng các mô hình khác như Payne-Whitham, Aw-Rascle, và Zhang Những cải tiến này giúp nâng cao hiệu quả trong các ứng dụng tính toán.
Độ chính xác cao trong việc phân tích tình hình giao thông ở mức vĩ mô được ứng dụng rộng rãi tại nhiều quốc gia phương Tây, giúp tính toán vận tốc luồng giao thông trên các tuyến đường cao tốc.
Việc triển khai hệ thống giao thông trong khu vực đô thị gặp khó khăn do tình trạng chia ô phức tạp, đặc biệt khi các Cell không đồng nhất về tính chất Điều này càng trở nên phức tạp hơn khi áp dụng trên các tuyến đường cao tốc.
3.1.3 Sử dụng các phương pháp thống kê
Ngoài ra, một số phương pháp tiên tiến đã được áp dụng để nâng cao độ chính xác trong việc ước lượng vận tốc, chẳng hạn như việc sử dụng lý thuyết thống kê Những phương pháp này mang lại nhiều ưu điểm đáng kể.
• Có thể sử dụng với mô tình tính toán ở mức độ vi mô, số lượng mẫu thưa
Để đảm bảo tính chính xác trong khảo sát giao thông, cần thực hiện khảo sát một cách thường xuyên và liên tục, vì tình hình và thói quen giao thông có thể thay đổi liên tục Ngoài ra, nhiều yếu tố khác cũng có thể ảnh hưởng đến quá trình khảo sát, do đó việc lặp lại khảo sát là rất cần thiết.
3.1.4 Mạng Nơ-ron nhân tạo (Artificial Neural Network)
Một phương pháp hiệu quả để ước lượng tốc độ là sử dụng mạng nơ-ron nhân tạo, trong đó nhiều nơ-ron liên kết và trao đổi thông tin với nhau Sự kết nối giữa các nơ-ron cho phép thông tin luân chuyển trong mạng, giúp mạng "học hỏi" qua việc huấn luyện bằng một tập dữ liệu cụ thể Hệ thống mạng này có khả năng mô hình hóa dữ liệu giao thông, sử dụng đầu vào là các thông số liên quan đến vận tốc như giá trị trung bình, phương sai, độ lệch, giá trị tối đa và tối thiểu Qua đó, mạng nơ-ron có thể học hỏi và từ mô hình thu được, chúng ta có thể ước lượng vận tốc của luồng giao thông một cách chính xác.
• Máy tự học hỏi được phương pháp ước lượng tùy theo dữ liệu đầu vào mà không phải theo một giải thuật nhất định
• Tập dữ liệu đủ lớn để huấn luyện cho mạng Nơ-ron.
Giải pháp tính toán vận tốc được áp dụng
Dựa trên các khảo sát và nghiên cứu về giải thuật hiện có cùng với tính chất của dữ liệu thu thập, mục tiêu của đề tài là giải quyết vấn đề giao thông ở mức độ vi mô Các phương pháp như sử dụng phương trình toán học tỏ ra không hiệu quả trong trường hợp này, đặc biệt khi dữ liệu di động có số lượng mẫu thấp và thưa thớt, gây khó khăn cho việc áp dụng ANN Do đó, mặc dù các giải thuật trung bình và thống kê được xem xét, bài toán này yêu cầu các bước xử lý phù hợp để nâng cao độ chính xác Nhóm nghiên cứu đề xuất giải thuật nhằm ước lượng vận tốc luồng phương tiện giao thông một cách hiệu quả.
Nhóm xây dựng hệ thống tính toán ước lượng vận tốc luồng giao thông trong một khoảng thời gian nhất định nhằm đảm bảo tính đồng nhất cho các tín hiệu trong khung thời gian đó Hệ thống sẽ áp dụng công thức trung bình để tính toán vận tốc, từ đó đưa ra kết quả ước lượng chính xác và hợp lý nhất cho từng khoảng thời gian được chọn.
Dữ liệu GPS từ thiết bị di động chỉ tại thời điểm nhất định có thể không đủ để tính toán chính xác Do đó, nhóm nghiên cứu đề xuất thu thập tín hiệu GPS trong một khoảng thời gian nhất định để có đủ dữ liệu ước lượng vận tốc luồng phương tiện giao thông Thời gian khảo sát cần được lựa chọn dựa trên nhiều yếu tố bên ngoài như thời tiết, khung thời gian trong ngày, tính chất đường và các yếu tố liên quan đến tính hoàn thiện của con đường.
Kết quả khảo sát cho thấy, khoảng thời gian từ 2 đến 5 phút là hợp lý để xử lý giá trị tham gia giao thông với vận tốc bằng 0 Thời gian này đủ để tổng hợp và tính toán vận tốc, giúp xác định tình hình giao thông hiện tại, bao gồm các trạng thái di chuyển nhanh, trung bình hoặc chậm.
Dữ liệu tính toán và lưu trữ hiện tại được thiết lập theo khung 15 phút, do đó việc sử dụng khung thời gian 5 phút là hợp lý Thêm vào đó, khảo sát về độ chính xác trong phần đánh giá cho thấy rằng lựa chọn khung 5 phút vẫn đảm bảo độ chính xác chấp nhận được.
Nhóm sử dụng công thức tính trung bình vận tốc cho từng segment theo công thức sau: v = 𝑣 !
- v: Vận tốc ước lượng của đoạn đường
- 𝑣 ! : Vận tốc từ tín hiệu gửi về trong khoảng frame
- N là tổng số tín hiệu trong frame đó
Mức độ tin cậy của giá trị phụ thuộc vào số mẫu dữ liệu N và độ lệch chuẩn của tập dữ liệu Vận tốc của một đoạn đường sẽ được thể hiện trong khoảng từ (v - 10%) đến (v + 10%), cùng với xác suất của một mẫu dữ liệu bất kỳ nằm trong khoảng đó.
Thử nghiệm và đánh giá giải pháp ước lượng vận tốc
3.3.1 Phương pháp thử nghiệm và đánh giá
Quá trình thử nghiệm hướng đến hai mục tiêu chính:
- Đánh giá chất lượng và đặc điểm dữ liệu GPS trả về từ các thiết bị di động
- Đánh giá mức độ chính xác của việc ước lượng vận tốc di chuyển của luồng phương tiện sử dụng tín hiệu GPS từ các thiết bị di động
Nhóm nghiên cứu đã chọn khu vực thử nghiệm để đánh giá chất lượng dữ liệu GPS tại các tuyến đường xung quanh Trường Đại học Bách Khoa, bao gồm Đường Lý Thường Kiệt, Lữ Gia, Tô Hiến Thành và các hẻm lân cận Khu vực này đại diện cho các đặc trưng cơ bản của các tuyến đường trong TP.HCM.
- Đường Lý Thường Kiệt là đường lớn với 4 làn xe, 2 làn xe mỗi chiều, có dãi phân cách cứng cho hai luồng xe ngược chiều nhau
Đường Lữ Gia và Tô Hiến Thành có thiết kế nhỏ hơn với hai làn xe, mỗi chiều một làn, nhưng không có dải phân cách cứng ở giữa.
- Khu vực lân cận các trục đường chính là các hẽm
Mỗi đợt thử nghiệm diễn ra trong khung thời gian xác định, trong đó một số lượng xe máy mang thiết bị di động di chuyển theo các luồng phương tiện tại khu vực thử nghiệm Tín hiệu GPS thu thập được sẽ được phân tích và đánh giá để đưa ra kết quả chính xác.
Để đánh giá độ chính xác của phương pháp ước lượng vận tốc di chuyển của luồng xe bằng tín hiệu GPS từ thiết bị di động, chúng tôi đã so sánh kết quả tính toán với dữ liệu vận tốc thu được từ video camera trên một đoạn đường cụ thể Chi tiết về quá trình thực nghiệm và đánh giá sẽ được trình bày trong các mục tiếp theo.
Tại TP.HCM, ngoài dữ liệu GPS từ thiết bị di động và video camera, còn có dữ liệu GPS từ các phương tiện giao thông như taxi, xe buýt và xe tải Tuy nhiên, mật độ dữ liệu GPS từ các phương tiện này thấp, khiến việc so sánh độ chính xác giữa dữ liệu GPS từ thiết bị di động và tín hiệu GPS từ hộp đen của các phương tiện trở nên không phù hợp.
3.3.2 Thu thập dữ liệu đánh giá Để đánh giá mức độ chính xác của giải pháp ước lượng, nhóm tiến hành 2 lần thu thập dữ liệu
Thu thập dữ liệu lần 1:
Vào ngày 19/08/2017, từ 10h25 đến 11h30, nhóm nghiên cứu đã thu thập dữ liệu từ 7 thiết bị di chuyển bằng xe máy trên đoạn đường Lữ Gia - Tô Hiến Thành, với tổng số tín hiệu thu được là 11.691 tín hiệu.
Hình 3.3-1: Tín hiệu thu được trong lần thu dữ liệu lần 1
Hình 3.3-1 thể hiện dữ liệu với màu sắc của từng điểm biểu thị tốc độ của các tín hiệu Màu đen cho thấy dữ liệu nhiễu hoặc không có giao thông Tốc độ được hiển thị theo thang màu từ đỏ đến xanh, tương ứng với mức độ tăng dần của vận tốc.
Dữ liệu thu được có nhiều sai lệch do ảnh hưởng của thiết bị di động và yếu tố thời tiết như mây Vì vậy, nhóm cần áp dụng phương pháp tiền xử lý để loại bỏ các tín hiệu nhiễu Sau khi xử lý, còn lại 11.517 tín hiệu có thể sử dụng cho việc tính toán ước lượng vận tốc, đạt tỷ lệ khoảng 98,51%.
Trong quá trình thu thập dữ liệu GPS, nhóm đã thực hiện quay lại quá trình tại cổng 3 Đại Học Bách Khoa Hồ Chí Minh Tuy nhiên, việc chỉ sử dụng một camera và thời gian quay không liên tục đã gây khó khăn trong việc đánh giá thuật toán.
Thu thập dữ liệu lần 2:
Do hạn chế trong lần thu thập dữ liệu đầu tiên, nhóm đã tiến hành thu thập dữ liệu lần thứ hai với 6 thiết bị di chuyển bằng xe máy trên đoạn đường như hình bên dưới, trong khoảng thời gian từ 9h20’ đến 10h30’ ngày 19/11/2017.
Trong quá trình thu thập dữ liệu, tổng số tín hiệu tiền xử lý đạt 11.193 tín hiệu Sau khi áp dụng giải thuật lọc nhiễu, số tín hiệu sử dụng được giảm còn 10.524 tín hiệu, tương đương khoảng 94,3% tổng số tín hiệu nhận Hình ảnh dữ liệu thu thập được thể hiện trong Hình 3.3-2 Đồng thời, nhóm đã tiến hành quay video trên một đoạn đường với khoảng cách giữa hai điểm quay là 28,5 mét, không có giao lộ nào giữa hai điểm này Hai video được ghi lại đồng thời từ 9h29’ trong vòng 57 phút.
Hình 3.3-2: Tín hiệu thu được từ lần thu dữ liệu thứ hai
3.3.3 Phân tích đánh giá kết quả tính toán
Dữ liệu thu từ camera được xử lý bằng hai công cụ viết bằng Matlab do nhóm phát triển, nhằm trích xuất dữ liệu vận tốc từ video Công cụ đầu tiên cho phép nhóm khoanh vùng các đối tượng di chuyển qua hai vạch được xác định trên video, tương ứng với vạch xuất phát và vạch kết thúc cách nhau 28,5 mét Kết quả từ công cụ này là danh sách các ảnh sắp xếp theo thời gian, chứa thông tin về thời điểm xe chạm vạch Công cụ thứ hai cũng được phát triển tương tự để hỗ trợ trong quá trình phân tích.
Nhóm nghiên cứu đã sử dụng hai danh sách ảnh để phân tích vận tốc của các phương tiện: danh sách hình ảnh xe đi qua vạch xuất phát và danh sách xe chạm vạch kết thúc Bằng cách so sánh các cặp ảnh tương ứng, nhóm xác định các phương tiện trùng khớp và tính toán vận tốc dựa trên khoảng cách giữa hai vạch và thời gian xe đi qua Kết quả cho thấy vận tốc trung bình của từng xe trên đoạn đường đó, với tổng cộng 2811 phương tiện được ghi nhận trong khoảng 50 phút.
Hình 3.3-3: Công cụ để khoanh chọn xe đi qua vạch
Hình 3.3-4: Công cụ so sánh tập ảnh đi vào từ 2 xe
Nhóm nghiên cứu đã sử dụng tín hiệu GPS và kết quả tính vận tốc luồng giao thông từ video thu thập vào ngày 19/11/2017 Chúng tôi giả định rằng dữ liệu từ video là giá trị chính xác Dựa trên vận tốc trung bình của từng phương tiện trong video, nhóm áp dụng hai phương pháp để ước lượng vận tốc luồng giao thông.
• Ước lượng dựa theo trung bình vận tốc các phương tiện trong một khung thời gian cố định từ thời điểm hiện tại
• Trung bình vận tốc của 30 phương tiện gần nhất từ thời điểm hiện tại
Nhóm nghiên cứu đã so sánh giá trị ước lượng vận tốc từ tín hiệu GPS với vận tốc luồng giao thông tính từ video Để đánh giá độ chính xác và độ tin cậy của giá trị ước lượng, nhóm đã sử dụng một số thống số dựa trên dữ liệu chính xác được trích xuất từ video.
Cách đánh giá thức nhất: Vận tốc tính từ video được tính trung bình trong khoảng thời gian là 30 giây Đồ thị so sánh kết quả biểu diễn ở Hình 3.3-5
Hình 3.3-5: Vận tốc ước lượng và vận tốc tính toán từ video tính theo cách thứ nhất
Các chỉ số so sánh hai phương pháp thu thập dữ liệu khác nhau như sau:
Cách đánh giá thức hai: Với vận tốc tính từ video chỉ tính trung bình của 30 chiếc xe Đồ thị so sánh kết quả biểu diễn ở Hình 3.3-6
Hình 3.3-6: Vận tốc ước lượng và vận tốc tính toán từ video tính theo cách thứ hai
Các chỉ số so sánh hai phương pháp thu thập dữ liệu khác nhau như sau:
Theo kết quả của các giá trị đánh giá:
• MPE < 3,0 %: tổng phần trăm sai số bé chứng tỏ tổng chênh lệch giữa 2 giá trị so sánh là nhỏ
CẢNH BÁO TÌNH HÌNH GIAO THÔNG
Mục tiêu cảnh báo
Dựa trên phân tích khảo sát nhu cầu người dùng được trình bày trong Phụ lục 1, chúng tôi đã xác định mục tiêu chính liên quan đến các cơ chế và cách thức cảnh báo giao thông.
- Xây dựng giải thuật cảnh báo thông minh về tình trạng giao thông cho người dùng
- Rút trích ra tri thức về thói quen di chuyển của người dùng
- Dựa trên thói quen di chuyển đã xác định, xây dựng mô hình dự báo lộ trình
- Xây dựng giải thuật xếp hạng các điểm ùn tắc, từ đó đưa ra các cảnh báo có giá trị nhất đối với người dùng
Ngoài cơ chế cảnh báo thông minh, chúng tôi cũng xây dựng các cơ chế cảnh báo cơ học
Người dùng có thể lựa chọn các khu vực mà họ quan tâm, và hệ thống sẽ tự động thông báo tình trạng giao thông khi phát hiện ùn tắc tại những khu vực đó.
- Quan sát và cảnh báo các điểm có ùn tắc xung quanh người dùng.
Những yếu tố cần cảnh báo tới người dùng
Trong các trường hợp cảnh báo thì tình trạng giao thông là yếu tố cực kỳ quan trọng Tình trạng giao thông bao gồm các vấn đề:
- Hiện tượng các phương tiện di chuyển chậm
- Hiện tượng đường ngập nước
- Hiện tượng đường đang có công trình thi công
- Hiện tượng đường có sự cố nguy hiểm
- Hiện tượng đường có cảnh sát
Hiện tượng đường có tai nạn giao thông thường xảy ra khi các phương tiện di chuyển chậm Thông tin về tình huống này được thu thập từ dữ liệu xe buýt, taxi và dữ liệu di động được gửi liên tục (real-time) Qua quá trình xử lý, thông tin cần thiết sẽ được gửi tới hệ thống cảnh báo giao thông Đối với các tình huống khác, thông tin sẽ được cung cấp bởi người quản trị hoặc người dùng chia sẻ Trong báo cáo này, nhóm chỉ tập trung vào thông tin về các phương tiện di chuyển chậm do hệ thống chưa có dữ liệu cho các tình huống còn lại.
Thông tin từ server traffic.hcmut.edu.vn cung cấp kinh độ, vĩ độ của điểm bắt đầu và kết thúc các đoạn đường, cùng với vận tốc và độ tin cậy của thông tin vận tốc Nhóm nghiên cứu xác định rằng các vận tốc nhỏ hơn hoặc bằng 5 thể hiện hiện tượng phương tiện di chuyển chậm Từ đây, nhóm tạm định nghĩa hiện tượng này, với độ tin cậy trên 60%, là ùn tắc giao thông để diễn đạt một cách ngắn gọn.
Dự báo lộ trình di chuyển của người sử dụng
Để đảm bảo việc cảnh báo chính xác và hiệu quả, việc dự báo lộ trình di chuyển của người đi đường là rất quan trọng Do đó, để giải quyết vấn đề cảnh báo, cần phải tập trung vào việc dự đoán lộ trình di chuyển trước tiên.
Dữ liệu GPS thô nhận được bao gồm kinh độ, vĩ độ và thời gian hiệu lực, được sinh ra từ thiết bị di động với thông tin ngày, tháng, năm, giờ, phút, giây Tín hiệu GPS p được định nghĩa là dữ liệu vị trí của người dùng theo thời gian, được biểu diễn bởi ba giá trị x, y, t, trong đó x là vĩ độ, y là kinh độ và t là mốc thời gian Nhóm đề xuất một phương pháp lưu trữ mới, đó là lưu lộ trình của từng người vào big-segment, dựa trên các khái niệm về node, segment, cell và street.
– Intersection (ngã rẽ) là node có số segment nối tới lớn hơn hai, ý nghĩa của khái niệm intersection là đại diện cho ngã ba, ngã tư
– End-Node (ngõ cụt) là node có số segment nối tới là một, ý nghĩa của khái niệm này là ngõ cụt, không nối tới đường nào nữa
Stay-node (điểm dừng) là vị trí mà người dùng tạm ngừng tham gia giao thông trong một khoảng thời gian nhất định, với tọa độ có thể thay đổi trong giới hạn cho phép Điều này thường ám chỉ đến các địa điểm như nơi làm việc, nơi ăn uống hoặc nơi ở của người dùng.
Big segments are connections that link two intersections, two end-nodes, or an intersection with an end-node (or vice versa) Technically, these segments connect two nodes, each having a different number of segments leading to them, specifically two.
Mục đích của việc đưa ra các khái niệm đó là:
– Stay-Node: để biết được điểm dừng của người dùng Ở đây mình có dùng thông tin lưu trong stay-node để biết đoạn đường tiếp theo người đó đi
Để tối ưu hóa việc lưu trữ, nhóm quyết định chỉ lưu một big-segment cho những segment liên tiếp không có ngã rẽ, nhằm tránh việc lưu trữ nhiều segment không cần thiết Các khái niệm như end-node và intersection sẽ hỗ trợ trong việc xác định big-segment một cách nhanh chóng, cùng với stay-node để cải thiện hiệu suất tìm kiếm.
Trong bài toán cảnh báo giao thông, nhóm không chọn lưu theo cell vì diện tích lớn khiến việc xác định vị trí người dùng trên đường gặp khó khăn, trong khi diện tích nhỏ tạo ra quá nhiều cell, phức tạp hơn so với lưu lộ trình theo segment Có hai cách lưu lộ trình theo segment: lưu trực tiếp hoặc gom các segment thành từng cụm để tiết kiệm không gian lưu trữ và dễ dàng tính toán xác suất Tuy nhiên, nhóm đề xuất lưu big-segment vì nhiều lý do hợp lý.
Big-segment là tập hợp các segment nằm giữa hai ngã rẽ, giúp người dùng dễ dàng di chuyển qua lại mà không bị phân tán Việc lưu trữ chỉ các big-segment sẽ giảm tải cho hệ thống lưu trữ và tính toán Theo dữ liệu meta của Việt Nam, tổng số segment là 2.055.685, nhưng nếu chỉ lưu big-segment, số lượng sẽ giảm đáng kể.
384992, tức giảm hơn 80% vê số lượng lưu trữ, tính toán mà vẫn đủ thông tin để giải quyết bài toán
Khi lưu big-segment, hệ thống không thực hiện gom cụm vì big-segment là tập hợp các segment và không thể đảm bảo rằng người dùng sẽ không thay đổi lộ trình trong tương lai Nếu có sự thay đổi, việc gom cụm sẽ trở nên phức tạp, do big-segment là đơn vị nhỏ nhất trong cụm.
Nhóm đã quyết định lưu lộ trình người dùng bằng cách sử dụng big-segment và stay-node Big-segment S là một bộ dữ liệu bao gồm nhiều điểm GPS S, giúp theo dõi và phân tích hành vi người dùng một cách hiệu quả.
Trong bài viết này, chúng tôi giới thiệu khái niệm về big-segment và stay-node, trong đó big-segment được định nghĩa là tập hợp các điểm GPS nằm trong một khu vực lớn, còn stay-node là những điểm mà người dùng dừng lại Việc theo dõi hành trình di chuyển của người dùng sẽ ghi lại các stay-node và big-segment mà họ đã qua Để quản lý thông tin này, chúng tôi phát triển hai khái niệm mới: bigsegmentinfo và staynodeinfo Bigsegmentinfo lưu trữ xác suất di chuyển từ big-segment hiện tại đến các big-segment khác, trong khi staynodeinfo lưu trữ xác suất từ stay-node hiện tại đến các big-segment khác Mối quan hệ giữa các yếu tố này được minh họa trong Hình 4.3-1.
Hình 4.3-1: Quá trình khái quát dữ liệu qua các mức
4.3.2 Dự báo xác suất dựa trên dữ liệu di chuyển trong quá khứ
Trong bài toán này, chúng ta tập trung vào việc tính xác suất di chuyển tới các đoạn đường tiếp theo dựa vào thông tin quá khứ Xác suất này không chỉ phụ thuộc vào vị trí hiện tại mà còn vào các đoạn đường mà người dùng đã đi trước đó Ví dụ, để tính xác suất người dùng đến D khi đang ở C và đã đi từ nhà qua A, ta sẽ sử dụng một công thức xác suất cụ thể.
P = number−of −(D,C,A,Home)/number−of −(C,A,Home)
Với công thức Bayesian với giả định các đoạn đường độc lập là:
Công thức tính độ tin cậy (confidence) khi áp dụng luật kết hợp trong trường hợp này là:
P=P(D|C,A,Home)= number−of −(D,C,A,Home)/number−of −(C,A,Home)
Công thức tính độ tin cậy trong luật kết hợp phù hợp hơn với cách tính xác suất ban đầu Bên cạnh đó, công thức bayesian đa bậc cũng thích hợp cho các tính toán liên quan đến nhóm.
Hình 4.3-2: Mô hình di chuyển của người dùng
Xây dựng được giải thuật phân tích, lọc dữ liệu lịch sử di chuyển của người sử dụng dựa vào việc áp dụng các kiến thức liên quan
Hệ thống có tính năng ổn định và thời gian thực, tự động cảnh báo người dùng để giúp họ tránh những điểm tắc nghẽn giao thông Tuy nhiên, cơ chế cảnh báo cần được thiết kế hợp lý để không gây phiền toái cho người sử dụng.
4.3.3 Dữ liệu từ người sử dụng cho việc cảnh báo
Ngoài việc thu thập dữ liệu GPS để xác định vận tốc luồng giao thông, ứng dụng cần bổ sung thêm các thông tin quan trọng khác để nâng cao khả năng cảnh báo.
• IMEI là viết tắt của International Mobile Equipment Identity (Mã số nhận dạng thiết bị di động quốc tế)
• Số lượng vệ tinh đang phủ tới thiết bị
• Thời gian có ngày tháng năm và giờ phút giây (có mẫu là yyyy-MM-dd
4.3.4 Đánh giá mức độ chính xác của giải thuật cảnh báo Để việc cảnh báo được chính xác, dữ liệu được sử dụng phải phản ánh được hành vi di chuyển thường ngày của người sử dụng Do vậy, khác với dữ liệu dùng cho việc ước lượng vận tốc di chuyển của luồng phương tiện, để tạo được bộ dữ liệu dùng cho việc cảnh báo trong quá trình thử nghiệm chúng tôi vận động một số lượng người sử dụng thiết bị di động cài đặt ứng dụng ghi nhận dữ liệu GPS Hành vi di chuyển của người sử dụng thiết bị sau khi cài đặt ứng dụng hoàn toàn không thay đổi so với trước đây Họ dùng thiết bị một cách bình thường cho các hoạt động hàng ngày Dựa trên dữ liệu có được, chúng tôi đánh giá mức độ chính xác của giải thuật dự báo lộ trình di chuyển Dữ liệu trong quá khứ dùng cho việc dự báo lần lượt là 5, 10 và 20 ngày Độ chính xác được xác định bằng tỉ lệ phần trăm giữa số segment dự báo đúng với lộ trình thực tế và tổng số segment được trả về bởi giải thuật dự báo Kết quả của việc đánh giá thể hiện ở các bảng sau:
Bảng 4.3-1: Độ chính xác của giải thuật dự báo sử dụng dữ liệu 5 ngày trong quá khứ
Quãng đường dự báo Độ chính xác
Dự đoán 1 big-segment tiếp theo 65,66
Dự đoán 5 big-segment tiếp theo 69,71
Dự đoán 10 big-segment tiếp theo 70,71
Dự đoán 15 big-segment tiếp theo 74,98
Bảng 4.3-2: Độ chính xác của giải thuật dự báo sử dụng dữ liệu 10 ngày trong quá khứ
Quãng đường dự báo Độ chính xác
Dự đoán 1 big-segment tiếp theo 63,39
Dự đoán 5 big-segment tiếp theo 64,15
Dự đoán 10 big-segment tiếp theo 71,82
Dự đoán 15 big-segment tiếp theo 73,98
Bảng 4.3-3: Độ chính xác của giải thuật dự báo sử dụng dữ liệu 20 ngày trong quá khứ
Quãng đường dự báo Độ chính xác
Dự đoán 1 big-segment tiếp theo 84,5
Dự đoán 5 big-segment tiếp theo 69,57
Dự đoán 10 big-segment tiếp theo 80,31
Dự đoán 15 big-segment tiếp theo 79,31
Cách thức, nội dung và xếp hạng các cảnh báo
Theo khảo sát, ứng dụng cần linh hoạt trong cách thức cảnh báo để phù hợp với từng đối tượng tham gia giao thông Người lái xe hơi có khả năng tương tác tốt hơn với ứng dụng khi di chuyển, thường sử dụng 3G hoặc 4G để truy cập dịch vụ chỉ đường như Google Map và Waze Trong khi đó, người đi xe máy hạn chế tương tác do vi phạm luật an toàn giao thông khi sử dụng thiết bị di động và thường không bật 3G, 4G Điều này gây khó khăn trong việc gửi thông báo cho họ trong khi tham gia giao thông Để hỗ trợ cả hai nhóm người dùng, chúng tôi sẽ tích hợp hai phương thức cảnh báo trong cùng một ứng dụng.
Cảnh báo qua notification trên thiết bị Android là giải pháp hiệu quả cho người dùng không tham gia giao thông, như khi ở nhà hoặc nơi làm việc Ứng dụng sẽ tự động gửi thông báo, giúp người dùng dễ dàng tiếp nhận thông tin mà không cần tương tác phức tạp Đặc biệt, đối với những người đi xe máy, việc không sử dụng điện thoại hoặc tắt 3G/4G khi di chuyển khiến cảnh báo qua notification trở nên tiện lợi và cần thiết hơn bao giờ hết trước khi họ ra đường.
Ứng dụng cung cấp cảnh báo giao thông bằng cách hiển thị các điểm ùn tắc đặc trưng trên bản đồ, giúp người dùng dễ dàng theo dõi tình hình giao thông xung quanh Phương pháp này đặc biệt hữu ích cho những người lái xe hơi, cho phép họ quan sát liên tục các điểm nóng mà không cần phải đọc thông báo văn bản, tiết kiệm thời gian và nâng cao an toàn khi tham gia giao thông.
Hình 4.4-1: Cảnh báo trên ứng dụng Android
4.4.2 Xếp hạng điểm ùn tắc
Sau khi áp dụng các thuật toán như xác định khu vực quan tâm của người dùng và dự đoán lộ trình tiếp theo, hệ thống sẽ kiểm tra tình hình giao thông tại các khu vực đó Nếu phát hiện ùn tắc, hệ thống sẽ cảnh báo người dùng Tuy nhiên, trong giờ cao điểm, số lượng điểm ùn tắc rất lớn, dẫn đến nhiều thông tin cảnh báo Nếu người dùng nhận quá nhiều cảnh báo nhưng chỉ một số ít có giá trị, chức năng cảnh báo sẽ trở nên kém hữu ích, khiến họ không còn quan tâm Do đó, việc xếp hạng các điểm ùn tắc để xác định những điểm quan trọng và ảnh hưởng nhất là rất cần thiết.
Hình 4.4-2: Cảnh báo thông qua chế độ lái xe của ứng dụng Để xếp hạng các điểm ùn tắc, nhóm có đưa ra các tiêu chí sau:
– Khả năng đi đến điểm ùn tắc trong tương lại gần
– Khoảng cách từ điểm ùn tắc tới vị tri hiện tại của người dùng,
– Có nằm trong khu vực người dùng quan tâm hay không
– Khoảng thời gian đã ùn tắc
– Khoảng thời gian ước tính để đi qua điểm này
4.4.3 Tạo mẫu tin cảnh báo Đối với cách thức cảnh báo thông qua notification của thiết bị di động, nội dung của mẫu tin cảnh báo cần phải dễ hiểu và giúp cho người dùng có thể dễ dàng xác định được vị trí của điểm ùn tắc Hơn nữa theo khảo sát của nhóm trên một số người dùng, một mẫu tin cảnh báo nên có thêm thông tin về khoảng thời gian đã ở trong tinh trạng ùn tắc và thời gian ước tính để đi qua khỏi điểm này Để người dùng có thể xác định mức độ nghiêm trọng ở điểm ùn tắc mà hệ thống cảnh báo
4.4.4 Cập nhập lại trọng số của người dùng
Một mẫu tin cảnh báo sẽ bao gồm hai nút "useful" và "unuseful" Khi người dùng đánh giá mẫu tin, hệ thống sẽ cập nhật trọng số của người dùng thông qua công thức gradient descent Việc cập nhật trọng số sau mỗi lần chọn "useful" hoặc "unuseful" giúp hệ thống cung cấp thông báo chính xác và ý nghĩa hơn cho người dùng.
4.4.5 Thời điểm, tần suất cảnh báo
Thời điểm cảnh báo: Hệ thống sẽ liên tục kiểm tra trang thái của người dùng
Dựa trên thói quen di chuyển trước đây của người dùng, hệ thống sẽ bắt đầu gửi cảnh báo giao thông nếu phát hiện họ có khả năng tham gia giao thông trong vòng 1 giờ tới Thời gian cảnh báo càng ngắn, thời điểm gửi cảnh báo sẽ càng chính xác, tuy nhiên, để thực hiện điều này, hệ thống cần có nhiều dữ liệu quá khứ hơn Với dữ liệu hiện có và kinh nghiệm thực tiễn, chúng tôi đã quyết định chọn khoảng thời gian 1 giờ.
Theo khảo sát, 90% đoạn đường sẽ thay đổi trạng thái giao thông trong vòng 12 phút, do đó, chúng tôi sẽ sử dụng con số này làm tần suất cảnh báo về tình trạng giao thông cho người dùng thông qua thông báo từ thiết bị Đối với chế độ lái xe, hệ thống sẽ gửi cảnh báo thường xuyên hơn để đảm bảo người dùng được cập nhật kịp thời.
Cảnh báo những khu vực người dùng quan tâm
Người dùng có thể chọn bất kỳ điểm nào trên bản đồ, như ngã tư hoặc trước trường đại học, và hệ thống sẽ cảnh báo về tình trạng giao thông đáng chú ý trong bán kính xung quanh các khu vực này.
Chức năng cảnh báo khu vực quan tâm của người dùng được phân loại là cảnh báo bị động Hệ thống tiếp nhận yêu cầu từ client và kiểm tra vận tốc trung bình tại khu vực đó Nếu phát hiện tình trạng ùn tắc (vận tốc < mức quy định), hệ thống sẽ thông báo cho người dùng.
5 km/h) thì sẽ thông báo cho người dùng.
Cảnh báo theo xu hướng di chuyển hiện tại
Trong một số trường hợp, thuật toán dự báo lộ trình không thể xác định được hướng di chuyển tiếp theo của người dùng, đặc biệt là khi người dùng mới tham gia hệ thống hoặc khi họ di chuyển trên những tuyến đường lạ Để khắc phục vấn đề này, nhiều người đã đề xuất giải pháp cảnh báo về các điểm ùn tắc giao thông trong một bán kính nhất định Tuy nhiên, phương pháp này có thể gây ra sự phiền toái do lượng thông tin dư thừa và không cần thiết Do đó, nhóm tác giả đã phát triển một thuật toán cảnh báo dựa trên xu hướng di chuyển hiện tại của người dùng, giúp họ nhận diện các điểm ùn tắc có khả năng ảnh hưởng đến hành trình của mình, đồng thời loại bỏ những thông tin không liên quan.
Sau khi thu thập thông tin về các điểm ùn tắc giao thông quanh khu vực người dùng, việc thông báo sẽ không diễn ra ngay lập tức Thay vào đó, sẽ theo dõi quá trình di chuyển của người dùng trong một khoảng thời gian t để xác định xu hướng di chuyển của họ, từ đó loại bỏ những điểm ùn tắc không nằm trong xu hướng này Tuy nhiên, vào giờ cao điểm, có nhiều điểm ùn tắc gần vị trí hiện tại, và với đặc điểm giao thông tại các thành phố Việt Nam có nhiều giao lộ, việc xác định xu hướng di chuyển trong thời gian ngắn là rất khó khăn Do đó, nhóm tác giả đề xuất ý tưởng cảnh báo người dùng theo hai bán kính khác nhau r và R (với r < R), và cần thực nghiệm để xác định hai giá trị bán kính này.
Trong khu vực bán kính nhỏ r, hệ thống sẽ liên tục cập nhật tình trạng giao thông và cảnh báo người dùng về mọi điểm bất thường xung quanh Điều này rất hữu ích vì người dùng có thể di chuyển đến bất kỳ địa điểm nào trong khu vực này trong thời gian ngắn.
Trong một bán kính lớn R, hệ thống cung cấp cho người dùng cái nhìn tổng quát về tình trạng giao thông, đồng thời liên tục theo dõi xu hướng di chuyển của họ Điều này giúp người dùng chỉ nhận thông báo về những khu vực mà họ có khả năng di chuyển tới.
Hình 4.6-1: Cảnh báo theo xu hướng di chuyển