Tổng quan2.1 Trực quan hóa thông tin Với xu thế nghiên cứu được trình bày ở trên thì tình hình nghiên cứu như sau chỉ tập trung vào các nghiên cứu dùng phân tích trực quan cho dòng giao
Trang 11
MỤC LỤC
MỤC LỤC 1
TÓM TẮT 3
ABSTRACT 4
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ 7
LỜI CẢM ƠN 9
CHƯƠNG 1 GIớI THIệU 10
1.1 Giới thiệu vấn đề 10
1.2 Cấu trúc báo cáo 13
CHƯƠNG 2 TổNG QUAN 14
2.1 Trực quan hóa thông tin 14
a) Tình hình ngoài nước: 14
b) Tình hình trong nước: 14
2.2 Bài toán tìm đường đi ngắn nhất 16
a) Mở rộng theo thời gian (Time-expanded) 16
b) Mở rộng theo thời gian (Time-expanded) 17
CHƯƠNG 3 PHÂN TÍCH VÀ Xử LÝ Dữ LIệU GIAO THÔNG 19
3.1 Phân tích dữ liệu và xử lý dữ liệu 19
3.2 Mô hình lưu trữ 23
CHƯƠNG 4 MÔ PHỏNG Dữ LIệU GIAO THÔNG TRÊN BảN Đồ 3D 26
4.1 Công nghệ 26
4.2 Kết quả trực quan hóa trên bản đồ 3D 27
CHƯƠNG 5 BÀI TOÁN TÌM ĐƯờNG ĐI XE BUÝT THEO THờI GIAN 31 5.1 Đồ thị xe buýt 31
5.2 Mô hình đồ thị xe buýt 32
5.3 Bài toán tìm đường đi xe buýt với ràng buộc 37
5.4 Giải quyết bài toán tìm đường đi bằng xe buýt theo thời gian 39
5.5 Hiện thực chương trình 44
Trang 22
5.6 Kết quả thử nghiệm 46
5.7 Một số kết quả tìm đường đi theo thời gian 48
CHƯƠNG 6 KếT LUậN 54
6.1 Tổng kết 54
6.2 Những đóng góp của đề tài 54
6.3 Hướng phát triển 55
TÀI LIỆU THAM KHẢO 56
Trang 3
3
TÓM TẮT
Trực quan hóa khoa học và trực quan hóa thông tin là những lĩnh vực đa ngành mới được tập trung phát triển trong thập kỷ gần đây Thời gian trước đây, trực quan hóa chủ yếu tập trung vào việc hiển thị và giúp đánh giá các kết quả mô phỏng Tuy nhiên, với các dữ liệu lớn ngày nay thì trực quan hoá còn được giao một nhiệm vụ lớn hơn, đó là giúp khám phá dữ liệu để giúp các nhà khoa học hiểu hơn những khái niệm, những quan hệ và quá trình bên trong dữ liệu Tại Việt Nam chủ đề giao thông ở các thành phố lớn như thành phố Hồ Chí Minh, Hà Nội đang được nhiều người quan tâm ở nhiều góc nhìn khác nhau Trong những năm gần đây, xe buýt dần trở thành phương tiện công cộng phổ biến và chính yếu của người dân Trong bài báo này, nhóm tác giả tập trung vào phân tích dữ liệu dòng giao thông xe buýt để xây dựng mô hình dữ liệu xe buýt hướng thời gian Dựa vào mô hình dữ liệu này, nhóm tác giả phát triển giải thuật tìm đường đi xe buýt theo thời gian thực Cuối cùng, dựa vào công nghệ WebGL, kết quả tìm tuyến xe buýt theo thời gian thực sẽ được hiển thị trực quan trên nền bản đồ 3D
Trang 5
5
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
GPS : Global Positioning System
GIS : Geographic Information System
OSM : Open Street Map
TDSP : Time Dependent ShorstedPath
FIFO : First In First Out
Trang 66
DANH MỤC CÁC BẢNG
Trang 77
DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ
Hình 1.1 Sơ đồ các tuyến xe buýt trên Tp Hồ Chí Minh 12
Hình 2.1 Hình ảnh trích từ đề tài nghiên cứu về mô phỏng ô nhiễm không khí 15
Hình 3.1 Đường đi và vị trí của các tín hiện trên bản đồ 2D 19
Hình 3.2 Đường đi của các xe buýt phủ khắp Tp.Hồ Chí Minh trên bản đồ 2D 20
Hình 3.3 Những tín hiệu bị ngắt quãng một thời gian lớn 20
Hình 3.4 Mô tả những đoạn màu đỏ được tính là gần với đoạn đường <v 1 ,v 2 > 22
Hình 3.5 Bảng lưu trữ dữ liệu giao thông ban đầu 23
Hình 3.6 Bảng dữ liệu đả được xử lý, cho biết những đoạn đường mà xe buýt đi qua với những thông tin kèm theo 24
Hình 3.7 Dữ liệu giao thông lưu trữ dưới dạng lưới theo thời gian 25
Hình 4.1 Một số kết quả mô phỏng 3D với công nghệ WebGL 26
Hình 4.2 Bản đồ OpenStreetMap ở khu vực thành phố Hồ Chí Minh 27
Hình 4.3 Mô phỏng tình trạng giao thông trên bản đồ 3D ở thời điểm xác định 28
Hình 4.4 Mô phỏng với góc nhìn từ trên xuống 28
Hình 4.5 Mô phỏng trong khoảng thời gian từ 9h00 đến 10h00 29
Hình 4.6 Biểu đồ thể hiện vận tốc tại các thời điểm tại một vị trí xác định 30
Hình 5.1 Hình vẽ mô tả việc kết nối giữa các đỉnh 33
Hình 5.2 Minh họa việc chuyển từ đa đồ thị sang đơn đồ thị 35
Hình 5.3 Minh họa việc chuyển từ đa đồ thị sang đơn đồ thị ở trường hợp tổng quát 35
Hình 5.4 Minh họa việc chuyển từ đa đồ thị sang đơn đồ thị, khi nối cạnh đi bộ giữa các trạm 36
Trang 88
Hình 5.6 Bảng lưu trữ thông tin của trạm xe buýt 44
Hình 5.7 Bảng lưu trữ thông tin của tuyến xe buýt 45
Hình 5.8 Bảng lưu trữ thông tin về lộ trình của xe buýt 45
Hình 5.9 Bảng lưu trữ các khoảng thời gian trong ngày 46
Hình 5.10 Bảng lưu trữ thông tin về vận tốc, thời gian di chuyển giữa hai trạm tại một khoảng thời gian 46
Hình 5.11 Thời gian di chuyển tại các thời điểm trong ngày 47
Hình 5.12 Vận tốc trung bình tại các thời điểm trong ngày 47
Hình 5.13 Kết quả của giải thuật CSP 48
Hình 5.14 Kết quả của giải thuật TDSP ràng buộc 2 lần chuyển tuyến 49
Hình 5.15 Kết quả giải thuật TDSP ràng buộc 1 lần chuyển tuyến 49
Hình 5.16 Kết quả đi vào lúc 5h với thời gian 1 giờ 26 phút 50
Hình 5.17 Kết quả đi vào lúc 8h với thời gian 1 giờ 30 phút 50
Hình 5.18 Kết quả đi vào lúc 17h với thời gian 1 giờ 45 phút 51
Hình 5.19 Trực quan hóa một lộ trình của xe buýt xuất phát từ bến xe An Sương đến Chợ Lớn bắt đầu từ lúc 8h trên bản đồ 3D , có góc nhìn từ trên xuống 52
Hình 5.20 Trực quan hóa một lộ trình của xe buýt xuất phát từ bến xe An Sương đến Chợ Lớn bắt đầu từ lúc 15h trên bản đồ 3D , có góc nhìn từ trên xuống 52
Hình 5.21 Kết quả giống như hình 4.18, nhưng có góc nhìn ngang thể hiển hiện thời gian di chuyển theo độ cao 53
Trang 99
LỜI CẢM ƠN
Nhóm đề tài cũng gửi lời cám ơn đến ĐH Quốc Gia Tp HCM đã hỗ trợ kinh phí để chúng tôi thực hiện những nghiên cứu trợ giúp cho người dân Tp HCM trong việc tìm kiếm thông tin về xe buýt Ngoài ra, nhóm đề tài xin gửi lời cám ơn chân thành đến quí đồng nghiệp Khoa KH&KT Máy Tính đã hỗ trợ nhóm rất nhiều về chuyên môn trong quá trình thực hiện đề tài Đặc biệt, chúng tôi gửi lời cám ơn sâu sắc đến Ban Giám Đốc Công ty Telecom Information Technology (TÍT) đã cung cấp cho chúng tôi các mẫu dữ liệu về mạng lưới xe buýt Tp HCM và dữ liệu GPS thu thập
từ phương tiện xe buýt trên địa bàn Tp HCM
Trang 10hệ và quá trình bên trong dữ liệu Và cũng trong xu thế đó, rất nhiều nhà khoa học đã đề xuất tách
ra hai nhánh như đã nêu ở trên để phân biệt việc trực quan 2 nhóm mô hình dữ liệu: liên tục (trực quan hóa khoa học) và rời rạc (trực quan hóa thông tin) Người đọc có thể xem thêm trong [19] về
sự phát triển của ngành trực quan hóa dữ liệu Ở Việt Nam, một trong những dữ liệu cần được hiển thị và khám phá nhất là dữ liệu về dòng giao thông
Hiện nay đã có quá nhiều các nhận định trái chiều về giao thông tại Việt Nam, và cũng từ
đó đã có rất nhiều các quyết sách chưa hợp lý Theo nhận định của nhóm đề tài thì một trong những nguyên nhân của điều này là việc thiếu trầm trọng dữ liệu giao thông ở những thành phố lớn của Việt Nam (ở nhiều mức độ chi tiết khác nhau) Với việc đầu tư mạnh mẽ về khoa học và công nghệ thì dữ liệu sẽ được thu thập, nhưng điều dễ dàng thấy rõ là sẽ có một dữ liệu rất phức tạp và khổng lồ Điều dễ thấy là việc hiển thị và phân tích dữ liệu đó sẽ hoàn toàn không dễ dàng,
và đây cũng chính là thách thức chính mà đề tài mong muốn tiếp cận
Trong thời gian gần đây, WebGL nổi lên như là một công nghệ lập trình tiên tiến cho phép người lập trình có thể trực quan hóa thông tin trên nền web dưới dạng 2D, 3D … rất uyển chuyển
và linh động WebGL có thể chạy trên đối tượng đồ họa 3 chiều, trực tiếp trên trình duyệt WebGL
sử dụng ngôn ngữ lập trình Javascript Công nghệ này có thể truy cập vào card đồ họa sử dụng JavaScript WebGL có thể chi phối giao diện DOM, dựa trên công nghệ OpenGL ES 2.0 , có thể vận hành trên nhiều thiết bị khác nhau gồm có máy tình cá nhân, điện thoại di động v v
WebGL có thể chạy trực tiếp trên card đồ họa Có một vài thư viện sử dụng cho WebGL được tạo ra để user có thể dễ dàng sử dụng Tuy nhiên sẽ tốt hơn nếu hiểu rõ cốt lõi của WebGL từ
đó tiếp cận công nghệ này WebGL có thể chạy thời gian thực với đối tượng đồ họa 3D và tất
Trang 11đó việc đầu tư đúng mức của các cấp lãnh đạo trong việc xây dựng hệ thống thông tin lưu trữ và chia sẽ tuyến xe buýt thông qua mạng internet đã giúp ích rất nhiều cho người đi xe buýt Do đó
đặt ra một bài toán tuy không mới nhưng khó giải, đó là bài toán tìm đường đi xe buýt ngắn nhất
Đường đi ngắn nhất ở đây có thể xét trên nhiều tiêu chí như ít nhảy tuyến xe buýt nhất, thời gian nhanh nhất, ít tiền vé nhất, khoảng đường đi bộ ngắn nhất…
Trang 1212
Hình 1.1 Sơ đồ các tuyến xe buýt trên Tp Hồ Chí Minh
Từ những phân tích trên, đề tài sẽ tập trung vào giải quyết một số vấn đề sau:
Thu thập dữ liệu mạng lưới tuyến xe buýt tại địa bàn Tp Hồ Chí Minh
Phân tích và xử lý dữ liệu trả về từ thiết bị định vị gắn trên xe buýt
Dựa vào dữ liệu đã xử lý, xây dựng mô hình đồ thị đường đi xe buýt và những tính chất của nó
Nghiên cứu phát triển giải thuật và ứng dụng về tìm đường xe buýt theo thời gian thực
Trực quan kết quả tìm đường xe buýt dưới dạng 2D trên nền bản đồ Google
Trực quan kết quả quả tìm đường xe buýt dưới dạng 3D trên nền bản đồ Open Street Map
Trang 1313
1.2 Cấu trúc báo cáo
Báo cáo được trình bày gồm có 5 chương:
Chương 1: Giới thiệu Giới thiệu vấn đề, mục tiêu và nội dung sơ lược của đề tài,
từ đó cho thấy sự cần thiết để thực hiện đề tài
Chương 2: Tổng quan Trình bày sơ lược về những nghiên cứu của các vấn đề liên
quan và bài toán mà đề tài quan tâm
Chương 3 : Phân tích và xử lý dữ liệu giao thông Trình bày về những thông tin
có được từ dữ liệu giao thông và cách thức xử lý để đưa vào mô hình lưu trữ phù hợp
Chương 4 : Thực hiện mô phỏng dữ liệu giao thông trên nền bản đồ 3D Trong
phần này nhóm đề tài trình bày về công nghệ cũng như cách thức để trực quan hóa
dữ liệu giao thông trên nền bàn đồ 3D
Chương 5 : Bài toán tìm đường đi xe buýt theo thời gian Trình bày về mô hình
đồ thị xe buýt, giải thuật trình đường đi xe buýt trên đồ thị phụ thuộc thời gian và những kết quả có được
Chương 6: Kết luận
Trang 1414
Chương 2 Tổng quan2.1 Trực quan hóa thông tin
Với xu thế nghiên cứu được trình bày ở trên thì tình hình nghiên cứu như sau (chỉ tập trung vào các nghiên cứu dùng phân tích trực quan cho dòng giao thông):
a) Tình hình ngoài nước:
Một trong các nghiên cứu đáng chú ý nhất được công bố trong [11], là xây dựng một nguyên mẫu cho một hệ thống trực quan hóa giao thông Trong công trình này, nhóm tác giả đã kết hợp các mô hình nghiên cứu cũ về 3-D và đưa vào dòng dữ liệu giao thông thời gian thực Tuy nhiên, chỉ có 2 đại lượng chính của dòng giao thông là tốc độ và khối lượng di chuyển được cung cấp và điều này đã hạn chế khá nhiều việc trực quan hóa Hơn nữa, các tác giả chỉ trình bày hoạt hình (computer animation) lại các phương tiện dựa trên 2 đại lượng trên chứ không có thật các phương tiện và vị trí thật của chúng Ngoài ra, nguyên mẫu này chưa hướng đến được việc phân tích trực quan mà chỉ mới đạt được mức độ hoạt hình hóa sử dụng đồ hoạ máy tính
Như được chỉ ra trong [16], các công cụ trực quan cổ điển (plan, profile, cross-section) trở nên kém hiệu quả trong việc phân tích trực quan để làm rõ được mối quan hệ giữa các đối tượng
di chuyển, hoặc các đại lượng mô tả dòng giao thông Nói một cách khác, các phương thức và công cụ trực quan cổ điển khó giúp ích được cho các nhà quy hoạch Bên cạnh công trình [16] thì
có rất nhiều các công bố tương tự (ví dụ như [17]), tuy nhiên, hầu như tất cả các nghiên cứu này
đề áp dụng các phương cách hiển thị 2-D, 3-D, 4-D hướng đến một môi trường hoạt hình (phục vụ hiển thị) nhiều hơn là giúp cho phân tích dòng giao thông (tương tự như [11])
Một khảo sát khá chi tiết về trực quan hóa trong lĩnh vực quy hoạch đô thị (có bao gồm giao thông) được trình bày trong [18] Trong tài liệu này, nhóm tác giả đã khảo sát rất tốt các phương pháp trực quan hóa phục vụ cho quy hoạch ở mức quản lý vĩ mô Tuy nhiên, hướng nghiên cứu về trực quan hóa dòng giao thông chưa được đề cập
b) Tình hình trong nước:
Có thể nói hầu như các nghiên cứu trong nước về trực quan hóa trong giao thông là gắn chặt với các hệ thông tin địa lý (GIS) Các nghiên cứu chủ yếu là sử dụng các công cụ có sẵn để trực quan hóa các đại lượng trong một lĩnh vực quản lý cụ thể nào đó, mà chưa đào sâu vào nghiên
Trang 1515
cứu cách trực quan hợp lý và mới để phục vụ việc phân tích Tìm kiếm trong các thư viện về các công trình nghiên cứu, cũng như trên Internet thì có thể nhận thấy đa số các nghiên cứu trong GIS chủ yếu tập trung vào các lĩnh vực sau:
Trực quan hóa hỗ trợ quản lý: đây là lĩnh vực được đầu tư nghiên cứu mạnh nhất ở Việt Nam Tuy nhiên, trực quan hóa dòng dữ liệu về giao thông là chưa được đề cập đến Một lý do chính là thiếu dữ liệu do nhiều lý do chủ quan và khách quan: đầu tư chưa đủ và thiếu tập trung, công nghệ thu thập chưa sẵn sàng (các công nghệ đo dòng giao thông cũ không phù hợp ở Việt Nam, các phương thức thu thập giao thông như camera, GPS - Global Positioning System,…chưa đáp ứng được độ tin cậy) Một lý
do khác là các nhóm nghiên cứu về GIS thì không có thế mạnh về lý thuyết dòng lưu thông (traffic theory) Điều này đã hạn chế rất nhiều khả năng đề xuất các phương pháp trực quan mới phù hợp với dòng giao thông hỗn hợp đặc thù ở Việt Nam (và một số nước khác có dòng giao thông tương tự) Do có quá nhiều nghiên cứu trong hướng này nên thuyết minh sẽ không chỉ rõ nghiên cứu nào trong phần tham khảo
Trực quan hóa hỗ trợ các mô phỏng trên nền bản đồ: có khá nhiều bài toán mô phỏng các hiện tượng tự nhiên trên nền bản đồ như lan truyền ô nhiễm, ngập lụt, biến đổi khí hậu, dự báo thời tiết,…Tuy nhiên, như đã đề cập ở phần trên thì đa số nghiên cứu
ở Việt Nam trong nhóm này là sử dụng các công cụ trực quan khoa học, xoay quanh việc sử dụng hiển thị bản đồ 3-D và dùng màu để mã hóa các đại lượng vật lý Dưới đây là một hình là một ví dụ về việc trực quan hóa ô nhiễm không khí tại một địa bàn
Hình 2.1 Hình ảnh trích từ đề tài nghiên cứu về mô phỏng ô nhiễm không khí
Trang 1616
2.2 Bài toán tìm đường đi ngắn nhất
Như đã biết bài toán tìm đường đi ngắn nhất (shortest path – SP) có độ phức tạp đa thức Tuy nhiên khi xét đến bài toán tìm đường đi ngắn nhất với các ràng buộc (constrained shortest path - CSP) thì bài toán này thuộc lớp bài toán NP-hard Tương tự bài toán tìm đường đi ngắn nhất trên đồ thị phụ thuộc thời gian (time-dependent shortest path - TDSP) cũng là bài toán NP-hard
Do đó trong thời gian qua đã có rất nhiều nghiên cứu về hai bài toán này và đề xuất những giải thuật tìm ra lời giải xấp xỉ cũng như lời giải tối ưu với những loại đồ thị khác nhau
Việc đầu tiên khi đối mặt với bài toán tìm đường đi ngắn nhất là làm sao mô hình bài toán thực tế thành một dạng đồ thị Đối với mỗi loại đồ thị mô hình cho những bài toán thực tế khác nhau sẽ có những đặc tính khác nhau Trong [8] đề cập tới mạng truyền tải liên lạc và những ràng buộc về việc truyền tải, từ đó đưa ra một giải thuật xấp xỉ để giải quyết bài toán Và trong [1][2] cũng đề cập về mạng liên lạc giữa các máy tính với theo thời gian với những quy định về việc truyền dữ liệu Trong [3] các tác giả quan tâm về mạng đường đi với đặc tính vào-trước-ra-trước (First-In-First-Out hoặc viết tắt là FIFO) Tính chất FIFO cho biết một đồ thị phụ thuộc thời gian
có tính FIFO nếu mọi cạnh của đồ thị đó có tính FIFO
Bài toán tìm đường đi xe buýt là bài toán khó và độ khó tuỳ thuộc vào số lượng ràng buộc đặt ra cho bài toán Nếu chỉ xét bài toán tìm đường đi ngắn nhất trên đồ thị có yếu tố thời gian, có thể chia ra hai lớp bài toán: mở rộng theo thời gian (time-expanded) và phụ thuộc theo thời gian (time-dependent)
a) Mở rộng theo thời gian (Time-expanded)
Đối với dạng bài toán này, tại một trạm xe buýt (tương ứng với một node trong đồ thị thời gian) ta sẽ quan tâm đến lịch các xe buýt thực sẽ đến trạm khi nào Yếu tố này đóng vai trò then chốt trong việc xây dựng trong số của các cạnh trong đồ thị mô phỏng mạng lưới xe buýt và đồ thị này là đồ thị có trọng số cố định Trong [6] Schulz và các cộng sự đề xuất áp dụng phương pháp này để giải quyết bài toán tìm đường cho hệ thống đường sắt (có tính chất tương tự hệ thống xe buýt) Trong đó nhóm tác giả đã mô hình hoá bản đồ đường sắt kết hợp lịch chạy thành một mô hình đồ thị có trọng số cố định Nhóm tác giả Hannenmann [10] tiếp tục phát triển nghiên cứu của Schulz với sự bổ sung về tối ưu giá vé và số lần chuyển tuyến Đóng chính của các nhóm tác giả
để giải quyết bài toán tìm đường đi ngắn nhất khi xét lịch trình xe là việc mô hình tất cả những yêu cầu thực tiển thành đồ thị có trọng số Sau khi đã xây dựng đồ thị trên, để giải quyết bài toán
Trang 1717
tìm đường đi ngắn nhất, các nhóm tác giả áp dụng giải thuật tìm đường kinh điển là Dijkstra Tuy nhiên các nhóm tác giả đã có những kỹ thuật cải tiến mới nhằm tăng tốc thời gian chạy của giải thuật Trong [9] Schulz cũng đã tóm tắt lại rất rõ ràng những nghiên cứu của ông và cộng sự liên quan đến bài toán tìm đường đi cho hệ thống đường sắt
Đối với những nghiên cứu trong nước, bài toán tìm đường đi xe buýt là bài toán mới, do đó
có rất ít nghiên cứu về bài toán này Có thể hiểu rằng việc thiếu dữ liệu thực nghiệm là một trong những nguyên nhân chính Trong [20] Vo Dang Khoa và cộng sự đưa ra phương pháp tìm đường
đi xe buýt có quan tâm đến lịch chạy của xe buýt Trong nghiên cứu, nhóm tác giả ứng dụng giải thuật gán nhãn để tìm đường đi xe buýt Tuy nhiên kết quả cũng chỉ dừng lại mức nghiên cứu chứ chưa thể áp dụng cho thực tế Lý do chính là hệ thống xe buýt tại Việt Nam tuy có thời gian biểu của xe, nhưng đa phần các xe buýt không chạy đúng giờ và đúng tuyến
b) Mở rộng theo thời gian (Time-expanded)
Đối với cách tiếp cận này, ta không hướng đến xây dựng đồ thị có trọng số cố định mà hướng đến xây dựng đồ thị có trọng số cạnh phụ thuộc thời gian (on-the-fly) Điều này ảnh hưởng lớn đến việc hiệu chỉnh giải thuật tìm đường sao cho tương thích với dạng đồ thị đặc biệt này Trong [21][22] các nhóm tác giả đề xuất phương pháp lập trình quy hoạch động để giải quyết bài toán tìm đường đi ngắn nhất Tuy nhiên nhóm tác giả cũng nhấn mạnh rằng họ không đảm bảo hiệu suất tốt của phương pháp đề xuất Orda và Rom [1] có những nghiên cứu về độ phức tạp của bài toán tìm đường đi ngắn nhất cho phương pháp phụ thuộc thời gian Từ đó nhóm tác giả đưa ra những giải thuật hiệu quả [23][24] nhóm tác giả tiếp tục có những nghiên cứu sâu hơn công trình của Orda và Rom và đã chứng minh được trên phương diện lý thuyết rằng phương pháp phụ thuộc thời gian hiệu quả hơn phương pháp mở rộng thời gian
Từ những phân tích trên, ta thấy phương pháp phụ thuộc thời gian chứng minh được những
ưu điểm so với phương pháp mở rộng thời gian trên cả hai phương diện lý thuyết lẫn thực tiễn Đối với bài toán xe buýt tại Việt Nam (Tp Hồ Chí Minh), nhận xét thấy rằng việc xe buýt chạy sai tuyến, sai giờ, bỏ trạm … là thách thức lớn cho nhà quản lý cũng như cho những nhà khoa học trong việc giải quyết bài toán tìm đường đi ngắn nhất Từ đó đề tài đề xuất giải thuật gán nhãn, là một biến thể của giải thuật Dijsktra, dùng để giải quyết các bài toán hồi quy, đa mục tiêu, hay các bài toán một mục tiêu kèm theo nhiều ràng buộc
Ngoài ra, đề tài cũng quan tâm tới với một mô hình mạng cụ thể và dựa vào những đặc tính của nó để đưa ra những kỹ thuật, heuristic tối ưu thuật giải Như đã trình bày mô hình mạng trong
Trang 1919
Chương 3 Phân tích và xử lý dữ liệu giao
thông 3.1 Phân tích dữ liệu và xử lý dữ liệu
Dữ liệu dòng giao thông xe buýt được thu thập thông qua các thiết bị GPS được gắn trên các xe buýt Các thiết bị này được định thời để gửi những tín hiệu về máy chủ Dữ liệu thô nhận được chỉ đơn giản với các dòng thông tin như sau:
53U1917,10.751246,106.7019,0.0,0.0,0,1,0,Wed Jun 04 00:00:19 ICT 2014
Dữ liệu này cho biết các thông tin bao gồm mã số quản lý của thiết bị, tọa độ của thiết bị
và thời điểm gửi tín hiệu Từ những thông tin trên có thể biết được vị trí của một thiết bị theo thời gian Hình 3.1 thể hiện đường đi và vị trí của một thiết bị Ở đó, thời gian giữa các tín hiệu không đều nhau, có lúc thưa hoặc dày đặc
Hình 3.1 Đường đi và vị trí của các tín hiện trên bản đồ 2D
Với số lượng lớn thiết bị GPS được gắn cho các xe buýt trong Tp Hồ Chí Minh (khoảng
6000 thiết bị), ta có được một mạng lưới dày đặc các đường đi của các xe buýt Như hình 3.2 thể hiện một mạng lưới đường đi của các xe buýt trong khoảng thời gian từ 6 giờ đến 7 giờ
Trang 2020
Hình 3.2 Đường đi của các xe buýt phủ khắp Tp.Hồ Chí Minh trên bản đồ 2D Các thiết bị trả về một số lượng lớn dữ liệu, khoảng 2.5 triệu dữ liệu trong một ngày Tuy nhiên trong đó có một số trường hợp dữ liệu không dùng được Khi các tín hiệu được gửi đều đặn
và thời gian giữa các lần gửi tín hiệu nhỏ thì có thể thấy rõ được đường đi của các phương tiện Từ
đó có thể tính toán được quãng đường đi và vận tốc của các phương tiện một cách tương đối chính xác Nhưng trong thực tế thì nhiều trường hợp tín hiệu có thời gian ngắt quãng quá lớn dẫn đến kết quả như hình 3.3 Có nhiều nguyên nhân như thiết bị hết năng lượng, tín hiệu bị mất, người điều khiển tắt thiết bị và điều này dẫn đến khó mà xác định được đường đi chính xác của xe buýt cũng như không thể xác định được vận tốc của xe buýt Đối với những dữ liệu như vậy thì sẽ bị loại bỏ
Hình 3.3 Những tín hiệu bị ngắt quãng một thời gian lớn Trước tiên, dữ liệu dòng giao thông cho biết thông tin một phương tiện đi tới điểm A ở
thời điểm t 1 rồi đi tới điểm B ở thời điểm t 2 Như vậy ta chỉ có được khoảng thời gian di chuyển
Trang 2121
giữa A và B, nhưng chưa biết đường đi thực sự giữa A và B Như đã trình bày ở phần trước, ta chỉ
quan tâm tới những trường hợp mà (t 2 -t 1 ) là một khoảng thời gian nhỏ ∆t thì có thể xem như
đường đi từ A tới B là một đường thẳng Từ đó ta có thể tính được quãng đường đi giữa A và B bằng công thức khoảng cách Euclide, cũng như vận tốc trung bình trên đoạn đường AB trong
khoảng thời gian từ t 1 đến t 2 Với cách này, ta sẽ tính được vận tốc cho tất cả các cặp vị trí liên tục
Tiếp theo việc quan trọng cần làm là tính toán để xây dựng dữ liệu cho đồ thị xe buýt theo thời gian từ dữ liệu đã được tính toán ở trên Ban đầu đồ thị xe buýt chỉ có thông tin về những bộ
dữ liệu tĩnh ( <v 1 ,v 2 >, d, r), ở đó <v 1 ,v 2 > là đoạn đường đi có chiều dài d giữa trạm v 1 và v 2 bởi
tuyến r, ở đây chưa cung cấp được thông tin về thời gian Trong đề tài nghiên cứu chia thời gian
một ngày thành những khoảng thời gian nhỏ T liên tục Mỗi bộ dữ liệu tĩnh ( <v 1 ,v 2 >, d, r) với từng khoảng thời gian T sẽ có thông tin về vận tốc và chi phí thời gian tương ứng Từ đó ta có những bộ dữ liệu theo thời gian gian (<v 1 ,v 2 >, d, r, T, s , t) cho biết đoạn đường đi có chiều dài d giữa trạm v 1 và v 2 bởi tuyến r trong khoảng thời gian T với vận tốc s và chi phí thời gian để đi t
Để tính được vận tốc s và chi phí thời gian t cho từng bộ dữ liệu, trong đề tài dùng giải thuật (gọi
tắt là GT-M1) sau:
Bước 1 (B1): Với mỗi bộ dữ liệu ( <v 1 ,v 2 >, d, r, T ) , ở đó <v 1 ,v 2 > là
đoạn đường đi có chiều dài d giữa trạm v 1 và v 2 bởi tuyến r trong khoảng thời gian T
Tìm tất cả những đoạn AB đi trong khoảng thời gian từ t 1 đến t 2, sao cho:
+ AB gần với <v 1 ,v 2 >
+ [t 1 ,t 2 ] thuộc khoảng thời gian T
Bước 2 (B2): Gán vận tốc trên đoạn đường <v 1 ,v 2 > bằng vận tốc trung
bình của tất cả những đoạn AB tìm được Từ đó tính được chi phí thời gian trên đoạn đường này
Bước 3 (B3): Nếu không tìm được đoạn AB nào thì vận tốc sẽ bằng một
giá trị vận tốc mặc định Ta có thể sử dụng vận tốc trung bình của toàn bộ dữ liệu dòng giao thông
Trang 2222
Trong bước B1, mục tiêu là tìm ra được những đoạn AB gần với đoạn đường <v 1 ,v 2 >, một đoạn AB được tính là gần với <v 1 ,v 2 >, khi tồn tại một điểm v i thuộc <v 1 ,v 2 > mà khoảng cách từ v i tới trung điểm của đoạn AB nhỏ hơn một giá trị ∆d cho trước Như hình 3.4 mô tả những đoạn
AB là những đoạn thẳng( màu đen và đỏ), trong đó những đoạn màu đỏ là những đoạn AB được
tính là gần với <v 1 ,v 2 >
Hình 3.4 Mô tả những đoạn màu đỏ được tính là gần với đoạn đường <v 1 ,v 2 >
Ở bước B2 chỉ đơn giản là tính ra vận tốc trung bình của tất cả những đoạn AB tìm được,
rồi gán giá trị vận tốc này cho đoạn đường <v 1 ,v 2 > Bước B3 dùng để xử lý cho những đoạn
đường không tìm được những đoạn AB nào gần nó, nên sẽ gán cho nó một giá trị vận tốc trung bình của dòng giao thông Sau khi thực hiện theo giải thuật này, đề tài đã xây dựng dược dữ liệu
đồ thị xe buýt theo thời gian cho những cạnh đồ thị di chuyển bởi xe buýt
Trong mô hình đồ thị theo thời gian như Chương 3 đã trình bày thì đồ thị phụ thuộc thời gian có 4 loại cạnh:
Loại a: kết nối bởi các tuyến xe buýt
Loại b: cho biết thông tin chuyển tuyến và thời gian đợi để chuyển tuyến
Loại c: cạnh thể hiện việc đi bộ giữa các trạm gần nhau
Loại d: cạnh thể hiện việc xuống xe buýt Cạnh này các giá trị đều bằng không, do đó không càn tính
Giải thuật GT-M1 dùng để tính toán cho các cạnh loại a Các cạnh loại c thì thì có thể xem vận tốc đi bộ là một hằng số không thay dổi theo thời gian, từ đó tính được chi phí thời gian di chuyển dựa trên quãng được đi bộ giữa hai đỉnh Còn cạnh loại b thì không thể dựa vào dữ liệu định vị để tính toán được, vì cạnh loại b thể hiện thông tin một người phải đợi bao lâu để đón một tuyến xe buýt nào đó.Yếu tố này có thể xác định dựa vào tần suất các chuyến của xe buýt Thông
Trang 2323
thường thời gian đợi tại một trạm trong khoảng từ 10 phút đến 20 phút tùy vào tình hình mật độ lưu thông trên đường Trên lộ trình di chuyển của một tuyến thì có nhiều chuyến của tuyến đó trong một ngày Với nhưng tuyến có nhiều chuyến hơn thì thời gian đợi kỳ vọng sẽ ngắn hơn Thời gian đợi này thường khó xác định một cách chính xác do nhiều yếu tố như mật độ lưu thông trên đường, lịch trình chạy không ổn định Trong đề tài xin đề xuất một cách tính thông tin về thời gian đợi tại một đỉnh trong đồ thị xe buýt đơn giản như sau:
Trước tiên, từ thông tin về các chuyến xe buýt cho biết được tần số chuyến của mỗi
tuyến Giả định với mỗi một tuyến r có lộ trình dài d r và có n r chuyến trong khoảng thời
gian T, giả định thời gian giữa các chuyến là như nhau
Từ đó tính được thời gian đợi kỳ vọng của tuyến r là T/n r Với mỗi một tuyến sẽ có thời
gian đợi tương ứng nên với tất cả cặp cạnh loại b, (v i , v j ), của đồ thị và nếu đỉnh v j thuộc
tuyến r , tức là có tồn tại 1 cạnh (v j , v k )=(<v j ,v k >, d, r), thì chí phí thời gian đợi của cạnh (v i , v j ) là thời gian đợi của tuyến r
3.2 Mô hình lưu trữ
Ban đầu dữ liệu thô có được sẽ được lưu theo định dạng như sau:
Hình 3.5 Bảng lưu trữ dữ liệu giao thông ban đầu
Bảng dữ liệu như hình 3.5 cũng đơn giản cho biết thông tin dữ liệu thô ban đâu có được Nhưng điểm khác ở đây là nó được lưu trữ trong hệ quản trị cơ sở dữ liệu, mà từ đó ta có thể truy vấn được những thông tin khác liên quan một cách dễ dàng như : một thiết bị đi qua những điểm
Trang 2424
nào theo thứ tự thời gian, Và với cách tính toán và xử lý như đã nêu ở mục 3.1 thì nhóm đề tài kết xuất ra dữ liệu như bản sau :
Hình 3.6 Bảng dữ liệu đả được xử lý, cho biết những đoạn đường mà xe buýt đi qua với
những thông tin kèm theo
Dữ liệu này cho biết đi từ điểm (x1,y1) ở thời điểm fromtime đến (x2,y2) ở thời điểm totime Kèm theo các thông tin về khoảng cách distance, khoảng thời gian timespan, và vận tốc di chuyển speed
Từ dữ liệu có được như hình 3.6, nhóm đề tài sẽ thực hiện tính toán để có được dữ liệu mật
độ giao thông theo thời gian Dữ liệu mật độ giao thông theo thời gian cho biết được tại một điểm nào đó sẽ có vận tốc thay đổi như thế nào theo thời gian Việc này hữu ích trong việc nhận biết những điểm, những vùng kẹt xe, Việc tính toán bao gồm các bước cụ thể như sau :
Chia thành phố thành những ô lưới nhỏ trong không gian hai chiều
Tại mỗi ô lưới sẽ tính toán vận tốc trung bình tại đó theo từng thời điểm khác nhau
Chia thời gian trong ngày thành những khoảng thời gian nhỏ Ở đề tài này, nhóm chia mỗi khoảng thời gian nhỏ là 10 phút Việc chia này vì dữ liệu không có đủ chi tiết để lưu trữ những thông tin giao thông (vận tốc) theo từng giây, từng phút
Từ đó có được dữ liệu mật độ giao thông như hình 3.7 Tại ô lưới (row,col) ở thời điểm ThoiGianId có vận tốc là speed
Trang 2525 Hình 3.7 Dữ liệu giao thông lưu trữ dưới dạng lưới theo thời gian
Trang 2626
Chương 4 Mô phỏng dữ liệu giao thông trên
bản đồ 3D 4.1 Công nghệ
Để hiện thực chương trình mô phỏng, ứng dụng dùng công nghệ WebGL trên nền web WebGL có thể chạy trên đối tượng đồ họa 3 chiều, trực tiếp trên trình duyệt, WebGL sử dụng ngôn ngữ lập trình Javascript Công nghệ này có thể truy cập vào card đồ họa sử dụng JavaScript WebGL có thể chi phối giao diện DOM, dựa trên công nghệ OpenGL ES 2.0 , có thể vận hành trên nhiều thiết bị khác nhau gồm có máy tình cá nhân, điện thoại di động … WebGL có thể chạy trực tiếp trên card đồ họa Có một vài thư viện sử dụng cho WebGL tạo ra để user có thể dễ dàng
sử dụng Tuy nhiên sẽ tốt hơn nếu hiểu rõ cốt lõi của WebGL từ đó tiếp cận công nghệ này WebGL có thể chạy thời gian thực với đối tượng đồ họa 3D và tất nhiên WebGL có thể áp dụng cho nhiều lĩnh vực thú vị với những ai muốn tiếp cận công nghệ này
Hình 4.1 Một số kết quả mô phỏng 3D với công nghệ WebGL
Ngoài ra ứng dụng lựa chọn nền bản đồ Open Street Map Đây là dự án cho phép mọi người cùng xây dựng bản đồ thế giới mở với một cộng đồng người dùng đông đảo tham gia hỗ trợ
Ở Việt Nam, cũng có một dự án con nhằm xây dựng bản đồ chi tiết và đầy đủ hơn Đây là nguồn bản đồ mở khá chi tiết để phát triển những ứng dụng về GIS Bên cạnh đó, ứng dụng còn sử dụng
Trang 2727
một số thư viện 3D như ReadyMap – thư viện hỗ trợ mô phỏng trái đất, và ThreeJS cho phép tạo những đối tượng 3D một cách tiện lợi
Hình 4.2 Bản đồ OpenStreetMap ở khu vực thành phố Hồ Chí Minh
4.2 Kết quả trực quan hóa trên bản đồ 3D
Với dữ liệu giao thông có được, đề tài cũng đã thực hiện mô phỏng tình trạng thông trong một phạm vi ở những thời điểm xác định Ví dụ như hình 4.3 và hình 4.4 cho thấy tình hình giao thông của một vùng trong thành phố trong khoảng thời gian từ 5h00 đến 6h00 Màu sắc trên hình thể hiện vận tốc tương ứng Ở những vùng màu xanh lá cây thể hiện tình trạng lưu thông tương đối nhanh (hoặc chưa có dữ liệu chính xác), còn những nơi có màu đỏ thì vận tốc đó đó tương đối chậm
Trang 2828 Hình 4.3 Mô phỏng tình trạng giao thông trên bản đồ 3D ở thời điểm xác định
Hình 4.4 Mô phỏng với góc nhìn từ trên xuống
Trang 2929
Với kết quả như hình 4.5 mô phỏng tình trạng giao thông trong khoảng thời gian từ 9h00 đến 10h00, có thể thấy được tại thời gian này thì trên bản đồ xuất hiện nhiều vùng màu đỏ hơn hình 4.3 Điều này cho thấy vận tốc của các phương tiện phụ thuộc vào thời gian Ngoài ra, có thể xem thông tin về vận tốc ở những thời gian khác nhau tại một vị trí bằng cách nhấn đúp chuột vào bản đổ để có được biểu đồ chi tiết về vận tốc như hình 4.6
Hình 4.5 Mô phỏng trong khoảng thời gian từ 9h00 đến 10h00