Bỏ qua một số lỗi cơ bản như chính tả, tiếng địa phương, hoặc viết tắt trong dữ liệu hai nguồn khác nhau minh họa là thông tin chủ nhà: ‘Huỳnh An Khương’ so với ‘Quỳnh An Khương’, việc
Trang 1BÀN LUẬN VỀ VẤN ĐỀ DỮ LIỆU ĐA NGUỒN VÀ KINH NGHIỆM TRONG TRIỂN KHAI THU THẬP DỮ LIỆU GIS – NHẬN ĐỊNH
TỪ MỘT NGUỒN DỮ LIỆU TẠI QUẬN 7, TP HỒ CHÍ MINH
(MULTI ESTABLISHED GIS DATA SOURCES PROBLEMS AND SOME
EXPERIMENTS ON LOCATING ACQUISITION SPATIAL DATA - STUDY CASE ON
ONE DATA SOURCE OF DISTRICT 7 TH IN HOCHIMINH CITY)
Khưu Minh Cảnh, Trần Quang Trường Hinh, Lâm Quang Hà, Trịnh Xuân Hoàng Trung tâm Ứng dụng Hệ thống thông tin Địa lý, TPHCM
Abstract: Data are establish during data collecting processing So, many sources may be
deviated in locating spatial objects The causes could be the data getting time, the details of data collection as well as the process These differents will affects strongly to spatial locating
in the synthesis and unified process We could use some experiment design factors to explore
the spatial rules and help matching spatial objects with their seperated information
Keywords: GIS, geocoding, statistics, locating process
1 MỞ ĐẦU
Hiện nay, dữ liệu bản đồ và GIS được trực tiếp thành lập từ các đơn vị có thẩm quyền về Khoa học và Công nghệ; Tài nguyên và Môi trường hoặc các đơn vị trực thuộc Dữ liệu (có yếu
tố không gian) thường được chuẩn hóa các trường dữ liệu và các thông tin mô tả (metadata) Việc chuẩn hóa đem lại nhiều lợi ích trong các hệ thống cơ sở dữ liệu (CSDL) Tuy nhiên, trong nhiều dự án GIS, để xây dữ liệu chuẩn hóa theo CSDL hiện hữu là điều khó vì lực lượng thu thập dữ liệu chưa hẵn có hoặc trình độ hoặc ý thức hoặc chưa được tập huấn kỹ về vấn đề xây dựng dữ liệu Mặt khác, sự thay đổi trên thực tế theo thời gian hoặc phương pháp thu thập cũng
là một nguyên nhân gây ra sự lệch giữa các dữ liệu chuyên đề và dữ liệu nền
Bỏ qua một số lỗi cơ bản như chính tả, tiếng địa phương, hoặc viết tắt trong dữ liệu hai
nguồn khác nhau (minh họa là thông tin chủ nhà: ‘Huỳnh An Khương’ so với ‘Quỳnh An
Khương’), việc định vị các dữ liệu trên thực tế sẽ rất khó khăn trong những khu vực có nhiều biến động Với lớp bài toán định vị phục vụ quản lý đô thị, cụ thể là định vị liên quan đến số nhà - dữ liệu số nhà được xem là rời rạc và hình thành theo khu vực: hẻm, địa danh, các nhân
tố ảnh hưởng đến thường xuất phát từ qui trình khai thác dữ liệu Trong bài báo này, chúng tôi nghiên cứu thực nghiệm việc định vị dữ liệu nhà tại khu vực Quận 7, thành phố Hồ Chí Minh trên cơ sở dữ liệu nhà do Phòng Tài nguyên Môi trường Quận 7 cung cấp và dữ liệu thu gom rác do các phường thuộc địa bàn Quận 7 cung cấp
2 VẤN ĐỀ ĐỊNH VỊ KHÔNG GIAN TỪ DỮ LIỆU GIS ĐA NGUỒN
2.1 Phát biểu bài toán và một số nguyên nhân
Dữ liệu GIS và dữ liệu phục vụ GIS ngày càng được phong phú và tạo bởi nhiều tổ chức khác nhau Trong các khu đô thị mới thành lập, việc triển khai các dự án GIS phục vụ là điều bắt buộc nhằm tăng cường thể chế quản lý Từ thực tế đó, dữ liệu GIS sẽ có nhiều nguồn và bắt đầu phát sinh ra những lệch và khác biệt lẫn nhau Sự sai khác sẽ gây rất phiền phức trong các công tác tổng hợp và thống kê Cụ thể hơn, khi chúng ta không thể tìm được vị trí không
Trang 2gian cho một căn nhà về thu gom rác, ngay khi đó, việc thống kê sẽ bị thiếu hoặc thừa Nguyên nhân chính là mỗi đơn vị luôn quan tâm đến dữ liệu của mình và do đó, việc tích hợp
dữ liệu là một khâu phức tạp và chiếm thời gian
Hình 1: Minh họa về dữ liệu trong một hệ thống đa nguồn cung cấp với sự sai lệch
về thời gian gây khó khăn cho việc định vị
Dưới đây là một số nguyên nhân gây khó khăn và lệch trong việc định vị các nguồn dữ liệu, trong điều kiện hiện nay:
¾ Thời điểm thu thập dữ liệu khác nhau: các đơn vị thành lập dữ liệu chuyên đề thường
dựa trên khảo sát thực tế tại thời điểm thực hiện dự án Trong khi đó, bản đồ nền thường được thành lập trước đó và được tổng hợp cập nhật toàn bộ theo định kì Do
đó, những khu vực có biến động nhiều sẽ gây ra khó khăn trong việc định vị không gian dữ liệu chuyên đề dựa trên dữ liệu nền
¾ Đối tượng thu thập: một số phương pháp thu thập thông qua việc phỏng vấn Do đó,
cùng một căn hộ, đơn vị phân phối báo chí có thể sẽ thu thập người nhận báo (có thể
là người chồng) khác với đơn vị cung cấp gas gia đình (có thể là người vợ)… Sự khác nhau về đối tượng sẽ dẫn đến sự khác nhau về dữ liệu và là điều cản trở cho việc định vị không gian khi chúng ta không có thông tin chính xác
¾ Ảnh hưởng bởi các qui trình khác: thực tế, dữ liệu có thể không được so khớp do các
qui trình thực tế không cùng lúc được cập nhật trên dữ liệu Ví dụ: một thửa đất có thể sở hữu bởi chủ sử dụng khác Tuy nhiên, trong dữ liệu không ghi nhận thực tế này do các quá trình thực hiện Trong trường hợp trên có thể do những người chủ giao dịch nhà đất thông qua các cam kết chưa tuân theo qui trình mua bán hoặc chuyển nhượng của cơ quan chức năng nhà nước
¾ Vấn đề không gian 2 và 3 chiều: Hiện tại, các dữ liệu địa chính được xây dựng trên
2D Do đó, việc tìm kiếm và định vị những dữ liệu thực tế như hộ trên tầng 2, 3, là không thể Do đó, việc quản lý sẽ gặp những bất cập nhất định trong các bước về hiển thị hoặc những vấn đề liên quan đến, như: chữa cháy, cứu hộ…
¾ Chuẩn hóa về mô tả không gian: dữ liệu thành lập chung thường ít thông tin chi tiết
hơn dữ liệu của một đơn vị riêng Thông thường các dữ liệu chuyên đề do người
Trang 3ngoài ngành tạo dựng, do đó, một số thông tin liên quan đến địa vật hay địa danh thường gọi được đưa vào Trong khi đó, dữ liệu trong hệ thống thường được chuẩn hóa nên không bổ sung các địa danh riêng (các tên thường gọi)
Hình 2: Minh họa việc sử dụng nhiều địa danh tại một khu vực quận 7, TPHCM
¾ Vấn đề tác động khách quan hoặc nội tại từ bài toán: (như dữ liệu “da beo” trong bài
toán thu gom rác) Trên thực tế, việc quản lý và thực hiện các chuyên đề chưa đạt được tối ưu, và do đó, khi thu thập dữ liệu, hiện tượng “da beo” sẽ xuất hiện Và bài toán thu gom rác là vấn đề điển hình về bài toán giảm thiểu hiện tượng “da beo” Cụ thể: khu vực gồm 10 căn nhà nhưng một người thu gom rác có thể chỉ thu gom 3 đến
4 căn nhà và số lượng còn lại do người hoặc các nhóm khác thu gom Vấn đề “da beo” trên thực tế gây cản trở việc định vị không gian do dữ liệu sẽ có nguy cơ về mất tính liên tục trong định vị
2.2 Những nhân tố mấu chốt của dữ liệu GIS đa nguồn
Hầu hết các vấn đề định vị không gian thường dựa trên một cơ sở lí luận, trong đó, các đại lượng là duy nhất, không đổi và duy nhất (trên lý thuyết) Ví dụ, trong bài toán phục vụ định vị nhà với dữ liệu được liệt kê trong bảng tính Microsoft Excel bao gồm thông tin thu
gom rác, định vị thuộc tính không gian thường dựa trên một bộ gồm ba thông số: (tên phường, tên đường, số nhà) Khi đó, chúng ta thiết lập các thông tin bổ sung trong mẫu bao
gồm họ tên chủ hoặc đại diện chủ nhà được thu gom
Hình 3: Một mẫu dữ liệu chuyên đề thu gom rác tại Quận 7 TP.HCM
Trang 4Tuy nhiên, đối với các khu dân cư mới, hoặc các đô thị phát triển, tên chủ hộ là yếu tố thường xuyên thay đổi Mặt khác, tuy số nhà là đối tượng ít thay đổi đồng loạt nhưng đối với những khu vực mới, điển hình là dữ liệu Quận 7 thành phố Hồ Chí Minh, việc cập nhật bản
đồ cần một thời gian để đồng bộ toàn bộ dữ liệu giữa thực tế và trong CSDL GIS phía Quận
Do đó, để định vị chính xác, chúng ta phải dựa thêm những nhân tố dưới đây:
a) Nhân tố về tính liên tục trong dữ liệu thu thập: yếu tố này là một tính chất quan trọng
trong việc xác định không gian Ví dụ: những người đảm nhận công tác thu thập dữ liệu về chuyên đề thu gom rác sẽ mô tả tuần tự thứ tự nhà thu gom theo trật tự đầu hẻm đến cuối hẻm, hoặc đầu đường đến cuối đường Thứ tự sẽ là yếu tố giúp giải đoán tốt nhất địa chỉ kế tiếp trong trường hợp chúng ta có cơ sở về các thông tin tìm thấy Tuy nhiên, nhược điểm của phương pháp này là các hệ thống như thu gom rác hiện tại đang có hiện tượng “da beo” đã nêu trong mục 2.1)
b) Nhân tố về thông tin không gian và phi không gian của các nhà lân cận: dữ liệu có
thể được “giải đoán” nếu lân cận ít thay đổi Điển hình là trong một dãy nhà, một hoặc vài căn nhà được lấy làm “chuẩn” là điều hoàn toàn có thể Những căn nhà đó sẽ tìm được một khi các vector mô tả dữ liệu trùng nhau ở các nguồn dữ liệu khác nhau Trong bài toán về định vị nhà ở, ta có vector định vị tối thiểu bao gồm các thông số: (số nhà, tên đường, phường, quận);
và dễ thấy rằng dữ liệu về “tên chủ sở hữu” chỉ là tham số mang tính chất tham khảo vì tham
số này thay đổi thường xuyên hơn các tham số còn lại
2.3 Phân tích và tìm kiếm những nhân tố hỗ trợ mang tính thống kê
Từ những phân tích bên trên, giả sử chúng ta cần xây dựng dữ liệu chuyên đề từ hai nguồn dữ liệu được thu thập từ thực tế: dữ liệu nền và dữ liệu chuyên đề Khi đó, việc định vị
dữ liệu chuyên đề từ hai nguồn dữ liệu sẽ thực hiện theo qui trình như sau:
- Bước 1: Định vị vị trí dữ liệu từ dữ liệu nền Ví dụ: tìm địa chỉ nhà theo số nhà, đường, phường
- Bước 2: Thiết lập dữ liệu chuyên đề từ kết quả tìm kiếm trên
Khi đó, với mỗi bước trên, các trường hợp sau đây sẽ xảy ra:
i Định vị dữ liệu nền/chuyên đề tốt
ii Định vị dữ liệu nền/chuyên đề theo lân cận gần
iii Định vị dữ liệu nền/chuyên đề theo các lân cận xa
iv Không thể định vị hoặc tìm kiếm dữ liệu nền/chuyên đề
Vì việc thực hiện tuần tự bước 1 Æ bước 2, và mặt khác, nếu giả định việc thay đổi trên thực tế dữ liệu nền (như thay đổi quyền sở hữu, xây nhà mới, tách thửa, hợp thửa,…) là những thay đổi ngẫu nhiêu, thì chúng ta có mô tả xác xuất như sau:
Bảng 1: Mô tả trạng thái định vị đối tượng chuyên đề theo dữ liệu nền
Bước 1 \ Bước 2 Æ Dữ liệu chuyên đề
Trang 5Theo nguyên lý xác suất, ta có tổng các dòng pi+qi+ri+si = 1 Trong bảng trên, dễ dàng
ta có nếu việc định vị dữ liệu nền tốt thì xác suất định vị dữ liệu chuyên đề là 1 (ô [i,i] trong bảng) và ngược lại, nếu chúng ta không thể định vị dữ liệu nền thì chúng ta sẽ không thể định
vị dữ liệu chuyên đề (trường hợp ô [iv,iv]) Với hai trường hợp [ii] và [iii], các xác suất p, q, r,
s thể hiện khả năng định vị dữ liệu theo các đối tượng ở xa hoặc gần so với vị trí của dữ liệu chuyên đề Do đó, chúng ta xác định các giá trị xác suất theo không gian: lân cận gần và lân cận xa Hai khái niệm trên được xây dựng dựa theo phương pháp thiết lập bản đồ nền Ví dụ trong bài toán định vị thông qua số nhà Chúng ta có thể định nghĩa lân cận gần là việc xác định nhà thông qua một số số lượng nhà lân cận xác định trong dãy nhà có số tăng hoặc giảm liên tục; trong khi đó, xác định lân cận xa được định nghĩa là việc xác định nhà thông qua các nhà đầu hẻm, các nhà tham chiếu hoặc thông qua các địa vật tham chiếu khác, như: nhà trong một khu dân cư, nhà có bể nước có khả năng phục vụ việc phòng cháy chữa cháy… Việc xác định lân cận gần hoặc xa hoàn toàn mang tính chất mờ trong đánh giá Tuy nhiên, với các nhân tố đề cập ở các mục trước, chúng ta thấy rằng các xác suất p, q, r, s sẽ bị tác động mạnh
mẽ trên chất lượng dữ liệu nền và các nhân tố hỗ trợ định vị (như tính liên tục và các dữ liệu lân cận hỗ trợ định vị) Dễ dàng ta thấy rằng, pi >> qi >> ri >> si nếu và chỉ nếu dữ liệu định vị được ở một phạm vi không gian hẹp và ngược lại
Các giá trị xác suất trên sẽ giúp người quản lý ước lượng được phương án triển khai thực hiện dữ liệu Trên thực tế, đối với các dự án, việc lựa chọn các phương án triển khai sẽ ảnh hưởng đến nhân sự, tiến độ, thời gian và chi phí thực hiện Các giá trị xác suất sẽ được tính toán dựa trên những phương thức lấy mẫu trên một số tuyến đường, và một số khu dân cư nhiều nhà
2.4 Về một quy trình định vị không gian tổng quát
Theo tài liệu [11], để định vị vị trí không gian, chúng ta phải thực hiện 03 bước cơ bản: bước tiền xử lý (pre-processing), bước lập tương ứng (matching) và bước tính toán (plotting) Tiền xử lý là bước thiết lập các chuẩn để hình thành dữ liệu Các địa chỉ sẽ được chuẩn hóa và được tách (parse) thành các thành phần, như: số nhà, đường, phường, khu phố, Tiếp đó là bước thiết lập tương ứng Trong bước này, chúng ta sẽ định vị cụ thể những đối tượng tìm thấy và những đối tượng không tìm thấy Và sau cùng là bước tính toán Bước tính toán sẽ nội suy những thông tin, như địa chỉ, trên bản đồ
Hình 4: Một góc dữ liệu nhà và thửa Quận 7
Trang 6Đối với dữ liệu nhà, một số luật được liệt kê như sau:
- Số nhà là một dãy tăng hoặc giảm cùng chẵn hoặc cùng lẻ
- Khi định vị dữ liệu về nhà, phân cấp định vị: đường, phường, khu dân cư, khối nhà, các nhà lân cận
2.5 Đề xuất giải pháp định vị không gian từ các nhân tố mấu chốt trên dữ liệu nguồn đa nền
Những nhân tố được xác định bên các mục trên dễ dàng dựa trên kinh nghiệm và thực tiễn về dữ liệu thu thập và dữ liệu Thật vậy, chúng ta hoàn toàn có thể xác định nhà bằng phương pháp định vị thủ công, nghĩa là, một kỹ thuật viên sẽ tìm kiếm khu nhà căn nhà, sau
đó định vị bằng chuột với công cụ phần mềm là một form tìm kiếm nhà Tuy nhiên, tốc độ tìm kiếm và định vị là yếu tố cần bàn đến đối với dữ liệu của một Quận trong thành phố Hồ Chí Minh Điển hình: Quận 7 có trên 40000 hộ, nếu bình quân định vị bằng cách tìm kiếm nhà sẽ mất ít nhất 01 phút/hộ thì chúng ta cần trên 40.000 phút, nghĩa là trên 666 giờ, hoặc trên 83 ngày làm việc Điều đó có nghĩa là, chúng ta cần tối thiểu 04 tháng làm việc hoặc tối thiểu 04 người sẽ thực hiện trong 01 tháng cho dữ liệu của một chuyên đề của một Quận Chúng ta sẽ phân tích hướng cài đặt đối với từng nhân tố được mô tả trong mục 2.2:
- Với nhân tố a), chúng ta có thể quy định những khu vực gọi là liên tục đối với một số ứng dụng nhất định Ví dụ: trong ứng dụng thu gom rác, chúng ta có thể cần đến mô tả về đường đi của người thu gom trong một tuyến Và tuyến trong hẻm sẽ khác với tuyến ngoài mặt phố Trên thực tế, thông thường các vùng liên tục ngoài đường lớn sẽ có biên là tim đường giao thông, nhưng các vùng hẻm ít khi sử dụng tim hẻm làm biên Về điểm này, chúng ta có thể giải quyết bằng phương pháp sử dụng GPS để theo dõi (tracking) đường đi tiêu biểu của xe lấy rác
Và trong trường hợp cần thiết hơn, chúng ta có thể thêm một GPS tracking vị trí lấy rác (trong trường hợp đường hẹp hoặc người lấy rác dừng xe để đi bộ vào khu dân cư lấy)
Hình 5: Lỗi số nhà chưa quán (giữa số cũ và số mới) trên một đoạn đường Huỳnh Tấn Phát gây khó khăn việc định vị
- Với nhân tố b), chúng ta dễ dàng thấy rằng nhân tố b) được hỗ trợ từ nhân tố a) Với
dữ liệu được xem như liên tục, chúng ta có để định vị chuẩn một số vị trí không gian và các vị trí khác sẽ được kết hợp để suy luận Cụ thể hơn, khi tìm thông tin các nhà lân cận, chúng ta
Trang 7phải tìm các đối tượng bằng phương pháp buffer và có loại trừ theo các ngữ nghĩa không gian như: nhà đang xét trong hẻm thì chỉ cần tìm các nhà trong hẻm mà không cần sử dụng thông tin về nhà phía mặt tiền và ngược lại
- Trong chương trình tự động định vị, những số nhà không định vị được (do không tìm thấy) sẽ được định vị lần nữa dựa trên những nhà định vị được Ví dụ: nhà 257 Lê Văn Lương không tìm thấy Tuy nhiên, ta có thể nội suy được nếu chúng ta xác định được nhà số 255 và
259 Lê Văn Lương
Ngoài ra, chúng ta phải xây dựng các module hỗ trợ giải quyết các công việc thực tiễn như sau:
- Chuyển đổi về một định dạng đối với hệ thống lưu trữ dữ liệu (font chữ) với các nguồn dữ liệu thuộc nhiều font chữ khác nhau
- Xây dựng thư viện phát hiện những từ “gần đúng” (có thể xác định thủ công) như: sai lỗi chính tả, từ viết tắt,… (bằng các kỹ thuật tìm kiếm gần đúng hoặc tìm kiếm theo ngữ nghĩa) Ví dụ: cùng một địa chỉ, tên hai chủ nhà ‘Nguyễn Quang Thìn’ và ‘Nguyễn Quan Thình’ sẽ được xem là đồng nhất do có thể đây là lỗi về chính tả; hoặc ‘Võ Thị Lắm’ sẽ đồng
nhất với ‘Vỏ Thị Lắm’; hoặc tên đường ‘Đường số 2’ sẽ đồng nhất với tên đường ‘Số 2’ hoặc
‘Đ.số 2’ Trong thí nghiệm, chúng tôi đã xây dựng các hàm so sánh chuỗi đơn giản như: loại
bỏ dấu của tất cả các kí tự trong chuỗi Ví dụ Nguyễn Quang Thình sẽ trở thành: Nguyên Quang Thinh Nếu việc so sánh không “khớp” giữa hai chuỗi, chúng ta tiến hành các biến đổi
Ở đây chúng ta so sánh số lượng chữ: ‘Nguyên Quan Thinh’ và ‘Nguyên Quang Thin’ đều có
3 chữ Trong đó có 01 từ (‘Nguyên’) giống nhau và 02 từ khác nhau (‘Quan’ <> ‘Quang’ và
‘Thinh’ <> ‘Thin’) Tuy nhiên, sự sai khác có thể được phát hiện bằng cách phân nhóm
Hình 6: Kết quả chương trình nhập liệu và định vị không gian bằng Spatial SQL sau khi khảo sát dữ liệu số nhà và chuyên đề thu gom rác Quận 7 TP.HCM
Trang 83 KẾT LUẬN
Việc chọn các nhân tố thực nghiệm gây ảnh hưởng đến việc tạo lập dữ liệu chuyên đề là vấn đề cần thiết Chúng ta cần phải xây dựng mối quan hệ giữa các nguồn dữ liệu trong điều kiện dữ liệu còn rời rạc Tuy nhiên, để ứng dụng đưa vào thực tế, dữ liệu phản ánh thế giới thực là điều chính yếu Do đó, chúng ta phải tìm kiếm những nhân tố tuân theo chất lượng dữ liệu và các qui trình phục vụ thu thập dữ liệu chuyên đề cụ thể Ngoài ra, từ những kết quả nghiên cứu trên, một số kết luận được rút ra như sau:
- Cải tiến các tiến trình xây dựng một hệ thống GIS theo hướng phát triển các liên hệ với nhau, đặc biệt là việc xây dựng và cập nhật dữ liệu trên từng chuyên đề và từng thời điểm
- Đẩy mạnh việc đồng bộ dữ liệu là vấn đề cần thiết trong các hệ thống Thời gian đồng bộ nhanh chóng giữa các cấp phường (xã) ÅÆ quận (huyện) ÅÆ thành phố (tỉnh) cần thực hiện nhanh chóng để dữ liệu không bị lạc hậu
- Xây dựng qui trình nhập liệu chuyên đề dựa trên các bản đồ nền Việc xây dựng Qua đó, chúng ta sẽ có những phản hồi với cơ quan quản lý về những sự thay đổi trong thực tế mà
dữ liệu nền chưa cập nhật kịp thời Trong qui trình đó, chúng ta xây dựng khung chuẩn đào tạo GIS đối với các lực lượng tham gia xây dựng hệ thống GIS để giảm sự sai lệch giữa các dữ liệu
- Tạm thời ứng dụng các phương pháp định vị theo xác suất, tận dụng các phương pháp toán học như thiết kế thực nghiệm để giảm các chi phí thực địa trong việc xây dựng các hệ thống GIS, đặc biệt các hệ thống chuyên đề
- Xây dựng các hệ thống 3D (không phải 2.5D) để quản lý các ứng dụng Trên thực tế, chúng ta cần đến các hệ thống 3D thực sự để giải quyết những căn hộ chung cư với hàng nghìn căn hộ trên một thửa lớn
Hình 7: Các mô tả chi tiết về dữ liệu 3D theo chuẩn CityGML Quản lý các đối tượng 3D là hướng đến của các ứng dụng quản lý đô thị trong tương lai
(a) LOD1 building
(c) LOD3 building (d) LOD4 building
(b) LOD2 building
Trang 9Tài liệu tham khảo
[1] Khưu Minh Cảnh, Trần Quang Trường Hinh, TS.Trần Trọng Đức, Hồ Nguyễn Cúc Phương, bài báo: “Một số vấn đề về đồng bộ dữ liệu không gian”, Hội nghị KHCN lần thứ 12 Trường Đại học Bách Khoa Tp.HCM, năm 2011
[2] TS Hồ Đình Duẫn, TS Lê Trung Chơn và Đặng Quốc Trung, bài báo nghiên cứu khoa học “Cơ
sở toán học của GIS 3D và các ứng dụng”, năm 2003
[3] TS Nguyễn Ngọc Lâu, bài giảng môn học “Hệ thống định vị GPS”, năm 2010
[4] TS Đào Xuân Lộc, Cơ sở lý thuyết sai số, NXB đại học Quốc Gia, năm 2007
[5] TS Huỳnh Trung Lương – ThS Trương Tôn Hiền Đức, Phương pháp định lượng trong quản lý và vận hành, NXB Khoa học và Kỹ thuật, năm 2002
[6] Nguyễn Khắc Thanh, Quản lý các dự án hệ thống thông tin địa lý (Tài liệu lưu hành nội bộ Sở KHCN TPHCM), năm 2005
[7] Tài liệu lập trình gvSIG các phiên bản gvSIG 1.1 và gvSIG 1.9, Tài liệu lưu hành nội bộ, Trung tâm GISC, năm 2010
[8] Tổ chức Open Geospatial Consortium xây dựng, Chuẩn CityGML, phiên bản 1.1, năm 2011 [9] Dennis Allard, Dimitri D’Or, Reoland Froidevaux, Estimating and simulating spatial categorical data using an efficiency maximum entropy approach, tại Unité Biostatisque et Processus Spatiaux Institut National de la Recherche Agronomique Avignon, France (http://www.biosp.org) Thời điểm: 22/9/2009
[10] Weidong Li, Chuanrong Zhang, bài báo Linear interpolation and joint model fitting of experimental transiograms for Markov chain simulation of categerical spatial variables, Vol.24,
No.6, 6/2010, trang 821-839, tạp chí International Joural of Geographical Information Science [11] Dr Md Khalequazzaman, bài báo cáo về “Geocoding & Dynamic Segmentation”, Dept of Geology & Physics Lock Haven University