Một trong những ưu điểm của hệ thống CSDL nền địa lý là khai thác dữ liệu thông qua các lớp đối tượng được chồng xếp với nhau, đồng thời được cập nhật nhanh và dễ dàng hơn so với các sản
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỎ - ĐỊA CHẤT
LUẬN VĂN THẠC SĨ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS Nguyễn Quang Minh
HÀ NỘI – 2014
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu và kết quả nghiên cứu nêu trong luận văn là trung thực Kết quả xây dựng các lớp dữ liệu chưa từng được ai công bố trong bất kỳ công trình nào khác
Hà Nội, ngày tháng 10 năm 2014
Tác giả
Nguyễn Thị Thắm
Trang 4ii
MỤC LỤC
Lời cam đoan i
Mục lục ii
Danh mục các thuật ngữ viết tắt v
Danh mục các bảng vi
Danh mục các hình vẽ vii
MỞ ĐẦU 1
CHƯƠNG 1: TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ 4
1.1 KHÁI NIỆM DỮ LIỆU ĐỊA LÝ 4
1.1.1 Thế giới thực và mô hình không gian miêu tả thế giới thực 4
1.1.2 Khái niệm hệ thống thông tin địa lý 14
1.1.3 Cơ sở dữ liệu hạ tầng thông tin không gian 22
1.2 CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ 25
1.2.1 Khái niệm 25
1.2.2 Nội dung của cơ sở dữ liệu nền địa lý 26
1.2.3 Sự khác biệt giữa CSDL nền địa lý với bản đồ địa hình 28
1.2.4 Vai trò của cơ sở dữ liệu nền địa lý 30
1.3 HIỆN TRẠNG VỀ VIỆC XÂY DỰNG CSDL NỀN ĐỊA LÝ CỦA VIỆT NAM
31 1.4 MỘT SỐ ỨNG DỤNG CỦA CSDL NỀN ĐỊA LÝ 32
1.4.1 Ứng dụng CSDL nền địa lý cho phát triển Kinh tế - xã hội 33
1.4.2 Ứng dụng CSDL nền địa lý cho An ninh quốc phòng 33
1.4.3 Ứng dụng CSDL nền địa lý cho nghiên cứu Môi trường, địa chất 34
CHƯƠNG 2: THÀNH LẬP, PHÂN TÍCH CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ TỶ LỆ 1/10.000
35 2.1 KHÁI NIỆM CHUẨN THÔNG TIN VÀ NỘI DUNG CHUẨN THÔNG TIN ĐIA LÝ
35
Trang 52.1.1 Khái niệm về chuẩn thông tin địa lý 35
2.1.2 Sự cần thiết xây dựng CSDL nền địa lý theo chuẩn thông tin địa lý cơ sở quốc gia
35 2.1.3 Nội dung chuẩn thông tin địa lý áp dụng trong CSDL nền địa lý 36
2.2 CÁC CHỈ TIÊU KỸ THUẬT THÀNH LẬP CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ
43 2.2.1 Độ chính xác xác định đối tượng địa lý nền 43
2.2.2 Cơ sở toán học 45
2.2.3 Mô hình cấu trúc dữ liệu 46
2.3 CÁC PHƯƠNG PHÁP THÀNH LẬP CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ 48
2.3.1 Thành lập CSDL nền địa lý từ ảnh hàng không 48
2.3.2 Thành lập CSDL nền địa lý từ bản đồ địa hình dạng số 50
2.3.3 Thành lập CSDL nền địa lý từ bản đồ địa chính cơ sở 53 CHƯƠNG 3: THÀNH LẬP CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ Ở TỶ LỆ 1/10.000 KHU VỰC TỈNH YÊN BÁI
56 3.1 KHÁI QUÁT MỤC ĐÍCH, NHIỆM VỤ KHU VỰC CẦN NGHIÊN CỨU 56
3.1.1 Mục đích 56
3.1.2 Nhiệm vụ 56
3.2 KHÁI QUÁT VỊ TRÍ ĐỊA LÝ, ĐẶC ĐIỂM ĐỊA LÝ TỰ NHIÊN KHU VỰC NGHIÊN CỨU
56 3.2.1 Vị trí địa lý, phạm vi khu vực nghiên cứu 56
3.2.2 Đặc điểm địa lý tự nhiên 57
3.3 HIỆN TRẠNG THÔNG TIN TƯ LIỆU 58
3.3.1 Hiện trạng tư liệu ảnh 58
3.3.2 Hiện trạng tư liệu bản đồ 59
3.3.3 Các loại tài liệu khác 59
Trang 63.4 ĐÁNH GIÁ HIỆN TRẠNG THÔNG TIN TƯ LIỆU . 59
3.4.1 Tư liệu ảnh hàng không 59
3.4.2 Tư liệu bản đồ 60
3.4.3 Các loại tài liệu khác 61
3.4.4 Phương án thành lập CSDL nền địa lý tỷ lệ 1/10.000 khu vực tỉnh Yên Bái
61 3.5 GIẢI PHÁP CÔNG NGHỆ THÀNH LẬP CSDL NỀN ĐỊA LÝ TỶ LỆ 1/10.000 TỪ BĐĐH DẠNG SỐ TỶ LỆ 1/10.000 KHU VỰC TỈNH YÊN BÁI
62 3.5.1 Danh mục các đối tượng địa lý và mô hình cấu trúc dữ liệu nền địa lý tỷ lệ 1/10.000
62 3.5.2 Quy trình công nghệ 64
3.5.3 Đặc điểm chung của nguồn dữ liệu đầu vào 65
3.5.4 Quá trình xây dựng CSDL nền địa lý tỷ lệ 1/10.000 66
3.6 KẾT QUẢ THỬ NGHIỆM XÂY DỰNG CSDL NỀN ĐỊA LÝ TỶ LỆ 1/10.000 KHU VỰC TỈNH YÊN BÁI
86 3.6.1 Mô hình thử nghiệm về dữ liệu chủ đề Cơ sở đo đạc 86
3.6.2 Mô hình thử nghiệm về dữ liệu chủ đề Biên giới địa giới . 87
3.6.3 Mô hình thử nghiệm về dữ liệu chủ đề Thủy hệ 88
3.6.4 Mô hình thử nghiệm về chủ đề dữ liệu Giao thông 88
3.6.5 Mô hình thử nghiệm về chủ đề dữ liệu Địa hình 89
3.6.6 Mô hình thử nghiệm về chủ đề dữ liệu Dân cư cơ sở hạ tầng 89
3.6.7 Mô hình thử nghiệm về chủ đề dữ liệu Phủ bề mặt 90
KẾT LUẬN VÀ KIẾN NGHỊ 92
TÀI LIỆU THAM KHẢO 95
PHỤ LỤC 96
Trang 7DANH MỤC THUẬT NGỮ VIẾT TẮT
6 Unified Modeling Language - Ngôn ngữ
7 eXtensible Markup Language - Ngôn
Trang 8DANH MỤC CÁC BẢNG
Bảng 1.1 Sự giống nhau về nội dung giữa CSDL nền địa lý và BĐĐH 28 Bảng 3.1 Bảng ánh xạ phân nhóm nội dung đối tượng địa lý 68
Trang 9DANH MỤC CÁC HÌNH VẼ
Hình 1.1.Cấu trúc dữ liệu raster 6
Hình 1.2 Minh họa cấu trúc raster 7
Hình 1.3 Minh họa cấu trúc vecter 9
Hình 1.4 Sự chuyển đổi dữ liệu giữa raster và vecter 11
Hình 1.5 Biến đổi vecter sang raster 11
Hình 1.6 Mối quan hệ giữa thông tin không gian và thông tin thuộc tính 13
Hình 1.7 Tổng quan về HTTTĐL 16
Hình 1.8 Các thành phần cơ bản của GIS 16
Hình 1.9 Các thành phần của NSDI 24
Hình 1.10 (a) Liên kết giữa từng cặp hệ thống thông tin địa lý; (b) Liên kết giữa các hệ thống thông tin địa lý thông qua SDI 24
Hình 1.11 Đối tượng địa lý thể hiện trên bản đồ địa hình 29
Hình 1.12 Đối tượng địa lý thể hiện trong cơ sở dữ liệu 30
Hình 2.1 Mô hình đối tượng địa lý tổng quát 38
Hình 2.2 Mô hình khái niệm không gian hình học 39
Hình 2.3 Mô hình khái niệm không gian Topo 39
Hình 2.4 Mô hình tổng quát cấu trúc siêu dữ liệu địa lý 41
Hình 2.5 Các thành phần thông tin của đối tượng địa lý 47
Hình 2.6 Sơ đồ quy trình công nghệ thành lập CSDL nền địa lý từ ảnh hàng không 49
Hình 2.7 Sơ đồ quy trình công nghệ thành lập CSDL nền địa lý từ bản đồ địa hình số 51
Hình 2.8 Sơ đồ quy trình công nghệ thành lập CSDL nền địa lý từ ảnh bản đồ địa chính cơ sở 54
Hình 3.1 Cấu trúc dữ liệu nền địa lý 1/10.000 62
Trang 10Hình 3.2 Sơ đồ quy trình công nghệ thành lập CSDL nền địa lý 1/10.000 áp
dụng cho khu vực tỉnh Yên Bái 64
Hình 3.3 Bản đồ địa hình tỷ lệ 1/10.000 khu vực tỉnh Yên Bái 65
Hình 3.4 Tổ chức dữ liệu theo chủ đề “Giao thông” 69
Hình 3.5 Tổ chức dữ liệu theo chủ đề “Thủy hệ” 70
Hình 3.6 Gán thủ công thông tin thuộc tính cho đối tượng địa lý 71
Hình 3.7 Gán tự động thông tin thuộc tính cho đối tượng địa lý 73
Hình 3.8 Chỉ thị chuẩn hóa cho Giao thông 75
Hình 3.9 Chỉ thị chuẩn hóa cho Thủy hệ 76
Hình 3.10 Chỉ thị chuẩn hóa cho Dân cư cơ sở hạ tầng 77
Hình 3.11 Chỉ thị chuẩn hóa cho Phủ bề mặt 78
Hình 3.12 Tìm lỗi topology bằng phần mềm MRF Clean 80
Hình 3.13 Tìm sửa lỗi topology bằng phần mềm MRF Flag 80
Hình 3.14 Chuẩn hóa tương quan giữa cầu với thủy hệ và giao thông 82
Hình 3.15 Tạo lập Geodatabase và Feature Dataset bằng phần mềm ArcCatalog 83
Hình 3.16 Thiết kế cấu trúc dữ liệu của lớp “DoanTimDuongBo” bằng ArcCatalog 83
Hình 3.17 Thiết kế luật topology cho chủ đề Phủ bề mặt 84
Hình 3.18 Chuyển đổi dữ liệu từ Microstation sang ArcGIS 84
Hình 3.19 Thành lập siêu dữ liệu Metadata cho khu vực tỉnh Yên Bái 85
Hình 3.20 Cấu trúc chung của CSDL nền địa lý thử nghiệm thể hiện trên ArcCatalog 86
Hình 3.21 Mô hình dữ liệu chủ đề Cơ sở đo đạc 87
Hình 3.22 Mô hình dữ liệu chủ đề Biên giới địa giới 87
Hình 3.23 Mô hình dữ liệu chủ đề Thủy hệ 88
Hình 3.24 Mô hình dữ liệu chủ đề Giao thông 88
Trang 11Hình 3.25 Mô hình dữ liệu chủ đề Địa hình 89 Hình 3.26 Mô hình dữ liệu chủ đề Dân cư cơ sở hạ tầng 89 Hình 3.27 Mô hình dữ liệu chủ đề Phủ bề mặt 90
Trang 12MỞ ĐẦU
1 Tính cấp thiết của đề tài
Tại Việt Nam, từ trước những năm 2000 bản đồ địa hình, bản đồ chuyên
đề, v.v được coi là tài liệu tối ưu cho việc xây dựng, quy hoạch, khai thác công trình, tiện ích Các tài liệu này được thành lập và khai thác dựa trên những mục tiêu cụ thể và gần như riêng biệt Vào những năm 2000 trở lại đây khi sức mạnh của khoa học kỹ thuật đã phát triển một cách vô cùng mạnh mẽ, các phần mềm
về quản lý dữ liệu, xây dựng, tích hợp dữ liệu bản đồ đã vô cùng đa dạng và hiệu quả Cùng với sự phát triển đó, nhu cầu sử dụng không còn chỉ gói gọn trong từng lĩnh vực riêng nhỏ, nó đòi hỏi một cơ sở dữ liệu về đo đạc bản đồ tích hợp nhiều thông tin mà trong đó cung cấp từng dịch vụ cho người sử dụng
Cơ sở dữ liệu nền địa lý (CSDL nền địa lý) là một dạng tài liệu đặc biệt, thể hiện điều kiện về tự nhiên, dân cư, cơ sở hạ tầng, hệ thống giao thông đường
bộ, mạng lưới đường bộ, mạng lưới sông, suối, v.v tương đối chi tiết CSDL nền địa lý có 7 chủ đề (lớp dữ liệu) là 7 file độc lập, bao gồm: Cơ sở đo đạc; biên giới, địa giới; địa hình; thủy hệ; giao thông; dân cư cơ sở hạ tầng; phủ bề mặt Các ngành và lĩnh vực như giao thông, thủy lợi, nông nghiệp, môi trường, v.v có thể sử dụng CSDL nền địa lý làm cơ sở để xây dựng cơ sở dữ liệu phục
vụ cho mỗi chuyên ngành riêng Một trong những ưu điểm của hệ thống CSDL nền địa lý là khai thác dữ liệu thông qua các lớp đối tượng được chồng xếp với nhau, đồng thời được cập nhật nhanh và dễ dàng hơn so với các sản phẩm bản
đồ trước đây
Điểm khác biệt chính giữa CSDL nền địa lý với các tài liệu trước đây là toàn bộ dữ liệu được xây dựng theo bộ chuẩn thông tin địa lý thống nhất do Bộ Tài nguyên và Môi trường ban hành Điều này đảm bảo tính nhất quán về nội dung và chất lượng dữ liệu nền tạo điều kiện thuận lợi cho các địa phương sử dụng hiệu quả các cơ sở dữ liệu nền thông tin địa lý để phục vụ phát triển kinh
Trang 13tế - xã hội, cũng như nhu cầu của người dân, nhất là bản đồ quy hoạch sử dụng đất các cấp và hệ thống bản đồ địa hình cơ bản dạng số thuộc phạm vi hành chính của tỉnh
Xuất phát từ thực tế nêu trên, tôi đã tiến hành nghiên cứu đề tài “Thành
lập và phân tích cơ sở dữ liệu nền địa lý ở tỷ lệ 1/10.000 khu vực tỉnh Yên Bái” dưới sự hướng dẫn của thầy giáo PGS.TS Nguyễn Quang Minh, trường
Đại học Mỏ- Địa chất, Hà Nội
2 Mục đích nghiên cứu của đề tài
Mục đích của đề tài là dựa trên cơ sở nghiên cứu lý thuyết, phân tích và xây dựng CSDL nền địa lý từ đó áp dụng thực nghiệm để thành lập cơ sở dữ liệu nền địa lý ở tỷ lệ 1/10.000 khu vực tỉnh Yên Bái phục vụ công tác quản lý điều hành quy hoạch phát triển kinh tế xã hội và an ninh quốc phòng
3 Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu của đề tài là cơ sở dữ liệu nền địa lý
- Phạm vi nghiên cứu của đề tài bao gồm các vấn đề liên quan đến lý thuyết về CSDL nền địa lý, nghiên cứu mô hình cấu trúc và quy trình thành lập CSDL nền địa lý ở tỷ lệ 1/10.000 khu vực tỉnh Yên Bái dựa trên nguồn tư liệu hiện có trong khu vực nghiên cứu
4 Nội dung nghiên cứu
- Nghiên cứu cơ sở lý thuyết về CSDL nền địa lý
- Phân tích, nghiên cứu cơ sở khoa học để thành lập CSDL nền địa lý
- Dựa trên kết quả khảo sát và đánh giá tư liệu hiện có của khu vực nghiên cứu để đưa ra giải pháp công nghệ thành lập CSDL nền địa lý ở tỷ lệ 1/10.000
- Thử nghiệm xây dựng CSDL nền địa lý ở tỷ lệ 1/10.000 khu vực tỉnh Yên Bái
5 Phương pháp nghiên cứu
Luận văn sử dụng các phương pháp nghiên cứu sau đây:
Trang 14- Phương pháp thống kê: Thu thập, tổng hợp, xử lý và thống kê các thông tin của các tài liệu liên quan
- Phương pháp phân tích: Sử dụng các phương tiện và các công cụ tiện ích
để phân tích các tư liệu, đánh giá khách quan các yếu tố từ đó đưa ra kết luận chính xác làm cơ sở giải quyết các vấn đề đặt ra
- Phương pháp thực nghiệm: Tiến hành thực nghiệm để chứng minh cho các luận chứng khoa học đã đưa ra
6 Ý nghĩa khoa học và thực tiễn của đề tài
Về khoa học: Đề tài giúp học viên hiểu biết những kiến thức về xây dựng CSDL nền địa lý tỷ lệ 1/10.000 Từ những phân tích, đánh giá cơ sở dữ liệu nền địa lý để xây dựng CSDL nền địa lý tỷ lệ 1/10.000 khu vực tỉnh Yên Bái
Về thực tiễn: Hiện nay CSDL nền địa lý đã và đang mang lại những lợi ích vô cùng to lớn trên mọi lĩnh vực đời sống, việc thành lập CSDL nền địa lý tỷ
lệ 1/10.000 khu vực tỉnh Yên Bái là một điều tất yếu Khi quy trình công nghệ cũng như các quy định về việc thành lập CSDL nền địa lý đã được ban hành thì thành lập CSDL nền địa lý tỷ lệ 1/10.000 khu vực tỉnh Yên Bái là hoàn toàn khả thi
7 Cấu trúc của luận văn
Nội dung của luận văn gồm phần mở đầu, 03 chương, phần kết luận và kiến nghị, tài liệu tham khảo được hoàn thành trên 95 trang đánh máy khổ A4
với 2 bảng , 47 hình và phần phụ lục
Trong quá trình thực hiện đề tài, tôi xin chân thành cảm ơn thầy giáo PGS.TS Nguyễn Quang Minh đã tận tình hướng dẫn và giúp đỡ tôi hoàn thành luận văn này Qua đây tôi cũng xin chân thành cảm ơn các thầy cô giáo trong khoa Trắc địa, tập thể cán bộ phòng Sau đại học của trường Đại học Mỏ - Địa chất, các đồng nghiệp thuộc Cục Đo đạc và Bản đồ Việt Nam đã giúp đỡ tôi trong suốt quá trình học tập và hoàn thành luận văn
Trang 15CHƯƠNG 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ
1.1 KHÁI NIỆM DỮ LIỆU ĐỊA LÝ
1.1.1 Thế giới thực và mô hình không gian miêu tả thế giới thực
1.1.1.1 Bản đồ
Bản đồ là phương tiện chuyển tải chủ yếu những kiến thức thông tin địa
lý Bản đồ cho con người nhận biết một cách có hiệu quả những đối tượng không gian, sự liên hệ giữa chúng, cũng như phương hướng
Trong lịch sử, loài người đã biết sử dụng bản đồ từ lâu Người ta tạo ra bản đồ để mô tả những thực thể trên mặt đất, liên quan tới hình dạng, vị trí của thực thể đó Ngày nay, bản đồ được in trên giấy, bản đồ số - bản đồ được thể hiện thông qua màn hình máy tính Bản đồ sử dụng đường nét, màu sắc, ký hiệu, chữ và số thể hiện những thông tin địa lý Bản đồ được tạo ra để mô tả vị trí, hình dạng, những đặc tính có thể nhận thấy phong cảnh như: sông, suối, đường
xá, làng mạc, rừng cây, v.v Những thông tin này thường bao gồm những thông tin về độ cao được thể hiện bằng các điểm chi tiết, với chữ số ghi chú độ cao, các đường bình độ (đường cùng độ cao hay còn được gọi là đường đồng mức)
Ngoài những bản đồ có mục đích sử dụng phổ thông, còn có những bản
đồ được sử dụng cho mục đích quân sự, một số loại bản đồ khác cung cấp những thông tin theo chủ đề, chúng được đặt tên là bản đồ chuyên đề Những bản đồ chuyên đề như bản đồ liên quan đến những đặc tính tự nhiên, như bản đồ địa chất; liên quan tới hoạt động của con người, như bản đồ số người thất nghiệp Cũng có thể bản đồ là công cụ để quản lý, như bản đồ quy hoạch sử dụng đất chẳng hạn
Một bản đồ thường bao gồm tập hợp các điểm, đường, vùng, nó được xác định bởi cả thông tin về vị trí không gian được tham chiếu bởi hệ tọa độ và về những thông tin thuộc tính - phi hình học
Trang 16Bản đồ là sự trừu tượng hóa các dữ liệu địa lý Bản đồ chắt lọc những thông tin theo yêu cầu, mục đích sử dụng, trình bày trên giấy, trên màn hình máy tính (các bản đồ số) Bản đồ làm đơn giản hóa những vấn đề phức tạp, những cấu trúc ẩn bên trong của dữ liệu Bản đồ mô tả các nội dung của dữ liệu bằng các nhãn: biểu thị tên, loại, kiểu và những thông tin khác
Mục đích của bản đồ là tạo ra cấu trúc dữ liệu, cung cấp thông tin và thể hiện có thẩm mỹ Bản đồ cung cấp thông tin bằng cách, trước hết là nó mô hình hóa các dữ liệu được cung cấp
Khi ta đọc một bản đồ, chúng ta thấy các yếu tố về hình dạng, những ký hiệu mô tả vị trí địa lý, những thông tin thuộc tính liên quan tới ký hiệu địa lý và mối quan hệ không gian giữa các ký hiệu địa lý
Những yếu tố địa lý được mô tả trên bản đồ là những yếu tố nằm trên, hoặc nằm gần bề mặt trái đất Nó mô tả yếu tố tự nhiên của trái đất (núi, đồi, sông, suối, rừng cây…), và có thể là những công trình nhân tạo trên mặt đất (đường xá, cầu cống, ống dẫn, công trình nhà cửa…), còn có thể là sự phân chia đất đai (các nước, các khoảnh đất, lô đất, hành chính)
Cách thức đơn giản nhất để biểu thị các diện tích địa lý trên bản đồ là phân chia ra các mảng, như là một hình ảnh, mạng lưới, hay các bề mặt
1.1.1.2 Dữ liệu thông tin lưu trữ trong máy tính
a Dữ liệu không gian
Đây là dữ liệu bao gồm các thông tin về đặc tính hình học của của những đối tượng có trên bề mặt hoặc ở trong vỏ trái đất như hình dạng, kích thước, vị trí… Từ góc độ công nghệ thông tin địa lý, đó chính là những yếu tố không gian địa lý được phản ánh trên bản đồ bằng những kiểu cấu trúc dữ liệu nhất định Dữ liệu không gian có ba dạng cấu trúc cơ bản là điểm, đường, vùng Đối tượng điểm mốc trắc địa, điểm giếng khoan… là những dữ liệu dạng điểm Sông, đường giao thông, đường bờ thửa, đường địa giới… là những dữ liệu dạng
Trang 17Dữ liệu không gian có thể mô tả theo hai kiểu cấu trúc dạng raster hoặc vector
Cấu trúc dữ liệu raster
Trong cấu trúc dữ liệu raster, thực thể không gian được biểu diễn thông qua các ô (cell) hay ô ảnh (pixel) của một lưới các ô Có nhiều dạng ô lưới có thể được sử dụng như: lưới lục giác, lưới tam giác, lưới ô vuông trong đó lưới
ô vuông là thông dụng nhất Trong máy tính, lưới các ô này được lưu trữ dưới dạng ma trận trong đó mỗi ô là giao điểm của một hàng và một cột trong ma trận
Hình 1.1 Cấu trúc dữ liệu raster
Trong cấu trúc dữ liệu raster các yếu tố điểm, đường, vùng được xác định như sau:
- Yếu tố điểm: Điểm được xác định tương ứng với một pixel độc lập
- Yếu tố đường: Đường được coi là các pixel liên tiếp nhau có cùng giá trị
- Yếu tố vùng: Vùng được xác định bởi một tập hợp các pixel có cùng giá trị liên tục nhau theo các hướng
Trang 18Ta thấy biểu diễn hai chiều của dữ liệu địa lý theo cấu trúc Raster là không liên tục nhưng được định lượng hóa để có thể đánh giá được độ dài, diện tích Dễ thấy không gian càng được chia nhỏ thành nhiều pixel thì tính toán càng chính xác Biểu diễn raster được xây dựng trên cơ sở hình học Owcơlit Mỗi một pixel tương ứng với một diện tích vuông trên thực tế Độ lớn cạnh của
ô vuông này còn được gọi là độ phân giải của dữ liệu
Hình 1.2 Minh họa cấu trúc raster
Ưu điểm:
- Cấu trúc dữ liệu đơn giản, đồng nhất có thể thu thập tự động với tốc độ nhanh
- Lưu trữ, mô tả chi tiết và dày đặc thông tin
- Chương trình xử lý số liệu tương đối ngắn gọn, đơn giản
- Dễ dàng chồng xếp, thu nạp thông tin giữa các bản đồ, thông tin viễn thám
- Dễ dàng thực hiện bài toán mô phỏng
Nhược điểm:
- Dung lượng thông tin rất lớn
- Bản đồ có hình ảnh thô, đơn điệu
- Không thể xác định các đối tượng riêng lẻ, khó suy giải tính toán, độ chính xác thấp, khó khăn khi chồng xếp các dữ liệu bản đồ có kích thước pixel khác nhau
Trang 19- Khi kích thước pixel lớn sẽ làm giảm dung lượng thông tin, làm cho thông tin dễ bị sai lệch
- Khối lượng tính toán để biến đổi tọa độ là rất lớn
Cấu trúc dữ liệu vector
Mô hình dữ liệu kiểu vector là mô hình thể hiện các đối tượng địa lý giống như các bản đồ truyền thống Các dữ liệu đồ họa được thể hiện giống với hình dạng thực tế của nó, bằng các yếu tố hình học đơn giản là điểm, đường, vùng và các mối quan hệ không gian hay sự kết nối của các đối tượng không gian (topology) như khoảng cách, tính liên thông, tính kề nhau, v.v Cấu trúc dữ liệu vector thể hiện chính xác vị trí không gian, khoảng cách và kích thước của các đối tượng trong thế giới thực lên bản đồ số bằng giá trị liên tục của các cặp tọa độ và xác định chính xác mối quan hệ không gian của các đối tượng Bên cạnh giả thiết về sự chính xác thể hiện tọa độ thì cấu trúc vector sử dụng các công thức quan hệ chính xác nên có thể lưu trữ dữ liệu phức tạp mà vẫn hiệu quả
về mặt bộ nhớ
Cấu trúc vector coi vật thể tự nhiên là tập hợp các yếu tố không gian cơ
sở (điểm, đường và vùng) và tổ hợp giữa các yếu tố này Các yếu tố này được thành lập trên cơ sở các cặp tọa độ của các điểm trong một hệ tọa độ nhất định Yếu tố điểm trong cấu trúc dữ liệu vector được mô tả bởi cặp tọa độ (x,y) trong một hệ tọa độ nhất định Đi kèm theo giá trị (x, y) của điểm còn có chỉ số cụ thể
để mô tả đặc tính của điểm
Yếu tố đường: Được dùng để biểu diễn tất cả các thực thể có dạng tuyến được tạo nên từ hai hoặc hơn hai cặp tọa độ (X, Y) Trong cấu trúc dữ liệu vector đường được mô tả như là tập hợp các cung Với một đường thẳng ta chỉ cần lưu giữ tọa độ của hai điểm đầu và cuối Với một cung (arc) là tập hợp của n cặp tọa độ biểu thị một đường cong phức tạp và liên tục Do đó số lượng điểm lưu trữ sẽ rất lớn do mỗi cung là tập hợp của các đoạn thẳng nhỏ nối giữa các điểm kề nhau đã được chọn Vì vậy người ta có thể giảm đáng kể bộ nhớ lưu trữ nếu có thể biểu diễn các đường cong bằng phương trình toán học vì khi đó chỉ
Trang 20Nói chung, không có sự khác biệt giữa việc lưu trữ số liệu định vị của yếu
tố đường và số liệu định vị của yếu tố vùng vì cả hai đều lưu trữ dưới dạng tập hợp các điểm của một đường Nhưng có thể nhận biết rõ ràng nếu ta chỉ ra số liệu định vị kèm theo yếu tố được hiển thị (điểm, đường, vùng) Đường bao của một vùng khép kín (điểm đầu và điểm cuối trùng nhau) Ngược lại, một đường khép kín không phải trong trường hợp nào cũng phản ánh một vùng (ví dụ đường bình độ là một đường khép kín nhưng không là yếu tố vùng)
Trong thực tế, các yếu tố vùng nằm kề nhau Để giảm việc lãng phí bộ nhớ do lưu giữ các cạnh chung hai lần người ta tiến hành lưu trữ mỗi cạnh một lần Đồng thời cung cấp cho từng vùng những thông tin thuộc tính về cạnh của nó
Trường hợp các điểm chung thì cũng lưu trữ tọa độ mỗi điểm một lần và cung cấp cho đường những thông tin thuộc tính về các điểm thuộc đường Sự tiết kiệm bộ nhớ này chỉ thực sự có giá trị khi số lượng cạnh chung khá lớn
Hình 1.3 Minh họa cấu trúc vector
Cấu trúc dữ liệu Vector có những ưu, nhược điểm sau:
Trang 21- Có thể tìm kiếm, cập nhật, khái quát hoá dữ liệu đồ họa và thuộc tính
- Thông tin đồ họa đẹp, sản phẩm in đạt chất lượng cao
- Tốn ít bộ nhớ khi lưu trữ dữ liệu
Chuyển đổi dạng dữ liệu raster và vector
Raster và vector là hai cách mô tả thông tin không gian khác nhau nhưng
có thể chuyển đổi từ dạng này sang dạng kia và ngược lại Tuy nhiên, việc chuyển đổi từ dạng vector sang raster chỉ xảy ra trong số ít trường hợp vì quá trình này sẽ làm mất một số thông tin Người ta tận dụng những ưu điểm của cả hai dạng dữ liệu để thu thập, lưu trữ và xử lý thông tin đạt hiệu quả cao hơn Quá trình chuyển từ dạng raster sang vector gọi là quà trình số hoá (hay vector hoá) và phép chuyển đổi này được ứng dụng nhiều trong thực tế
Trang 2211
Hình 1.4 Sự chuyển đổi dữ liệu giữa raster và vector
- Chuyển từ dữ liệu vector sang dữ liệu raster là tiến trình chia đường, vùng thành các ô vuông (pixel) Để làm được việc này, lưới của các ô được đặt trên bản đồ vector cơ sở và thông tin ở mỗi ô được gán vào ô khi chuyển một điểm sang thành một ô, vị trí chính xác của nó mờ nhạt dần và trở lên kém chính xác Quá trình chuyển đổi đơn giản
Ví dụ bản đồ địa chất: Đặt lưới trên bản đồ tạo lập raster Sau đó mã hóa từng tế bào bởi giá trị biểu diễn loại đất đá mà nó chiếm đa số phần diện tích của
tế bào Cuối cùng mỗi tế bào có giá trị mã
Hình 1.5 Biến đổi vector sang raster
Trang 2312
Thông thường CSDL không gian của HTTTĐL thường được thành lập trong máy tính ở dạng dữ liệu vector và được quản lý theo từng lớp đối tượng, mỗi lớp chứa các hình ảnh bản đồ liên quan đến một thành phần nhất định hay các ứng dụng cụ thể Ví dụ lớp thông tin về giao thông, lớp thông tin về thuỷ hệ, lớp thông tin về thửa đất,v.v Dưới dạng vector, máy tính thể hiện các đối tượng điểm, đường, vùng giống như là một danh sách tọa độ thay cho các hình ảnh hoặc không gian Máy tính có thể thành lập bản đồ từ tập hợp các điểm tọa độ lưu trữ và mối tương quan giữa chúng Cấu trúc dữ liệu vector có 2 mô hình dữ liệu chính là Topology và Spaghetti
Topology là một mô hình quan hệ không gian (bản đồ) đã được chuẩn hoá,
nó không chỉ lưu giữ các thông tin địa lý, mô tả vị trí, kích thước, hình dạng của từng đối tượng mà còn xác định mối liên hệ không gian giữa các đối tượng như liên thông với nhau, kề nhau, nằm trong, bao phủ nhau Trong quá trình thành lập bản đồ, Topology giúp ta xây dựng mối liên hệ giữa các hình ảnh bản đồ Ngoài ra, Topology còn giúp ta xác định hướng của đối tượng Phần mềm của HTTTĐL dùng tập hợp tọa độ các điểm và quan hệ Topology của các đối tượng quản lý trong CSDL để thể hiện các đối tượng đó trên màn hình máy tính theo các số liệu đã quản lý trong hệ thống
Mô hình dữ liệu Vector Spaghetti đơn giản, dễ quản lý tuy nhiên không có topology Chủ yếu được sử dụng trong các hệ thống bản đồ đồ họa máy tính (CAC – computer assisted cartography)
Trang 2413
thao tác với dữ liệu dễ dàng, mềm dẻo trong xử lý nên được dùng khá phổ biến
Dữ liệu quan hệ bao gồm các bảng, mỗi bảng bao gồm các hàng, cột Mỗi hàng bao gồm nhiều loại thông tin về một đối tượng nào đó Mỗi loại thông tin khác nhau này gọi là một trường, mỗi trường được sắp xếp tương ứng với một cột Việc sắp xếp dữ liệu phi không gian thành bảng gồm hàng và cột trên rất thuận lợi cho quá trình tìm kiếm, cập nhật, sắp xếp dữ liệu phi không gian Thêm nữa,
dữ liệu phi không gian còn bao gồm các hình thức trình bày chuẩn các yếu tố đồ họa như màu sắc, lực nét, kiểu đường… điều này đặc biệt có lợi để biểu thị và thao tác với các dữ liệu đồ họa của CSDL không gian
Dữ liệu thuộc tính có thể được xây dựng trực tiếp từ các bảng dữ liệu, từ các tệp văn bản hoặc liên kết thu nhận từ các phần mềm khác nhau Một trong các chức năng đặc biệt của HTTTĐL là khả năng của nó trong việc liên kết và
xử lý đồng thời giữa dữ liệu bản đồ và dữ liệu thuộc tính Sự liên kết giữa hình ảnh bản đồ và các bảng ghi thuộc tính được thực hiện thông qua mã xác định ID (Identifier) gán cho cả hai loại dữ liệu, quan hệ giữa hai loại dữ liệu là quan hệ một – một
Hình 1.6 Mối quan hệ giữa thông tin không gian và thông tin thuộc tính
Trang 2514
1.1.2 Khái niệm hệ thống thông tin địa lý
1.1.2.1 Định nghĩa hệ thống thông tin địa lý
GIS là từ viết tắt của thuật ngữ: Geographic Information System là hệ thống thông tin địa lý được hình thành từ ba khái niệm “Địa lý, thông tin, hệ
thống”
Hệ thống thông tin địa lý (GIS) là một nhánh của công nghệ thông tin, được hình thành vào những năm 60 của thế kỷ trước và phát triển rất mạnh mẽ trong những năm gần đây
Ngày nay, GIS là công cụ trợ giúp quan trọng trong nhiều hoạt động kinh
tế - xã hội, quốc phòng của nhiều quốc gia trên thế giới GIS có khả năng cho phép các cơ quan chính phủ, các nhà quản lý, các doanh nghiệp, các cá nhân…đánh giá được hiện trạng của các quá trình, các thực thể tự nhiên, kinh tế
- xã hội thông qua các chức năng thu thập, quản lý, truy vấn, phân tích và tích hợp các thông tin trên bản đồ tạo ra tính nhất quán trên cơ sở tọa độ của các dữ liệu đầu vào Với những ưu điểm đó người ta đã đưa ra những khái niệm về hệ thống thông tin địa lý (HTTTĐL)
Có rất nhiều quan niệm khác nhau khi định nghĩa về HTTTĐL như sau:
- Theo định nghĩa của National Center for Information and Analysis,
1988, HTTTĐL là một hệ thống quản trị cơ sở dữ liệu bằng máy tính để thu thập, lưu trữ, phân tích và hiển thị không gian
- Theo ESRI, tập đoàn nghiên cứu và phát triển các phần mền GIS nổi tiếng, GIS là một tập hợp có tổ chức bao gồm hệ thống phần cứng, phần mềm máy tính, dữ liệu địa lý và con người được thiết kế nhằm mục đích nắm bắt, lưu trữ cập nhật, điều khiển, phân tích và hiển thị tất cả các dạng thông tin có liên quan đến vị trí địa lý
- Theo GS.Shunjin Murai, người đã có hơn 40 năm làm việc trong lĩnh vực viễn thám và GIS, GIS là một hệ thống thông tin được sử dụng để nhập, lưu
Trang 2615
trữ, truy vấn thao tác, phân tích và xuất ra các dữ liệu có tham chiếu địa lý hoặc
dữ liệu địa không gian; hỗ trợ ra quyết định trong việc quy hoạch và quản lý về
sử dụng đất và tài nguyên thiên nhiên, môi trường, giao thông, các tiện ích đô thị
và nhiều lĩnh vực quản lý khác
Về tổng quát, sự phát triển của công nghệ thông tin đã dẫn đến sự phát triển song song tự động hoá công tác thu thập, phân tích, trình bày dữ liệu trong nhiều lĩnh vực rộng lớn như trắc địa – bản đồ, địa chất, quy hoạch phát triển, môi trường… Do đó có nhiều công việc phải xử lý các thông tin liên quan phối hợp trong nhiều chuyên ngành khác nhau nên phải có hệ thống quản lý liên kết
dữ liệu từ nhiều nguồn vào khác nhau như bản đồ, ảnh hàng không, ảnh vệ tinh, các số liệu quan trắc, điều tra khảo sát… Hay nói cách khác là cần phải phát triển một hệ thống các công cụ để thu thập, tìm kiếm, biến đổi và hiển thị các dữ liệu không gian từ thế giới thực nhằm phục vụ những mục đích cụ thể Tập hợp các công cụ trên đã tạo lập ra hệ thống thông tin địa lý, đó là hệ thống thể hiện các đối tượng từ thế giới thực thông qua các dữ liệu cơ bản:
- Vị trí của đối tượng thông qua một hệ tọa độ
- Các thuộc tính của các đối tượng
- Quan hệ không gian giữa các đối tượng
Từ đó HTTTĐL đã được thống nhất quan điểm chung: “HTTTĐL là một
hệ thống kết hợp giữa con người và hệ thống máy tính cùng các thiết bị ngoại vi
để lưu trữ, xử lý, phân tích, hiển thị các thông tin địa lý để phục vụ một mục đích nghiên cứu nhất định”
Trang 2716
Hình 1.7 Tổng quan về HTTTĐL
1.1.2.2 Thành phần của hệ thống thông tin địa lý
Công nghệ GIS là một hệ thống gồm 5 hợp phần cơ bản với những chức năng rõ ràng Đó là: Thiết bị, phần mềm, cơ sở dữ liệu, chuyên viên, chính sách
và quản lý
Hình 1.8 Các thành phần cơ bản của GIS
Trang 2817
a Thiết bị
- Bộ xử lý trung tâm (CPU)
Bộ xử lý trung tâm hay còn gọi là CPU, là phần cứng quan trọng nhất của
vi tính CPU không những thực hành tính toán trên dữ liệu, mà còn điều khiển sắp đặt phần cứng khác Mặc dù bộ vi xử lý hiện đại rất nhỏ chỉ khoảng 5mm2
nhưng nó có khả năng thực hiện hàng triệu thông tin trong một giây
- Bộ nhớ trong (RAM)
Tất cả máy vi tính có một bộ nhớ trong mà chức năng giống như “không gian làm việc” cho chương trình và dữ liệu Bộ nhớ truy xuất ngẫu nhiên (RAM)
có khả năng giữ một giới hạn số lượng dữ liệu ở một số hạng thời gian
- Bộ sắp xếp và lưu trữ ngoài (Diskette, harddisk, CD-ROM)
Băng từ có tính được giữ không những trong cuộn băng lớn (giống trong cuộn băng máy hát đĩa) mà còn trong cuộn băng nhỏ Thuận lợi của dây băng có
từ tính mà nó có thể lưu trữ một số lượng lớn dữ liệu Sự gia tăng khả năng lưu trữ thể hiện bằng các đĩa có từ tính Các đĩa cứng với khả năng lưu trữ rất lớn và còn ở các đĩa mềm với khả năng giới hạn (2,25 inch, với 360 Kb hoặc 1,2 Mb hoặc 3,5 inch với 720 Kb hoặc 1,4Mb)
- Các bộ phận dùng để nhập dữ liệu (Input devices)
Sử dụng để đưa dữ liệu vào cơ sở dữ liệu Chúng có thể là: Các ổ đọc dữ liệu, bàn số hóa dùng để tạo dữ liệu vector, máy quét ảnh dùng để tạo dữ liệu
raster, các thiết bị thu nhận thông tin điện tử, …
Trang 2918
hoặc tổ hợp các phần mềm máy tính Phần mềm được sử dụng trong kỹ thuật
GIS phải bao gồm tính năng cơ bản sau:
Công cụ nhập và kiểm tra dữ liệu (Data input): Bao gồm tất cả các khía cạnh về biến đổi dữ liệu đã ở dạng bản đồ, trong lĩnh vực quan sát vào một dạng
số tương thích Đây là giai đoạn rất quan trọng cho việc xây dựng CSDL địa lý
- Lưu trữ và quản lý dữ liệu (Geographic database): Lưu trữ và quản lý CSDL đề cập đến phương pháp kết nối thông tin vị trí và thông tin thuộc tính
của các đối tượng địa lý
- Biến đổi dữ liệu (data transfomation): Biến đổi dữ liệu gồm 02 lớp điều hành nhằm mục đích khắc phục lỗi từ dữ liệu và cập nhật chúng Biến đổi dữ liệu có thể thực hiện trên dữ liệu không gian và thông tin thuộc tính một cách
tách biệt hoặc tổng hợp cả hai
- Tương tác với người dùng (Query input): Giao tiếp với người dùng là yếu tố rất quan trọng của bất kỳ hệ thống thông tin nào Các giao diện người dùng là một hệ hống thông tin được thiết kế phụ thuộc vào mục đích của ứng
dụng đó
Các phần mềm tiêu chuẩn và sử dụng phổ biến hiện nay trong khu vực châu Á là ARC/INFO, MAPINFO, IL WIS, WINGIS, SPANS, IDRISIW, Hiện nay có rất nhiều phần mềm máy tính chuyên biệt cho GIS, bao gồm các
phần mềm như sau:
- Phần mềm dùng cho lưu trữ, xử lý số liệu thông tin địa lý: ACR/INFO, SPAN, ERDAS - Imagine, IL WIS, MGE/MICROSTATION, IDRISIW, IDRISI,
WINGIS,
- Phần mềm dùng cho lưu trữ, xử lý và quản lý các thông tin địa lý:
ER-MAPPER, ATLASGIS, ARCVIEW, MAPINFO,
c Cơ sở dữ liệu
- Dữ liệu bản đồ
Trang 3019
Là những mô tả hình ảnh bản đồ được số hoá theo một khuôn dạng nhất
định mà máy tính hiểu được Hệ thống thông tin địa lý dùng CSDL này để xuất
ra các bản đồ trên màn hình hoặc các thiết bị ngoại vi khác
- Dữ liệu vector: Được trình bày dưới dạng điểm, đường và diện tích, mỗi
dạng có liên quan đến một số liệu thuộc tính được lưu trữ trong CSDL
- Dữ liệu raster: Được trình bày dưới dạng lưới ô vuông hay ô chữ nhật đều nhau, giá trị được ấn định cho mỗi ô sẽ chỉ định giá trị của thuộc tính (số liệu của ảnh hàng không, ảnh vệ tinh, số liệu bản đồ được quét ảnh là các loại số
liệu dạng Raster)
- Dữ liệu thuộc tính
Được trình bày dưới dạng các ký tự hoặc số hoặc ký hiệu để mô tả các thuộc tính của các thông tin thuộc về đối tượng địa lý Trong các dạng số liệu trên, số liệu vector là dạng thường sử dụng nhiều nhất Tuy nhiên số liệu raster rất hữu ích để mô tả các dãy số liệu có tính liên tục như nhiệt độ, độ cao, và thực hiện các phân tích không gian số liệu Còn số liệu thuộc tính được dùng để
mô tả CSDL Có nhiều cách để nhập số liệu nhưng cách thông thường nhất hiện nay là số hoá (Digitizing) bằng bàn số hoá (Digitizer), hoặc thông qua việc sử
dụng máy quét ảnh (Scanner)
Trang 3120
thống GIS cần được điều hành bởi một bộ phận quản lý, bộ phận này phải được
bổ nhiệm để tổ chức điều hành các hoạt động của hệ thống GIS một cách có hiệu quả nhằm phục vụ người sử dụng thông tin
Để hoạt động thành công hệ thống GIS phải được đặt trong một khung tổ chức phù hợp và phải có hướng dẫn cần thiết để quản lý, thu thập, lưu trữ và phân tích số liệu, đồng thời có khả năng phát triển được hệ GIS theo nhu cầu
Hệ thống GIS cần được điều hành bởi một bộ phận quản lý, bộ phận này cần được bổ nhiệm để tổ chức hoạt động hệ thống thông tin địa lý GIS một cách có hiệu quả nhằm phục vụ người sử dụng các thông tin này Trong quá trình hoạt động, mục đích trên chỉ có thể đạt được và tính hiệu quả trong kỹ thuật GIS chỉ được minh chứng khi công cụ này có thể hỗ trợ những người sử dụng thông tin ứng dụng vào công việc chuyên môn của họ Ngoài ra việc phối hợp giữa các cơ quan chức năng có liên quan cũng phải được đặt ra nhằm gia tăng hiệu quả sử
dụng của GIS cũng như các nguồn dữ liệu hiện có
Như vậy, trong 5 hợp phần của GIS, hợp phần chính sách và quản lý đóng vai trò rất quan trọng để đảm bảo khả năng hoạt động của hệ thống, đây là yếu
tố quyết định sự thành công của việc phát triển công nghệ GIS
Trong phối hợp và vận hành các hợp phần của hệ thống GIS nhằm đưa vào hoạt động có hiệu quả kỹ thuật GIS, 2 yếu tố huấn luyện và chính sách - quản lý là cơ sở của thành công Việc huấn luyện các phương pháp sử dụng hệ thống GIS sẽ cho phép kết hợp các phần: thiết bị, phần mềm, chuyên viên và số liệu với nhau để đưa vào vận hành Tuy nhiên, yếu tố chính sách và quản lý sẽ
có tác động đến toàn bộ các hợp phần nói trên, đồng thời quyết định đến sự
thành công của hoạt động GIS
1.1.2.3 Chức năng của GIS
Một hệ thống thông tin địa lý có các chức năng cơ bản như: Nhập dữ liệu, lưu trữ dữ liệu, xử lý dữ liệu, hiển thị dữ liệu theo cơ sở địa lý và đưa
ra những quyết định Có thể khái quát các chức năng đó như sau:
Trang 3221
Nhập và bổ sung dữ liệu: Một trong những chức năng quan trọng của HTTTĐL là nhập và bổ sung dữ liệu mà công việc đó không tiến hành riêng rẽ Bất kỳ một hệ thống nào cũng phải cho phép nhập và bổ sung dữ liệu, nếu không có chức năng đó thì không xem là một HTTTĐL vì chức năng đó là một yêu cầu bắt buộc phải có
Chuyển đổi dữ liệu: Chuyển đổi dữ liệu là một chức năng rất gần với việc nhập và bổ sung dữ liệu Nhiều phần mềm thương mại cố gắng giữ độc quyền bằng cách hạn chế đưa ra các khuôn dạng dữ liệu theo loại phổ cập Tuy nhiên, người sử dụng phải lựa chọn để hạn chế việc phải số hóa thêm những tài liệu hiện đang có ở dạng số Trong thực tế, cùng một tư liệu nhưng có thể tồn tại ở nhiều khuôn dạng khác nhau Vì vậy, đối với tư liệu quốc gia, cần có các chuẩn
dữ liệu để có thể sử dụng các dữ liệu khác nhau một cách dễ dàng
Lưu trữ tư liệu: Một chức năng quan trọng của HTTTĐL là lưu trữ và tổ chức cơ sở dữ liệu với một dung lượng lớn của dữ liệu không gian có tính: đa dạng về thuộc tính, về khuôn dạng, về đơn vị đo, về tỷ lệ bản đồ Hai yêu cầu cơ bản trong việc lưu trữ dữ liệu là:
Thứ nhất là phải tổ chức nguồn dữ liệu sao cho đảm bảo độ chính xác và không mất thông tin
Thứ hai là các tài liệu cho cùng một khu vực song các dữ liệu lại khác nhau về tỷ lệ, về đơn vị đo thì phải được định vị chính xác và chuyển đổi một cách hệ thống để có thể xử lý hiệu quả
Xử lý dữ liệu: Do nhiều HTTTĐL hoạt động đòi hỏi dữ liệu không gian phải được lựa chọn với một chỉ tiêu nhất định được phân loại theo một số phương thức riêng, tổng hợp thành những đặc điểm riêng của hệ thống Do đó HTTTĐL phải đảm nhiệm được chức năng xử lý thông tin không gian Khả năng xử lý cho phép phân tích, phân loại và tạo lập các đặc điểm bản đồ thông qua các dữ liệu thuộc tính và thuộc tính địa lý được nhập vào hệ thống Các thuộc
Trang 33lý cần được hiển thị dưới dạng như: Chữ và số, dạng bảng biểu hoặc dạng bản
đồ Các tính toán chung và kết quả phân tích được lưu giữ ở dạng chữ và số để
dễ dàng in ra hoặc trao đổi giữa các phần mềm khác nhau
Phân tích không gian: Trước đây chỉ với 5 chức năng mô tả ở trên là được tập trung, phát triển bởi những người xây dựng HTTTĐL Chức năng thứ sáu là phân tích không gian được phát triển một cách nhanh chóng dựa vào sự tiến bộ của công nghệ và nó trở nên thực sự hữu ích cho người ứng dụng Những khái niệm chỉ có trên lý thuyết về HTTTĐL trước đây đã trở thành thực tiễn trên cơ
sở ứng dụng trực tiếp chức năng phân tích không gian
1.1.3 Cơ sở dữ liệu hạ tầng thông tin không gian
Tại Hội nghị Môi trường và Phát triển ở Rio De Janerio năm 1992 và tại các hội nghị quốc tế về Môi trường tiếp theo đã xem xét, chỉ rõ việc thiếu các thông tin địa lý cần thiết là một trong những nguyên nhân dẫn đến không ít chương trình, dự án phát triển kinh tế - xã hội của nhà nước cũng như doanh nghiệp không tạo ra hiệu quả tài chính mà còn gây tác hại nghiêm trọng cho môi trường sinh thái, cản trở quá trình xây dựng nền kinh tế bền vững tại các quốc gia Các nghị quyết của những hội nghị trên hướng dẫn các quốc gia thành viên tăng cường quản lý xây dựng và khai thác thông tin địa lý nhằm nâng cao hiệu quả sử dụng trên cơ sở một hạ tầng chung (tên tiếng Anh là Spatial Data Infrastructure, viết tắt là SDI) gồm nhiều yếu tố, không chỉ có dữ liệu và thiết bị
xử lý dữ liệu, mà còn chính sách và pháp luật để bảo đảm hành lang pháp lý, cơ chế tổ chức thực hiện chuẩn hóa dữ liệu, mở rộng đào tạo nguồn nhân lực và nhận thức cộng đồng v.v
Cho tới nay các định nghĩa về cơ sở hạ tầng dữ liệu không gian (SDI) thường để dưới dạng mô tả các thành phần:
Trang 3423
Hiệp hội cơ sở hạ tầng dữ liệu không gian toàn cầu (GSDI) đã định nghĩa SDI bao gồm các thành phần cần thiết như: chính sách, tổ chức, dữ liệu, công nghệ, chuẩn, cơ chế phân phối thông tin, nguồn nhân lực và tài chính
Tài liệu hướng dẫn (Cookbook) về NSDI của Nebert đã đưa ra thuật ngữ SDI để nói lên tập hợp các cơ sở có liên quan tới công nghệ, chính sách, tổ chức
bộ máy nhằm tạo thuận lợi trong việc truy nhập dữ liệu không gian truy cập, chuẩn, dữ liệu và con người để người sử dụng có thể tìm kiếm, truy cập và sử dụng dữ liệu không gian
Tài liệu hướng dẫn về NSDI của Cơ quan dữ liệu không gian New Zealand (New Zealand Geospatial Office, 2011) định nghĩa: SDI là mạng lưới bao gồm các chính sách, hệ thống mạng truy cập, chuẩn, dữ liệu và con người để người
sử dụng có thể tìm kiếm, truy cập và sử dụng dữ liệu không gian
Theo đó quan điểm chung nhất của giới khoa học đã cho rằng: SDI là tập hợp các phương pháp, kiến thức quy trình và kỹ thuật dùng để chế biến thông tin
dữ liệu không gian, được đặt trong một hệ thống nhất với những mối quan hệ nền tảng về chính sách - pháp luật, tổ chức bộ máy nhằm tạo hiệu quả và thuận lợi trong việc khai thác thông tin cho toàn xã hội
Thuật ngữ “Cơ sở hạ tầng” được sử dụng để nhấn mạnh khái niệm của môi trường hỗ trợ tin cậy, tương tự như một hệ thống giao thông hoặc mạng viễn thông Ý tưởng của SDI là cung cấp dữ liệu không gian như là (hạ tầng) điện, nước - cắm vào hay mở vòi là có thể sử dụng (có trả phí), nó tương đồng với ý tưởng điện toán đám mây rất hiện đại hiện nay đó là không cần biết các Server đang ở đâu chỉ biết môi trường được tạo ra để sử dụng theo nhu cầu
SDI không phải là một Trung tâm dữ liệu hay một Cơ sở dữ liệu không gian Sự khác biệt giữa thiết lập SDI và xây dựng các CSDL hay hệ thống thông tin phổ biến đó là cách tiếp cận SDI mang tính mở, tính chia sẻ với ý nghĩa hạ tầng Còn các CSDL hay hệ thống thông tin (kể cả mở) thường có tính đóng hơn
và phục vụ những mục đích xác định
Trang 3524
SDI tạo ra sự truy nhập dễ dàng các thông tin có liên quan tới dữ liệu không gian, thông qua sử dụng các chuẩn, giao thức và những đặc tả kỹ thuật SDI tạo sự thuận tiện để chuyển các dữ liệu thông tin không gian tới cộng đồng Như vậy, SDI sẽ là mục tiêu cụ thể mà các nước cần hướng tới
Cơ sở hạ tầng dữ liệu không gian quốc gia (NSDI) là SDI được xem xét ở cấp độ quốc gia Đặc điểm nổi bật của NSDI là khả năng tích hợp và công bố các thông tin không gian từ các nguồn dữ liệu khác nhau
Hình 1.9 Các thành phần của NSDI
Để triển khai một NSDI, yếu tố quan trọng cần phải có sự thỏa thuận của những
tổ chức cung cấp và khai thác dữ liệu không gian, sự cộng tác và quản lý ở các cấp khác nhau và của cộng đồng Hiệu quả của nó mang lại chính là sự tiết kiệm trong việc thu thập dữ liệu, nâng cao hiệu quả sử dụng dữ liệu và đưa ra các quyết định toàn diện và tốt hơn
Hình 1.10 (a) Liên kết giữa từng cặp hệ thống thông tin địa lý, (b) Liên kết giữa
các hệ thống thông tin địa lý thông qua SDI
Trang 3625
Trước khi có NSDI, các hệ thống thông tin địa lý được thành lập riêng rẽ
và có thể có liên kết đôi một như trên Hình 1.10(a) Các liên kết này đôi khi không tồn tại, hoặc nếu có thì cũng khó thiết lập Ngoài ra, việc một người sử dụng có thể sử dụng nhiều thông tin từ các hệ thống khác nhau không hề dễ dàng Một trong những chức năng của SDI là kết nối các thông tin khác nhau làm nền tảng cho các ứng dụng thông tin địa lý Người sử dụng chỉ cần truy cập đến SDI là có thể có dữ liệu thông tin không gian theo ý muốn của mình như trên Hình 1.10(b) Tuy nhiên, ở đây để tất cả các hệ thống thông tin địa lý riêng biệt với cấu trúc dữ liệu khác nhau, hệ thống phần mềm khác nhau có thể kết nối vào SDI, cần phải có một “đầu nối” “Đầu nối” đó chính là chuẩn dữ liệu thông tin địa lý được xây dựng làm nền tảng cho các hệ thống này
Trên thế giới hiện nay hầu hết các nước tiên tiến đã xây dựng nền tảng cho các NSDI hoặc SDI như Mỹ, Nhật, Châu Âu, Singapore, v.v Trong các hệ thống NSDI này, chuẩn dữ liệu thông tin địa lý là một hợp phần không thể thiếu của
các NSDI do vai trò quan trọng của nó như đã được trình bày ở trên
1.2 CƠ SỞ DỮ LIỆU NỀN ĐỊA LÝ
1.2.1 Khái niệm
Cơ sở dữ liệu địa lý là một sản phẩm được xây dựng từ dữ liệu của tập hợp các đối tượng địa lý dựa trên các tiêu chuẩn kỹ thuật nhất định (ví dụ: OGC, W3C, ISO TC211, v.v.), có khả năng mã hoá, cập nhật và trao đổi qua các dịch
vụ truyền tin hiện đại Định dạng mở, không phụ thuộc vào phần mềm xây dựng
dữ liệu
CSDL nền địa lý là CSDL địa lý để mô tả thế giới thực ở mức cơ sở, có
độ chi tiết và độ chính xác đảm bảo để làm “nền” cho các mục đích xây dựng các hệ thống thông tin địa lý chuyên đề khác nhau Mỗi khu vực địa lý cần được
mô tả bởi loại dữ liệu “nền” phù hợp sao cho mức độ khái lược và thu nhỏ mô hình thực địa là ít nhất, cho phép đủ phục vụ đa mục đích Theo đó, tuỳ thuộc
Trang 3726
vào mô hình quản lý, khai thác ứng dụng, cập nhật sản phẩm dữ liệu địa lý để định hướng cho công tác đo đạc xây dựng CSDL nền địa lý trên phạm vi cả nước hoặc theo khu vực địa lý phục vụ đa mục đích (Ví dụ CSDL nền địa lý ở tỷ
lệ 1/10.000 bao trùm toàn bộ lãnh thổ; CSDL nền địa lý ở tỷ lệ 1/2000, 1/5000
sẽ có mức độ chi tiết và độ chính xác cao hơn, thường dành cho các khu vực đô thị, thành phố v.v.)
Tài liệu mô tả sản phẩm dữ liệu nền địa lý được xây dựng trên cơ sở các văn bản hướng dẫn áp dụng Quy chuẩn thông tin địa lý cơ sở Quốc gia cho từng loại CSDL nền địa lý Cấu trúc dữ liệu địa lý được quy định chặt chẽ trong danh mục đối tượng và lược đồ ứng dụng của mỗi loại dữ liệu địa lý ở mức cơ sở (nền), với mật độ thông tin tương đương với các loại bản đồ địa hình truyền thống cùng loại tỷ lệ Mỗi bộ dữ liệu địa lý đều kèm theo dữ liệu mô tả các thông tin cơ bản về chính nó (METADATA), cho phép người sử dụng có thể hình dung được về độ tin cậy về một sản phẩm dữ liệu nền địa lý, cách tiếp cận
và cấu trúc nội dung: là những đặc tính cơ bản về một bộ sản phẩm dữ liệu (bao nhiêu lớp đối tượng địa lý, thuộc tính của từng loại đối tượng địa lý và quan hệ
giữa chúng)
1.2.2 Nội dung của cơ sở dữ liệu nền địa lý
Cơ sở dữ liệu nền địa lý là một dạng tài liệu đặc biệt, thể hiện điều kiện về
tự nhiên, dân cư, cơ sở hạ tầng, hệ thống giao thông đường bộ, mạng lưới đường
bộ, mạng lưới sông, suối… tương đối chi tiết CSDL nền địa lý có 7 chủ đề (lớp
dữ liệu) là 7 file độc lập, bao gồm: Cơ sở đo đạc; biên giới địa giới; địa hình;
thủy hệ; giao thông; dân cư cơ sở hạ tầng và phủ bề mặt
1 Lớp cơ sở đo đạc: cung cấp các thông tin về các điểm gốc quốc gia, điểm cơ sở quốc gia, điểm cơ sở chuyên dụng
2 Biên giới địa giới: gồm các thông tin về ranh giới hành chính, địa danh hành chính và đơn vị hành chính, mốc biên giới, địa giới Lớp thông tin này
Trang 384 Lớp thuỷ hệ: gồm các thông tin về mạng lưới thủy hệ gồm sông suối, kênh rạch, ao hồ trên bề mặt đất và các đối tượng liện quan như đê, đập, trạm bơm, nguồn nước, cống thủy lợi, v.v Lớp thông tin này được xây dựng từ các thông tin trên bản đồ và được chỉnh lý, cập nhật lại theo các thông tin mới nhất trên lớp thông tin ảnh trực giao, đo đạc ngoài thực địa
5 Lớp giao thông: gồm các thông tin về hệ thống giao thông đường bộ, đường sắt, đường thuỷ kèm theo các công trình giao thông đầu mối như sân bay, bến cảng, nhà ga, cầu, hầm đường bộ, v.v Lớp thông tin này được xây dựng từ các thông tin trên bản đồ và được chỉnh lý, cập nhật lại theo những thông tin mới nhất trên lớp thông tin ảnh trực giao, kết quả đo đạc hoặc do các cơ quan quản lý giao thông cung cấp
6 Lớp dân cư cơ sở hạ tầng: gồm các thông tin về sự phân bố dân cư và tính chất các vùng dân cư, điểm dân cư tại nông thôn và đô thị, các đối tượng kinh tế - xã hội, đường dây tải điện, ranh giới sử dụng đất, ranh giới khu vực cấm, v.v Lớp thông tin này được xây dựng từ các thông tin trên bản đồ và được chỉnh lý, cập nhật lại theo những thông tin mới nhất trên lớp thông tin ảnh trực giao, kết quả đo đạc hoặc do các cơ quan quản lý về xây dựng cung cấp
7 Lớp phủ bề mặt: gồm các thông tin về các loại lớp phủ thực vật ranh giới phủ bề mặt của chúng trên bề mặt đất Lớp thông tin này được xây dựng từ các thông tin trên bản đồ và được chỉnh lý, cập nhật lại theo các thông tin mới nhất trên lớp thông tin ảnh trực giao, kết quả đo đạc ngoài thực địa
Trang 3928
1.2.3 Sự khác biệt giữa CSDL nền địa lý với bản đồ địa hình
+ Giống nhau: Giữa CSDL nền địa lý và BĐĐH về cơ bản nội dung là
giống nhau và đều có 7 chủ đề Cụ thể:
Bảng 1.1: Sự giống nhau về nội dung giữa CSDL nền địa lý và BĐĐH
+ Khác nhau:
Bản đồ địa hình là bản đồ mô tả thế giới thực ở mức cơ sở (base), có mức
độ chi tiết và độ chính xác đủ để làm nền (Cơ sở) chung cho các mục đích xây dựng các bản đồ chuyên đề
CSDL nền địa lý là một hệ thống dữ liệu địa lý mô tả thế giới thực ở mức
cơ sở (base), có mức độ chi tiết và độ chính xác đủ để làm nền (Cơ sở) chung cho các mục đích xây dựng dữ liệu địa lý chuyên đề
- Về mô hình cấu trúc:
Bản đồ địa hình bao gồm 7 chủ đề là 7 file độc lập
CSDL nền địa lý bao gồm 7 chủ để được quản lý trong 01 file duy nhất: file *.mdb hoặc *.xml, *.gml
- Cấu trúc dữ liệu của bản đồ là cấu trúc vector Spaghetti (điểm đường vùng và những chuỗi ký tự được biểu diễn đơn thuần là vị trí Vì vậy bản đồ không có khả năng tìm kiếm, phân tích không gian
Trang 4029
- Cấu trúc dữ liệu của CSDL nền địa lý là cấu trúc vector topology (mô
tả mối quan hệ không gian giữa các phần tử hoặc đối tượng không gian trong/ngoài, trái/phải, trên dưới, trùng/kề…) Mô hình dữ liệu vector topology bao gồm các khái niệm về mô hình hoá 3 kiểu dữ liệu điểm, đường, vùng như sau:
Đỉnh (vertex): Được mô hình hoá bằng một tọa độ
Nút (node): Được mô hình hoá bởi một tọa độ
Cạnh (Arc): Được tạo từ các đỉnh và các node
CSDL nền địa lý có khả năng tìm kiếm, chồng xếp và phân tích không gian
- Về cách thể hiện
Cách thể hiện của bản đồ địa hình là thể hiện các yếu tố nội dung của bản
đồ thông qua hệ thống ký hiệu Giúp người sử dụng bản đồ dễ dàng đọc được nội dung của bản đồ hay đọc được các yếu tố tự nhiên, kinh tế xã hội thông qua ngôn ngữ ký hiệu của bản đồ Như vậy, bản đồ địa hình được thiết kế nhằm mục đích để trình bày và in sao cho người sử dụng dễ dàng đọc được nội dung thế giới thực nhất
Ví dụ: sông Nậm Dôn, tên sông nằm độc lập với đối tượng sông; thuộc tính có nước thường xuyên (ổn định) và có nước theo mùa (không ổn định) được thể hiện qua sự khác nhau của ký hiệu hình học
Hình 1.11 Đối tượng địa lý thể hiện trên bản đồ địa hình