Theo nghĩa này HQTCSDL có nhiệm vụ rất quan trọng như là một bộ diễn dịch interpreter với ngôn ngữ bậc cao nhằm giúp người sử dụng có thể dùng được hệ thống mà ít nhiều không cần quan tâ
Trang 2LUẬN VĂN THẠC SỸ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS Nguyễn Trường Xuân
Hà Nội – 2010
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu riêng của tôi Các số liệu, kết quả trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Tác giả luận văn
Lê Quang
Trang 4Tôi xin chân thành cảm ơn tới các cán bộ và giáo viên khoa Trắc địa, Trường Đại học Mỏ - Địa chất và toàn thể cán bộ phòng sau đại học, đã tận tình giúp đỡ, cung cấp tư liệu giúp tôi thực hiện luận văn này
Tôi xin chân thành cảm ơn tập thể cán bộ, công nhân viên Tổng Công ty Tài nguyên và Môi trường Việt Nam đã tạo điều kiện giúp đỡ tôi trong suốt quá trình học tập và hoàn thành luận văn
Tôi xin chân thành cảm ơn gia đình, bạn bè, đồng nghiệp đã giúp đỡ động viên tôi trong suốt quá trình học tập và hoàn thành luận văn
Xin trân trọng cảm ơn !
Hà nội, tháng 9 năm 2010
Học viên
Lê Quang
Trang 5MỤC LỤC
CÁC TỪ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC HÌNH 7
MỞ ĐẦU 10
Chương 1 12
TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU 12
1.1 KHÁI NIỆM CHUNG VỀ CƠ SỞ DỮ LIỆU 12
1.1.1 Khái niệm về hệ cơ sở dữ liệu 12
1.1.2 Kiến trúc một hệ cơ sở dữ liệu và tính độc lập của dữ liệu 14
1.1.3 Thể hiện và lược đồ 16
1.1.4 Mô hình cơ sở dữ liệu 17
1.2 CẤU TRÚC CƠ SỞ DỮ LIỆU TRONG HỆ THÔNG TIN ĐỊA LÍ 21
1.2.1 Cơ sở dữ liệu không gian 22
1.2.2 Cơ sở dữ liệu thuộc tính 33
1.2.3 Mối liên kết dữ liệu 34
1.3 THU THẬP DỮ LIỆU VÀ CẬP NHẬT DỮ LIỆU 34
1.3.1 Thu thập dữ liệu không gian 34
1.3.2 Thu thập các dữ liệu thuộc tính 37
1.3.3 Cập nhật thông tin 37
1.4 SIÊU DỮ LIỆU - METADATA 38
1.4.1 Khái niệm về metadata và metadata trong HTTĐL 38
1.4.2 Chuẩn Metadata cho dữ liệu địa lí 39
Chương 2 41
GIỚI THIỆU VỀ ARCGIS 41
2.1 TỔNG QUAN VỀ ARCGIS 41
2.2 CÁC MODUL TRONG ARCGIS 42
2.2.1 ArcGIS Desktop 42
2.2.2 ArcGIS Server 45
Trang 62.2.3 ArcGIS Engine 46
2.2.4 Mobile GIS 47
2.3 TỔ CHỨC CSDL TRONG ARCGIS 47
2.3.1 Geodatabase 47
2.3.2 ArcSDE 52
2.3.3 SQL Server 55
Chương 3 57
XÂY DỰNG CSDL THÀNH PHỐ BẮC GIANG 57
3.1 THÔNG TIN KHÁI QUÁT VỀ THÀNH PHỐ BẮC GIANG 57
3.1.1 Vị trí địa lý 57
3.1.2 Địa lý tự nhiên 57
3.1.3 Kinh tế xã hội 58
3.2 CSDL PHỤC VỤ QUẢN LÝ VÀ QUY HOẠCH THÀNH PHỐ BẮC GIANG 59
3.3.1 Mô hình chuẩn thông tin CSDL thành phố Bắc Giang 59
3.3.2 Mô hình tổ chức CSDL thành phố Bắc Giang 61
3.3.3 Mô hình tổ chức CSDL nền địa hình Bắc Giang 65
KẾT LUẬN 90
TÀI LIỆU THAM KHẢO 91
Trang 7CÁC TỪ VIẾT TẮT
CSDL: Cơ sở dữ liệu
HQTCSDL: Hệ quản trị cơ sở dữ liệu HTTĐL: Hệ thống thông tin địa lý
Trang 8DANH MỤC CÁC BẢNG
TrangBảng 1-1: Mô hình quan hệ cơ sở 19
Trang 9Hình 1-9: Dữ liệu vector được biểu thị dưới dạng điểm 25
Hình 1-10: Dữ liệu vector được biểu thị dưới dạng đường 26
Hình 1-11: Dữ liệu vector được biểu thị dưới dạng vùng 27
Hình 1-12: Sơ đồ liên kết thông tin chung giữa 2 vùng 28
Hình 1-14: Yếu tố hình học và Topology của dữ liệu vector 28
Hình 1-17: Cấu trúc dữ liệu topology (nút, đường, vùng) 30
Hình 1-19: Liên kết dữ liệu không gian và thuộc tính 34
Hình 2-2: ArcObjects: các thành phần xây dựng nên ArcGis 42
Trang 10Hình 2-3: Giao diện chính của ArcCatalog 43
Hình 2-5: Giới thiệu các chức năng edit của ArcMap 44
Hình 2-7: Sử dụng Geodatabase để quản lý về lưu trữ thông tin địa lý 48
Hình 2-11: Cấu hình ArcSDE kết nối trực tiếp 55
Hình 3-1: Vai trò của chuẩn thông tin địa lý đối với CSDL thành phố Bắc Giang 60
Hình 3-2: Mô hình chuẩn thông tin địa lý CSDL thành phố Bắc Giang 61
Hình 3-3: Mô hình tổ chức CSDL thành phố Bắc Giang 62
Hình 3-4: CSDL thành phố Bắc Giang theo chuẩn thông tin địa lý 66
Hình 3-5: Quy trình tổng quát thành lập CSDL nền địa lý bằng bay quét Lidar và chụp ảnh số 67
Hình 3-6: Lược đồ CSDL nền địa hình Thành Phố Bắc Giang 68
Hình 3-7: Lược đồ lớp các điểm toạ độ cơ sở 69 Hình 3-8: Lược đồ lớp biên giới địa giới 70
Hình 3-10.2: Lược đồ lớp thủy hệ (tiếp) 72 Hình 3-10.3: Lược đồ lớp thủy hệ (tiếp) 73
Trang 11Hình 3-10.4: Lược đồ lớp thủy hệ (tiếp) 74 Hình 3-10.5: Lược đồ lớp thủy hệ (tiếp) 75
Hình 3-11.2: Lược đồ lớp giao thông (tiếp) 77
Hình 3-11.3: Lược đồ lớp giao thông (tiếp) 77
Hình 3-11.4: Lược đồ lớp giao thông (tiếp) 78
Hình 3-11.5: Lược đồ lớp giao thông (tiếp) 79
Hình 3-12.2: Lược đồ lớp dân cư, cơ sở hạ tầng (tiếp) 80
Hình 3-12.3: Lược đồ lớp dân cư, cơ sở hạ tầng (tiếp) 81
Hình 3-12.4: Lược đồ lớp dân cư, cơ sở hạ tầng (tiếp) 81
Hình 3-12.5: Lược đồ lớp dân cư, cơ sở hạ tầng (tiếp) 82
Hình 3-12.6: Lược đồ lớp dân cư, cơ sở hạ tầng (tiếp) 83
Trang 12MỞ ĐẦU
1 Đặt vấn đề
Hiện nay tại nhiều địa phương đang phát triển trên cả nước nói chung và thành phố Bắc Giang nói riêng, công tác quản lý và quy hoạch gặp rất nhiều khó khăn do tư liệu, dữ liệu không đầy đủ, đồng bộ Mặt khác sự thay đổi nhanh lại gây khó khăn cho công tác chỉnh sửa, cập nhật dữ liệu
Các loại dữ liệu vẫn hiện còn ở nhiều khuôn dạng khác nhau Micro Station, Map Info, Auto Cad … gây ra nhiều khó khăn cho công người sử dụng Việc
“Nghiên cứu xây dựng cơ sở dữ liệu thông tin địa lý phục vụ quản lý và quy hoạch phát triển thành phố Bắc Giang” là rất cấp thiết
2 Mục tiêu của đề tài
Mục tiêu của đề tài là nghiên cứu xây dựng CSDL thông tin địa lý, các nguồn dữ liệu đầu vào, các cơ chế cập nhật chỉnh sửa, để có một bộ dữ liệu đồng
bộ, tức thời, trên hệ thống phần mềm ARCGIS phục vụ cho công tác quản lý và quy hoạch phát triển
3 Phạm vi của đề tài
Nghiên cứu xây dựng CSDL tin địa lý cho các phường, xã của thành phố Bắc Giang trên cơ sở các nguồn dữ liệu từ bản đồ nền địa hình 1/2000 thành phố Bắc Giang, được thành lập bằng phương pháp bay chụp ảnh số kết hợp quét Lidar
4 Nội dung của đề tài
Nghiên cứu cơ sở dữ liệu thông tin địa lý nhằm phục vụ quản lý và quy hoạch phát triển đô thị
Thiết kế và xây dựng hệ thống cơ cở dữ liệu thông tin địa lý cho thành phố Bắc Giang
5 Ý nghĩa khoa học và thực tiễn của đề tài
Nghiên cứu ứng dụng ArcGis cho công tác xây dựng và quản lý CSDL địa
lý
Xây dựng được mô hình CSDL thông tin địa lý nhằm mục đích quản lý và quy hoạch phát triển thành phố Bắc Giang
Trang 136 Cấu trúc của luận văn
Ngoài phần mở đầu và phần kết luận, luận văn có bố cục 3 chương, bao gồm
52 hình vẽ và 4 bảng
Trang 14Chương 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU 1.1 KHÁI NIỆM CHUNG VỀ CƠ SỞ DỮ LIỆU
1.1.1 Khái niệm về hệ cơ sở dữ liệu
Các tập dữ liệu chứa các thông tin có liên quan đến một cơ quan, một tổ chức, một chuyên ngành khoa học tự nhiên hoặc xã hội được lưu trữ trong máy tính theo một qui định nào đó cho mục đích sử dụng được gọi là CSDL
Phần chương trình để có thể xử lý, thay đổi dữ liệu này là hệ quản trị cơ sở
dữ liệu (HQTCSDL) Theo nghĩa này HQTCSDL có nhiệm vụ rất quan trọng như là một bộ diễn dịch (interpreter) với ngôn ngữ bậc cao nhằm giúp người sử dụng có thể dùng được hệ thống mà ít nhiều không cần quan tâm đến thuật toán chi tiết hoặc biểu diễn dữ liệu trong máy Mục đích chính của một hệ quản trị cơ sở dữ liệu là cung cấp một cách lưu trữ và truy lục thông tin trong cơ sở dữ liệu sao cho vừa thuận tiện vừa hiệu quả Một số hệ quản trị cơ sở dữ liệu thông dụng hiện nay như DataBase, SyBase, Informix, SQL Serve, Oracle, Microsoft Access Sự khác nhau giữa các hệ quản trị dữ liệu là định dạng dữ liệu (format) và ngôn ngữ hỏi đáp để tìm dữ liệu và cập nhật dữ liệu
Các hệ quản trị cơ sở dữ liệu được thiết kế để quản lý một lượng lớn thông tin
HQTCSDL hỗ trợ các tính năng sau:
* Định nghĩa dữ liệu (Database definition)
* Xây dựng dữ liệu (Database construction), hỗ trợ người dùng xây dựng các
Trang 15HQTCSDL có thể được phân loại dựa theo nhiều tiêu chí khác nhau ở đây giới thiệu ba kiểu HQTCSDL khác nhau được phân loại theo quan điểm chung nhất,
đó là:
*HQTCSDL loại 1: Người dùng vừa thiết kế, sử dụng và quản trị, hay còn gọi là HQTCSDL đơn người dùng Nó thường được sử dụng để giải quyết các nhiệm vụ đơn lẻ với một người hoặc một vài ngườ1
*HQTCSDL loại 2: Người sử dụng cuối truy cập CSDL thông qua các thiết
bị truy nhập đầu cuối, còn HQTCSDL đa người dùng - HQTCSDL trung tâm
*HQTCSDL loại 3: Những yêu cầu của người sử dụng cuối và trình ứng dụng được xử lý tại các máy trạm, chỉ những yêu cầu nào cần tới CSDL mới được chuyển tới HQTCSDL nằm trên máy chủ Đây là mô hình HQTCSDL Client/Server
Cả ba HQTCSDL trên đều đặt CSDL tại một nơi, do đó HQTCSDL có tính chất tập trung
Cuộc cách mạng Internet vào cuối những năm 90 đã làm tăng mạnh mẽ số lượng người dùng truy xuất trực tiếp vào các cơ sở dữ liệu Các công ty đã chuyển nhiều giao diện điện thoại của họ với cơ sở dữ liệu thành các giao diện web tạo ra nhiều dịch vụ và thông tin trực tuyến Thí dụ truy xuất một cửa hàng sách trực tuyến
và duyệt xem sách hoặc băng đĩa nhạc, có nghĩa là chúng ta đang truy xuất dữ liệu được lưu trong cơ sở dữ liệu Khi đặt một đơn đặt hàng trực tuyến, đơn này được lưu vào cơ sở dữ liệu Khi truy xuất điểm web của một ngân hàng và truy lục thông tin số dư và giao dịch của mình, thông tin này được lấy từ hệ cơ sở dữ liệu của ngân hàng Khi truy xuất một điểm web, thông tin của chúng có thể được truy lục từ một
cơ sở dữ liệu và chọn ra những quảng cáo thích hợp cho chúng ta Ngoài ra, dữ liệu
về việc truy xuất của chúng ta cũng có thể được lưu cất trong cơ sở dữ liệu
Vì thế mặc dù các giao diện người dùng đã che dấu các chi tiết về những truy xuất đến cơ sở dữ liệu và phần lớn chúng ta không biết rằng mình đang giao diện với một cơ sở dữ liệu, việc truy xuất cơ sở dữ liệu đã trở nên một bộ phận thiết yếu trong đời sống của mỗi người
Trang 161.1.2 Kiến trúc một hệ cơ sở dữ liệu và tính độc lập của dữ liệu
Một cơ sở dữ liệu được phân thành các mức khác nhau Ở đây có thể xem như chỉ có một cơ sở dữ liệu đơn giản và có một hệ quản trị CSDL (Hình 1-1)
Môi trường hệ điều hành
Hệ quản trị cơ sở dữ liệu
Mức trìu tượng hoá thấp nhất của kiến trúc một hệ CSDL là cơ sở dữ liệu vật
lý (mức vật lý) là các tệp dữ liệu theo một cấu trúc nào đó được lưu trên các thiết bị
nhớ thứ cấp (như đĩa từ, băng từ ) Mức này mô tả việc dữ liệu thật sự được lưu như thế nào Ở mức vật lý, một mẫu tin có thể được mô tả như một khối các vị trí lưu trữ nằm kế cận nhau (ví dụ như các từ nhớ hoặc byte) Trình biên dịch của ngôn ngữ che khuất không cho chúng ta thấy mức chi tiết này Tương tự, hệ thống CSDL
Yêu cầu của
người sử dụng
Thông tin
Trang 17che khuất nhiều chi tiết lưu trữ ở mức thấp nhất Tuy nhiên, người quản trị CSDL
có thể biết được một số chi tiết tổ chức vật lý của dữ liệu
CSDL mức khái niệm hay gọi là mức Logic Đó là mức trìu tượng hoá kế
tiếp mô tả việc những dữ liệu nào được lưu trong CSDL và mối quan hệ tồn tại giữa các dữ liệu này Mức Logic vì thế mô tả toàn bộ CSDL theo một số ít cấu trúc tương đối đơn giản, mặc dù bản cài đặt các cấu trúc đơn giản ở mức logic có thể chứa đựng các cấu trúc phức tạp của mức vật lý, người sử dụng không cần biết về
sự phức tạp này Ở mức này, mỗi mẫu tin như thế được mô tả bằng một định nghĩa kiểu giống như đoạn mã ở trên và mối liên hệ qua lại giữa các kiểu dữ liệu này cũng được định nghĩa
Mức khung nhìn là mức trìu tượng hoá cao nhất chỉ mô tả một phần CSDL
Mặc dù mức logic sử dụng các cấu trúc đơn giản, sự phức tạp vẫn còn do có rất nhiều loại thông tin trong một CSDL lớn Nhiều người sử dụng của hệ thống CSDL không cần tất cả mọi loại thông tin này, thay vào đó họ chỉ cần truy xuất một phần CSDL Như vậy mức khung nhìn tồn tại để đơn giản hoá sự tương tác với hệ thống
Hệ thống có thể cung cấp nhiều khung nhìn trên cùng một CSDL và người sử dụng CSDL chỉ thấy những khung nhìn này
CSDL mức vật lý
Trang 18Về tính độc lập của dữ liệu, chúng ta hãy xem xét hình 1- 2 từ khung nhìn,
tới CSDL khái niệm và CSDL vật lý cho thấy có hai mức “độc lập dữ liệu” Thứ
nhất, lược đồ vật lý có thể thay đổi do người quản trị CSDL mà không cần thay đổi lược đồ con Việc tổ chức lại CSDL vật lý (thay đổi các tổ chức, cấu trúc dữ liệu trên các thiết bị nhớ thứ cấp) có thể làm thay đổi hiệu quả tính toán của các chương trình ứng dụng nhưng không đòi hỏi phải viết lại các chương trình đó Tính độc lập
này gọi là độc lập dữ liệu mức vật lý
Mối quan hệ giữa các khung nhìn và lược đồ khái niệm cho thêm một loại
độc lập nữa, gọi là độc lập dữ liệu logic Khi sử dụng một CSDL, có thể cần thiết
phải thay đổi lược đồ khái niệm như thêm thông tin về các loại khác nhau của các thực thể hoặc bớt, xoá các thông tin về các thực thể đang tồn tại trong CSDL Việc thay đổi lược đồ khái niệm không làm ảnh hưởng tới các lược đồ con đang tồn tại,
do đó không cần thiết phải thay đổi các chương trình ứng dụng
Vì thế, tính độc lập dữ liệu là mục tiêu chủ yếu của các hệ CSDL Có thể
định nghĩa tính độc lập dữ liệu là “tính bất biến các hệ ứng dụng đối với các thay
đổi trong cấu trúc lưu trữ và chiến lược truy nhập”
1.1.3 Thể hiện và lược đồ
Cơ sở dữ liệu thay đổi theo thời gian khi các thông tin được chèn thêm và được xoá bớt đ1 Tập hợp các thông tin được lưu trong CSDL tại một thời điểm cụ
thể được gọi là một thể hiện của CSDL Bản thiết kế tổng thể của CSDL được gọi
là lược đồ CSDL Các lược đồ ít khi thay đổi nếu không nói là không thay đổ1 Các
hệ CSDL có nhiều lược đồ, được phân chia dựa theo các mức trìu tượng hoá Lược
đồ vật lý mô tả bản thiết kế CSDL ở mức vật lý, lược đồ logic mô tả bản thiết kế CSDL ở mức logic Một CSDL cũng có thể có nhiều lược đồ ở mức khung nhìn hay còn gọi là lược đồ con, chúng mô tả những khung nhìn khác nhau của CSDL
Cho đến nay, lược đồ logic là lược đồ được coi là quan trọng nhất nếu nói theo tác dụng của nó đối với các chương trình ứng dụng Lược đồ vật lý được che khuất bên dưới lược đồ logic và thường có thể thay đổi dễ dàng mà không làm ảnh hưởng đến các chương trình ứng dụng
Trang 191.1.4 Mô hình cơ sở dữ liệu
Mỗi mô hình cơ sở dữ liệu sẽ làm nền tảng cho cấu trúc của một CSDL, nghĩa là liên quan đến phương pháp tổ chức dữ liệu trong một CSDL logic hoặc liên quan đến cấu trúc logic của dữ liệu trong một CSDL
1 Mô hình phân cấp (Hierarchical models)
Hình 1-3: Mô hình dữ liệu phân cấp
Mô hình phân cấp là sự kết hợp của nhiều cấp độ cơ bản có liên quan.Trong thực tế, nó là một cây theo thứ tự (hình 1-3) Mô hình phân cấp lưu trữ
dữ liệu bằng các cấp độ giống như mỗi bộ phận phù hợp với cấu trúc của một cây như rễ, cành và lá Cấp độ thứ nhất R1 trong hình vẽ là rễ; S1, S3 ở cấp độ thứ hai là cành, trong khi đó S2, S4, T1, T2, T3, T7 ở cấp độ hai và ba là lá
Tuy nhiên, để nhận ra một mô hình phân cấp không khó, nhưng còn một số vấn đề trong việc tìm kiếm cấp độ này sau một cấp độ khác và còn nhiều dữ liệu dư thừa
Trang 202 Mô hình mạng (Network Model)
Mô hình mạng là sự tập hợp các cấp độ cơ bản đã được kết nối (hình 1- 4) Đặc điểm cơ bản của nó là không chỉ được kết nối từ lá đến cành Ví dụ, S1 trong hình vẽ được kết nối với R1, R3 Loại cấu trúc này có thể được xem như là loại cấu trúc phân cấp có nhiều mạng kết nố1 Kết quả là, tuy tiết kiệm được thời gian tìm kiếm, nhưng mối quan hệ giữa các dữ liệu lại phức tạp, còn cấu trúc thì không thể nhìn thấy một cách rõ ràng
Trong mô hình mạng và mô hình phân cấp thiết, việc truy cập tuyến dữ liệu một cách cẩn thận là rất cần thiết Một khi nó đã được xác định thì tuyến dữ liệu không thể thay đổi được Vậy kết quả hiện hữu của các mối quan hệ phức hợp trong thực tế giữa các dữ liệu thường là không thể mô tả chúng bằng một mô hình mạng hay một mô hình phân cấp cố định Vì vậy, khái niệm của một mô hình quan hệ đã được hình thành
Hình 1-4: Mô hình mạng
3 Mô hình quan hệ (Relationship Model)
Mô hình quan hệ liên quan đến sự tập hợp nhiều mối quan hệ hiện hữu giữa các dữ liệu Mô hình quan hệ sử dụng một tập các bảng để biểu diễn cả dữ liệu lẫn mối liên hệ giữa những dữ liệu này Mỗi bảng có nhiều cột và mỗi cột có một tên duy nhất Mỗi bảng đều chứa các các mẫu tin cùng kiểu Mỗi mẫu tin định nghĩa một số trường hay thuộc tính nhất định Các cột của bảng tương ứng với các thuộc tính của kiểu mẫu tin Ví dụ, bảng 2-1 đưa ra một phần mô hình quan hệ của cơ sở
R3
R4
Trang 21dữ liệu trong việc quản lí giảng dạy Trong bảng này, "Mối quan hệ học sinh", "Mối quan hệ giáo viên" và "Mối quan hệ học tập" không chỉ mô tả sự tồn tại, mà còn mô
tả các mối quan hệ giữa chúng Mỗi một mối quan hệ tương đương với một "bảng hai chiều" Vậy tính đơn giản trong cấu trúc là một đặc điểm chính của mô hình quan hệ, nó có thể mô tả cấu trúc dữ liệu của mô hình mạng hay một số mô hình phân cấp bằng một loạt các mối quan hệ có cấu trúc đơn giản
Bảng 1-1: Mô hình quan hệ cơ sở dữ liệu
Mèi quan hÖ sinh viªn Mèi quan hÖ häc tËp Mèi quan hÖ gi¸o viªn
Trang 22- Quan hệ một đối một: Đòi hỏi giá trị của trường khoá trong chỉ một khoản
tin của bảng mới phải so khớp với một giá trị tương ứng của trường có quan hệ trong bảng hiện có Trong trường hợp này, khoá trường trong bảng phải là duy nhất, không thể có giá trị trùng lặp trong trường khoá
- Quan hệ nhiều đối một: Cho phép bảng mới có nhiều giá trị trong trường
khoá tương ứng với chỉ một giá trị trong trường quan hệ của bảng hiện có Trong trường hợp này có thể có các giá trị trường khoá trùng lặp, bởi vì trường là một trường khoá ngoạ1
- Quan hệ một đối nhiều: Đòi hỏi trường khoá chính của bảng mới phải
là duy nhất, nhưng các giá trị trong trường khoái ngoại của bảng mới có thể
so khớp với nhiều mục trong trường quan hệ của CSDL hiện có Trong trường hợp này, trường quan hệ của CSDL hiện có sẽ có nhiều mối quan hệ nhiều đối một với trường khoá chính của CSDL mớ1
- Quan hệ nhiều đối nhiều: là kiểu tự do, ở đó không có mối quan hệ duy
nhất nào tồn tại giữa các trường khoá trong bảng hiện có hoặc bảng mới, các trường khoá ngoại của cả hai bảng sẽ chứa các giá trị trùng lặp các mối quan hệ nhiều đối nhiều được tạo thông qua các bảng quan hệ chỉ chứa các trường khoá ngoạ1
Thuận lợi của mô hình quan hệ là được hình thức hoá toán học chặt chẽ, do
đó các xử lý, thao tác với dữ liệu dễ dàng, có tính độc lập dữ liệu cao Cấu trúc dữ liệu đơn giản mềm dẻo trong xử lý và dễ dàng cho người sử dụng Đặc biệt các phép tính cập nhật dữ liệu cho mô hình quan hệ nói chung là ít phức tạp hơn nhiều
so với các mô hình khác
4 Mô hình quan hệ thực thể (ERM - Entity Relationship Model)
Mô hình quan hệ thực thể dựa trên quan niệm về thế giới thực bao gồm các đối tượng được gọi là các thực thể (entity) và mối quan hệ giữa chúng "Thực thể" là một vật hoặc một đối tượng (gọi là object) trong thế giới thực mà ta có thể phân biệt được chúng với nhau Các thực thể được mô tả trong CSDL bởi một tập các thuộc tính (attributess or features)
Trang 23Mô hình quan hệ thực thể luôn luôn khống chế nội dung trong cơ sở dữ liệu làm cho CSDL luôn luôn nhất quán Điểm mạnh nhất của nó là khả năng hỗ trợ thiết
kế và tổ chức thông tin cũng như tính tương thích lớn của nó đối với mô hình dữ liệu quan hệ Ngoài các thực thể và mối liên hệ, mô hình này cũng biểu diễn một số ràng buộc mà nội dung của một cơ sở dữ liệu phải tuân thủ Một ràng buộc quan trọng là lượng ánh xạ biểu diễn số lượng các thực thể mà một thực thể bên kia có thể được kết hợp thông qua một tập các mối quan hệ
Thực thể là một vật thực hay một đối tượng tồn tại một cách khách quan, chúng ta có thể phân biệt chúng nhờ chỉ số index của chúng trong máy tính (ID) Nếu các thực thể không có chỉ số thứ tự tự nhiên thì chúng ta phải tạo ra các chỉ số cho chúng Thuộc tính hay còn gọi là tính chất của các thực thể được biểu thị trong các trường (cột) của bảng Giữa các thực thể có các mối quan hệ với nhau
5 Mô hình hướng đối tượng ( OOM - Object Oriented Model)
Mô hình hướng đối tượng dựa trên cơ sở các gói dữ liệu (data packages) và
mã liên quan tới đối tượng Mọi sự tương tác của người sử dụng với các đối tượng được quản lý này đều thông qua các thông điệp, hoặc sự tương tác giữa đối tượng này với đối tượng khác đều phải thông qua các thông điệp Đối tượng bao giờ cũng
có mã thao tác, nhưng mã này được gọi là những phương pháp Những đối tượng có chung kiểu giá trị và cùng phương pháp thì được gộp vào một lớp
Mô hình hướng đối tượng là một mô hình hiện đại được nhiều quốc gia phát triển trong những năm gần đây và cũng có nhiều ứng dụng trong các ngôn ngữ lập trình cũng như các giải pháp về phần mềm và phần cứng
Trên cơ sở các mô hình dữ liệu trên, trong quá trình sử dụng và phát triển, người ta đang nghiên cứu phát triển thêm một số loại mô hình dữ liệu khác nhằm
mô tả và thể hiện thế giới thực một cách chính xác và phù hợp với nhu cầu sử dụng
hơn
1.2 CẤU TRÚC CƠ SỞ DỮ LIỆU TRONG HỆ THÔNG TIN ĐỊA LÍ
Như chúng ta đã biết, CSDL chiếm khoảng 70% giá trị của hệ thông tin địa
lý, hay nói cách khác cơ sở dữ liệu chính là “linh hồn” của hệ thống Cơ sở dữ liệu
Trang 24của hệ thông tin địa lý là tập hợp dữ liệu có liên quan với nhau được lưu trữ dưới dạng số Vì cơ sở dữ liệu của hệ thống có mối liên quan với các điểm đặc trưng trên
bề mặt trái đất nên nó bao gồm hai nhóm là cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính Hai loại dữ liệu này cần phải tuân theo một cấu trúc hợp lí để thuận tiện quản lí, lưu trữ, sửa đổi và khai thác theo mục đích sử dụng
1.2.1 Cơ sở dữ liệu không gian
Cơ sở dữ liệu không gian là cơ sở dữ liệu có chứa trong nó những thông tin
về định vị của đối tượng Nó là những dữ liệu phản ánh, thể hiện những đối tượng
có kích thước vật lí nhất định Nếu là những cơ sở dữ liệu không gian địa lí thì đó là những dữ liệu phản ánh những đối tượng có trên bề mặt hoặc ở trong vỏ quả đất
Tất cả các đối tượng trên bề mặt quả đất đều có thể gộp vào ba dạng cơ bản trên bởi vì công nghệ hệ thống thông tin địa lí là công nghệ tin học và máy tính không hiểu được các khái niệm giếng khoan, sông là gì nhưng nó có thể hiểu được định nghĩa về điểm, đường, vùng Các yếu tố cơ bản nêu trên thường được gắn với lời chú giải hoặc kí hiệu Ví dụ những bãi cát, vùng cây ngập nước được thể hiện bằng vùng bao phủ tập hợp toạ độ cùng với những kí hiệu qui định Các chú giải này có thể là tên, có thể là kí hiệu thực tế hoặc số qui ước hay kí hiệu đặc biệt
Để qui dữ liệu không gian về ba loại trên, cần thiết phải xác định:
* Vị trí của đối tượng
Trong khi tạo dựng dữ liệu chúng ta luôn phải trả lời câu hỏi cái này ở đâu?
vị trí của nó ở chỗ nào trong hệ quy chiếu đã chọn , vì vậy việc xác định vị trí các đối tượng là hết sức cần thiết
* Đặc trưng của đối tượng
Đây chính là mô tả thuộc tính của đối tượng và máy tính có thể hiểu được nhờ mã hoá chúng theo các mức dữ liệu và các giá trị số khác nhau
* Mối quan hệ giữa các đối tượng
Các đối tượng nghiên cứu chuyên ngành luôn được so sánh với nhau để tìm
ra mối liên quan hình học và ảnh hưởng giữa chúng Đây là một yếu tố rất quan
Trang 25trọng và có thể là yếu tố then chốt trong công nghệ thông tin địa lí và cũng là sự khác nhau cơ bản giữa hệ thông tin địa lí hiện đại và các hệ xử lí đồ thị khác
Tất cả các đối tượng trong hệ thông tin địa lí đều có thể được mô tả theo hai kiểu cấu trúc dữ liệu raster hoặc vector
1 Cấu trúc dữ liệu Raster
Đây là cấu trúc dữ liệu mà trong đó dữ liệu được thể hiện thành một mảng gồm các pixel và mỗi pixel đều mang giá trị của thông số đặc trưng cho đối tượng Một khu vực trên bản đồ được biểu thị ở dạng số bằng cách lưu giữ vị trí (toạ độ tâm điểm của chúng), kích thước và đặc tính tương ứng của đối tượng thuộc pixel
đó Mỗi Pixel sẽ tương ứng với một diện tích vuông trên thực tế Giá trị độ lớn của Pixcel còn được gọi là độ phân giải của dữ liệu Hình vuông là dạng pixel phổ biến nhất, sau đó là hình chữ nhật, hình 1- 5 minh hoạ cách biểu diễn thông tin kiểu raster
Hình 1-5: Minh hoạ thông tin Raster
Đối với một file dữ liệu dạng Raster, cần có một file chứa các thông tin về cấu trúc của dữ liệu, ta gọi là Header file
Thông thường khi lưu trữ cũng như biểu diễn thông tin theo dạng cấu trúc raster thì người ta hay sử dụng thuật toán mã nhị phân, tức là những thông tin biểu diễn (hiển thị lên màn hình) đều được gán mã là 1, còn phần trống (không chứa thông tin ) sẽ được gán mã là 0 hoặc ngược lạ1
Trong cấu trúc dữ liệu raster các đối tượng cơ bản được biểu diễn là :
Đối tượng điểm
Trang 26Điểm được xác định tướng ứng với một pixel độc lập, trong thế gới thực,
điểm có thể là một ngôi nhà nằm trên vài Pixel có cùng giá trị (mã) Yếu tố hình học
và topology dạng điểm của dữ liệu raster được biểu thị ở hình 1-6
Hình 1-6: Biểu diễn đối tượng điểm dạng Raster
Đối tượng đường
Đường được coi là tập hợp các pixel liên tiếp nhau có cùng giá trị Yếu tố hình học và topology dạng đường dữ liệu rastor được chỉ ra ở hình 1-7
Hình 1-7: Biểu diễn đối tượng đường dạng Raster
Đối tượng vùng
Vùng được xác định bởi một tập hợp các pixel có cùng giá trị liên tục nhau
theo các hướng Yếu tố hình học và topology dạng vùng của dữ liệu rastor được chỉ
Trang 27
Hình 1-8: Biểu diễn đối tượng vùng dạng Raster
2 Cấu trúc dữ liệu vector
Cấu trúc vector là cấu trúc dữ liệu dựa trên toạ độ các điểm để biểu diễn các đối tượng qua ba yếu tố cơ bản là điểm, đường, vùng Cấu trúc dữ liệu vector mô tả chính xác vị trí và mối quan hệ không gian của các đối tượng và hiện tượng Xét về mặt toán học, Vector là cách biểu diễn một đoạn thẳng có hướng và có độ dài nhất định
Đối tượng điểm (Point)
Điểm trong cấu trúc dữ liệu vector được mô tả bởi cặp toạ độ X,Y trong một
hệ thống toạ độ nhất định Đi theo giá trị toạ độ X,Y của điểm còn có chỉ số cụ thể
để mô tả đặc tính của điểm (điểm đơn giản, điểm nút, độ sâu )
Các đối tượng điểm có đặc điểm:
- Là toạ độ đơn (x,y)
- Không thể hiện chiều dài và diện tích
Hình 1-9: Dữ liệu vector được biểu thị dưới dạng điểm
(4A, 4B), (4A, 4B), (3A, 2C, 3B)
(3A, 2C, 3B), (2A, 6C), (2A, 6C)
Trang 28Nếu tỷ lệ trên bản đồ là tỷ lệ lớn thì đối tượng sẽ được thể hiện dưới dạng vùng Tuy nhiên trên bản đồ tỷ lệ nhỏ, đối tượng này có thể thể hiện dưới dạng một điểm Vì vậy, khái niệm về các đối tượng điểm và vùng phụ thuộc vào hệ quy chiếu
về tỷ lệ khi biểu diễn
Đối tượng đường (Line)
Về mặt lý thuyết đường là tập hợp vô số các điểm liên tiếp mô tả các đối tượng địa lý dạng tuyến Đối tượng đường có các đặc điểm sau:
- Là một dãy các cặp toạ độ
- Một đường thẳng bắt đầu và kết thúc bởi nút
- Các đường thẳng nối với nhau và cắt nhau tại nút
- Hình dạng của đường thẳng được định nghĩa bởi các đỉnh (vertices)
- Độ dài chính xác bằng các cặp toạ độ
Hình 1-10: Dữ liệu vector được biểu thị dưới dạng đường
Đối tượng vùng (Polygon)
Vùng (hay còn gọi là miền) có thể coi là tập hợp vô số điểm được giới hạn bởi một đường khép kín Các đối tượng địa lý có diện tích và đóng kín bởi đối tượng đường được gọi là đối tượng vùng (polygon) Số liệu định vị của yếu tố vùng được xác định bởi đường bao của chúng Đối tượng vùng có các đặc điểm sau:
- Vùng được mô tả bằng tập các đường và điểm nhãn (label points)
- Một hoặc nhiều đường định nghĩa đường bao của vùng
- Một điểm nhãn nằm trong vùng để mô tả, xác định cho mỗi một vùng
Trang 29Hình 1-11: Dữ liệu vector được biểu thị dưới dạng vùng
Trong thực tế các đối tượng vùng nằm kề nhau (có bờ ngăn cách chung) Để giảm việc lãng phí bộ nhớ do lưu giữ các cạnh chung hai lần, người ta chỉ tiến hành lưu trữ mỗi cạnh một lần, đồng thời cung cấp cho từng vùng những thông tin về cạnh thuộc nó
Tương tự như vậy với trường hợp các điểm chung có thể lưu giữ toạ độ mỗi điểm một lần và cung cấp cho đường những thông tin về các điểm thuộc đường ví
dụ hình 1- 12, hai vùng I và II có chung cạnh c và hai điểm 3 và 4 Từ đó ta có sơ
đồ về việc liên kết thông tin chung giữa hai vùng
Hình 1-12: Sơ đồ liên kết thông tin chung giữa hai vùng
Sự tiết kiệm bộ nhớ này chỉ thực sự có giá trị khi số lượng cạnh chung khá lớn Tuy nhiên điều đáng kể ở đây là cách tổ chức dữ liệu như trên cho phép thao tác với số liệu thuận lợi hơn
Dữ liệu Vector thể hiện quan hệ hình hình Topology Topology là khái niệm
dùng để xác định các quan hệ không gian giữa các đối tượng địa lý Topology xác
định nhiều mối quan hệ như kế cận, liền kề hay trùng khớp của các đối tượng địa lý
Trang 30Hình 1-13: Quan hệ topology
Một topology mạng hình học là một mô hình từ mạng thế giới thực Mạng hình học sẽ thiết lập các luật điều khiển khi một đối tượng trong mạng nối với một đối tượng khác Các mối quan hệ topology được xây dựng từ những thành phần đơn giản như: điểm (thành phần đơn giản nhất), đường (tập hợp các điểm được liên kết), vùng (tập hợp các đường được liên kết) Dữ liệu các toạ độ được loại bỏ, bởi lẽ một đường có thể biểu diễn một đối tượng dạng đường, hoặc một phần đường biên của một đối tượng vùng, hoặc cả ha1
Hiện nay, quan hệ Topology có hai mô hình là dữ liệu Vector Topology và
dữ liệu Vector Spaghett1
*Cấu trúc dữ liệu kiểu Vector Topology
Hình 1-14: Yếu tố hình học và Topology của dữ liệu vector
Điểm (Point feature) được thể hiện như một Vector có độ dài bằng không
(không có kích thước) và vị trí được xác định bằng cặp toạ độ X, Y (có thể cả Z)
Đường (Line feature) đơn giản nhất là đường nối giữa hai điểm bất lỳ có tọa
độ Xi Yi và Xj Yj Điểm xuất phát và điểm kết thúc của đường gọi là nút (node)
thó
Trang 31Đường phức tạp hơn là đường cong hoặc đường gấp khúc (hay gọi là chuỗi) Các đường này được tạo nên bằng các đoạn thẳng nhỏ Các đoạn thẳng nhỏ này được nối với nhau tại các điểm trung gian gọi là đỉnh (vertex) và toạ độ của cúng cũng được ghi nhận Đường trong mô hình biểu diễn này có hướng và độ dài, hướng của đường được ghi nhận theo một trật tự nhất định các dữ liệu điểm dù là nút hay đỉnh đều có mã của chúng Mã này có thể là số thứ tự được tạo nên khi ta nhập dữ liệu vào hệ thống Trong hệ thống, hướng của một đường được ghi nhận là lưu trữ trong máy tính có thể bắt đầu nút i và kết thúc là nút j như chỉ ra ở hình 1-14
Polygon
Ph¶i Polygon
Hình 1-15: Cấu trúc dữ liệu topology (đường)
Hình 1-16: Cấu trúc dữ liệu Topology (Vùng)
12 11
Trang 32Vùng (polygon feature) được thể hiện là một đa giác khép kín bởi các đường Vậy vùng là tổ hợp của đường khép kín nên toạ độ của vùng tại ranh giới vùng chính là toạ độ của các điểm (nút hoặc đỉnh) nằm trên các đường hình thành nên vùng Bất kỳ toạ độ nào nằm trong vùng không được ghi nhận trong cơ sở dữ liệu vùng, nhưng bằng công cụ HTTĐL, ta có thể đưa ra toạ độ của chúng bằng các Modul nội suy một cách nhanh chóng và chính xác Các đối tượng không gian có thuộc tính và thuộc tính được lưu trữ trong cơ sở dữ liệu theo một trật tự hợp lý nhấtHình 1-16 và hình 1-17 minh hoạ tổng hợp về cấu trúc dữ liệu topology vùng Hình 1-18 mô tả mối quan hệ không gian giữa các đối tượng trong mô hình dữ liệu topology
Hình 1-17: Cấu trúc dữ liệu topology (nút, đường, vùng)
12 11
Trang 33Hình 1-18: Quan hệ không gian gữa các đối tượng
Mô hình dữ liệu Vector Topology có ưu điểm là tối ưu hoá việc lưu trữ do sử dụng một số tối thiểu tọa độ để mô tả đối tượng Khả năng sử dụng để phục vụ phân tích cao, tiền đề để phát triển các lớp thông tin phức tạp, độ chính xác dữ liệu cao và đặc biệt mô tả một cách chính xác các quan hệ không gian của đối tượng Tuy nhiên, nó có nhược điểm là mô hình dữ liệu phức tạp, công biên tập dữ liệu lớn
*cấu trúc dữ liệu Vector Spaghetty
Đối tượng điểm được định nghĩa bởi một cặp tọa độ; đối tượng dạng tuyến được biểu diễn bởi một dãy các điểm; đối tượng dạng miền được biểu diễn bởi một dãy các điểm có điểm đầu và điểm cuối trùng nhau
Mô hình dữ liệu này có tổ chức dữ liệu đơn giản Nhưng có lượng dư thừa dữ liệu Mô hình này không thể phát triển dữ liệu thành các mô hình dữ liệu không gian khác và khả năng phân tích dữ liệu kém
3 Ưu nhược điểm của cấu trúc dữ liệu kiểu Raster và Vector
Qua quá trình nghiên cứu và thực nghiệm người ta đã so sánh và rút ra những
ưu nhược điểm của hai loại cấu trúc dữ liệu trên như sau:
Cấu trúc dữ liệu Raster
Trang 34- Dễ dàng chồng xếp, thu nạp thông tin giữa các bản đồ, giữa các bản đồ và thông tin viễn thám
- Chương trình xử lý dữ liệu tương đối ngắn gọn và đơn giản
- Lưu trữ, mô tả chi tiết và dày đặc thông tin
- Máy vẽ Raster có tốc độ đầu ra nhanh
Nhược điểm:
- Dung lượng thông tin quá lớn
- Dung lượng thông tin giảm khi kích thước pixel lớn và khi đó các thông tin
dễ bị sai lệch
- Các bản đồ có hình ảnh thô và đơn điệu
- Khó khăn khi chồng xếp và phân tích các dữ liệu bản đồ có kích thước pixel khác nhau; không thể xác định các đối tượng riêng lẻ một cách trực tiếp
- Khối lượng tính toán để biến đổi tọa độ rất lớn
Cấu trúc dữ liệu vector
- Có một số khó khăn nảy sinh khi chồng xếp một số bản đồ
Raster và vector là hai phương pháp mô tả các thông tin không gian khác nhau và thể hiện sự mở rộng không gian thực thể, chúng có thể chuyển đổi từ dữ liệu vector sang dữ liệu raster và ngược lạ1
4 Khái niệm về nén dữ liệu
Trang 35Như chúng ta đã biết, dữ liệu trong hệ thông tin đối với một khu vực thường rất lớn, vì vậy người ta phải nghiên cứu tìm ra kỹ thuật nào đó để giảm dung lượng khi lưu dữ liệu trong hệ thống, đó là kỹ thuật nén ảnh
Nén ảnh là quá trình làm giảm lượng thông tin "dư thừa" trong dữ liệu gốc và
do vậy lượng thông tin thu được sau khi nén thường nhỏ hơn dữ liệu gốc rất nhiều Ngoài thuật ngữ nén dữ liệu", do bản chất của kỹ thuật này nó còn có tên gọi khác như giảm độ dư thừa, mã hoá ảnh gốc Theo các kết qủ nghiên cứu được công bố,
dữ liệu nén thường có dung lượng bằng 1/10 dữ liệu gốc Còn khi sử dụng kỹ thuật nén Fractal thì tỷ số nén có thể đạt trên 1/30
Hiện nay có rất nhiều phương pháp nén dữ liệu đã và đang được nghiên cứu ứng dụng trong thực tế và có thể được chia thành hai hệ nén, đó là:
- Nén chính xác hay nén không mất thông tin, các phương pháp nén này sẽ cho ta chính xác dữ liệu gốc sau khi giải nén
- Nén có mất thông tin, với các phương pháp nén này thì chúng ta không thu được dữ liệu như bản gốc sau khi giải nén
1.2.2 Cơ sở dữ liệu thuộc tính
Cơ sở dữ liệu thuộc tính (còn gọi là dữ liệu phi không gian) là cơ sở dữ liệu phản ánh tính chất của các đối tượng khác nhau Ví dụ, các thông tin về chủ đất, chất lượng đất, thể loại đất là những dữ liệu thuộc tính
Dữ liệu thuộc tính bao gồm dữ liệu thuộc tính định tính và dữ liệu thuộc tính định lượng, chúng được cấu trúc theo dạng bảng gồm các hàng, cột Mỗi hàng bao gồm nhiều loại thông tin về một đối tượng nào đó như tên, diện tích và được gọi
là một tấm tin Mỗi loại thông tin khác nhau này gọi là một trường, mỗi trường được sắp xếp tương ứng với một cột Việc sắp xếp dữ liệu phi không gian thành bảng gồm các hàng các cột như trên rất thuận lợi cho quá trình tìm kiếm, cập nhật, sắp xếp dữ liệu phi không gian
Ngoài những đặc điểm như đã nêu trên, dữ liệu phi không gian có thể bao gồm các hình thức trình bày chuẩn của mỗi yếu tố (màu sắc, lực nét, kiểu đường ) nhằm giúp cho các quá trình sử dụng các kí hiệu và dụng cụ vẽ được thuận tiện
Trang 36Dữ liệu thuộc tính có thể được nhập vào trực tiếp từ các bảng dữ liệu, các tệp văn bản hoặc thu nhận từ các phần mềm khác nhau
1.2.3 Mối liên kết dữ liệu
Cùng với dữ liệu không gian, các dữ liệu thuộc tính của cùng yếu tố cũng được lưu trữ và đều được liên kết với dữ liệu không gian của chính đối tượng đó
D÷ liÖu kh«ng gian D÷ liÖu thuéc tÝnh
Hình 1-19: Liên kết dữ liệu không gian và thuộc tính
Mối liên kết dữ liệu thuộc tính và dữ liệu không gian có thể được thực hiện bằng cách đặt dữ liệu thuộc tính vào đúng vị trí của dữ liệu không gian Cách thứ hai để thực hiện mối liên kết này là sắp xếp các dữ liệu không gian và dữ liệu thuộc tính theo cùng một trình tự, sau đó gán mã duy nhất cho cả hai loại dữ liệu
Mối liên kết dữ liệu phản ánh mối quan hệ mật thiết giữa hai loại thông tin Mối liên kết đảm bảo cho mỗi đối tượng bản đồ đều được gắn liền với các thông tin thuộc tính, phản ánh đúng hiện trạng và các điểm riêng biệt của đối tượng Đồng thời qua đó người sử dụng dễ dàng tra cứu, tìm kiếm và chọn lọc các đối tượng theo yêu cầu thông qua bộ xác định hay chỉ số Index Sự liên kết giữa các thành phần dữ liệu không gian và thuộc tính được thể hiện theo hình 1-20
1.3 THU THẬP DỮ LIỆU VÀ CẬP NHẬT DỮ LIỆU
1.3.1 Thu thập dữ liệu không gian
Các dữ liệu không gian thường ở dạng ảnh hàng không, ảnh vệ tinh, các loại
dữ liệu bản đồ và từ số liệu đo đạc ngoài thực địa Các loại ảnh chỉ đóng vai trò là
Trang 37các thông tin nguồn ở dạng raster để thành lập các loại bản đồ dạng vector hoặc raster- vector
1 Thu thập dữ liệu bằng đo đạc mặt đất
Các phương pháp đo đạc bản đồ số bằng thiết bị mặt đất hiện nay là các máy toàn đạc điện tử tự động (Electronic Totalstion) hoặc các thiết bị định vị vệ tinh (GPS)
Đo đạc bằng các máy toàn đạc điện tử dựa trên nguyên tắc truyền thống là việc đo toạ độ các điểm chi tiết thông qua chiều dài cạnh và góc bằng để tính góc phương vị từ một cạnh đã biết phương vị
Đo đạc bằng các thiết bị định vị vệ tinh được phát triển mạnh trong các thập
kỷ 90 này Các phương pháp GPS đo tĩnh đã giải quyết trọn vẹn vấn đề thành lập các lưới toạ độ-độ cao
Ngoài ra, các thông tin về bề mặt có thể được thu nhận nhanh chóng nhờ công nghệ Laser (LIDAR - Light Detection And Ranging) và Radar độ mở tổng hợp giao thoa (IFSAR - InterFerometric Synthetic Aperture Radar) Công nghệ LIDAR được áp dụng trên máy bay, còn công nghệ IFSAR được áp dụng trên máy bay, tầu
vũ trụ hay các vệ tinh
2 Thu thập dữ liệu từ ảnh hàng không và ảnh vệ tinh
Ngày nay, chúng ta có thể sử dụng phương pháp đo ảnh số để xây dựng cơ
sở dữ liệu bản đồ địa hình số tỷ lệ 1:50.000, 1:25.000, 1:10.000,1:5.000 và 1:2.000 trên cơ sở tư liệu ảnh hàng không và ảnh vệ tinh độ phân giải cao Còn các dữ liệu khác ở tỷ lệ nhỏ hơn, ta có thể thu thập từ các loại ảnh vệ tinh có độ phân giải thông thường Sau khi biên tập dữ liệu theo các chuẩn quy định, chúng ta sẽ thu nhận được các dữ liệu quản lý trong hệ thống
Hiện nay người ta đang ưa dùng thể loại dữ liệu bản đồ ở dạng Orthophotomap, tức là dạng để nguyên nền ảnh (Rater) và chỉ thành lập dạng vector một số lớp thông tin cần thiết Loại bản đồ này có ưu điểm là đạt tốc độ xử lý rất nhanh, cung cấp kịp thời các thông tin cần thiết
Trang 38Xu hướng phát triển hiện nay của công nghệ đo ảnh là nghiên cứu chế tạo các máy chụp ảnh số có độ phân giải cao, kích thước lớn để thu ngay ảnh số trong quá trình chụp ảnh
3 Đo đạc biển
Bản đồ địa hình đáy biển là một thành phần dữ liệu quan trọng trong các hệ thông tin địa lý môi trường biển Nhờ công nghệ định vị vệ tinh, nguời ta đã giải quyết hoàn chỉnh vấn đề định vị trên biển ở khoảng cách dà1 Các tàu đó cũng được trang bị các máy thu GPS, máy nhận tín hiệu vô tuyến từ trạm cố định và máy
đo sâu Các thiết bị này đều được nối với một máy tính làm nhiệm vụ thu nhận tín hiệu và dẫn đường Các tín hiệu thu nhận được sẽ chuyển ngay sang một máy tính khác làm nhiệm vụ thành lập bản đồ thông qua phần mềm tạo địa hình và số hoá các đối tượng địa lý theo các lớp thông tin
Công nghệ đo đạc mô tả trên phát huy tác dụng trong những vùng biển mà tàu đo có thể vào được Đối với vùng cận bờ, công nghệ này được thay thế bằng công nghệ tương tự với việc thay thế tàu đo bằng máy bay trực thăng và máy đo sâu theo nguyên tắc hồi âm bằng máy đo sâu Lazer Cụm thiết bị đo đạc này có giá thành cao hơn cụm trên tàu đo nhiều lần Ngoài ra, người ta có thể kết hợp công nghệ truyền thống với công nghệ hiện đại để đo vẽ vùng biển nông, gần bờ
4 Số hoá các loại bản đồ đang có giá trị sử dụng
Hiện nay chúng ta có rất nhiều các loại bản đồ được thành lập bằng công nghệ cổ truyền, chỉ có các bản gốc trên phim hoặc trên giấy Do đó, ta phải số hoá các bản đồ này để chuyển sang bản đồ số
Về nguyên lý, việc số hóa bản đồ được thực hiện bằng một trong hai giải pháp là số hoá bằng bàn số hoá (digitizer) và số hoá thông qua hệ thống máy quét (scanner) và phần mềm chuyên dụng Hiện nay, người ta chỉ sử dụng phương pháp
số hoá thứ ha1
Trang 391.3.2 Thu thập các dữ liệu thuộc tính
Các dữ liệu thuộc tính được thu thập theo một đường hoàn toàn khác, gắn liền với việc thực hiện các công tác điều tra cơ bản Các dữ liệu này nhận được theo các con đường sau:
• Tổ chức các đoàn điều tra thực địa để đánh giá một số tham số của các đối tượng địa lý, phương pháp này thường chỉ được dùng khi phải tập trung tìm hiểu và nghiên cứu một số tham số nào đó
• Lấy số liệu từ hệ thống mạng lưới tổ chức quản lý ngành, phương pháp này mang lại hiệu quả lớn đối với những ngành có chân rết ở các địa phương, đặc biệt
có hiệu quả khi bộ máy quản lý toàn ngành được nối với nhau bằng hệ thống mạng máy tính
• Lấy số liệu từ Tổng cục Thống kế và các cơ quan quản lý nhà nước tại các
cơ quan này, số liệu được tập hợp theo biểu mẫu qui định Các số liệu này là nguồn thông tin thuộc tính tin cậy
1.3.3 Cập nhật thông tin
Một cơ sở dữ liệu địa lý sẽ không có giá trị sử dụng nếu không tổ chức tốt việc cập nhật thông tin Việc cập nhật thông tin thường được thực hiện theo chu kỳ hoặc có thể theo nhiệm vụ đột xuất cần giải quyết ngay Việc cập nhật thông tin thường thực hiện đồng thời hoặc có thể riêng biệt giữa thông tin không gian và thông tin thuộc tính
Việc cập nhật các thông tin theo chu kỳ thường sử dụng các tư liệu ảnh hàng không và ảnh vệ tinh mới chụp Nói chung mô hình độ cao không thay đổi nhiều theo thời gian Thông tin cần cập nhật là các yếu tố không gian và một số yếu tố thuộc tính Người ta chỉ cần ghép các ảnh mới chụp lên bản đồ số trong cơ sở dữ liệu địa lý là xác định được và điều chỉnh lại các lớp thông tin theo đúng hiện trạng Cập nhật các thông tin thuộc tính có trình tự và con đường tương tự như thu thập thông tin
Trang 401.4 SIÊU DỮ LIỆU - METADATA
1.4.1 Khái niệm về metadata và metadata trong HTTĐL
Metadata hiện đang được dùng như một thuật ngữ riêng của cơ sở dữ liệu Ở
nước ta, thuật ngữ này thường được giữ nguyên trong các văn bản, tài liệu nghiên
cứu, đôi khi nó được dịch là dữ liệu của dữ liệu hoặc siêu dữ liệu Metadata được
hiểu là một loại dữ liệu mô tả nội dung, chất lượng, điều kiện và các thông tin khác
về dữ liệu trong một cơ sở dữ liệu Tuy nhiên, về cấu trúc và nội dung, metadata được nhìn nhận theo những quan điểm khác nhau
Trong các từ điển của các nhà tin học, metadata được định nghĩa như một dạng từ điển dữ liệu trợ giúp các nhà thiết kế hệ thống trong việc duy trì tính tương thích giữa các trình ứng dụng trong hệ thống Từ điển dữ liệu mô tả các thông tin về đường dẫn, vị trí, kiểu dữ liệu và các mô tả dữ liệu sẽ được sử dụng khi chạy các trình ứng dụng
Khi mở rộng phạm vi sử dụng của metadata ra khỏi các trình ứng dụng, metadata được sử dụng trước tiên cho mục đích tra cứu và tìm kiếm dữ liệu Khi đó metadata đơn giản là dữ liệu ở dạng văn bản chỉ dẫn cho biết các thông tin cơ bản
về dữ liệu trong cơ sở dữ liệu như dữ liệu do ai làm ra; dữ liệu gì, mục đích sử dụng
của dữ liệu (dựa trên một số tiêu chuẩn và yêu cầu cụ thể); dữ liệu được xây dựng
như thế nào (nguồn tài liệu và công nghệ); có thể sao chép dữ liệu ở đâu, ở dạng dữ liệu nào; và hướng dẫn sử dụng dữ liệu
Ngoài ra, Metadata bổ sung các thông tin giúp người sử dụng đánh giá và truy cập dữ liệu bao gồm thông tin về chất lượng, số lượng, cơ quan, tổ chức quản
lý dữ liệu, tính hiện thời, quy chế phân phối và tham khảo dữ liệu
Bên cạnh mục đích đáp ứng cho nhu cầu tra cứu, tìm kiếm thông tin, metadata còn được nhìn nhận như một công cụ quan trọng trợ giúp các nhà quản trị
cơ sở dữ liệu trong công tác quản lý, bảo trì và xây dựng dữ liệu trong cơ sở dữ liệu
Tóm lại, trên cả phương diện kỹ thuật và quản lý, metadata phải được xây dựng để đáp ứng yêu cầu của không những các nhà quản lý hệ thống, người sử dụng
dữ liệu, mà còn cả những nhà quản lý cơ sở dữ liệu Một cách đầy đủ và ngắn gọn,