Cơ sở dữ liệu Địa chất – Địa vật lý biển được tổ chức theo mô hình dữ liệu không gian hướng đối tượng của hệ thống thông tin địa lý (GIS), các dữ liệu được tích hợp t[r]
Trang 1XÂY DỰNG CẤU TRÚC CSDL ĐỊA CHẤT & ĐỊA VẬT LÝ BIỂN BẰNG PHẦN MỀM ARCGIS 9.3 TỪ CÁC KẾT QUẢ NGHIÊN CỨU, ĐIỀU TRA, KHẢO SÁT CỦA VIỆN ĐỊA CHẤT & ĐỊA VẬT LÝ BIỂN
Trịnh Hoài Thu
Email: hoaithu0609@hotmail.com, ththu@imgg.vast.vn
Viện Địa chất và Địa vật lý Biển - Viện Hàn lâm Khoa học và Công nghệ Việt Nam
Tóm tắt:
Bài viết này bước đầu nghiên cứu và đưa ra đề xuất về cấu trúc khung cơ sở dữ liệu Địa chất – Địa vật lý biển bằng phần mềm ArcGIS 9.3 trong khuôn khổ các đề tài, dự án đã được thực hiện tại Viện Địa chất – Địa vật lý biển Với mục đích đưa ra các cách thức tổ chức, lưu trữ dữ liệu không gian như bản đồ, số liệu không gian,… trên máy tính bằng phần mềm ArcGIS 9.3 nhằm đem lại hiệu quả tối ưu trong quá trình khai thác, sử dụng dữ liệu, phân tích dữ liệu phục vụ các công trình nghiên cứu trong viện Hơn thế nữa còn đảm bảo tính cập nhật mới, tính đồng bộ, khả năng tích hợp cao giữa các dữ liệu thuộc các bộ, các viện, ban ngành khác trên toàn quốc
1 Mở đầu
Công nghệ tin học là một bước tiến có tính đột phá của nhân loại, đánh dấu một thời
kỳ mới, một kỷ nguyên mới về sự phát triển của khoa học, kỹ thuật Công nghệ tin học ngày càng phát triển và được ứng dụng rộng rãi đối với hầu hết các ngành nghề và các lĩnh vực trong cuộc sống Ứng dụng công nghệ tin học cho nghiên cứu khoa học chuyên ngành Địa chất – Địa vật lý biển cũng là một lĩnh vực không nằm ngoài sự tác động đó Đối với công tác nghiên cứu khoa học thì công nghệ tin học là một công cụ đắc lực hỗ trợ cho các nghiên cứu, cũng như xây dựng các mô hình thử nghiệm
Cơ sở dữ liệu Địa chất – Địa vật lý biển là một hệ thống hợp nhất các dữ liệu của các ngành thuộc lĩnh vực biển và tài nguyên biển, thuộc phạm vi quản lý của Viện Hàn Lâm Khoa học và Công nghệ Việt Nam Cơ sở dữ liệu Địa chất – Địa vật lý biển được tổ chức theo mô hình dữ liệu không gian hướng đối tượng của hệ thống thông tin địa lý (GIS), các dữ liệu được tích hợp trên nền thành phần cơ bản là hạ tầng thông tin địa lý (VSDI), các chức năng cơ bản của hệ thống là cập nhật thông tin, quản lý, phân tích, trình bày và phân phối thông tin Địa chất – Địa vật lý biển nhằm phục vụ chính phủ và các cơ quan quản lý nhà nước và các tổ chức ở cấp trung ương; các viện, bộ, ngành; các nhu cầu sử dụng trong nghiên cứu khoa học
Cơ sở dữ liệu là đầu mối điện tử nhằm tập hợp các ngân hàng dữ liệu trong ngành và cung cấp
cơ chế để các đơn vị và cá nhân trong ngành trên phạm vi toàn quốc khai thác, sử dụng chung với nhiều mức truy nhập khác nhau Chính vì vậy, việc xây dựng dữ liệu cần phải tuân theo một trình tự nhất định nhằm đảm bảo tính hiệu quả cho người sử dụng
Tại Việt Nam, công nghệ GIS cũng được thí điểm khá sớm, và đến nay đã được ứng
Trang 2mới giới hạn ở các lĩnh vực lưu trữ, in ấn các tư liệu bản đồ bằng công nghệ GIS Các ứng dụng GIS thuộc lĩnh vực quản lý, điều hành, trợ giúp quyết định hầu như mới dừng ở mức thử nghiệm, còn cần thời gian và đầu tư mới có thể đưa vào ứng dụng chính thức Do đó việc đưa
ra một cấu trúc cơ sở dữ liệu về Địa chất – Địa vật lý biển dựa trên phần mềm ArcGIS 9.3 là rất cần thiết
2 Phương pháp xây dựng khung cơ sở dữ liệu Địa chất – Địa vật lý biển bằng phần mềm ArcGIS 9.3
Cơ sở dữ liệu Địa chất – Địa vật lý biển được xây dựng dựa trên nền tảng là các đề tài,
dự án đã được thực hiện tại Viện Địa chất – Địa vật lý biển, với tham vọng đưa ra một cấu trúc về dữ liệu có tính quy chuẩn cho toàn bộ dữ liệu thuộc viện, có đặc tính tương thích (có thể tích hợp, đồng bộ hóa) với hệ thống dữ liệu thuộc các bộ, ban ngành, mặt khác cơ sở dữ liệu phải đảm bảo được tính mở, tính cập nhật thường xuyên, tính phân tích và thực hiện được các bài toán Do đó, ArcGIS 9.3 là một phần mềm đáp ứng được tương đối tốt các yêu cầu mà
cơ sở dữ liệu đặt ra
Cơ sở dữ liệu Địa chất – địa vật lý biển bao gồm Siêu dữ liệu (Metadata) và dữ liệu thực đo, trong đó Siêu dữ liệu là thành phần giới thiệu các thông tin chung liên quan đến dự
án Các dữ liệu thực đo được phân tách thành hai loại là dữ liệu không gian và dữ liệu phi không gian
Dữ liệu không gian chứa đựng các thông tin về vị trí, hình dạng của các đối tượng: địa hình, địa mạo, địa chất, tài nguyên khoáng sản và năng lượng, trầm tích đáy, cấu trúc đệ tam, đẳng dày trầm tích Kainozoi, Đệ tứ, động đất, dị thường trọng lực Fai, dị thường trọng lực Bughe, dị thường từ, cấu trúc kiến tạo
Dữ liệu phi không gian (dữ liệu thuộc tính): diễn tả đặc tính, số lượng, mối quan hệ của các hình ảnh bản đồ với vị trí địa lý của chúng Các dữ liệu phi không gian tồn tại dưới các định dạng bảng biểu, gắn kết trực tiếp với các đối tượng không gian hoặc kết nối bằng một mã riêng cho từng đối tượng Do đó, một yêu cầu đối với mỗi đối tượng trong cơ sở dữ liệu là phải đảm bảo tính duy nhất về mã (ID) Các dữ liệu không gian phải được chuẩn hóa
và tuân thủ các quy luật về không gian
Cơ sở dữ liệu Địa chất - địa vật lý biển được xây dựng dựa trên nguyên tắc phân nhánh dữ liệu, các lớp dữ liệu (Feature class) cùng chung những đặc tính lớn sẽ được quản lý cùng một nhóm dữ liệu (Feature Dataset) Các nhóm dữ liệu sẽ được quản lý trong một kho
dữ liệu (Personal Geodatabase hoặc File Geodatabase) Đối với các dữ liệu phi không gian không gắn kết trực tiếp với các dữ liệu không gian thì ngoài việc lưu trữ dưới dạng bdf trong các kho dữ liệu (Personal Geodatabase hoặc File Geodatabase), thì các dữ liệu này cho phép tồn tại ở rất nhiều định dạng khác nhau như excel, word, image,… Với cách thức tổ chức dữ liệu này đảm bảo tính chặt chẽ, không trùng lặp dữ liệu và hiệu quả khai thác dữ liệu rất cao [5, 3]
Mô hình tổ chức dữ liệu trong cơ sở dữ liệu Địa chất – địa vật lý biển đươc thể hiện
trên (Hình 1)
Trang 3Hình 1 Mô hình tổ chức dữ liệu Địa chất & Địa vật lý biển
3 Khung cơ sở dữ liệu Địa chất – địa vật lý biển trên phần mềm ArcGIS
Với mỗi một cơ sở dữ liệu luôn tồn tại một siêu dữ liệu (Metadata) là thông tin mô tả
nội dung của cơ sở dữ liệu (CSDL) Metadata thông báo cho người dùng biết thời gian cập nhật sau cùng của dữ liệu, định dạng và mục đích sử dụng của nó Những thông tin này có thể hướng dẫn người dùng duyệt qua CSDL với mục đích giới thiệu, cung cấp các thông tin cơ bản Metadata của cơ sở dữ liệu Địa chất – Địa vật lý biển theo chuẩn metadata quy định là ISO 19115 sẽ bao gồm các nội dung sau: Tên tập dữ liệu; Phạm vi áp dụng của dự án; Cơ quan thực hiện dự án; Cơ quan ban hành; Hệ quy chiếu; Hệ tọa độ; Tọa độ địa lý; Quy định thể hiện cho những khu vực thành lập bản đồ tỷ lệ lớn; Quy định nguồn dữ liệu; Tài liệu sử dụng; Ngày công bố dữ liệu; Ngôn ngữ được sử dụng trong tập dữ liệu; Bảng mã kí tự sử
Trang 4độ chi tiết, mức độ đầy đủ của dữ liệu nền địa lý và dữ liệu địa chất – địa vật lý biển; Thông tin mô tả về mục đích sử dụng và hiện trạng của dữ liệu; Thông tin mô tả định dạng dữ liệu; Thông tin về phạm vi không gian và thời gian của dữ liệu; Thông tin về đơn vị xây dựng siêu
dữ liệu; Ngày lập siêu dữ liệu [6, 1]
Theo mô hình tổ chức dữ liệu như minh họa trên hình 1, dữ liệu Địa chất – Địa vật lý biển được tổ chức thành ba cấp:
Cấp 1: Geodatabase hay còn gọi là kho dữ liệu, chứa đựng đối tượng dữ liệu dạng không gian và thuộc tính của cơ sở dữ liệu Địa chất – Địa vật lý biển
Cấp 2: Feature dataset là nhóm lớp thông tin trong Geodatabase Đây là nhóm các đối tượng không gian có cùng chung một số thuộc tính có tính cơ bản tùy thuộc vào mục đích, chuyên môn của ngành Các đối tượng này là các dạng dữ liệu được đo đạc thực tế từ viện hoặc từ các đơn vị khác nhưng phục vụ cho công tác khai thác, nghiên cứu của viện nên sẽ được đưa ra các quy định chuẩn về thông tin nhằm phù hợp với mục đích của viện Căn cứ vào dữ liệu cũng như mục tiêu thực tế, các nhóm dữ liệu trong CSDL bao gồm 14 nhóm chính: Địa hình, Địa mạo, Địa chất, Tài nguyên khoáng sản và năng lượng, Trầm tích đáy, Cấu trúc đệ tam, Đẳng dày trầm tích Kainozoi, Đệ Tứ, Động đất, Dị thường trọng lực Fai, Dị thường trọng lực Bughe, Dị thường từ, Cấu trúc kiến tạo, Thông tin tư liệu
Cấp 3: Feature class là các lớp thông tin của từng loại đối tượng được chứa đựng trong các Feature dataset Mỗi lớp thông tin sẽ chứa đựng các thông tin thuộc tính của từng đối tượng Cụ thể:
Nhóm dữ liệu Địa hình gồm các lớp thông tin về đường đẳng sâu, điểm độ sâu, phân tầng độ sâu có các nội dung thông tin về mã loại, giá trị độ sâu, các thông tin mô tả khác Các lớp thông tin về các dạng địa hình đặc biệt, hệ thống đường bờ, lòng sông cổ, hướng dòng chảy có nội dung thông tin về mã loại, các thông tin về mô tả khác cho từng loại đối tượng
Nhóm dữ liệu Địa mạo gồm các lớp thông tin về địa hình thềm lục địa, địa hình sườn lục địa, địa hình chân lục địa, địa hình đáy biển thẳm và các đối tượng khác Mỗi lớp thông tin được quy định chặt chẽ về kiểu định dạng dữ liệu, các nội dung thuộc tính của từng lớp dựa theo thông tin thực tế của đối tượng
Nhóm dữ liệu Địa chất gồm các lớp thông tin về địa tầng, thành tạo magma, đứt gẫy
và các đối tượng khác
Nhóm dữ liệu Tài nguyên khoáng sản và năng lượng gồm các lớp thông tin về các khoáng sản, mỏ dầu, mỏ khí
Nhóm dữ liệu Trầm tích đáy gồm các lớp thông tin về trầm tích, góc cắm
Nhóm dữ liệu Cấu trúc Đệ Tam gồm các lớp thông tin về bể trầm tích Đệ Tam, mặt cắt cấu trúc tuyến, vị trí mặt cắt cấu trúc
Nhóm dữ liệu Đẳng dày trầm tích Kainozoi gồm các lớp thông tin về đẳng dày trầm tích Kainozoi, bể dày trầm tích Kainozoi
Trang 5Nhóm dữ liệu Đệ Tứ gồm các lớp thông tin về cấu trúc đệ tứ, phun trào Bazan Đệ Tứ, San hô Pliocen – Đệ Tứ, ranh giới địa chất, vị trí lấy mẫu tuổi tuyệt đối, đường cong dao động mực nước biển
Nhóm dữ liệu Động đất gồm các lớp thông tin về phân vùng động đất, yếu tố dạng điểm
Đối với nhóm dữ liệu Dị thường trọng lực Fai gồm các lớp thông tin về đường đẳng trị dị thường trọng lực Fai, phân tầng dị thường trọng lực Fai
Đối với nhóm dữ liệu Dị thường trọng lực Bughe gồm các lớp thông tin về đường đẳng trị dị thường trọng lực Bughe, phân tầng dị thường trọng lực Bughe
Nhóm dữ liệu Dị thường từ gồm các lớp thông tin về phân tầng dị thường từ, dị thường từ
Nhóm dữ liệu Cấu trúc kiến tạo gồm các lớp thông tin về phân vùng các kiểu vỏ, phân vùng kiến tạo, các pha kiến tạo
Nhóm dữ liệu Metadata gồm các lớp thông tin về tư liệu ảnh Viễn Thám, tư liệu ảnh khác, tư liệu bản đồ, tư liệu khác
Đối với mỗi lớp thông tin được quy định bởi định dạng dữ liệu tùy thuộc vào đặc điểm
đồ hình của đối tượng hoặc theo quy định cũng như tiêu chí của ngành là điểm, đường, vùng hay text Ví dụ như lớp thông tin về đứt gãy, các đường đẳng trị trọng lực, đường đẳng sâu, có định dạng dữ liệu là đường; các lớp thông tin về phân tầng dị thường, phân vùng kiến tạo có định dạng dữ liệu là vùng; các điểm độ sâu, góc cắm có định dạng dữ liệu là điểm
4 Cấu trúc các lớp thông tin trong cơ sở dữ liệu Địa chất – Địa vật lý biển
Mỗi lớp thông tin trong cơ sở dữ liệu Địa chất – Địa vật lý biển chứa đựng các nội dung thông tin đặc trưng cho các đối tượng hay còn gọi là thông tin thuộc tính Việc xây dựng các thông tin thuộc tính được quy định theo một quy chuẩn nhất định, được chi tiết hóa bằng các trường thông tin Mỗi trường thông tin này cũng phải tuân theo quy tắc cụ thể về kiểu dữ liệu (Text, Interger, Double, Float, Date, ) độ dài trường tùy thuộc thông tin thuộc tính từng loại đối tượng
Ví dụ cấu trúc một bảng thuộc tính của lớp thông tin đường đẳng sâu thuộc nhóm địa hình
như Bảng 1 dưới đây:
Bảng 1: Thông tin thuộc tính cơ sở dữ liệu Địa chất – Địa vật lý biển
Thông tin thuộc tính
Kiểu dữ liệu
Trang 65 Giới thiệu về phần mềm ArcGIS 9.3 với các chức năng quản lý và phân tích dữ liệu
Với ưu thế hơn hẳn các phần mềm quản lý dữ liệu khác, ngoài khả năng quản lý và lưu trữ dữ liệu không gian, phi không gian bằng modul ArcCatalog, ArcGIS 9.3 còn có modul ArcToolbox hỗ trợ trực tiếp cho quá trình tìm kiếm, phân tích, thống kê dữ liệu, kết nối dữ liệu không gian với dữ liệu phi không gian Dưới đây là một số minh họa về khung CSDL Địa
chất – Địa vật lý biển trên phần mềm ArcGIS 9.3 (Hình 2 - Hình 6) [2]
Hình 2 Siêu dữ liệu (Metadata)
Hình 3 Cấu trúc các nhóm lớp thông tin quản lý trong cơ sở dữ liệu
Trang 7Hình 4 Cấu trúc các lớp thông tin trong nhóm lớp thông tin cơ sở dữ liệu
Hình 5 Cấu trúc bảng thông tin thuộc tính của 1 lớp thông tin