CHƯƠNG 4 HỆ THỐNG THÔNG TIN MÔI TRƯỜNG
4.5 Cơ cấu tổ chức của HTTTMT
4.5.2 Quản lý hệ CSDL không gian (CSDLKG)
Quản lý hệ CSDLKG bao gồm quản trị dữ liệu và phân phối dữ liệu (Hình 4.2).
4.5.2.1 Quản trị CSDL không gian
Quản trị CSDL bao gồm các việc như lưu trữ (storage), bảo trì (maintenance), cập nhật (update), dự phòng (bakup) CSDL hàng ngày.
Lưu trữ CSDL
Hiện nay, dữ liệu khụng gian cú thể ủược lưu trữ với nhiều ủịnh dạng khỏc nhau bằng cỏch sử dụng phần mềm ESRI. 5 ủịnh dạng lưu trữ ủược liệt kờ dưới ủõy:
70
a. Thư viện ngôn ngữ ARC/INFO (ARC/INFO librarian): Nếu hệ CSDL không gian một cỏch luận lý (logically) ủược quản lý theo tập cỏc lớp bản ủồ, thư viện ngụn ngữ ARC/INFO cú thể ủược sử dụng ủể thực hiện vật lý cỏc hệ thống này như một thư viện bản ủồ. Thư viện ngụn ngữ ARC/INFO quản lý một phạm vi rộng lớn bằng cỏch chia nú ra thành cỏc lỏt (tiles) khỏc nhau. Từng lỏt dữ liệu ủược thể hiện như một workspace (khụng gian làm việc) trong ủú chứa tất cả thụng tin dữ liệu của một phạm vi khụng gian cho trước. Thư viện ngụn ngữ ARC/INFO là một thư viện bản ủồ cú tớnh tương tỏc, nú cú cơ chế theo dừi xem người dựng nào ủang làm việc với lớp bản ủồ nào vỡ thế 2 người dựng sẽ khụng làm nhiễu lẫn nhau trong suốt quá trình hiệu chỉnh dữ liệu. Nó cũng có thể theo dõi lịch sử thông tin ( nghĩa là nú lưu lại cỏc thụng tin ai là người hiệu chỉnh lớp bản ủồ nào tuy nhiờn lại khụng lưu lại thụng tin mụ tả sự thay ủổi ủú diễn ra theo cỏc bước nào).
b. ArcStorm: Nếu cụng việc quản lý dữ liệu cú những ủặc ủiểm riờng hay nếu sự giải quyết phức tạp kộo theo những bảng phức tạp, khi ủú cỏc ủặc trưng phải ủược quản lý bằng một cách phù hợp và hệ CSDL ArcStorm là một sự lựa chọn phù hợp. ArcStorm cho phép nhiều người sử dụng có thể làm việc trên cùng một thông tin hay bảng trong cùng một thời ủiểm nhưng khụng cựng ủặc trưng hay hàng. ArcStorm cũn hỗ trợ ủầy ủủ sự thay ủổi cỏc rónh. Tư liệu liờn quan tới sự thay ủổi (biến ủổi) cú thể ủược lưu trữ và sử dụng ủể hạ giỏ cỏc CSDL hay tạo ra cỏc hiển thị sự thay ủổi của dữ liệu.
c. Cỗ máy CSDL không gian (Spatial Database Engine - SDE)
Nếu hệ CSDL chứa ủựng hàng triệu ủối tượng và chỳng ủũi hỏi mụi trường CSDL quan hệ tiêu chuẩn chạy trên máy chủ, còn gọi là cấu trúc xử lý khách hàng/máy chủ (client/server), khi ủú hệ thống SDE là một sự lựa chọn phự hợp. SDE là một tập cỏc truy vấn dữ liệu và cỏc cụng cụ xử lý ủịa lý cho phộp tiếp cận cỏc mức ủộ lập trỡnh cỏc ứng dụng ủịa lý. Mụ hỡnh dữ liệu là hướng ủối tượng, cú nghĩa là cỏc dữ liệu hỡnh học và cỏc dữ liệu thuộc tớnh gắn liền với cỏc ủối tượng khụng gian (vớ dụ một khoảnh ủất) ủược lưu trữ chung với nhau và chỉ cần một lần truy xuất ủĩa lưu trữ ủể truy xuất dữ liệu. Cỏc ủối tượng khụng gian ủược lưu trữ trong một hệ CSDL liờn tục. Trong nhiều khớa cạnh, SDE lựa chọn sỏng giỏ cho cỏc server dữ liệu trong hệ thống Internet bởi vỡ nú cú một số ưu ủiểm sau:
- Khả năng xử lý cỏc ủối tượng ủịa lý cao
- Là một hệ thống mạng mỏy chủ/khỏch ủớch thực
- Cú ủược tất cả ưu ủiểm của hệ thống quản lý hệ CSDL (sao lưu, phục hồi, khả năng làm việc mạng, các công cụ v.v…)
- Hộ trợ xử lý ủa kờnh, ủa xử lý
- Giao diện cỏc ứng dụng ủược mở cho sự giao tiếp với lập trỡnh viờn - Các máy khách GIS với khả năng kết nối internet
- Hỗ trợ nhiều người dựng ủọc hoặc ghi dữ liệu cựng lỳc
SDE khụng cú giao diện ủồ họa người dựng. Khả năng lập trỡnh và sử dụng thành thạo lập trình giao diện C (API) là những yêu cầu bắt buộc khi sử dụng SDE.
71
Hỡnh 4.4. Sơ ủồ dũng thụng tin trong bước quản lý CSDL khụng gian
d. Vùng làm việc (Workspace): Nếu hệ CSDL chỉ một cách giới hạn các lớp không gian với một phạm vi cú thể quản lý, khụng yờu cầu cỏc truy vấn SQL, hỗ trợ ủa người dựng và theo dừi lịch sử thụng tin, khi ủú hệ thống quản lý CSDL khụng gian theo vựng làm việc là một sự lựa hiệu quả. Vùng lựa chọn là một thư mục có thể chứa các lớp, lưới và các file INFO. Nó cũng có thể chứa các lọai file và thư mục khác. Các file INFO không có các ưu ủiểm như ủó kể trờn nhưng cung cấp một mụi trường phõn tớch dữ liệu rất dễ dàng và mạnh mẽ. ARC/INFO cung cấp cỏc cụng cụ ủể chuyển ủổi cỏc bảng giữa cỏc ủịnh dạng INFO, SQL và dBASE.
e. Hệ thống quản lý CSDL quan hệ ngoại vi: cũng cú thể ủược chọn ủể chứa cỏc bảng. Các bảng có thể truy nhập bằng cách sử dụng tích phân hệ CSDL (DATABASE INTEGRATOR), hệ CSDL ArcStorm hoặc thụng qua ArcView. Một trong những lớ do ủể chọn hệ thống quản lý CSDL quan hệ ngoại là vỡ một lượng lớn dữ liệu và bảng ủang ủược lưu trữ trong các hệ CSDL quan hệ ngoại vi và các thông tin không gian không phải là trung tõm của hệ CSDL. Trong trường hợp này, cỏc cõu lệnh truy vấn cú thể ủược thực thi trong hệ CSDL quan hệ ngoại vi ủể thu nhận cỏc tập hợp con của dữ liệu và phần mềm GIS cú thể ủược sử dụng như cụng cụ phõn tớch.
Bảo dưỡng hệ CSDL
Hoạt ủộng bảo dưỡng CSDL hàng ngày cú liờn quan ủến việc cập nhật CSDL và sao lưu. ðể thiết kế một hệ CSDL cú tổ chức tốt, phự hợp và cú chất lượng cao ủũi hỏi một nổ lực rất lớn. Nỗ lực bỏ ra ủể giữ cho nú cú ủộ chớnh xỏc và tớnh cập nhật cao cũng khụng hề ớt. Một lịch trỡnh cập nhật thớch hợp cần ủược xõy dựng tương ứng cho từng lọai dữ liệu. Nhiều họat ủộng và mẫu mụi trường cần ủược cập nhật hàng ngày; một số khỏc cần cập nhật hàng tuẩn, hàng thỏng hoặc ủịnh kỳ hàng năm. Cỏc dữ liệu vựng ủịa lý cú thể khụng cần phải cập nhật thường xuyờn như cỏc họat ủộng và mẫu mụi trường, tuy nhiờn, người quản trị dữ liệu cần
72
phải nỗ lực giữ cho dữ liệu trong cỏc trạng thỏi cú thể chấp nhận ủược bằng cỏch cộng tỏc với cỏc nhà cung cấp, kiểm tra ủầu vào, ủầu ra và thực hiện cỏc phộp kiểm tra.
Sao lưu dữ liệu là một trong những nhiệm vụ cốt yếu của người quản trị hệ CSDL.
Một lịch trỡnh sao lưu thường xuyờn cần phải ủược xõy dựng và phỏt triển. Sao lưu bảo ủảm cho dữ liệu ủược toàn vẹn trong trường hợp hệ thống gặp sự cố và bảo vệ cỏc CSDL GIS trong trường hợp chỳng bị xúa một cỏch tỡnh cờ. Mức ủộ an toàn của hệ thống cũng cú thể bị phỏ vỡ bởi cỏc thiờn tai như hỏa họan, lũ lụt, ủộng ủất và bóo. Nhiều cụng ty cho phộp thực hiện sao lưu ngoại tuyến off-site trong ủú cỏc tổ chức trả chi phớ cho sự an tũan của hệ CSDL GIS. Những cụng ty này cú hệ thống an ninh riờng và ủược xõy dựng ủể chống lại cỏc thiờn tai.
4.5.2.2 Phân phối hệ CSDLKG
Tính hiệu quả của hệ CSDLKG hoàn toàn tùy thuộc vào khả năng truy cập vào hệ CSDL, ủược ủịnh nghĩa theo cỏc tiờu chớ sau:
- Phạm vi phõn phối: Cú bao nhiờu người cú khả năng truy cập ủược dữ liệu ?
- ðịnh dạng phân phối CSDL – theo yêu cầu nào thì người dùng nào có thể truy nhập ủược vào hệ CSDL ?
- Tớnh dễ sử dụng - Việc truy xuất dữ liệu ủược thực hiện với tốc ủộ nhanh bao nhiờu ? Mức ủộ dễ dàng trong việc truy vấn hoặc tỡm kiếm dữ liệu ? Dữ liệu cần dung lượng lưu trữ bao nhiêu ?
- Mức ủộ cập nhật của dữ liệu - Hệ CSDL ủược cập nhật thường xuyờn như thế nào?
Cú nhiều lựa chọn ủể phõn phối CSDLKG ủến người dựng ủầu cuối. Cỏc phương thức thường dựng ủược liệt kờ dưới ủõy:
- Hệ CSDL trực tuyến.
- CD-Rom
- Mạng internet/intranet CSDL trực tuyến:
Một hệ CSDL trực tuyến có phạm vi phân phối giới hạn. Khiếm khuyết chủ yếu của nú là chỉ cú người dựng ủược cấp quyền truy nhập mạng mới cú thể truy xuất dữ liệu. Một khuyết ủiểm khỏc là sự hoạt ủộng phụ thuộc vào sự truy nhập thụng qua cỏc mạng phạm vi rộng (WAN) và mạng nội bộ (LAN) ủến hệ CSDL trung tõm. Sự truy nhập vào hệ CSDL bị cắt ủứt khi kết nối mạng từ mỏy chủ và mỏy khỏch gặp sự cố.
Phân phối dữ liệu trên hệ CSDL trực tuyến còn bị giới hạn về băng thông mạng. Các dự liệu không gian thường có dung lượng rất lớn. Việc tải các dữ liệu theo yêu cầu diễn ra chậm chạp sẽ làm chậm quá trình xử lý và gây khó khăn cho việc sử dụng dữ liệu. Trường hợp này khụng phải là vấn ủề lớn ủối với những người dựng sử dụng mạng LAN. Mạng LAN cung cấp kết nối băng thông rộng trong khảng cách ngắn, trong khi mạng WAN lại cung cấp băng thông hẹp tên một khoảng cách xa. Vì thế, việc truy xuất dữ liệu bằng mạng LAN có thể nhanh hơn so với việc sử dụng mạng WAN và mạng intrnet nhưng chậm hơn việc truy xuất dữ liệu trực tiếp từ ổ cứng.
73
Ưu ủiểm chớnh yếu của hệ CSDL trực tuyến là tất cả cỏc dữ liệu cú thể quản lý trong mụi trường ủơn lẻ (single environment). Dữ liệu cú thể dễ dàng cập nhật và sao lưu. Hệ CSDL trực tuyến ủặc biệt hữu dụng ủể quản lý một hệ CSDL rộng lớn, trong ủú dữ liệu dú thể ủến mức gigabyte hoặc tetrabyte. Chỉ cần bảo dưỡng một bản sao dữ liệu duy nhất. Cỏc người dựng chỉ truy xuất cỏc tập dữ liệu con cho cỏc ứng dụng ủơn lẻ. Vỡ thế tiết kiệm dung lượng chứa và bảo tũan ủược dữ liệu. Một ưu ủiểm khỏc là nếu hệ CSDLKG ủược lưu trữ trực tiếp trong một hệ CSDL quan hệ ủược ủịnh nghĩa rừ ràng, khi ủú cỏc tỡm kiếm và truy vấn ủược cho phép theo topo. ðiều này cung cấp dịch vụ truy cập dữ liệu không gian nhanh hơn và sự chồng lớp khụng gian ủộng hơn trờn hệ CSDL.
Xõy dựng hệ CSDLKG trực tuyến ủũi hỏi cỏc thiết kế, xõy dựng và bảo dưỡng rất phức tạp. Chi phí bỏ ra cho phần cứng và phần mềm tùy thuộc hoàn toàn vào kích kỡ của hệ CSDLKG.
Hệ CSDLKG trực tuyến thường ủược cập nhật và bảo dưỡng hàng ngày bởi người quản trị dữ liệu. Nó cung cấp các dữ liệu chính xác và cập nhật nhất.
CD-ROM
CD-ROM là dạng phân phối cơ sở dữ liệu rất phổ biến khác. Công nghệ xuất bản CD-ROM bắt ủầu tăng nhanh từ những năm 1990. Nú ủó trở thành tiờu chuẩn cho việc xuất phần mềm và dữ liệu. Kỹ thuật chớnh CD-ROM với giỏ thành thấp ủó làm cho việc xuất dữ liệu trờn CD-ROM ủược thực hiện ở hầu hết cỏc cơ quan. Hàng triệu ổ CD-ROM lắp vào mỏy tớnh và ủược thực hiện theo tiờu chuẩn ISO 9660, ủiều này làm dữ liệu CD-Rom phõn phát một cách an toàn và có sự chọn lựa. Với dung lượng 600 MB và giá thành thấp cho mỗi ủĩa CD-ROM là sự lựa chọn lý tưởng ủể phõn phối bộ dữ liệu lớn cho bạn ủọc.
Thuận lợi ủầu tiờn của CD-ROMs như một lựa chọn của sự phõn phối cơ sở dữ liệu khụng gian là tốc ủộ cao của ủường dẫn vào dữ liệu. Những bộ dữ liệu ủồ họa lớn cần ủược truy cập và lấy ra trực tiếp từ bộ phận ủĩa khụng gian mà khụng cú bất kỳ sự can thiệp của sự thực hiện mạng lưới ( hệ thống ). Bất lợi ủầu tiờn của dữ liệu trờn CD-ROM là chỳng khụng ủược cập nhật dữ liệu mới nhất. Hơn nữa, CD-ROM cú thể ủắt tiền và tiờu tốn nhiều thời gian.
CD-ROM thường thớch hợp hơn cho bộ dữ liệu ủịa lý ủịa phương bởi vỡ nhu cầu cập nhật dữ liệu của họ không nhiều. Nếu CD-ROM là một sự lựa chọn phân phối cho cơ sở dữ liệu không gian thì tốt nhất hãy dành cho mối liên hệ dữ liệu không gian tĩnh, giá thành CD – ROM rẻ hơn hệ thống mạng. Những kờnh mạng cú thể ủược giữ lại cho những trường hợp khẩn cấp hơn và khi nhu cầu cập nhật dữ liệu thường xuyên hơn. Sự kết hợp của CD- ROM cho cơ sở thụng tin tĩnh và Internet cho nhiều thụng tin ủược cập nhật và hợp thời ủược xem là một xu hướng trong tương lai.
Internet/ Intranet
Thuật ngữ Internet thỡ thường ủược sử dụng cho hệ thống mạng toàn cầu. Thuật ngữ Intranet thường ủược ứng dụng cho hệ thống mạng nội bộ sử dụng kỹ thuật Internet chuẩn.
Một Intranet thỡ thường ủược tỏch từ Internet bởi một bức tường lửa ( một thiết bị ủiện tử ủể lọc mạng giao thông).
Internet là hệ thống mạng lớn nhất thế giới, nú ủược thống nhất bởi sự sử dụng chung bằng phương thức Internet (Internet Protocol - IP). Chuẩn truyền thông này cho phép những phần cứng khụng ủồng nhất truyền thụng ủạt cú hiệu quả trong một mụi trường chung
74
ủú là mở rộng, khụng ủắt tiền, dễ sử dụng, hỗ trợ nhiều kờnh truyền thụng (ủồ thị, video, và âm thanh) và cung cấp khả năng siêu liên kết.
Trong phạm vi của GIS, Internet có nhiều tiềm năng sử dụng như là việc công bố dữ liệu, bán và phân phối sản phẩm, và những dịch vụ GIS.
Internet/ Intranet như là một lựa chọn phân phối cơ sở dữ liệu tĩnh. Cách lựa chọn này nhiều thuận nhất là có phạm vị phân phối rất rộng lớn. Càng ngày càng có nhiều cơ quan chớnh phủ và những nhà cung cấp dữ liệu khỏc ủang xuất dữ liệu phạm vi chung của họ lờn Internet/Intranet. Nếu như trước ủõy ủể nhận ủược những dữ liệu này, cần nhiều thỏng ủể xử lý với giá thành rất cao. Với “Với xa lộ siêu thông tin – Internet”, chỉ cần nhấp chuột ngay tức khắc và dữ liệu thì miễn phí.
Giải pháp này không chỉ cung cấp dữ liệu nhanh chóng và miễn phí mà còn cung cấp dữ liệu ủược cập nhật mới hơn. Với một hệ thống quản lý cơ sở dữ liệu liờn hệ giao diện tốt, Internet/ Intranet cú thể cung cấp ngay cả dữ liệu tĩnh mà ủược cập nhật hằng ngày hoặc dữ liệu thường thay ủổi.
Hơn nữa, giải pháp Internet/ Intranet không chỉ phân phối trực tuyến dữ liệu tĩnh mà cũn cần thiết ủể phõn phối trực tuyến GIS. Theo ESRI, giải phỏp Internet cho GIS cần tuõn thủ những yêu cầu sau ( ESRI White Paper Series, 1997b):
- Cụng cụ chuẩn ủơn giản và nền ủộc lập: Dữ liệu GIS và xử lý chỳng cần ủược thực hiện bằng cách sử dụng các browser chuẩn tiến trình và dữ liệu GIS nên dùng lướt qua tiêu chuẩn và kỹ thuật phụ và tự do của hỗn hợp phần cứng môi trường.
- ðộng lực và lối vào dữ liệu an toàn: người sử dụng nên có lối vào dữ liệu tương tác và xuất bản ủồ chớnh xỏc. Bởi người sử dụng tỏch từ cơ sở dữ liệu, trọn vẹn và cẩn thận cú thể ủược duy trỡ dễ dàng.
- Bản ủồ phong phỳ và khả năng GIS: trung tõm sử dụng mà cú những cụng cụ tinh vi cho hiển thị, nghi vấn và phân tích có thể giữ và tiến trình dữ liệu
- ðủ loại dữ liệu: cả trường quột và hướng dữ liệu nờn ủược ủng hộ trong ứng dụng Internet. Tất cả loại dữ liệu này ủược sử dụng cho tiến trỡnh ủịa lý, nhưng trường dữ liệu cú thể ủược dựng ủể trỡnh bày một bản ủồ trường mà giống như một bản ủồ thật.
ðiều không thuận lợi chính của giải pháp Internet/Intranet là sự phục thuộc nặng nề vào khả năng của hệ thống. Thất bại của hệ thống có thể chấm dứt hoàn tất tiến trình cơ sở dữ liệu. Sự chuyển ủộng mạnh trờn Internet cũng cú thể làm giảm tiến trỡnh dữ liệu và làm cho nú khú sử dụng, ủặc biệt là những tập tin GIS lớn.