Hiện nay, có rất nhiều định nghĩa về hệ thông tin địa lý được sứ dụng, ví dụ: Viện nghiên cứu Hệ thống Môi trường ESRI cúa Mỹ định nghĩa “Hệ thông tin địa lý là một tập hợp có tổ chức b
Trang 13.1 TỔNG QUAN VÈ HỆ THÔNG TIN ĐỊA LÝ
3.1.1 Khái niệm vê hệ thông tin địa lý
Hệ thông tin địa lý (HTTĐL) - Geographycal Information System (GIS) là hệ thống quản lý thông tin không gian địa lý được phát triển dựa trên cơ sở công nghệ máy tính và tin học với mục đích lun trữ, hợp nhất, mô hình hóa, phân tích, dự báo và trình bày được nhiều dạng dữ liệu.
Hiện nay, có rất nhiều định nghĩa về hệ thông tin địa lý được sứ dụng,
ví dụ: Viện nghiên cứu Hệ thống Môi trường ESRI cúa Mỹ định nghĩa “Hệ thông tin địa lý là một tập hợp có tổ chức bao gồm phần cứng, phần mềm máy tính, dữ liệu địa lý và con người, được thiết kế nhằm mục đích nắm bắt, lưu trữ, cập nhật, điều khiển, phân tích và kết xuất’'; hoặc “Hệ thông tin địa
lý là một hệ thống quản trị cơ sở dữ liệu bằng máv tính để thu thập, lưu trữ, phân tích và hiển thị không gian” (National Center for Geographic Information and Analysis, 1988)
Chúng ta có thể định nghĩa Hệ thông tin địa lý l à m ộ t h ệ th ố n g th ô n g tin c ó k h á n ă n g th u th ậ p , c ậ p n h ậ t , q u á n t r ị v à p h â n t í c h , b i ê u d ìề r t d ừ liệ u
đ ịa l ý p h ụ c v ụ g i a i q u y ế t c á c b à i to á n ứ n g d ụ n g c ó liê n q u a n t ớ i v ị t r í đ ị a l ý trên , t r o n g v à n g o à i b ề m ặ t t r á i đ ấ t hoặc được định nghĩa như là m ộ t h ệ
th ố n g th ô n g tin v ớ i k h a n ă n g t r u y n h ậ p , tìm k iế m , x ư lý, p h â n t í c h v à t r u y
x u ấ t d ữ liệ u đ ị a l ý n h ằ m h ỗ t r ợ c h o c ô n g t á c q u a n lý, q u y h o ạ c h v à q u a n t à i
n g u y ê n th iê n n h iê n & m ô i tr ư ờ n g
Công nghệ hệ thông tin địa lý kết hợp các thao tác cơ sở dừ liệu thông thường (như cấu trúc hỏi đáp) và cho phép phân tích thốno kê phân tích địa
lý, trong đó phép phân tích địa lý và hình ảnh được cung cấp duy nhất từ các bản đồ Những khả năng này phân biệt hệ thông tin địa lý với các hệ thống
Trang 2Hình 3.1 Mô phỏng hệ thông tin địa lý
Tại sao p líả ỉ s ử dụn g H ệ thôn g tin địa lý? Hệ thống phần mềm trong
hệ thông tin địa lý có thể kết nối thông tin về vị trí địa lý của sự vật với những thông tin về bản thân sự vật Khác với bản đồ trên giấy, hệ thông tin địa lý có thể tổ hợp nhiều lớp thông tin, mồi loại thông tin trên bản đồ có thể
bố trí trên một lớp riêng (Hình 3.2), người sứ dụng có thể bật hoặc tắt các lớp thông tin theo nhu cầu của mình Ví dụ một lớp có thể gồm các con đường trong một khu vực, lớp khác có thể chứa các hồ trên khu vực đó, lớp khác lại chứa tất cả các thành phố
Điểm mạnh của hệ thông tin địa lý so với bản đồ giấy chính là khả năng cập nhật dữ liệu nhanh và cho phép thực hiện các phép phân tích không gian và chọn những thông tin cần theo mục đích sừ dụng Một doanh nhân lập bản đồ các khách hàng trong một thành phố sẽ cần xem những thông tin về khách hàng sống trong các khu vực dân cư, làm việc trong các công sở, trường học nhưng với một kỳ sư cấp nước lại cần các thông tin
về mạng đường ống nước trong thành phố và nhu cầu sử dụng nước Cả hai
có thể bắt đầu từ cùng một bản đồ chung, là bán đồ đường phố và vùng lân cận của thành phố nhưng thông tin mà họ bô xung thêm sẽ khác nhau.
Trang 3phương để báo cáo về việc nước sông có mùi lạ Chính quyền địa phương có thể sử dụng hệ thông tin địa lý để kết hợp các thông tin về các khu công nghiệp trong huyện tỉnh với thông tin về vị trí của tất cả các sông, suối trên địa bàn Biện pháp đầu tiên có thể là xác định tất cả các khu công nghiệp nằm gần con sông đó hay những con suối chảy ra sông đó Nếu mẫu nước được xét nghiệm và chất gây ô nhiễm được phát hiện thì chính quyền địa phương có thể sử dụng hệ thông tin địa lý để tìm tất cả các khu công nghiệp trên địa bàn có sử dụng chất gây ô nhiễm đó trong sản xuất.
Hình 3.2 Các lóp thông tin trong hệ thống Với mục đích quy hoạch, có thể dùng hệ thông tin địa lý để xác định các cơ sở công nghiệp không tuân thủ tiêu chuẩn Việt Nam về nước thải Các khu công nghiệp này sẽ là mục tiêu đầu tiên trong kế hoạch giám sát tác động môi trường sắp tới Bằng cách đó, chính quyền địa phương có thể lập bản đồ tất cả các khu công nghiệp đã tuân thủ các tiêu chuẩn môi trường và tất cả các khu công nghiệp cần có hành động đế cải thiện điều kiện môi
Trang 4lý lại là một lợi thế.
v ề tổng quát, sự phát triển của công nghệ thông tin đã dẫn đến sự phát triển song song tự động hóa công tác thu thập dữ liệu, phân tích dữ liệu, trình bày dữ liệu trong nhiều lĩnh vực như trắc địa bản đồ, địa chất, quy hoạch phát triển, môi trường Do có nhiều công việc phải xử lý các thông tin liên quan và phối hợp trong nhiều chuyên ngành khác nhau nên cần phải
có hệ thống quản lý, liên kết các dữ liệu từ nhiều nguồn vào khác nhau như bản đồ, ảnh hàng không, ảnh vệ tinh, các số liệu quan trắc, điều tra, Hay nói cách khác là cần phải phát triển một hệ thống các công cụ để thu thập, tìm kiếm, biến đổi, phân tích và hiển thị các dữ liệu không gian từ thế giới thực nhằm phục vụ thực hiện những mục đích cụ thể Tập hợp các công cụ trên đã tạo lập ra hệ thông tin địa lý, đó là hệ thống thể hiện các đối tượng từ thế giới thực thông qua các dữ liệu cơ bản:
- Vị trí của các đối tượng thông qua một hệ tọa độ;
- Các thuộc tính của các đối tượng;
- Quan hệ không gian giữa các đối tượng.
Như vậy, nhờ hệ thông tin địa lý, người sử dụng có thể truy vấn thông qua một số dạng câu hỏi để hệ thống có thể trà lời được là:
+ Có cái gì tại vị trí này?
+ Mối quan hệ giữa các.đối tượng như thế nào?
+ Ở đâu thỏa mãn những điều kiện này?
+ Cái gì đã thay đổi và thay đổi như thế nào từ thời điếm này đến thời điểm khác?
+ Những mẫu không gian nào tồn tại?
+ N ó sẽ như thế nào nếu quá trình diễn ra?
+
Từ đó ta thấy rằng, hệ thông tin địa lý có các chức năng cơ ban được
mô phỏng theo hình 3.3.
Trang 5Sắp xếp dữ liệu Quản lý CSDL
* Thao tác xử lý: Nhằm mục đích đưa các dữ liệu dưới dạng các tập tin sao cho máy tính có thể dễ dàng sử dụng.
* Sắp xếp dữ liệu: Là cách lựa chọn các thông tin dựa trên một tiêu chuẩn hoặc chủ đề nào đó.
* Biểu diễn: Là thực hiện việc biếu diễn các dữ liệu bằng các biểu đồ, bản đồ, các bảng biểu của một đối tượng địa lý.
* Quản lý cơ sở dữ liệu: Là việc sắp xếp quản lý các dữ liệu phức tạp sao cho việc truy cập, kết nối dễ dàng, lưu trữ và bảo quản dữ liệu bảo đảm cho hệ thống luôn hoạt động.
* Phân tích không gian: Phân tích không gian là quá trình thực hiện một trong các loạt thao tác như truy vấn tọa độ địa lý, truy vấn dừ liệu đặc tính (truy vấn phi không gian) hay thao tác dừ liệu mới từ dừ liệu ban đầu
Trang 6- Mối quan hệ không gian giữa các đối tượng địa lý.
Kết quả phân tích không gian có thể được thể hiện thông qua các bản
đồ, đồ thị, các báo cáo hoặc tất cả sản phẩm.
Như vậy, hệ thông tin địa lý khác với các hệ thống thông tin khác, đó
là nó chủ yếu mô tả việc nghiên cứu và sự tồn tại của các thực thể không gian và mối quan hệ giữa chúng Thuật ngữ "Địa lý" ở đây thực tế là đồng nghĩa với thuật ngữ “không gian”.
Cấu thành cơ bản của hệ thông tin địa lý bao gồm hệ thống xừ lý hay
có thể gọi là hệ thống máy tính gồm phần cứng và phần mềm, cơ sở dữ liệu, đội ngũ cán bộ kỹ thuật và phương thức tổ chức.
Hệ thông tin địa lý là một khoa học liên ngành, nó liên quan đến rất nhiều chuyên ngành thuộc Khoa học trái đất như Địa lý học, Kỹ thuật Trắc địa-Bản đồ, Đ o ảnh và Viễn thám, Kỳ thuật Địa chất, ; Toán học, Công nghệ thông tin, kinh tế - xã hội
Công nghệ hệ thông tin địa lý ứng dụng trong Khoa học Trái đất sẽ mang lại cho chúng ta nhiều lợi ích như:
- Cho khả năng tích hợp nhiều dạng dữ liệu với nhiều nguồn khác nhau.
- Sử dụng tra cứu, cập nhật thông tin và phân tích không gian rất hữu hiệu, giảm chi phí trong công tác quản lý.
- Việc phân tích không gian trong hệ thống sẽ làm thay đổi cách nhìn nhận thế giới và cách hành xử của chúng ta với ngôi nhà chung là trái đất.
- Tăng cường khả năng phối họp giữa các cơ quan trong nhiều lĩnh vực
và trợ giúp nhiều thông tin dẫn đến các quyết định đúng đắn.
3.1.1.2 K h á i niệm về chuẩn d ữ liệu
Hệ thống thông tin càng phát huy tác dụng rộng rãi nếu dừ liệu trong
hệ thống được định chuẩn Điều kiện này giúp cho thông tin được trao đổi rộng rãi hơn, người sử dụng thông tin nhiều hơn, hệ thống cập nhật thông tin
Trang 7chuẩn hóa dữ liệu là công việc cần thiết phải làm đối với cơ quan chủ quản
ờ nước ta là Bộ Tài nguyên và Môi trường.
Chuẩn hóa dữ liệu là hệ thống các tiêu chuẩn về cách thức mô tả và lưu trữ thông tin trong hệ thống cơ sở dữ liệu, khuôn dạng lưu trữ và trao đổi dữ liệu, nội dung và mối quan hệ của các đối tượng địa lý được mô tả trong hệ thống Chuẩn dữ liệu còn quy định các tiêu chuẩn, nội dung các thông tin về siêu dữ liệu (Metadata).
Chuẩn dữ liệu có thể do các tổ chức quốc tế hoặc quốc gia xây dựng
và ban hành áp dụng thống nhất Nhiều quốc gia trên thế giới như Hoa Kỳ, Nhật bản, Nga, Trung Quốc đã xây dựng hệ thống chuẩn quốc gia về cơ sở
dữ liệu thông tin địa lý.
Trước đây, chúng ta chưa xây dựng chuẩn Quốc gia về cơ sở dữ liệu địa lý
Do nhu cầu sử dụng, một số dự án xây dựng hệ thông tin địa lý của các bộ, ngành và địa phương tự xây dựng một số quy định tạm thời về chuẩn dữ liệu
để sử dụng Để nghiên cứu và hiểu được nội dung của các chuẩn Quốc tế ISO/TC211 và OPENGIS áp dụng vào Việt Nam, Bộ Tài nguyên và Môi trường đã phê duyệt dự án chuẩn hóa hệ thống thông tin quốc gia Năm
2008, Bộ tài nguyên và Môi trường đã ban hành chuẩn cơ sở dữ liệu nền địa
lý quốc gia.Trong đó, các chuẩn ISO - 19.100 trong Bảng 3.1 được áp dụng trong xây dựng các Quy chuẩn thông tin địa lý cơ sở Quốc gia.
Có nhiều ý kiến cho rằng tài liệu “Chuẩn thông tin địa lý cơ sở quốc gia” áp dụng “nguyên” tài liệu chuẩn của nước ngoài vào Việt Nam Điều này
là hoàn toàn không đúng Chuẩn ISO/ OPENGIS chỉ đưa ra quy tắc chung
và các phương pháp để xây dựng chuẩn thông tin địa lý cho từng quốc gia Mục đích là để nhiều quốc gia hay khu vực trên thế giới có tiếng nói chung khi nghiên cứu các vấn đề về trái đất có liên quan đến thông tin địa lý.
Trang 8Bảng 3.1 Quy chuẩn thông tin địa lý cơ sở Quốc gia
1 Chuẩn ngôn ngữ mô hình hóa sử dụng trong thông tin địa lý
ISO/TS 19103 Geographie Information - Conceptual Schema Language
2 Chuẩn lược đồ dữ liệu không gian ISO/DIS 19107 Geographic Information
ISO/DIS 19109 Geographic Information
- Rules for Application Schema
5 Chuẩn phương pháp xây dựng danh mục đối tượng địa lý
ISO/FDIS 19110 Geographic Information - Methodology for Feature Cataloguing
6 Chuẩn nguyên tắc đánh giá chất lượng dữ liệu địa lý
ISO/FDIS 19113 Geographic Information - Quality principles
7 Chuẩn quy trình đánh giá chất lượng dữ liệu địa lý
ISO 19114 Geographic Information - Quality evaluation procedures
8 Chuẩn siêu dữ liệu ISO 19115 Geographic Information -
Metadata
9 Chuẩn trình bày dữ liệu địa lý ISO 19117 Geographic Information -
Portrayal
10 Chuẩn hệ quy chiếu tọa độ ISO 19111 Geographic Inform ation-
Spatial Referencing by Coordinates
11 Chuẩn mã hóa dữ liệu ISO 19101 Geographic Information -
Endcoding
12 Chuần trao đổi dữ liệu ISO 19136 Geographic Information -
Geography Mark-up Language
Việc áp dụng chuẩn ISO trong xây dựng chuẩn thông tin địa lý ờ Việt Nam thực chất mới chỉ bắt đầu ở Bộ Tài nguyên và M ôi trường, nhằm đưa ra cấu trúc chung về sản phẩm dữ liệu địa lý để khắc phục tình trạng chồng chéo về đầu tư kinh phí cho việc xây dựng dữ liệu phục vụ công tác điều tra cơ bản Việc hình thành các lớp thông tin hầu hết dựa vào nội dung bản đô hiện hành, áp dụng các nguyên tắc khái quát hóa, phương pháp phân loại đôi tượng địa lý, phương pháp lập danh mục đối tượng để xây dựng danh mục đổi tượng địa lý cơ sở Quốc gia Nhưng chuẩn dừ liệu địa lý
Trang 9bản đô địa hình hiện hành.
Bên cạnh việc vận dụng các quy chuẩn quốc tế ISO/TC211, chuẩn thông tin địa lý cơ sở quốc gia còn được xây dựng trên quan điểm kế thừa : các văn bản kỹ thuật đo đạc bản đồ hiện hành.
Trong quá trình thực hiện, Bộ Tài nguyên và Môi trường đã giao cho Cục Đo đạc và Bản đồ Việt Nam tiếp tục nghiên cứu chuẩn thông tin địa lý Quốc gia sao cho phù hợp với Việt Nam và có khả năng trao đổi dừ liệu quốc tế Ngày 19/3/2012, Bộ Tài nguyên và Môi trường đã ban hành Quy chuẩn kỹ thuật quốc gia số QCVN 42:2012/BTNM T kèm theo thông tư số
02/2012/TT-BTNMT về chuẩn thông tin địa lý cơ sở quốc gia (National technical regulation on Standard o f basic geographic information).
Chuẩn thông tin địa lý cơ sở Quốc gia là quy chuẩn để xây dựng các Quy định kỹ thuật dữ liệu địa lý (tài liệu chính được sử dụng trực tiếp trong thi công xây dựng các dự án) Nội dung tài liệu chuẩn cơ sở Quốc gia có sử dụng rất nhiều khái niệm, thuật ngữ chuyên môn, cụ thể: ký hiệu và thuật ngữ sử dụng trong các lược đồ khái niệm; mô hình cấu trúc dữ liệu địa lý;
Mô hình khái niệm dữ liệu không gian; mô hình khái niệm dữ liệu thời gian; Phương pháp lập danh mục đối tượng địa lý; danh mục đối tượng địa lý cơ
sở Quốc gia; hệ quy chiếu tọa độ; nội dung siêu dữ liệu địa lý cơ sở; chất lượng dữ liệu địa lý; trình bày dừ liệu địa lý; lược đồ GML cơ sở; quy tắc xây dựng lược đồ ứng dụng GML; quy tắc chuyển đổi lược đồ ứng dụng ƯML sang lược đồ ứng dụng GML và một số địa chỉ website hữu ích.
3.1.1.3 X u th ể p h á t triển h ệ th ôn g tin địa lý
Hệ thông tin địa lý ngày càng khẳng định được sức mạnh của mình trong nhiều lĩnh vực của cuộc sống, nhưng dường như nó vẫn chưa đến được với mọi người Lý do rất dễ nhận ra là một hệ thống ứng dụng hệ thông tin địa lý hầu hết chạy trên máy tính đơn được cài đặt các module xử
Trang 10lý hệ thông tin địa lý Đây chính là lý do cản ừ ở khả năng ứng dụng rộng rãi của hệ thống.
Ví dụ, khi một khách hàng muốn tìm đến một doanh nghiệp nào đó
mà muốn sử dụng ứng dụng hệ thông tin địa lý thì hoặc là thượng đế này phải mang theo một Pocket PC cài ứng dụng tìm kiếm các doanh nghiệp, hoặc là anh ta phải chịu khó trở về nhà hoặc đến cơ quan để tìm đến đúng máy tính đó được cài đặt ứng dụng này để tìm kiếm thông tin.
Qua đó ta có thể nhận thấy, với các ứng dụng hệ thông tin địa lý mang tính cộng đồng hoặc khi cần có thể sử dụng w h e r e v e r , tức là bất cứ nơi đâu, thì mô hình ứng dụng chạy trên máy đơn là không đáp ứng được.
Internet ra đời vào thập niên 90 của thế kỷ X X đã rút ngắn khoảng cách giữa mọi người, cho phép bạn có thể “ngồi nhà, nhìn ra toàn thế giới”
Mô hình ứng dụng hệ thông tin địa lý chạy trên nền Internet cho phép mọi người dùng bất kỳ công cụ nào, chỉ cần có thể truy cập Internet là chắc chắn
họ sẽ tìm kiếm được thông tin mình cần.
Xu thế phát triển hệ thông tin địa lý hiện nay là: Truyền thông đa phương tiện, Googe Erth, WebGis, Mobile G is ,
WebGIS là hệ thông tin địa lý phân tán trên mạng máy tính để tích hợp, trao đổi các thông tin địa lý trên World Wide Web Trong cách thực hiện nhiệm vụ phân tích của hệ thông tin địa lý, dịch vụ này gần giống như kiến trúc Client - Server của Web Xử lý thông tin địa lý được chia ra thành các nhiệm vụ ở phía Server và phía Client Điều này cho phép người dùng
có thể truy xuất, thao tác và nhận kết quả từ việc khai thác dữ liệu hệ thống
từ trình duyệt web của họ mà không phải trả tiền cho phần mềm ứng dụng.
Ngoài ra, với sự phát triển của công nghệ điện thọai di động thông minh, hệ thống M obile GIS là phần mở rộng của hệ thông tin địa lý Hệ thống này giúp các ứng dụng của hệ thông tin địa lý hoạt độne ngoài thực địa thay vì hoạt động trong phòng M obile GIS kết hợp với hệ thống định vị toàn cầu GPS sẽ cho phép người sử dụng ở ngoài thực địa thu thập, lưu trữ, phân tích và hiển thị thông tin địa lý.
Trang 11Hệ thống thông tin bản đồ đã ra đời cách đây rất lâu Từ xa xưa, con người đã biết cách biểu diễn các thông tin địa lý bằng cách thu nhỏ các sự vật theo một kích thước nào đó, rồi vẽ lên mặt phang Để đánh dấu các đặc tính của sự vật, người ta dùng các loại ký hiệu khác nhau như độ cao được biểu diễn bởi các đường bình độ, độ sâu của nước biển được biểu diễn bởi màu sắc, có những đặc tính lại được biểu diễn bởi các lời chú thích và số hiệu đi kèm Dần dần, bản đồ chiếm một vị trí quan trọng, không thể thiếu được trong đời sống của con người, chiếm lĩnh trong rất nhiều lĩnh vực khác nhau như trong quân sự, kinh tế, quản lý tài nguyên thiên nhiên và môi trường Nhờ có bản đồ, nhiều ngành khoa học kỹ thuật đã phát triển rất mạnh, đồng thời với sự phát triển đó cũng thúc đẩy kỹ thuật bản đồ ngày càng trở nên hoàn thiện hơn.
Theo yêu cầu phát triển, lượng thông tin trên bản đồ ngày càng trở nên phong phú Khi lượng thông tin biểu diễn trên một diện tích bản đồ trở nên quá lớn, người ta bắt đầu lập các bản đồ chuyên đề Mồi bản đồ chuyên đề phản ánh các đối tượng địa lý về một lĩnh vực nào đó như bản đồ quân sự đánh dấu các điểm đóng quân, hướng hành quân ; bản đồ khí tượng thủy văn biểu diễn lượng mưa, hướng gió, nhiệt độ trung bình của vùng ; bản đồ địa chất và khoáng sản biếu diễn các thành tạo địa chất, sự phân bố khoáng sản trên nền các cấu trúc địa chất đó Thậm chí ngay trong mồi chuyên ngành cũng có rất nhiều loại bản đồ khác nhau, ví dụ như trong lĩnh vực Trắc địa - Bản đồ có các loại bản đồ địa hình, bản đồ địa chính, bản đồ hiện trạng sử dụng đất, bản đồ thổ nhưỡng, bản đồ quy hoạch sử dụng đất hoặc trong lĩnh vực địa chất có các loại bản đồ.như bản đồ địa chất và khoáng sản, bản đồ địa chất thủy văn - địa chất công trình, bản đồ địa mạo, bản đồ kiến tạo
Với vai trò quan trọng như vậy, nên sau khi công nghệ thông tin ra đời
ít lâu, các nhà khoa học đã nghĩ đến việc số hóa bản đồ, lưu trữ và quản lý các thông tin địa lý bàng máy tính Vào đầu những năm sáu mươi của thế kỷ hai mươi, các nhà khoa học Canada đã cho ra đời hệ thông tin địa lý (Geographycal Infomation System - GIS) Tại Mỹ, nhiều trường đại học cùng bắt đầu tiến hành nghiên cứu và xây dựng hệ thống thông tin địa lý.
3.1.2 Sự hình thành và phát triển hệ thông tin địa lý
Trang 121977 đã có 54 hệ thống thông tin địa lý khác nhau trên thế giới ra đời Sụ xuất hiện quá nhiều hệ thống này đã làm phát sinh vấn đề không tương thích
về khuôn dạng dữ liệu và người ta phải nghiên cứu khả năng giao diện giữa các khuôn dạng dữ liệu trong các hệ thống thông tin địa lý.
Thập kỷ 80, đánh dấu sự bùng nổ của hệ thống thông tin địa lý Hàng loạt nhu cầu ứng dụng mới nảy sinh như các bài toán về giao thông, cấp nước, quản lý và sử dụng tối ưu tài nguyên thiên nhiên, khảo sát thị trường, thông tin đất đai trong địa chính, quản lý mạng cáp trong bưu điện, phòng chống thiên t a i,
Những năm đầu thập kỷ 90 được đánh dấu bằng việc nghiên cứu sự hoà nhập giữa kỹ thuật viễn thám và hệ thống thông tin địa lý Từ góc độ hệ thống thông tin địa lý, kỹ thuật viễn thám ngày càng trở nên vô cùng quan trọng vì nó là nguồn dữ liệu rất quan trọng để cập nhật vào hệ thống, vì thế khả năng phát triển và ứng dụng của hệ thống sẽ phụ thuộc vào kỹ thuật viễn thám Ngược lại, từ góc độ kỹ thuật viễn thám, hệ thống thông tin địa
lý có thể tạo ra khả năng phát triển họp lý các hệ thống xử lý ảnh hiện có và nhờ đó mở ra một viễn cảnh mới đối với việc phát triển và ứng dụng có hiệu quả kỹ thuật viễn thám.
Trên thế giới, ngoài việc tích họp hai kỹ thuật trên, người ta đã tiến hành tích họp cùng với công nghệ định vị toàn cầu và đã thu nhận được hiệu quả cao về kinh tế - xã hội và sẽ đem lại nhiều hứa hẹn hơn nữa trong tương lai Các nước Tây Âu và Bắc Mỹ đã đi đầu và gặt hái được rất nhiều thàrứ
Trang 133.2 CÁC THÀNH PHÀN TRONG HỆ THÔNG TIN ĐỊA LÝ
Hệ thông tin địa lý là một hệ thống bao gồm năm thành phần cơ bản là
hệ thống phần cứng, hệ thống phần mềm, cơ sở dữ liệu, tri thức con người
và phương thức tổ chức thực hiện, hệ thống này được được mô phỏng ở hình 3.4.
GIS
Trang 14về cơ bản hệ thống phần cứng của một hệ thông tin địa lý gồm các phần chính là bộ xử lý trung tâm (CPU), các thiết bị đầu vào như bàn số hóa, máy quét, các thiết bị thu nhận thông tin điện từ và các thiết bị lưu trữ, hiển thị như thiết bị ghi ngoài, màn hình, máy vẽ (hình 3.5) Máy tính hoặc bộ xử lý trung tâm (CPU) được nối với thiết bị chứa ổ đĩa, cung cấp không gian để lưu trữ số liệu và các chương trình Máy số hóa (digitizer) hoặc thiết bị chuyên dụng khác
có nhiệm vụ chuyển hóa các số liệu từ bản đồ và các tư liệu thành dạng số rồi đưa vào máy tính Máy vẽ (Plotter) hoặc các kiểu thiết bị biểu hiện khác được
sử dụng để xuất dữ liệu ở dạng số trên màn hình hoặc trên nền vật liệu in Sự liên hệ bên trong của máy tính cũng có thể thực hiện thông qua một hệ thống mạng với các đường dẫn dữ liệu đặc biệt Người sử dụng máy tính và các thiết
bị ngoại vi khác (như máy in, máy vẽ, máy số hóa và các thiết bị khác nối với máy tính) thông qua một thiết bị hiển thị hình ảnh (Video Display Unit - VDƯ)
để cho phép các sản phẩm đầu ra được hiển thị nhanh chóng.
3.2.1 Hệ thống phần cứng
Hình 3.5 Hệ thống phần cứng Nói riêng về máy tính, cho đến nay đã có bốn giai đoạn chính, hay thế hệ máy tính, trong quá trình phát triển của phần cứng máy tính, mồi thế hệ đều được phân biệt bởi một công nghệ khác nhau cho các thành phần thực hiện công việc
xử lý của máy tính Mỗi thế hệ đều mở rộng đáng kể năng lực xừ lý của máy tính
và khả năng ghi nhớ trong khi đồng thời lại giảm giá thành Nhừne thay đổi thế
hệ này trong phần cứng máy tính đã đi kèm với những thay đổi thế hệ phần mềm làm cho máy tính ngày một mạnh hơn, không đắt và dễ dùng.
Trang 153.2.1.1 C ác th ế h ệ m áy tính
Thế hệ thứ nhất: Đèn điện tử (1946 - 1956).
Thế hệ máy tính thứ nhất dựa vào các rơle điện từ và đèn điện tử để lưu trữ và xử lý thông tin Các đèn này tiêu thụ rất nhiều năng lượng, đời sống lại ngắn và sinh ra rất nhiều nhiệt Máy tính nhỏ nhất thế hệ này cũng
có khoảng 5.000 đền điện tử, sử dụng 650 KW /giờ và chiếm một diện tích khoảng 200 m2 Với kích thước khổng lồ, máy tính thế hệ thứ nhất có bộ nhớ và khả năng xử lý rất hạn chế, bộ nhớ chính tối đa là 2.000 byte (2 kilobyte), với tốc độ 10.000 lệnh trong 1 giây Trống từ được dùng làm bộ nhớ trong và bìa đục lỗ được dùng làm bộ nhớ ngoài Các máy tính thuộc thế hệ này hầu như không xử lý được thông tin văn bản, chúng chỉ dùng cho một số phép xử lý và tính toán kỹ thuật
Thế hệ thứ hai: Transistor (1957 - 1963).
Trong thế hệ thứ hai, bóng bán dẫn transistor đã thay thế cho đèn điện
tử làm thiết bị ghi nhớ và xử lý thông tin Transistor ổn định và tin cậy hơn nhiều so với đèn điện tử, chúng sinh ra ít nhiệt hơn và tiêu thụ ít năng lượng hơn Tuy nhiên, từng transistor phải được chế tạo riêng biệt và được nối dây trong bo mạch in Bộ nhớ lõi từ là công nghệ bộ nhớ chính cho thời kỳ này
Nó bao gồm các xuyến từ nhỏ (cỡ 1 mm đường kính), có thế được phân cực theo một hay hai hướng để biểu diễn cho một bit dữ liệu Dây nối được xâu qua các lõi này cho cả việc đọc và ghi dữ liệu Hệ thống này phải được lắp ráp thủ công và do đó rất đắt Máy tính thế hệ thứ hai này có tới 32 KB bộ nhớ RAM và tốc độ đạt tính có thể đạt tới 300.000 lệnh một giây Năng lực
xử lý và bộ nhớ được nâng cao của các máy tính thế hệ thứ hai làm cho chúng được sử dụng rộng rãi hơn trong công tác khoa học và cho các nhiệm
vụ kinh doanh như tự động tính lương làm hóa đơn.
Trang 16thiết bị bán dẫn Bộ nhớ máy tính đã mở rộng tới 2 megabyte và tốc độ tăng tới 5 MIPS Việc tăng năng lực xử lý cho phép phát triển những phần mềm đặc biệt gọi là hệ điều hành vốn tự động cai quản các chương trình và việc truyền thông giữa CPU, máy in và các thiết bị khác Công nghệ máy tính thế
hệ thử ba đã đưa vào các phần mềm có thể cho phép người không được huấn luyện nhiều về kỹ thuật cũng có thể dùng được máy, làm cho máy tính
mở rộng vai trò của chúng trong kinh doanh.
Thế hệ thứ tư: Mạch tích họp cỡ lớn và rất lớn ( 1980 cho đến nay) Thể hệ thứ 4 trải rộng từ năm 1980 đến nay Máy tính ừong thời kỳ này sử dụng mạch tích hợp cỡ lớn LSIC (Large Scale Intergrated Circuit) và những mạch rất lớn VLSIC (Very Large Scale Intergrated Circuit), được đóng gói với cỡ từ 200.000 đến trên 300.000 transistor trên một chip LSIC
và tới hàng triệu transistor trên một chip VLSIC Kích thước của máy tính
có thời chiếm cả một phòng lớn,nhưng bây giờ nằm trên một chiếc bàn nhỏ
Bộ nhớ trong của máy tính tăng trên một gigabyte trong những máy tính thương mại lớn; tốc độ xử lý đã vượt quá 200 MIPS (triệu phép tính trên giây) Trong thế hệ may tính này, các máy tính siêu hạng có thể đạt tới hàng
tỷ MIPS.
Công nghệ VLSIC đã hướng tới việc giảm thiểu kích cỡ xuống micro-
sự phát triển nhanh chóng của máy tính nhỏ, nhanh và rẻ đến mức chúng đà trở thành phổ biến ở đâu cũng có Chẳng hạn, nhiều tính năng "thông minh"
đã được đưa vào ô tô, máy nghe stereo, đồ chơi, đồng hồ, máy ảnh và các thiết bị khác làm cho dễ dùng hơn, đều dựa trên các bộ vi xừ lý.
Máy tính thế hệ năm (máy tính tưomg lai)
Các máy tính thế hệ trước đó là máy tính qui ước dựa trên nguyên lý kiến trúc Von Neumann, xử lý thông tin một cách tuần tự, mồi lúc một lệnh Trong tương lai, nhiều máy tính sẽ dùng cách xử lý song song và xừ lý song song cực lớn để trộn lẫn tiếng nói, hình ảnh và dữ liệu từ các nguồn khác nhau bằng việc dùng trí tuệ nhân tạo và các mô hình toán học phức tạp.
Máy tính xử lý song song cực lớn có các mạng khổng lồ các chip xử
lý đan dệt với nhau theo cách linh hoạt và phức tạp Đ ối lập với xử lý song song, nơi mà một số nhỏ các chip chuyên dụng mạnh nhưng đẳt được nối với nhau, các máy song song cực lớn móc xích hàng trăm hay thậm chí hàng
Trang 17nghìn chip thường dùng, không đắt để tấn công vào những vấn đề tính toán lớn, đạt tới tốc độ siêu máy tính.
3.2.1.2 Các lo ạ i m áy tính
Máy tính có thể được phân loại theo các tiêu chí khác nhau như phân loại theo thông tin biểu diễn trong máy tính (máy tính tương tự - Analog Computer, máy tính số - Digital Computer); phân loại theo khả năng thực hiện các bài toán (máy tính chuyên dụng - Specialized Computer, máy tính vạn năng - Computer); phân loại theo tốc độ tính toán, ta có máy tính điện tử siêu hạng, máy tính điện tử cỡ lớn, máy tính điện tử cỡ vừa và nhỏ, máy vi tính.
Máy vi tính (Micro Computer) hay còn gọi là máy tính cá nhân (Personal Computer) có nhiều kích cỡ khác nhau như máy Destop, máy Portable, máy latop, máy Notebook và máy Palmtop.
Thuật ngữ máy vi tính đôi khi được sử dụng đồng nghĩa với máy tính
cá nhân, vì vi tính ban đầu được dự định làm công cụ cá nhân, một người dùng Tuy nhiên, nhờ công nghệ mạng, máy vi tính đã trở thành mạnh đến mức chúng không còn bị giới hạn vào các hệ thông tin cá nhân nữa.
Máy vi tính và thể vận hành hoặc như máy riêng lẻ cá nhân với năng lực xử lý biệt lập hoặc như một phần của mạng của thiết bị thông minh quy
mô công ty hay phòng ban Chúng có thế được kết nối với các máy vi tính khác, các thiết bị viễn thông, trạm làm việc hay máy tính lớn.
Máy tính điện tử cở vừa và nhỏ (Mini Computer) là máy tính hạng trung có kích cỡ bàn làm việc, thường dụng cho các trường đại học, xí nghiệp hay phòng thí nghiệm nghiên cứu Đại diện cho nhóm này là máy tính DEC Vax 7000 Model 600.
Trạm làm việc (Work Station) có thể xếp vào loại máy tính loại vừa hoặc nhỏ N ó có đặc điểm là khả năng xứ lý đồ họa và thực hiện các phép tính toán học mạnh hơn máy vi tính và có thể thực hiện nhiều nhiệm vụ phức tạp trong cùng thời gian Trạm làm việc được dùng cho công việc khoa học, kỹ nghệ và thiết kế đòi hỏi khả năng tính toán và đồ họa mạnh.
Máy tính điện tử cõ’ lớn (Mainframe Computer) là loại máy tính được sử dụng cho các ứng dụng thương mại, khoa học, quân sự , trong đó
Trang 18Mới đây, các nhà khoa học Mỹ tại Viện thí nghiệm quốc gia Los Alamos và tập đoàn IBM vừa cho ra đời chiếc siêu máy tính nhanh nhất thế giới, máy có trị giá 100 triệu U SD có tốc độ tính 1 triệu tỷ phép tính trong
01 giây, nhanh gấp 03 lần các siêu máy tính đứng sau nó trên thế giới Siêu máy tính này có tên Roadrunner Ta có thể làm phép tính so sánh khả năng siêu tốc của nó, đó là nếu cả 06 tỷ người trên thế giới sử dụng một máy tính cầm tay và bấm liên tục trong 24 giờ thì sẽ mất 46 năm để thực hiện các phép tính mà Roadrunner thực hiện trong 01 ngày Máy tính này được chế tạo với mục đích hỗ trợ các công việc đặc biệt như mô phỏng vụ nổ hạt nhân, động đất, sóng thần,
Nhật đang có dự kiến sản xuất một siêu máy tính có khả năng thực hiện
10 triệu tỉ phép tính trong một giây với giá thành khoảng gần 900 triệu USD.
3.2.2 Hệ thống phần mềm
3.2.2.1 K h á i n iệm chun g về ph ầ n m ềm
Phần mềm là các lệnh chi tiết kiểm soát sự vận hành của hệ thống máy tính Không có phần mềm thì phần cứng máy tính không thể thực hiện được nhiệm vụ mà chúng ta trao cho máy tính.
Các chức năng của phần mềm:
- Quản lý tài nguyên máy tính của tổ chức.
- Cung cấp công cụ cho ta tận dụn2 ưu thế của những tài nguyên này
Trang 19- Hành động như một trung gian giữa tổ chức và thông tin được lưu giữ.
C hư ơng trình phần mềm là một chuỗi các câu lệnh cho máy tính Việc xử lý viết ra hay mã hóa chương trình được gọi là lập trình, và người chuyên môn làm việc này được gọi là người lập trình.
Có ba kiểu phần mềm chính là phần mềm hệ thống, phần mềm ứng dụng và phần mềm người dùng cuối Mỗi kiểu phần mềm thực hiện một
chức năng khác nhau.
Phần mềm hệ thống (System Software) là tập các chương trình tổng quát quản lý tài nguyên của máy tính, như đơn vị xử lý trung tâm, các móc nối truyền thông, và các thiết bị ngoại vi Người lập trình viết phần mềm hệ thống được gọi là người lập trình hệ thống.
Phần mềm hệ thống có thể chia thành 4 loại sau:
* Hệ điều hành (Operating System)
* Chương trình tiện ích (Utilities)
* Chương trình điều khiển thiết bị (Device Drivers)
* Trình dịch (Compiler) Phần m ềm ứ ng dụng (Application Software) mô tả cho chương trình được viết cho người dùng để áp dụng máy tính vào một nhiệm vụ đặc biệt Phần mềm để xử lý dữ liệu đồ họa hay quản lý ngân hàng là phần mềm ứng dụng Người lập trình viết ra phần mềm ứng dụng được gọi là người lập trình ứng dụng.
Phần mềm ứng dụng có thể chia thành bốn loại sau:
- Phần mềm năng suất, ví dụ như phần mềm soạn thảo văn bản, bảng tính điện tử, các hệ quản trị cơ sở dữ liệu, phần mềm nhận và gửi thư điện
Trang 20dùng cuối trực tiếp phát triển một số ứng dụng mà không cần tới người lập
trình chuyên nghiệp Một số phần mềm người dùng cuối được dùng để nâng
cao hiệu suất của người lập trình chuyên nghiệp.
Ba kiểu phần mềm này có quan hệ lẫn nhau và có thể được coi như một tập các hộp lồng nhau, mồi hộp trong đó phải tương tác chặt chẽ với các hộp khác bao quanh nó Phần mềm hệ thống bao quanh và kiểm soát việc truy nhập vào phần cứng Phần mềm ứng dụng phải làm việc qua phần mềm
hệ thống để vận hành Cuối cùng, phần mềm người dùng cuối thường phải làm việc qua phần mềm ứng dụng và chung cuộc qua phần mềm hệ thống.
3.2.2.2 H ệ điều hành
Hệ điều hành là một bộ chương trình giúp người sử dụng khai thác thuận tiện các tài nguyên của máy tính, tạo môi trường để người sử dụng giao tiếp với máy tính như ghi thông tin vào đĩa từ, tìm kiếm, đọc thông tin
đã ghi, thực hiện các chương trình, đưa thông tin ra màn hình, máy in hay nói cách khác hệ điều hành quán xuyến toàn bộ các hoạt động của máy tính
Giổng như bất kì phần mềm nào khác, phần mềm máy tính dựa trên hệ điều hành và phần cứng máy tính riêng Gói phần mềm được viết cho hệ điều hành máy tính này không thể chạy trên hệ khác Bản thân hệ điều hành máy tính cũng có những tính năng phân biệt như liệu chúng có hồ trợ cho đa nhiệm hay công việc đồ họa hay không, vốn xác định ra kiểu ứng dụng mà chúng thích hợp.
Hệ điều hành DOS do hãng sản xuất máy tính Si-Tom (Seatle Computer Produccts) đưa ra vào năm 1980, sau đó được hãng M icrosoft mua lại cải tiến và trang bị cho các máy vi tính IBM PC với tên gọi MS DOS phiên bàn 1.0 Từ đó đến nay M S-DOS đã được cải tiến và hoàn thiện liên tục.
Trang 21os/2 là hệ điều hành được dùng cho máy vi tính IBM Personal System/2 và máy tương hợp IBM os/2 có thể chạy nhanh hơn DOS (vốn chỉ đánh địa chỉ dữ liệu theo từng chùm 16-bit) bởi vì nó có thể đánh địa chỉ
dữ liệu theo các chùm 32 bit os/2 được dùng cho các ứng dụng tiêu thụ nhiều bộ nhớ phức tạp hay những ứng dụng đòi hỏi kết mạng hay đa nhiệm OS/2 hỗ trợ cho đa nhiệm, thích ứng cho các ứng dụng lớn, cho phép các ứng dụng chạy đồng thời, hỗ trợ các ứng dụng mạng và là hệ điều hành được bảo vệ hơn nhiều Một ứng dụng hỏng thì ít có khả năng làm cho toàn
bộ hệ thống và các ứng dụng khác sập theo với nó Hệ điều hành này đòi hỏi phần cứng máy tính mạnh, tối thiểu là bộ vi xử lý 80386, 4 Mb RAM và 60
Mb đĩa cứng, os/2 cung cấp cho các máy tính để bàn khả năng của hệ điều hành máy lớn như đa nhiệm và hỗ trợ đa người dùng trong mạng.
Windows, W indows NT, Windows XP là hệ điều hành do Microsoft phát triển có tính năng vượt trội so với hệ điều hành DOS về giao diện với người dùng Hệ điều hành này có một giao diện hoàn toàn mới, sử dụng nhiều mầu sắc và không gian 3 chiều (3D) cho các Task Bar cũng như các cửa sổ và hộp thoại.
Windows NT dùng cùng giao diện đồ họa như W indows nhưng nó có khả năng đa nhiệm mạnh và khả năng quản lý bộ nhớ W indows NT có thể
hồ trợ cho các phần mềm hiện có được viết cho DOS và nó có thể cung cấp khả năng tính toán tựa máy tính lớn cho các ứng dụng mới với yêu cầu bộ nhớ và tệp lớn N ó có thể đánh địa chỉ theo các chùm 32 bit nếu cần và thậm chí có thể hồ trợ cho đa xử lý với nhiều CPU Khác với o s/2 , W indows NT không bị gắn với phần cứng máy tính dựa trên bộ vi xử lý của Intel N ó có thể chạy trên các máy vi tính và trạm làm việc dùng các bộ vi xử lý của Mips Computer Systems Inc hay chip Alpha mới của DEC.
UN IX đã được phát triển tại Bell Laboratories vào năm 1969 để giúp các nhà nghiên cứu khoa học dùng chung dữ liệu và chương trình trong khi vẫn giữ các thông tin khác riêng tư N ó là hệ điều hành tương tác, đa người dùng, đa nhiệm Nhiều người có thể dùng UNIX đồng thời để thực hiện cùng kiểu nhiệm vụ, hay một người dùng có thể chạy nhiều nhiệm vụ trên
Trang 22UNIX có thể là ít thân thiện với người dùng N ó mạnh nhưng rất phức tạp N ó có những chi lệnh, một số trong chúng rất bí ẩn và cộc lốc Một lồi
gõ dòng lệnh cùng có thể dễ dàng xoá đi các tệp quan trọng UNIX không thể đáp ứng tốt với các vấn đề gây ra bởi việc lạm dụng tài nguyên hệ thống như công việc và không gian đĩa UNIX cũng đặt ra một số vấn đề an toàn,
vì đa việc và đa người dùng có thể truy nhập vào cùng tệp đồng thời Cuối cùng hệ UNIX đòi hỏi khối lượng truy nhập bộ nhớ và đĩa lớn, giới hạn sự hữu dụng của nó cho các máy vi tính kém mạnh hơn.
Linux là một hệ điều hành được giới đại học phát triển từ việc viết lại và cho không mã nguồn của hệ điều hành UNIX Linux hoàn toàn mang tất cả những ưu điểm của UNIX nhưng đồng thời đang trở thành một hệ điều hành được ngày càng nhiều người chú ý vì tính mở của nó để đối lập lại tính đóng kín của hệ điều hành Windows Linux hiện nay được gắn liền với việc phát triển kết cụm máy tính và xử lý song song trên cơ sở nhiều bộ xừ lý.
System 7 (nay đã có System 10) là phần mềm hệ thống cho máy tính Macintosh, mang tính năng đa nhiệm cũng như các khả năng đồ họa mạnh
và giao diện đồ họa người dùng điều khiển bằng chuột Một mờ rộng của hệ điều hành này được gọi là QuickTime cho phép người dùng Macintosh tích hợp các ảnh video, âm thanh stereo và các đoạn hoạt hình với phần mềm đồ họa và vãn bản qui ước.
Trang 23System 7 có một số tính năng làm cho nó thành hấp dẫn cho các ứng dụng toàn cầu Chẳng hạn, nó cung cấp sự hỗ trợ mức hệ thống cho các ngôn ngữ châu Á với tập ký tự lớn.
3.2.2.3 P h ần m ềm ứ ng dụng trong h ệ thông tin địa lý
Đ ây là hệ thống phần mềm được thiết kế và xây dựng cho các ứng dụng trong công nghệ hệ thông tin địa lý Các phần mềm ứng dụng này cần
có các khả năng sau:
• Có khả năng nhập dữ liệu không gian và thuộc tính từ các nguồn dữ liệu khác nhau như từ bản đồ, từ các thông tin viễn thám, từ các số liệu đo đạc trực tiếp ngoài thực địa và liên kết.
• Có khả năng quản lý, sửa chữa, đồng bộ các nhóm dữ liệu không gian nhanh chóng để phục vụ các phân tích tiếp theo và còn cho phép chuyển đổi nhanh và chính xác các dữ liệu không gian.
• Đảm bảo các khả năng phân tích dữ liệu ở các trạng thái khác nhau, đặc biệt là khả năng phân tích không gian; có khả năng thay đổi về cấu trúc
dữ liệu phục vụ người dùng; các biện pháp đánh giá chất lượng sản phẩm và các nguyên tắc xử lý chuẩn các thông tin theo không gian - thời gian cũng như theo các kiểu mẫu thích họp khác.
• Các dữ liệu được hiển thị toàn bộ hoặc từng phần theo thông tin gốc, các dữ liệu đã xử lý được hiển thị bằng các bảng biểu hay các loại bản đ ồ Ngày nay, tất cả các phần mềm của hệ thống đều được đặt trong môi trường W indows (có thể môi trường UNIX, mã nguồn mở) với các thanh công cụ có đầy đủ các biểu tượng kích hoạt nên giao diện giữa thao tác viên
và hệ thống rất linh hoạt, hiệu quả Với sự phát triển mạnh mẽ của công nghệ tin học, khả năng giao diện giữa người và máy càng ngày càng hoàn hảo Hiện nay, các phần mềm thông tin địa lý đang được ứng dụng ở nước ta
là Arc/Info, Arc/GIS, MGE, Geomedia Proffesional, Map/Info, G rass
3.2.3 Cơ sở dữ liệu
Cơ sở dữ liệu là bộ các thông tin được lưu dưới dạng số theo một khuôn dạng nào đó mà máy tính có thể hiểu và đọc được Cơ sở dừ liệu trong hệ thông tin địa lý bao gồm các dữ liệu địa lý và các dừ liệu thuộc tính
Trang 24(các dữ liệu chữ - số, dữ liệu multimedia ) và mối quan hệ giữa hai loại dữ liệu này Ngoài ra, với sự phát triển của công nghệ thông tin với nhu cầu chính xác hóa và hợp pháp hóa các thông tin đưa vào hệ thống, ưong hệ thông tin địa lý còn có một loại thông tin “đặc biệt”, đó là “siêu dữ liệu” (Metadata).
Dữ liệu trong hệ thông tin địa lý phải luôn được cập nhật theo thời gian Như vậy, dữ liệu trong hệ thống sẽ là dữ liệu đa thời gian.
Chúng ta cũng cần phải thấy rằng trong hệ thông tin địa lý hệ thống phần cứng và phần mềm của hệ thống chỉ chiếm khoảng 15% giá thành toàn
hệ thống, bảo dưỡng hoạt động cho hệ thống chiếm khoảng 5% giá trị, đào tạo cán bộ khoảng 10%, còn lại 70% là giá trị của dữ liệu Vì vậy, có thể nói
cơ sở dữ liệu là "linh hồn'' của hệ thông tin địa lý.
3.2.5 Phương thức hay đó là các chính sách, quy định và pháp lý
Đây muốn nói đến môi trường pháp lý của hệ thông tin địa lý Môi trường này bao gồm: Chính phủ điện tử, các văn bản pháp luật, các nghị định, thông tư và các văn bán hướng dần thực hiện, các quyết định, quy định của các bộ, ngành, Trên cơ sở các chính sách, quy định và pháp lý, chủ trương ứng dụng của các nhà quản lý, các chuyên gia chuyên ngành sẽ đề xuất xem hệ thông tin địa lý sẽ được xây dựng theo mô hình nào lộ trình và phương thức thực hiện như thế nào, hệ thống được xây dựng sẽ đảm đương được các chức năng trợ giúp quyết định g ì
3.3.1.1 K h á i niệm chung về c ơ sở d ữ liệu
Các tập dừ liệu chứa các thông tin có liên quan đến một cơ quan, một
tổ chức, một chuyên ngành khoa học tự nhiên hoặc xã hội được lưu trữ
Trang 25trong máy tính theo một qui định nào đó cho mục đích sử dụng được gọi là
cơ sở dữ liệu (viết tắt CSDL, tiếng Anh là Database).
Phần chương trình để có thể xử lý, thay đổi dữ liệu này là hệ quản trị
cơ sở dữ liệu (HQTCSDL, tiếng Anh là D atabase management system) Theo nghĩa này HQTCSDL có nhiệm vụ rất quan trọng như là một bộ diễn dịch (interpreterj với ngôn ngữ bậc cao nhằm giúp người sử dụng có thể
dùng được hệ thống mà ít nhiều không cần quan tâm đến thuật toán chi tiết hoặc biểu diễn dữ liệu trong máy Mục đích chính của một hệ quản trị cơ sở dữ liệu là cung cấp một cách lun trữ và truy lục thông tin trong cơ sở dữ liệu sao
cho vừa thuận tiện vừa hiệu quà Một số hệ quàn trị cơ sở dữ liệu thông dụng
hiện nay đang được sử dụng như DataBase, SyBase, Informix, SQL Serve, Oracle, Microsoft Access Sự khác nhau giữa các hệ quản trị dữ liệu là định dạng dữ liệu (format) và ngôn ngữ hỏi đáp để tìm dữ liệu và cập nhật dữ liệu Các hệ quản trị cơ sở dữ liệu được thiết kế để quán lý một lượng lớn thông tin.
Hệ quản trị cơ sở dữ liệu hỗ trợ các tính năng sau:
- Định nghĩa dữ liệu (Database definition)
- Xây dựng dữ liệu (Database construction), hỗ trợ người dùng xây dựng các bộ dừ liệu riêng.
- Thao tác dữ liệu (Database manipulation) hỗ trợ các thao tác cập nhật, tìm kiếm, sửa, xoá
- Quản trị dữ liệu (Database administrator) hỗ trợ phân quyền sử dụng, bảo mật thông tin
- Bảo vệ dữ liệu (Database protection) thực hiện các thao tác sao chép, phục hồi, tránh mất mát dừ liệu.
Hệ quản trị cơ sở dữ liệu có thể được phân loại dựa theo nhiều tiêu chí khác nhau Ở đây giới thiệu ba kiểu HQTCSDL khác nhau được phân loại theo quan điểm chung nhất, đó là:
HQTCSDL loại 1 : Người dùng vừa thiết kế, sử dụng và quản trị, hay còn gọi là HQTCSDL đơn người dùng Nó thường được sử dụng để giải quyết các nhiệm vụ đơn lẻ với một người hoặc một vài người.
Trang 26HQTCSDL loại 2: Người sử dụng cuối truy cập cơ sở dữ liệu thông qua các thiết bị truy nhập đầu cuối, còn HQTCSDL đa người dùng - HQTCSDL trung tâm.
HQTCSDL loại 3: Những yêu cầu của người sử dụng cuối và trình ứng dụng được xử lý tại các máy trạm, chỉ những yêu cầu nào cần tới cơ sờ
dữ liệu mới được chuyển tới HQTCSDL nằm trên máy chủ Đây là mô hình HQTCSDL Client/Server
‘ Cả ba HQTCSDL trên đều đặt cơ sở dữ liệu tại một nơi, do đó HQTCSDL có tính chất tập trung.
Qua suốt bốn thập niên cuối cùng của thế kỷ 20, việc sử dụng cơ sở dừ liệu đã lớn dần ở nhiều cơ quan Trong những ngày đầu có rất ít người tương tác với các hệ cơ sở dữ liệu mặc dù họ không biết ràng họ đã tương tác gián tiếp với nó - qua những bản báo cáo in ra như phiếu thanh toán thè tín dụng hoặc trung gian qua nhân viên bán vé máy bay Sau đó các máy rút tiền tự động xuất hiện và cho phép người dùng tương tác trực tiếp với cơ sở
dừ liệu Các giao diện điện thọai với máy tính (các hệ thống trả lời tiếng nói trực tiếp) cũng cho phép người dùng tương tác trực tiếp với cơ sở dữ liệu - bên gọi có thể quay số và nhấn vào các phím của điện thọai để nhập thông tin và chọn lựa, chẳng hạn như tìm thời gian đến/đi của chuyến bay hoặc đăng ký các lớp ở một trường đại học.
Cuộc cách mạng Internet vào cuối những năm 90 đã làm tăng mạnh
mẽ số lượng người dùng truy xuất trực tiếp vào các cơ sở dữ liệu Các công
ty đã chuyển nhiều giao diện điện thọai của họ với cơ sở dừ liệu thành các giao diện web tạo ra nhiều dịch vụ và thông tin trực tuyến Thí dụ truy xuất một cửa hàng sách trực tuyến và duyệt xem sách hoặc băng đĩa nhạc, có nghĩa là chúng ta đang truy xuất dữ liệu được lun trong cơ sở dữ liệu Khi đặt một đơn đặt hàng trực tuyến, đơn này được lưu vào cơ sờ dừ liệu Khi truy xuất điểm web của một ngân hàng và truy lục thông tin số dư và giao dịch của mình, thông tin này được lấy từ hệ cơ sở dữ liệu của ngân hàng Khi truy xuất một điểm web, thông tin của chúng có thể được truy lục từ một cơ sở dừ liệu và chọn ra những quảng cáo thích hợp cho chúng ta Ngoài ra, dữ liệu về việc truy xuất cùa chúng ta cũng có thể được lun cất trong cơ sở dữ liệu.
Trang 27Vì thế mặc dù các giao diện người dùng đã che dấu các chi tiết về những truy xuất đến cơ sở dữ liệu và phần lớn chúng ta không biết rằng mình đang giao diện với một cơ sở dữ liệu, việc truy xuất cơ sở dữ liệu đã trở nên một bộ phận thiết yếu trong đời sống của mỗi người.
3.3.1.2 Kiến trúc m ộ t h ệ c ơ s ở d ữ liệu và tính độc lập của d ữ liệu
Một cơ sở dữ liệu được phân thành các mức khác nhau Ở đây ví dụ chỉ có một cơ sờ dữ liệu đơn giản và hệ quản trị cơ sở dữ liệu (hình 3.6).
X , M ôi trường hệ điều hành
Y êu câ u của
dữ liệu, nghĩa là hệ thống che khuất nhiều chi tiết về việc lưu trữ và duy trì các dữ liệu Các mức trìu tượng hóa dừ liệu như mô tả tổng quát ở hình 3.7 Mức trìu tượng hóa thấp nhất của kiến trúc một hệ c ơ s ờ dữ liệu là cơ
sờ dữ liệu vật lý (mức vật lý) là các tệp dữ liệu theo một cấu trúc nào đó
được lưu trên các thiết bị nhớ thứ cấp (như đĩa từ, băng từ ) Mức này mô
tả việc dữ liệu thật sự được lưu như thế nào Ở mức vật lý, một mẫu tin có thể được mô tả như một khối các vị trí lưu trữ nằm kế cận nhau (ví dụ như các từ nhớ hoặc byte) Trình biên dịch của ngôn ngữ che khuất không cho
Trang 28chúng ta thấy mức chi tiết này Tương tự, hệ thống che khuất nhiều chi tiết lưu trữ ở mức thấp nhất Tuy nhiên, người quản trị cơ sờ dữ liệu cỏ thê biết được một số chi tiết tổ chức vật lý của dữ liệu.
Hình 3.7 Cấu trúc của cơ sở dữ liệu
C ơ sở dữ liệu mức khái niệm hay gọi là mức Logic Đ ó là mức trìu
tượng hóa kế tiếp mô tả việc những dữ liệu nào được lưu trong cơ sờ dữ liệu
và mối quan hệ tồn tại giữa các dừ liệu này Mức Logic vì thế mô tả toàn bộ
cơ sở dữ liệu theo một số ít cấu trúc tương đối đơn giản, mặc dù bản cài đặt các cấu trúc đơn giản ở mức logic có thể chứa đựng các cấu trúc phức tạp của mức vật lý, người sử dụng không cần biết về sự phức tạp này Ở mức này, mỗi mẫu tin như thế được mô tả bàng một định nghĩa kiểu giống như đoạn mã ở trên và mối liên hệ qua lại giữa các kiểu dữ liệu này cũng được định nghĩa.
sở dữ liệu Mặc dù mức logic sử dụng các cấu trúc đơn giản, sự phức tạp vẫn còn do có rất nhiều loại thông tin trong một cơ sở dừ liệu lớn Nhiều người sử dụng hệ thống không cần tất cả mọi loại thông tin này thay vào đó
họ chi cần truy xuất một phần cơ sở dữ liệu Như vậy mức khung nhìn tồn tại để đcm giản hóa sự tương tác với hệ thống Hệ thống có thể cung cấp nhiều khung nhìn trên cùng một cơ sở dừ liệu và người sừ dụna chi thấy nhừng mức khung nhìn này.
v ề tính độc lập của dừ liệu, chúng ta hãy xem xét hình 3.7 từ khung nhìn, tới cơ sờ dừ liệu khái niệm và cơ sở dừ liệu vật lý cho thấy có hai mức
Trang 29líđ ộ c l ậ p d ữ l i ệ u ” Thứ nhất, lược đồ vật lý có thể thay đổi do người quản trị
cơ sở dữ liệu mà không cần thay đổi lược đồ con Việc tổ chức lại cơ sở dữ liệu vật lý (thay đổi các tổ chức, cấu trúc dữ liệu trên các thiết bị nhớ thứ cấp) có thể làm thay đổi hiệu quả tính toán của các chương trình ứng dụng nhưng không đòi hỏi phải viết lại các chương trình đó Tính độc lập này gọi
Vì thế, tính độc lập dữ liệu là mục tiêu chủ yếu của các hệ cơ sở dữ liệu Có thể định nghĩa tính độc lập dữ liệu là “tỉn h b ẩ t b i ế n c á c h ệ ứ n g
d ụ n g đ ố i v ớ i c á c t h a y đ ổ i t r o n g c ấ u tr ú c lư u t r ừ v à c h iế n l ư ợ c t r u y nhập'".
3.3.ỉ 3 Thể hiện và lư ợc đồ
Cơ sở dữ liệu thay đổi theo thời gian khi các thông tin được chèn thêm
và được xoá bớt đi Tập họp các thông tin được lưu trong cơ sở dữ liệu tại
một thời điểm cụ thể được gọi là một th ể hiện của cơ sở dữ liệu Bản thiết
kế tổng thể của cơ sở dữ liệu được gọi là lư ợc đồ cơ sở dữ liệu Các lược đồ
ít khi thay đổi nếu không nói là không thay đổi Các hệ cơ sở dừ liệu có nhiều lược đồ, được phân chia dựa theo các mức trìu tượng hóa Lược đồ vật lý mô tả bản thiết kế cơ sở dữ liệu ở mức vật lý, lược đồ logic mô tả bản thiết kế cơ sở dữ liệu ở mức logic Một cơ sở dữ liệu cũng có thể có nhiều lược đồ ở mức khung nhìn hay còn gọi là lược đồ con, chúng mô tả những khung nhìn khác nhau của cơ sở dữ liệu.
Cho đến nay, lược đồ logic là lược đồ được coi là quan trọng nhất nếu nói theo tác dụng của nó đối với các chương trình ứng dụng Lược đồ vật lý được che khuất bên dưới lược đồ logic và thường có thể thay đổi dễ dàng
mà không làm ánh hưởng đến các chương trình ứng dụng.
Trang 30Mồi mô hình cơ sở dữ liệu sẽ làm nền tảng cho cấu trúc của một cơ sở
dữ liệu, nghĩa là liên quan đến phương pháp tổ chức dữ liệu trong một cơ sở
dữ liệu logic hoặc liên quan đến cấu trúc logic của dữ liệu trong cơ sờ dữ liệu.
M ô hình phân cấp (Hierarchical models)
Mô hình phân cấp là sự kết hợp của nhiều cấp độ cơ bản có liên quan Trong thực tế, nó là một cây theo thứ tự (hình 3.8) Mô hình phân cấp lưu trữ dữ liệu bằng các cấp độ giống như mỗi bộ phận phù hợp với cấu trúc của một cây như rễ, cành và lá c ấ p độ thứ nhất R| trong hình vẽ là rễ; S l, S3 ở cấp độ thứ hai là cành, trong khi đó S2, S4, T l, T2, T3, , T7 ở cấp độ hai
và ba là lá.
3.3.1.4 Mô hình cơ sở dữ liệu
Hình 3.8 Mô hình dữ liệu phân cấp
Tuy nhiên, để nhận ra một mô hình phân cấp không khó, nhưng còn một số vấn đề trong việc tìm kiếm cấp độ này sau một cấp độ khác và còn nhiều dừ liệu dư thừa.
Trang 31M ô hình m ạng (N etw ork M odel)
Mô hình mạng là sự tập hợp các cấp độ cơ bản đã được kết nối như
mô phỏng theo hình 3.9.
Đặc điểm cơ bản của nó là không chỉ được kết nối từ lá đến cành Ví
dụ, SI trong hình vẽ được kết nối với R I, R3 Loại cấu trúc này có thể được xem như là loại cấu trúc phân cấp có nhiều mạng kết nối Kết quả là, tuy tiết kiệm được thời gian tìm kiếm, nhưng mối quan hệ giữa các dữ liệu lại phức tạp, còn cấu trúc thì không thể nhìn thấy một cách rõ ràng.
Trong mô hình mạng và mô hình phân cấp, việc truy cập tuyến dữ liệu một cách cẩn thận là rất cần thiết Một khi nó đã được xác định thì tuyến dữ liệu không thể thay đổi được Vậy kết quả hiện hữu của các mối quan hệ phức hợp trong thực tế giữa các dữ liệu thường là không thể mô tả chúng bằng một mô hình mạng hay một mô hình phân cấp cố định Vì vậy, khái niệm của một mô hình quan hệ đã được hình thành.
Mô hình quan hệ (R elationship M odel)
Mô hình quan hệ liên quan đến sự tập hợp nhiều mối quan hệ hiện hữu giữa các dữ liệu Mô hình quan hệ sử dụng một tập các báng để biểu diễn cá
dữ liệu lẫn mối liên hệ giữa những dữ liệu này.
Mỗi bảng có nhiều cột và mỗi cột có một tên duy nhất Mồi bảng đều chứa các các mẫu tin cùng kiểu Mỗi mẫu tin định nghĩa một số trường hay thuộc tính nhất định Các cột của bảng tương ứng với các thuộc tính của kiểu mẫu tin Ví dụ, bảng 3.2 đưa ra một phần mô hình quan hệ cứa cơ sở
Trang 32Khi sử dụng, chúng ta phải thiết lập sự phân tích cấu trúc và đưa ra dữ liệu theo mô hình mạng và mô hình phân cấp, sau đó cố định mối quan hệ logic giữa các dữ liệu nếu cần thiết Tuy nhiên trong cơ sở dữ liệu quan hệ, việc thiết lập các mối quan hệ logic phức hợp thường không cần thiết Những gì chúng ta làm là lưu trừ dữ liệu trên máy tính theo một mẫu nhất định, sau đó chúng có thể được sử dụng cho các mục đích khác nhau.
Bảng 3.2 Mô hình quan hệ cơ sở dữ liệu
Mói quan hê sinh viên
Trang 33chính không được trùng nhau và không được rỗng Có bốn khả năng tồn tại cho các mối quan hệ giữa các bảng:
- Q u a n h ệ m ộ t đ ổ i m ộ t: Đòi hỏi giá trị của trường khóa trong chỉ một khoản tin của bảng mới phải so khớp với một giá trị tương ứng của trường
có quan hệ trong bảng hiện có Trong trường hợp này, khóa trường trong bảng phải là duy nhất, không thể có giá trị trùng lặp trong trường khóa.
- Quan hệ nhiều đối một' Cho phép bảng mới có nhiều giá trị trong
trường khóa tương ứng với chỉ một giá trị trong trường quan hệ của bảng hiện có Trong trường hợp này có thể có các giá trị trường khóa trùng lặp, bởi vì trường là một trường khóa ngoại.
- Quan hệ một đối nhiều: Đòi hỏi trường khóa chính của bảng mới
phải là duy nhất, nhưng các giá trị trong trường khóa ngoại của bảng mới có thể so khớp với nhiều mục trong trường quan hệ của cơ sở dữ liệu hiện có Trong trường hợp này, trường quan hệ của cơ sở dữ liệu sẽ có nhiều mối quan hệ nhiều đối với trường khóa chính của cơ sở dữ liệu mới.
- Quan hệ nhiều đổi nhiều: là kiểu tự do, ớ đó không có mối quan hệ
duy nhất nào tồn tại giữa các trường khóa trong bảng hiện có hoặc bảng mới, các trường khóa ngoại của cả hai bảng sẽ chứa các giá trị trùng lặp các mối quan hệ nhiều đối nhiều được tạo thông qua các bảng quan hệ chỉ chứa các trường khóa ngoại.
Thuận lợi của mô hình quan hệ là được hình thức hóa toán học chặt chẽ, do đó các xử lý, thao tác với dữ liệu dễ dàng, có tính độc lập dữ liệu cao Cấu trúc dữ liệu đơn giản mềm dẻo trong xứ lý và dễ dàng cho người
sử dụng Đặc biệt các phép tính cập nhật dữ liệu cho mô hình quan hệ nói chung là ít phức tạp hơn nhiều so với các mô hình khác.
M ô hình quan hệ thực thể (E R M - E ntity R elationship M odel)
Mô hình quan hệ thực thể dựa trên quan niệm về thế giới thực bao gồm các đối tượng được gọi là các thực thể (entity) và mối quan hệ giữa chủng "Thực thể" là một vật hoặc một đối tượng (gọi là object) trong thế giới thực mà ta có thể phân biệt được chúng với nhau Các thực thể được mô
tà trong CSDL bởi một tập các thuộc tính (attributess or features).
Trang 34Thực thể là một vật thực hay một đối tượng tồn tại một cách khách quan, chúng ta có thể phân biệt chúng nhờ chi số index của chúng Ưong máy tính (ID) Nếu các thực thể không có chi số thứ tự tự nhiên thì chúng ta phải tạo ra các chỉ sổ cho chúng Thuộc tính hay còn gọi là tính chất của các thực thể được biểu thị trong các trường (cột) của bảng Giữa các thực thể có các mối quan hệ với nhau.
M ô hình hướng đối tượng (O O M - O bject O rien ted M odel)
Mô hình hướng đối tượng dựa trên cơ sở các gói dữ liệu (data packages) và mã liên quan tới đối tượng Mọi sự tương tác cùa người sử dụng với các đối tượng được quản lý này đều thông qua các thông điệp, hoặc sự tương tác giữa đối tượng này với đối tượng khác đều phải thông qua các thông điệp Đối tượng bao giờ cũng có mã thao tác, nhưng mã này được gọi là những phương pháp Những đối tượng có chung kiểu giá trị và cùng phương pháp thì được gộp vào một lớp.
Mô hình hướng đối tượng là một mô hình hiện đại được nhiều quốc gia phát triển trong những năm gần đây và cũng có nhiều ứne dụng trong các ngôn ngừ lập trình cũng như các giải pháp về phần mềm và phần cứng.
Trên cơ sờ các mô hình dữ liệu trên, trong quá trình sử dụng và phát triển, người ta đang nghiên cứu phát triển thêm một số loại mô hình dữ liệu khác nhằm mô tả và thể hiện thế giới thực một cách chính xác và phù hợp với nhu cầu sử dụng hơn.
Trang 35Như chúng ta đã biết, cơ sở dữ liệu chiếm khoảng 70% giá trị của hệ thống thông tin địa lý, hay nói cách khác cơ sở dữ liệu chính là “linh hồn” của hệ thống thông tin địa lý Cơ sở dữ liệu của hệ thống thông tin địa lý là tập hợp dữ liệu có liên quan với nhau được lưu trữ dưới dạng số Vì cơ sở
dữ liệu của hệ thống có mối liên quan với các điểm đặc trưng trên bề mặt trái đất nên nó bao gồm hai nhóm là cơ sở dữ liệu không gian và cơ sở dữ liệu thuộc tính Hai loại dữ liệu này cần phải tuân theo một cấu trúc hợp lý
để thuận tiện quản lí, lưu trữ, sửa đổi và khai thác theo mục đích sử dụng.
3.3.2.1 C ơ s ở d ữ liệu không gian
Cơ sở dữ liệu không gian là cơ sở dữ liệu có chứa trong nó những
thông tin về định vị của đối tượng N ó là những dữ liệu phản ánh, thể hiện những đối tượng có kích thước vật lý nhất định Nếu là những cơ sở dữ liệu không gian địa lý thì đó là những dữ liệu phản ánh những đối tượng có trên
bề mặt hoặc ở trong vỏ quả đất.
Từ góc độ công nghệ thông tin địa lý, đó là những yếu tố không gian lí địa lý được phản ánh trên bản đồ bằng những kiểu cấu trúc dữ liệu nhất định Tuy nhiên cơ sở dữ liệu không gian không đơn thuần là sự mô tả địa chỉ của một khu dân cư mà chúng ta nên hiểu rằng khu dân cư đó chính là một cơ sở dữ liệu không gian Dữ liệu không gian có ba dạng cơ bản là điểm, đường và vùng Các đối tượng dạng kiểu đất cảnh quan như hồ nước, ranh giới thảm thực vật là dữ liệu không gian vùng; sông, suối, đường giao thông là dữ liệu dạng đường; điểm mốc trắc địa, điểm giếng khoan, cột điện là dữ liệu dạng điểm.
Tất cả các đối tượng trên bề mặt quả đất đều có thể gộp vào ba dạng
cơ bản trên bởi vì công nghệ hệ thống thông tin địa lý là công nghệ tin học
và máy tính không hiểu được các khái niệm giếng khoan, sông là gì, nhưng nó có thể hiểu được định nghĩa về điểm, đường, vùng Các yếu tố cơ bản nêu trên thường được gắn với lời chú giải hoặc kí hiệu Ví dụ những bãi bùn cát, vùng cây ngập nước được thể hiện bàng vùng bao phủ tập hợp tọa
3.3.2 Cấu trúc cơ sở dữ liệu trong hệ thông tin địa lý
Trang 36độ cùng với những kí hiệu qui định Các chú giải này có thể là tên, có thể là
kí hiệu thực tế hoặc số qui ước hay kí hiệu đặc biệt.
Đ ể qui dữ liệu không gian về ba loại trên, cần thiết phải xác định:
Vị trí của đối tượng: Trong khi tạo dựng dữ liệu chúng ta luôn phải trả lời câu hỏi cái này ở đâu? vị trí của nó ở chỗ nào trong hệ quy chiếu đã chọn , vì vậy việc xác định vị trí các đối tượng là hết sức cần thiết.
Đặc trưng của đối tượng: Đây chính là mô tả thuộc tính của đối tượng và máy tính có thể hiểu được nhờ mã hóa chúng theo các mức dừ liệu
và các giá trị số khác nhau.
Mối quan hệ giữa các đối tượng: Các đối tượng nghiên cứu chuyên ngành luôn được so sánh với nhau để tìm ra mối liên quan hình học và ảnh hưởng giữa chúng Đây là một yếu tố rất quan trọng và có thể là yếu tố then chốt trong công nghệ thông tin địa lý và cũng là sự khác nhau cơ bản giữa
hệ thông tin địa lý với các hệ thông tin khác!
Tất cả các đối tượng trong hệ thông tin địa lý đều có thể được mô tả theo hai kiểu cấu trúc dữ liệu raster hoặc vector.
Cấu trúc dữ liệu Raster: Đây là cấu trúc dữ liệu mà trong đó dữ liệu được thể hiện thành một mảng gồm các pixel và mồi pixel đều mang giá trị của thông sổ đặc trưng cho đối tượng Một khu vực trên bản đồ được biểu thị ở dạng số bàng cách lun giữ vị trí (tọa độ tâm điểm của chúng), kích thước và đặc tính tương ứng của đối tượng thuộc pixel đó M ồi Pixel sẽ tương ứng với một diện tích vuông trên thực tế Giá trị độ lớn của Pixel còn được gọi là độ phân giải của dữ liệu Hình vuông là dạng pixel phổ biến nhất, sau đó là hình chữ nhật.
Đối với một file dừ liệu dạng Raster, cần có một file chứa các thông tin về cấu trúc của dữ liệu, ta gọi là Header file.
Thông thường khi lưu trữ cũng như biểu diễn thông tin theo dạng cấu trúc raster thì người ta hay sử dụng thuật toán mã nhị phân, tức là những thông tin biểu diễn đều được gán mã là 1, còn phần trống (không chứa thông tin) sẽ được gán mã là 0 hoặc ngược lại.
Trang 37Trong cấu trúc dữ liệu raster, các đối tượng được biểu diễn dưới các dạng cơ bản sau:
Đ ố i tư ợ n g điểm Điểm được xác định tương ứng với một pixel Trong
thế giới thực, điểm có thể là một ngôi nhà nằm trên vài Pixel có cùng giá trị (mã) Yếu tố hình học và topology dạng điểm của dữ liệu raster được biểu thị ở hình 3.10.
Pixel số i
ạ.
5
ó-(ũ
<y>
o»
( i ,j ) = (3, 4); (2 ,6 ); (5 ,7 ) (a ) H ìn h học (b) T op o lo g y
Hình 3.10 Đối tượng dạng điểm
Đ ổi tư ợ ng đường' Đường là tập hợp các pixel liên tiếp nhau có cùng
giá trị Yeu tố hình học và topology dạng đường dữ liệu raster được chỉ ra ở hình 3.11.
w Pixel số i
Q O'
Trang 38Đ ố i tư ợ n g vù n g : Vùng được xác định bời một tập hợp các pixel có
cùng giá trị liên tục nhau theo các hướng Yếu tố hình học và topology dạng vùng của dữ liệu raster được chỉ ra ở hình 3.12.
Đ ổ i tư ợ n g điểm' Điểm trong cấu trúc dữ liệu vector được mô tả bởi
cặp tọa độ X,Y trong một hệ thống tọa độ nhất định Đi theo giá trị tọa độ X,Y của điểm còn có chỉ số cụ thể để mô tả đặc tính của điểm (điểm đơn giản, điểm nút, độ sâu ).
Trang 39Các đối tượng điểm có đặc điểm:
- Là tọa độ đơn (x, y);
- Không thể hiện chiều dài và diện tích.
N ếu tỷ lệ trên bản đồ là tỷ lệ lớn thì đối tượng sẽ được thể hiện dưới dạng vùng Tuy nhiên trên bản đồ tỷ lệ nhỏ, đối tượng này có thể thể hiện dưới dạng một điểm Vì vậy, các đối tượng điểm và vùng có thể được dùng phản ánh lẫn nhau.
Đ ố i tư ợng đ ư ờ n g : v ề mặt lý thuyết đường là tập hợp vô số các điểm liên tiếp mô tả các đối tượng địa lý dạng tuyến Trong cấu trúc dữ liệu vector thường mô tả đường là tập hợp các cung (ARC), mỗi cung là tập hợp của các đoạn thẳng nhỏ nối giữa các điểm kề nhau đã được chọn Các đoạn thẳng này đủ nhỏ để đảm bảo không lệch khỏi đoạn thực một khoảng vượt quá sai số cho phép, s ố liệu định vị của các yếu tố đường được lun trong máy tính dưới dạng tập hợp các cặp tọa độ, trong đó các cặp tọa độ đặc trưng cho điểm thuộc đường đó Với một đường thẳng ta có thể lưu giữ tọa
độ của hai điểm đầu và cuối, nhưng với một đường cong số lượng điểm lun trữ rất lớn Các điểm của đường được chọn để lưu trữ thường là các điểm ngoặt (điểm đặc trưng) phản ánh đúng hình thái của đường một cách đơn giàn nhất.
Trục y
File tọa độ đường Chi số Tọa độ x,y
- ' Ị i n i d
Hình 3.14 Dừ liệu vector được biểu thị dưới dạng đường
Trang 40Đối tượng đường có các đặc điểm sau:
- Là một dãy các cặp tọa độ;
- Một đường thẳng bắt đầu và kết thúc bởi nút;
- Các đường thẳng nổi với nhau và cắt nhau tại nút;
- Hình dạng của đường thẳng được định nghĩa bởi các đinh (vertices);
- Độ dài chính xác bằng các cặp tọa độ.
Đ ổ i tư ợ ng vùng' Vùng (hay còn gọi là miền) có thể coi là tập hợp vô
số điểm được giới hạn bởi một đường khép kín Các đối tượng địa lý có diện tích và đóng kín bởi đối tượng đường được gọi là đối tượng vùng, s ố liệu định vị của yếu tố vùng được xác định bởi đường bao của chúng Đối tượng vùng có các đặc điểm sau:
- Vùng được mô tả bằng tập các đường và điểm nhãn (label points).
- Một hoặc nhiều đường định nghĩa đường bao của vùng.
- Một điểm nhãn nằm trong vùng để mô tả, xác định cho mồi một vùng.
Hình 3.15 Dữ liệu vector được biểu thị dưới dạng vùng
N ói chung không có sự khác biệt giữa việc lưu trữ số liệu định vị của đối tượng đường và số liệu định vị của đối tượng vùng, cả hai đều lưu trữ dưới dạng tập hợp các điểm của một đường Nhưng có thể nhận biết rò ràng nếu chi ra số liệu định vị kèm theo kiểu yếu tố được biểu thị (điểm , đường, vùng) Ngoài ra cũng có khả năng ngầm hiểu như rừng thường là đối tượng vùng, đường sắt là đối tượng đường Đường bao của một vùng khép kín