Tuy nhiên, nhìn chung GIS được định nghĩa là một hệ thống thông tin được lưu trữ trên máy tính có khả năng thu thập, lưu trữ, điều chỉnh, phân tích và thể hiện thành hình __ ảnh không g
Trang 1CHUONG TRINH DIEU TRA CO BAN
- KC.09-
**K* ELI KKK
BAO CAO KET QUA NGHIEN CUU KHOA HOC
Đề tài: ĐÁNH GIÁ TONG HOP TIEM NANG TU NHIEN, KINH TẾ XÃ HỘI;
THIET LAP CO SG KHOA HỌC VÀ CÁC GIẢI PHÁP PHÁT TRIỂN KINH TE - XA HOI BEN VUNG CHO MỘT SỐ HUYỆN ĐẢO
Mã số: KC-09-20
Chủ nhiệm: TSKH Phạm Hoàng Hải
Chuyên dé
XÂY DỰNG CƠ SỞ DỮ LIỆU HỆ THỐNG
CAC HUYEN DAO VEN BO VIET NAM
Trang 2MUC LUC
Trang
DANH MỤC CÁC TỪ VIẾT TẮT " iv
DANH SÁCH BẢNG BIỂU VÀ HÌNH VẼ Error! Bookmark not defined
DANH SÁCH BẢN ĐỔ -es.e rErerrttttiir.rrrrrrriirkerrsririierorrie vii
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT XÂY DUNG HE CƠ SỞ DỮ LIỆU HỆ THỐNG CÁC HUYỆN ĐẢO VEN BỜ VIỆT NAM1 KHÁI QUÁT VỀ HỆ THỐNG THÔNG TIN ĐỊA LÝ 1
1.1.Các khái niệm cơ bản vẻ hệ thống thông tỉn địa lý - eerrrrre 1
ăn) Trẻ nehe I
1.1.3 Các chức năng của phân mềm hệ thống thông tín địa lý
1.1.4 Sử dụng hệ thống thông tin địa lý cho phân tích không 6i4n eằ 7 1.1.5 Một số vấn đề cơ bẩn trong xử lý không QIAN ec ceccccestestes cesses te esseeseeseseessteeesneenens 8 1.1.6 Các yếu tố cơ bản của thông tin không BÌ4H: che 9 1.1.7 Tổ chúc dữ liệu không gian của hệ thống thông tin địa lý: cco.e 10 1.2.Các mô hình cấu trúc cơ sở dữ liỆU - . <5 se s << n3 Y4 e1 seree 13
12.6 Mô hình dữ liệu hướng đối tHỢNg, SE nh 222221 xxsuree 24
1.2.7 Mô hình hướng đối tượng cho GIS 26
1.3.1 Điều khiển thông tin một lỚp S221 222 ee 41
1.3.2 Điều khiển chi tiét (Feature Manipulation) o.c.cccccccccccccccccscscscesccesescestsveecesvesseces 4]
134 Phan loai tu liéu trong hé théng thong tin dia ly (Data Classification) : 49 1.3.5 Điều khiển thông tin nhiều lớp (Muliilayer operdtiOh) -.-s-cccccseecree 53 1.4 Phan tich mu di€M c.csececesssceccssessseesescsessssssssssssssucacsssncesencsscacseeacsasescacsnsenees 60 1.5, Phân tích đường -«- -s.<ese
Trang 31.6 Giới thiệu về các thiết bị xuât nhập đữ liệu . -«-«+-< s-=sexss+ 70
1.6.1 Các thiết bị nhập đữ liệM ch ng rrrrrHrerrane 72
1.6.2 Xuất dữ liệu ccccncnnnnnenieerrrrree TH n2 Hee 75
CHƯƠNG 2 : XÂY DỰNG CƠ SỞ DỮ LIỆU HỆ THỐNG CÁC HUYỆN ĐẢO VEN BỞ VIỆT NAM, LẤY VÍ DỤ HAI HUYỆN ĐẢO CÔ TÔ VÀ LÝ SƠN ccc.e 78 2.1 Xây dựng cơ sở dữ liệu cho huyện đảo Lý Sơn . es-e-=-ssseseerreess 78 2.1.1 Thành lập bản đồ địa hình
2.1.2 Thành lập bản đồ địa chất
2.1.3 Thành lập bản đồ địa mạo
2.1.4 Thành lập bản đồ tài nguyên và môi ITHỜNg HHÓC càceSeieierrerrerre 87
3.1.1 Các báo cáo chuyên đỀ che
3.2.6 Chức năng chuyển đổi định dạng cơ sở dữ liệu
3.2.7 In ấn cơ sở đữ liệu
il
Trang 4DANH SACH TAC GIA THAM GIA THUC HIEN
Trang 5DANH MUC CAC TU VIET TAT
nghiệp của Liên Hợp quốc,
Quốc gia về chuẩn dữ liệu đồ hoạ số của Mỹ
biến đổi điều hoà dải màu xám
UTM Universal Transverse Mercator Projection - Hệ toạ độ lưới chiếu hình nón của Mỹ
Trang 6
DANH SACH BANG BIEU, HINH VE
Trang
Bảng 1.2: Bảng thống kê thuộc tính của cung AAT ceeireerrrrirrrire 22 Bảng 2.1: Tổng hợp các lớp thông tin bản đồ địa hình huyện Lý Sơn 80 Bảng 2.2: Tổng hợp các lớp thông tin bản đồ địa chất huyện đảo Lý Sơn 84 Bảng 2.3: Tổng hợp các lớp thông tin bản đồ địa địa mạo huyện đảo Lý Sơn 87 Bảng 2.4: Tổng hợp các lớp thông tin bản đồ tài nguyên nước dưới đất huyện đảo Lý
ko 90
Bảng 2.5: Tổng hợp các lớp thông tin bản đồ đất huyện đảo Lý Sơn 94 Bảng 2.6: Tổng hợp các lớp thông tin bản đồ thảm thực vật huyện đảo Lý Sơn 98 Bảng 2.7: Tổng hợp các lớp thông tin bản đồ hiện trạng sử dụng đất huyện đảo Lý Sơn
101
Bảng 2.8 : Tổng hợp các lớp thông tin bản đồ địả hình huyện đảo Cô Tô 105 Báng 2.9: Tổng hợp các lớp thông tin bản đồ địa mạo huyện đảo Cô Tô 108 Bảng 2.10: Tổng hợp các lớp thông tin bản đồ hiện trạng tài nguyên nước dưới đất I01420E:909901 0001015 Bảng 2.11: Tổng hợp các lớp thông tin bản đồ đất huyện đảo Cô Tô
Bảng 2.12: Tổng hợp các lớp thông tin bản đồ thảm thực vật huyện đảo Cô Tô
Bảng 2.13: Tổng hợp các lớp thông tin bản đồ hiện trạng sử dụng đất huyện đảo Cô Tô
Hình 1.1: Khái niệm về GIS (Nitin 2002) . 2c < n2 T122 1511121 1Errerree 2
Hình 1.2: Mô hình tổ chức, của hệ thống thông tin địa lý . ccccccceescee 3 Hình 1.3: Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B) 15
Hình 1.4: Biểu điễn raster dữ liệu theo lưới điểm -2-ccce+czeeccrxesre
Hình 1.5: Biểu diễn raster dữ liệu theo cấu trúc ô chữ nhật phân cấp
Hình 1.6: Dữ liệu thuộc tính cho cấu trúc ô chữ nhật phân cấp và sự chồng xếp các lớp thông tin của dữ LiỆU TASf€T - c Q n2 T2 HE HH HH 1 1x1 ng re 17 Hình 1.7: Cấu trúc dữ liệu vecter của poligon :-:ccctc2ct2retrrEreekerrrererres Hình 1.8: Biểu điễn mô hình Vector của các đối đượng địa lý
Hình 1.9 So sánh giữa cấu trúc Raster và V€CfOF - - ác S n2 91v HH sen Hình 1.10: Cấu trúc một polygon đơn giản trong mô hình cung và điểm nối 21 Hình 1.11: Các kiểu đối tượng của yếu tố hình học -csccccczscscccrerkscxrree 25
Hình 1.13: Chuyển đổi dạng Vector sang Raster và ngược lại 31 Hình 1.14: Các đường kinh tuyến, vĩ tuyến trong hệ toạ độ lưới - 34
Trang 7áp dụng chức năng loại bỏ để chỉnh sửa bản đồ ii 45
: Tao cdc ving đệm với các khoảng cách khác nhau s-c+c<55252 46 : Kết quả phân tích sự gần gũi
Xác định độ cao của một điểm bằng con trỏ và màn hình 48
6 mẫu phân bố tần số thông dụng .-.-.- 2S vn Hee 50 Phân chia bản đồ thành các vùng theo hệ số chia mảnh khác nhau 53
Mô phỏng quan hệ giữa hai lớp thông tin bằng thuật toán Boolean 54 Quan hệ logic giữa các lớp thông tin véctơ
Kết quả trong phép tính đồng nhất (Identity) -5ccccccccc-s-se 56
Sơ đồ hàm NEAR tính khoảng cách một điểm tới đường gần nhất 57
Tính toán giá ở các vị trí có khoảng cách khác nhau .- «+ 39
Mô tả cho các dạng phân bố điểm khác nhau 5 ccccccczcscsse2 61
Độ phân tán của các điểm
Sự phân bố ngẫu nhiêncủa các điểm
Mô hình phân bố không gian của các tập hợp điểm -c-ccsca 64
vì
Trang 8DANH SACH BAN DO
Bản đồ địa hình huyện dao Ly Son
Bản đồ địa chất huyện đảo Lý Sơn
Bản đồ địa mạo huyện đảo Lý Sơn
Bản đồ hiện trạng tài nguyên nước dưới đất đảo Lý Sơn
Bản đồ thổ nhưỡng huyện đảo Lý Sơn
Bản đồ thực vật huyện đảo Lý Sơn
Bản đồ hiện trạng sử dụng đất huyện Lý Sơn
Bản đồ địa hình đảo Cô Tô - Thanh Lam, huyện Cô Tô
Tô,
11 Bản đồ thổ nhưỡng đảo Cô Tô - Thanh Lam, huyện Cô Tô
12 Bản đồ thảm thực vật đảo Cô Tô - Thanh Lam, huyện Cô Tô
13 Bản đồ hiện trạng sử dụng đất và phát triển kinh tế — xã hội đảo Cô Tô - Thanh Lam huyện Cô Tô
Trang 9CHUONG 1:
CO SO LY THUYET XAY DUNG HE CO SO DU LIEU
HỆ THỐNG CÁC HUYỆN ĐẢO VEN BỜ VIỆT NAMI KHÁI QUÁT VỀ
HỆ THỐNG THÔNG TIN ĐỊA LÝ
1.1.Các khái niệm cơ bản về hệ thống thông (in địa lý
1.1.1 Định nghĩa
Có nhiều định nghĩa khác nhau về một hệ thong thong tin dia ly (HTTTDL) ma nhiều khi trong các tài liệu vẫn thường duce goi tat 14 GIS (Geographical Information System), về tổng thể có những định nghĩa sau là nêu được một cách tổng hợp các chức năng và thành phần của một hệ thống thông tin địa lý hoàn chỉnh
Định nghĩa: hệ thống thông tin địa lý là một hệ thống bao gồm các phần mềm, phần cứng máy tính và một cơ sở đữ liệu đủ lớn, có các chức năng thu thập, cập nhật, quản trị và phân tích, biểu diễn dữ liệu địa lý phục vụ giải quyết rộng lớn các bài toán ứng dụng có liên quan tới vị trí địa lý trên bề mặt trái đất
Burough (1986) định nghĩa GIS là một công cụ mạnh sử dụng cho thu thập, phân tích thông tin, sau đó chuyển đổi, thể hiện các dữ liệu không gian của thế giới thực cho một mục đích cụ thể nào đó GIS còn được định nghĩa là một hệ thống máy tính sử dụng cho mục đích lưu trữ và phân tích theo từng mục đích cụ thể những thông tin địa
lý (Aronoff, 1989)
Cowen (1988) xa hơn nữa đã định nghĩa GIS là “một hệ thống hỗ trợ ra quyết định sử dụng các dữ liệu không gian trong việc giải quyết các vấn đề về môi trường”
Tuy nhiên, nhìn chung GIS được định nghĩa là một hệ thống thông tin được lưu trữ trên
máy tính có khả năng thu thập, lưu trữ, điều chỉnh, phân tích và thể hiện thành hình ảnh không gian cùng với các dữ liệu bảng, thuộc tính đi cùng trong việc giải quyết các nghiên cứu phức tạp cũng như quy hoạch - lập kế hoạch và quản lý (Fishcher and Nijkamp, 1993)
Hệ thống thông tin địa lý là một công cụ mạnh mẽ trong việc tổ chức, quản lý và trình bày đữ liệu không gian GIS với các tính năng của nó đã đóng góp cho rất nhiều cho các ngành khoa học và nó đã thực sự trở thành một cuộc cánh mạng với tốc tộc, tính chính xác và khả năng quản lý một cơ sở dữ liệu lớn Ngoài những mặt nêu trên ứng dụng của GIS trong ngành khoa học thủy sản ngày nay cũng tương đối phát triển
so với ứng dụng của nó với các ngành khoa học khác Tuy nhiên, những ứng dụng của GIS cho ngành khoa học thủy sản có tính phức tạp riêng bởi vì chúng phải xem xét một
hệ thống thủy sản trên nhiều phương diện ví dụ như các đặc tính sinh học của các loài
Trang 10thủy sản, sinh thái vùng nuôi và hàng loạt các dữ liệu về điều kiện tự nhiên, kinh tế và
xã hội của khu vực nuôi chứ không chỉ quan tâm đến các đặc điểm địa lý của khu vực Chủ đề sử dụng GIS là một chủ đề đã được thảo luận rất nhiều và như chúng ta đã biết GIS có khả năng liên kết các dữ liệu không gian với các dữ liệu thuộc tính, từ đó
đã đưa ra các kết quả đầu ra là bản đồ, hình ảnh và bảng biểu Trong khi đó bản đồ là một công cụ vô cùng hữu ích cho những nhà lập kế hoạch quản lý tài nguyên, những người đi công tác thực địa và người dân địa phương - những người muốn hiểu hiện trạng thực tế của vùng bảo tồn hoặc vùng quy hoạch, quản lý Như vậy, GIS đã trở thành một công cụ phân tích hữu dụng mạnh mẽ dành cho các nhà lập kế hoạch và quản lý tài nguyên (FAO, 1988)
Hệ thông tin địa lý (HTTĐL) là một tổ chức tổng thể của bốn hợp phân: phần cứng máy tính, phần mềm, tư liệu địa lý và người điều hành được thiết kế hoạt động một cách có hiệu quả nhằm tiếp nhận, lưu trữ, điều khiển, phân tích và hiển thị toàn bộ các dạng dữ liệu địa lý HTTĐL có mục tiêu đầu tiên là xử lý hệ thống dữ liệu trong môi trường không gian địa lý (Viện Nghiên cứu Môi trường Mỹ - 1994)
TRO ¡ phát triển song song
Sự phát triển cua khoa học kỹ thuật và ý tưởng sáng tạo
Hình 1.1: Khai niém vé GIS (Nitin 2002)
Mội định nghĩa khác có tính chất giải thích, hé tro la: HTTDL 1a mot hé thong may tính có chức năng lưu trữ và liên kết các dữ liệu địa lý với các đặc tính của bản đồ dạng
đồ họa, từ đó cho một khả năng rộng lớn về việc xử 1ý thông tin, hiển thị thông tin và cho
ra các sản phẩm bản đồ, các kết quả xử lý cùng các mô hình (Antenucci 1991)
Trang 111.1.2 Cấu trúc của hệ thống thong tin dia ly
HTTĐL bao gồm các hợp phần cơ bản như sau: dữ liệu không gian, người điều hành, phần cứng, phần mềm (hình 1.2)
Hình 1.2: Mô hình tổ chức của hệ thống thông tin địa lý
%> Dữ liệu không gian:
Dữ liệu không gian có thể đến từ nhiều nguồn, có các nguồn tư liệu sau: số liệu tính toán thống kê, báo cáo, các quan trắc thực địa, ảnh vệ tinh, ảnh máy bay, bản đồ giấy (dạng analog) Công nghệ Viễn thám và HTTĐL có khả năng cưng cấp thông tin không gian bao gồm các thuộc tính địa lý, khuộn dạng dữ liệu, tỷ lệ bản đồ và các số liệu đo đạc Việc tích hợp các tư liệu địa lý từ nhiều nguồn khác nhau là đặc điểm cơ bản của một phần mềm HTTĐL
Thông thường, tư liệu không gian được trình bày dưới dạng các bản đồ giấy với các thông tin chỉ tiết được tổ chức ở một file riêng Các tư liệu đó không đáp ứng được các nhu cầu hiện nay về tư liệu không gian là vì những lý do sau:
- Đòi hỏi không gian lưu trữ rất lớn, tra cứu khó khăn Để nhập và khai thác dữ liệu, nhất thiết phải liên kết được với các thông tin địa lý trên bản đồ và các đữ liệu thuộc tính khác được lưu trữ riêng biệt và điều này trở nên rất khó khăn với hình thức
- Các khuôn dạng lưu trữ truyền thống thường không tương thích với các tiêu chuẩn dữ liệu hiện nay Thay thế cho các dữ liệu dạng truyền thống, hiện nay tư liệu dạng số với một khối lượng rất lớn có thể được lưu trữ trong các đĩa CD, tương ứng với những khối lượng rất lớn của tư liệu analoge Tư liệu số còn cho khả năng xử lý tự
Trang 12động trên máy tính Như vậy, HTTĐL là sự phát triển đặc biệt để sử dụng công nghệ và nghệ thuật máy tính trong việc xử lý tư liệu không gian dạng số
Ø Người điều hành:
Vì HTTĐL là một hệ thống tổng hợp của nhiều công việc kỹ thuật, do đó đòi hỏi người điều hành phải được đào tạo và có kinh nghiệm trong nhiều lĩnh vực Người điều hành là một phần không thể thiếu được của HTTĐL Hơn nữa sự phát triển không ngừng của các kỹ thuật phần cứng và phần mềm đòi hỏi người điều hành phải luôn được đào tạo Những yêu cầu cơ bản về người điều hành bao gồm các vấn đề sau:
Có kiến thức cơ bản về địa lý, bản đồ, máy tính và công nghệ thông tin:
- Việc đào tạo cơ bản về địa lý cung cấp khả năng khai thác các đặc điểm không gian và các quá trình không gian (Spatical Process), đồng thời phát hiện được mối quan hệ không gian giữa các hợp phần
- Ban đồ học cung cấp các hiểu biết về thiết kế bản đồ, lập bản đồ (ví dụ: lưới chiếu bản đồ, hệ thống tọa độ, các mẫu ký tự trên bản đồ và các kỹ thuật in ấn)
- Khoa học về máy tính và thông tin cung cấp các kiến thức cơ bản về phần cứng máy tính và vận hành thông thạo các chương trình liên kết phần cứng
- Kinh nghiệm trong việc sử dựng các phần mềm HTTĐL: việc đào tạo các phần mềm chủ yếu thường tập trung vào việc xử lý HTTĐL, lập trình cơ bản, quản lý cơ sở
dữ liệu và một số công việc khác có liên quan đến tích hợp thông tin
- Hiểu biết nhuần nhuyễn về đữ liệu: hiểu về nguồn đữ liệu, nội dung và độ chính xác của dữ liệu, tỷ lệ bản đồ nguyên thủy và các số liệu đo đạc của tập dữ liệu, cấu trúc của đữ liệu
- Có khả năng phân tích không gian Yêu cầu được đào tạo về các phương pháp
xử lý thống kê và xử lý định tính trong địa lý, việc đào tạo cho người xử lý có thể lựa chọn phương pháp tốt nhất để phân tích và áp dụng nhằm đưa ra kết quả tốt nhất
Các yêu cầu trên là cần thiết đối với người điều hành HTTĐL Các huấn luyện chi tiết sẽ tùy thuộc nội dung và mục tiêu cũng như khả năng của máy tính và phần mềm để lựa chọn những chương trình đào tạo thích hợp
œ Phần cứng (máy tính và thiết bị ngoại vì):
Phần cứng của một HTTĐL bao gồm các hợp phần sau: bộ xử lý trung tâm (CPU), thiết bị nhập dữ liệu, lưu dữ liệu và thiết bị xuất dữ liệu
e Bộ xử lý trung tâm (Central Processing Dnit - CPU): hệ thống điều khiển, bộ nhớ, tốc độ xử lý là những yếu tố quan trọng nhất của CPU Hiện nay xử lý HTTĐL trên nền Unix là hệ thống có đủ các chức năng nhất, trong khi với máy PC thì HTTĐL có những chức năng hạn chế hơn Các hệ xử lý GIS trước đây, phần lớn đều chạy trong trạm
Trang 13Unix Trạm Unix cho phép lưu trữ cơ sở dữ liệu lớn và nhiều chức năng xử lý khác nhau Tất nhiên với sự trợ giúp của Window NT và Windows XP thì PC cũng có thể so sánh được với hệ Unix Ví dụ điểm hình về một hệ thống có hiệu quả là một hệ Unix nhỏ có cài đặt phần mềm ARC/INEO để quản lý và vận hành HTTĐL Hiện nay, các hệ thống
xử lý liên tục được nâng cấp và khoảng cách giữa trạm Unix và PC càng hẹp dần
e Nhập, lưu dữ và xuất dữ liệu: các thiết bị ngoại vi phục vụ cho việc nhập dữ liệu là: Bàn số hoá, máy quét để chuyển đổi dữ liệu analoge thành dạng số Hoặc đọc băng và đĩa CD - ROM có nhiệm vụ lấy thông tin hiện có trong băng và đĩa Các phương tiện thông dụng là ổ đĩa cứng, ổ đọc bằng, ổ đĩa quang có thể ghi và xoá đữ liệu Thiết bị xuất dữ liệu bao gồm máy ¡n đen trắng và màu, báo cáo, kết quả phân tích, máy in kim (Plotter) Hiện nay, với sự phát triển của công nghệ tin học và điện tử, đặc biệt là khi có thiết bị mạng cho phép san sẻ các chức năng và trao đổi giữa những người sử dụng và càng tạo điều kiện cho HTTĐL phát triển
Phần mềm: một hệ thống phần mềm xử lý HTTĐL yêu cầu phải có hai chức năng sau: tự động hoá bản đồ và quản lý cơ sở dữ liệu Sự phát triển kỹ thuật HTTĐL hiện đại liên quan đến sự phát triển của hai hợp phần này
e Tự động hoá bản đồ: bản đồ học là môn khoa học và kỹ thuật thành lập bản
đồ Do đó, tự động hoá bản đồ là thành lập bản đồ với sự trợ giúp của máy tính Một bản
đồ là sự thể hiện bằng đồ họa của mối quan hệ không gian và các hình dạng (Robinson
và NNK, 1984) và mỗi một bản đồ là sự mô hình hoá thực tế theo những tỷ lệ nhất định
Mô hình đó yêu cầu biến đổi các số liệu ghi bản đồ thành bản đồ và gồm các công đoạn sau: lựa chọn, phân loại, làm đơn giản hóa và tạo mẫu ký tự (Den - 1990)
Máy tính trợ giúp cho bản đồ học ở nhiều phương điện như sau:
Trước hết, bản đồ trong máy tính là dạng số nên dễ dàng chỉnh sửa và việc chỉnh
lý đó tốn ít công sức hơn so với việc không có sự trợ giúp của máy tính Mặc dù việc số hóa có thể đẫn đến nhiều lỗi và làm giảm độ chính xác, song các lỗi đó có thể sửa dễ dàng nếu phát hiện được Khi đó, bản đồ sẽ được hoàn thiện và lượng thông tin sẽ được nâng lên Đặc biệt, việc bổ sung thông tin cho bản đồ cũng dễ dàng thực hiện được Thứ hai, quá trình tạo chú giải và các chỉ dẫn lên ban đồ được thao tác với tốc độ nhanh nên giá thành thấp Việc lựa chọn, phân loại và làm đơn giản hóa các đặc điểm bản đồ cũng được thực hiện một cách khoa học Quá trình thiết kế và khái quát hóa bản
đồ cũng được lập trình và tạo nên các chức năng cụ thể của phần mềm Kết quả như mong muốn có thể đạt được bởi nhiều cán bộ bản đồ hoặc do chính một cán bộ bản đồ làm trong nhiều thời gian khác nhau
Thứ ba, thiết kế bản đồ có thể được hoàn thiện hơn qua việc thử và chỉnh sửa lỗi Kích thước, hình dạng hoặc vị trí của chữ hoặc ký hiệu trên bản đồ có thể dễ dàng được thay đổi và đưa về vị trí chính xác như mong muốn
Trang 14e Quản lý dữ liệu: chức năng thứ hai của phần mềm HTTĐL là hệ thống quản
ly dir liéu (Database Management System - DBMS) Hệ thống TTÐL (Thông tin Địa lý) phải có khả năng điều khiển các dạng khác nhau của đữ liệu địa lý đồng thời có thể quản lý hiệu quả một khối lượng lớn dữ liệu với một trật tự rõ ràng Một yếu tố rất quan trọng của phần mềm HTTĐL là cho khả năng liên kết hệ thống giữa việc tự động hóa bản đồ và quản lý cơ sở đữ liệu Các tài liệu mô tả cho một vị trí bất kỳ, có thể liên
hệ một cách hệ thống với vị trí không gian của chúng Sự liên kết đó là một ưu thế nổi bật của việc vận hành HTTĐL:
s* Các tài liệu, dữ liệu thuộc tính nhất thiết phải được thể hiện trên những chi tiết của bản đồ Ví dụ số liệu về dân số của một thành phố cũng được gọi ra một cách
tự động mà không cần phải có một sự tra cứu nào khác Đối với bản đồ học thì công việc tra cứu thường phải làm độc lập, không thực hiện tự động được Ngoài ra việc bổ sung số liệu cũng đòi hỏi phải được cập nhật thường xuyên nên chỉ HTTĐL mới có thể đáp ứng được đầy đủ
s* Sự thay đổi về những chi tiết bản đồ nhất thiết phải phù hợp với sự thay đổi về
tự nhiên thuộc tính Ví dụ, sự thay đổi về diện tích đô thị về số liệu phải tương xứng với
sự thay đổi về đường ranh giới thành phố Khi thay đổi ranh giới thì số liệu tính toán về điện tích cũng tự động được thay đổi
1.1.3 Các chức năng của phần mềm hệ thống thông tin địa lý
Một phần mềm HTTĐL có các chức năng cơ bản như sau: nhập dữ liệu, lưu trữ
dữ liệu, điều khiển đữ liệu, hiển thị đữ liệu theo cơ sở địa lý và đưa ra những quyết định (Decision Making - Calkins và Tomlinson 1997) Có thể khái quát về các chức năng đó như sau:
e Nhập và bổ sung dữ liệu (Entry and Updating): một trong những chức năng quan trọng của HTTĐL là nhập và bổ sung dữ liệu mà công việc đó không tiến hành riêng rẽ Bất kỳ một hệ thống nào cũng phải cho phép nhập và bổ sung dữ liệu, nếu không có chức năng đó thì không được xem là một HTTĐL vì chức năng đó là một yêu cầu bất buộc phải có
e Việc nhập và bổ sung dữ liệu phải chỏ phép sử dụng nguồn tự liệu dưới dạng
số hoặc dạng analog Dạng tư liệu không gian như bản đồ giấy hoặc ảnh vệ tỉnh, ảnh máy bay phải được chuyển thành dạng số và các nguồn tư liệu số khác cũng phải chuyển đổi được để tương thích với cơ sở dữ liệu trong hệ thống đang sử dụng
e Chuyển đổi dữ liệu: chuyển đổi dữ liệu là một chức năng rất gần với việc nhập và bổ sung đữ liệu Nhiều phần mềm thương mại cố gắng giữ độc quyên bằng cách hạn chế đưa các khuôn dạng dữ liệu theo loại phổ cập Tuy nhiên, người sử dụng phải lựa chọn để hạn chế việc phải số hóa thêm những tài liệu hiện đang có ở đạng số Trong thực tế, cùng một tư liệu nhưng có thể tổn tại ở nhiều khuôn dạng khác nhau Vì
Trang 15vậy, đối với tư liệu quốc gia, không thể chỉ lưu giữ ở một dạng thuộc tính riêng biệt mà cần thiết phải lưu giữ ở nhiều khuôn dạng có tích chất phổ biến để sử dụng được trong nhiều ứng dụng khác nhau Như vậy, một phần mềm HTTĐL cần phải có chức năng nhập và chuyển đổi nhiều khuôn dạng dữ liệu khác nhau
« Lưu giữ tư liệu: một chức nang quan trọng của HTTĐL là lưu giữ và tổ chức
cơ sở dữ liệu do sự đa dạng và với một khối lượng lớn của dữ liệu không gian: đa dạng
về thuộc tính, về khuôn dạng, về đơn vị đo, về tỷ lệ bản đồ Hai yêu cầu cơ bản trong việc lưu trữ dữ liệu là: thứ nhất là phải tổ chức nguồn đữ liệu sao cho đảm bảo độ chính xác và không mất thông tin, thứ hai là các tài liệu cho cùng một khu vực song các dữ liệu lại khác nhau về tỷ lệ, về đơn vị đo thì phải được định vị chính xác và chuyển đổi một cách hệ thống để có thể xử lý hiệu quả
e Điều khiển dữ liệu (Data Manipulation): do nhiều HTTĐL hoạt động đòi hỏi
tư liệu không gian phải được lựa chọn với một chỉ tiêu nhất định được phân loại theo một phương thức riêng, tổng hợp thành những đặc điểm riêng của hệ thống, do đó HTTĐL phải đảm nhiệm được chức năng điều khiển thông tin không gian Khả năng điều khiển thông tin không gian cho phép phân tích, phân loại và tạo lập các đặc điểm bản đồ thông qua các dữ liệu thuộc tính và thuộc tính địa lý được nhập vào hệ thống Các thuộc tính khác nhau có thể được tổng hợp, nắm bắt một cách riêng biệt và những
sự khác biệt đó có thể được xác định, được tính toán và được can thiệp, biến đổi
e Trình bày và hiển thị: đây cũng là một chức năng bất buộc phải có của một HTTĐL Không gian dưới dạng tài liệu nguyên thủy hay tài liệu được xử lý cần được hiển thị dưới các khuôn dang như: chữ va sé (Text), dang bang biéu (Tabular) hoac dang bản đồ (Map) Các tính toán chung và kết quả phân tích được lưu giữ ở dạng chữ
và số để dễ dàng in ra hoặc trao đổi giữa các bộ phần mềm khác nhau Các dữ liệu thuộc tính có thể được lưu ở dạng bảng biểu hoặc các dạng cố định khác Bản đồ được thiết kế để hiển thị trên màn hình hoặc lưu dưới dạng điểm (Plot file) để in Như vậy, hiển thị và in ra là những chức năng rất cần thiết của một HTTĐL
Chức năng phân tích không gian được phát triển dựa vào sự tiến bộ của công nghệ
và nó trở nên thực sự hữu ích cho người ứng dụng Những định nghĩa về HTTĐL trước đây đã trở thành thực tiễn trên cơ sở ứng dụng trực tiếp chức năng phân tích không gian Theo quan điểm hiện nay thì chức năng đó cần thiết phải có đối với một hệ thống được gọi là HTTĐL, Tất nhiên, các chức năng có thể khác nhau đối với từng hệ thống song đối với một một HTTTĐL, sử dụng tư liệu bản đồ thì chức năng đó là bắt buộc Với một hệ thống như vậy, các mô tả bằng lời có thể tổ chức thành các tham số riêng, các mô hình giải thích, dự báo đều có thể thực hiện trong chức năng xử lý không gian 1.1.4 Sử dụng hệ thống thông tin địa lý cho phân tích không gian
Trang 16Phân tích không gian HTTĐL bao gồm ba hoạt động chính: giải quyết các câu hỏi về thuộc tính, các câu hỏi về phân tích không gian và tạo nên tập dữ liệu mới từ cơ
sở đữ liệu ban đầu Mục tiêu của việc phân tích không gian là từ việc giải quyết các câu hỏi đơn giản về các hiện tượng, các vấn đề trong không gian, đi đến tập hợp thành các thuộc tính của một hay nhiều lớp và phân tích được sự liên quan giữa các dữ liệu ban đầu
Trong ứng dụng của HTTĐL, các đặc điểm và thuộc tính về không gian là rất phổ biến Câu hỏi về thuộc tính (Attribute Query) có chứa đựng cả tích chất thông tin về không gian Ví dụ: Trong cơ sở dữ liệu của một hành phố, ở đó mỗi mảng bản đồ đều
có Code thuộc tính về sử dụng đất Một bảng thuộc tính đơn giản có thể yêu cầu liệt kê toàn bộ các mảng của các loại hình sử dụng đất có trong bản đồ Bảng thuộc tính đó có thể tạo được mà không hề có sự tham khảo về các mảng trên bản đồ Vì không có thông tin không gian đòi hỏi trả lời cho câu hỏi này nên bảng đó được xem như là bảng thuộc tính (Attribute Query) Trong ví dụ này, toàn bộ bảng thuộc tính có các Code của
sử dụng đất đã được xác định Các thông tin khác có thể được tạo nên, ví dụ như số mảng đơn vị (Parcel) của loại hình sử dụng đất này, hoặc tổng diện tích của loại hình
sử dụng đất này ở trong thành phố Tất nhiên, những bài toán xử lý thông tin cho một lớp là cần thiết, song trong ứng dụng, việc xử lý thông tin của nhiều lớp cũng là công việc rất quan trọng và đòi hỏi nhiều công sức trong lập trình Ví dụ giải bài toán về 2 lớp không gian về tính toán diện tích của các loại hình sử dụng đất theo các cấp độ dốc khác nhau Những bài toán đó đặt ra đối với nhiều nội dung ứng dụng khác nhau mà những phần mềm chuyên tự động hóa bản đồ hay quản lý đữ liệu không đáp ứng được Tất nhiên, do mục đích của HTTĐL là tập trung vào xử lý không gian, nên một số chức năng của việc tự động hóa bản đồ hoặc tính toán thống kê chuyên đề thì có thể HTTĐL không đáp ứng được
1.1.5 Một số vấn đề cơ bản trong xử lý không gian
e Xử lý thông tin trong một lớp: Giải quyết các vấn đề về thuộc tính các đơn
vị trong một lớp, đo đạc các giá trị, phân tích sự liên quan giữa các đơn vị trong một lớp bản đồ Ví dụ, xác định tên, tính diện tích, chu vi của từng khoanh vi bản đồ, xác
định khoảng cách, tạo các vùng ảnh hưởng (Buffer Zone)
s Xử lý thông tin nhiều lớp: chồng xếp hai hoặc nhiều lớp thông tin cho phép tạo ra nhiều đơn vi bản đồ mới trên cơ sở làm chỉ tiết hoá thông tin của từng phần trong một đơn vị bản đồ Ví dụ, hai lớp thực vật và đất khi chồng xếp sẽ cho bản đồ thực vật phân bố trên các loại đất khác nhau
« Xử lý không gian: có thể có rất nhiều lớp thông tin mà xử lý không gian cần phải tính toán được mối quan hệ giữa chúng
Trang 17e Phân tích các mẫu điểm: một số đối tượng tự nhiên hoặc hiện tượng tự nhiên
có sự phân bố bằng các điểm tập trung theo các,quy luật nhất định Ví dụ: phân bố của các đồng cỏ, hệ thống các điểm hố sụt cactor, phân bố của các loài động vật, thực vật quý hiếm Trong xử lý không gian, sự phân bố về những điểm đó cần được nhận diện
và phân loại
e Phân tích mạng: thiết lập một mạng hữu ích giữa các diện có sự phân bố khác nhau là một trong những chức năng xử lý không gian: ví dụ, tạo tuyến xe bus gần nhất nối các điểm đón khách trong thành phố, mở một hệ thống đường nối giữa các khu dân cư, thiết kế một tuyến đường ống dẫn dầu Tất nhiên, khi thiết kế cụ thể lại phải bổ sung bằng một số thông tin khác nhau, ví du: địa hình, sử dụng đất
e Phân tích, xử lý theo ô lưới (Grid Analysis) Bài toán xử lý ô lưới rất phong phú, nó có thể ứng dụng cho nhiều ngành: ví dụ, tính toán lan truyền ô nhiễm, lập các đường đẳng trị, đự báo cháy rừng
e Phân tích xử lý nhiều lớp thông tin theo điều kiện Đây là chức năng phức tạp và đa dạng nhất của xử lý không gian Nhiều bài toán được áp dụng để biến đối lớp thông tin ban đầu thành một hay nhiều lớp thông tin mới: ví dụ tính độ dốc, hướng đốc, tính mật độ, bài toán boolean, bài toán logic, các phép phân chia, tính căn bản
e Vùng bên trong là phần không bao gồm đường biên Polygon là diện tích có vùng bên trong, một đường viền bên ngoài, không có điểm giao cắt ở bên trong và không có khoanh vi nào khác ở phía trong Polygon phức tạp: là polygon có một hoặc nhiều khoanh vi khác ở bên trong
e Có hai khái niệm được sử dụng bổ sung cho định nghĩa trên đó là Pixels và ô
lưới đơn vị (Grid Cells) Pixel là đơn vị hình ảnh có hai kích thước, nó là đơn vị nhỏ
nhất của hình ảnh không thể chia nhỏ được Ô lưới đơn vị là đối tượng có hai kích thước, thể hiện một yếu tố của một bề mặt có cấu trúc đều đặn bởi chúng
Những khái niệm nêu ở trên là do Uỷ ban Quốc gia về Chuẩn đữ liệu đồ hoạ số cua My dua ra (National Commitee for Digital Colorgaphic Data Standards - NCDCDS) Các khái niệm đó có thể được gọi khác đi, tùy theo sự thiết kế về tên gọi trong từng hệ thống phần mềm HTTĐL
1.1.6 Các yếu tố cơ bản của thông tin không gian:
Việc phân tích trật tự và tổ hợp không.gian yêu cầu phải có ba thuộc tính cơ bản sau: vi tri (Location), dữ liệu thuộc tính (Attribute Data) và tính chất hình học
(Topology)
e Vi trí: là tính chất quan trọng mà mỗi đối tượng không gian phải có Vị trí được xác định bởi tọa độ X và Y trên mặt phẳng ngang (Caitesian)
Trang 18e Dữ liệu thuộc tính: cung cấp nhiều thông tin quan trọng về tính chất của đối tượng được nghiên cứu Ví dụ, bản đồ có các đặc điểm thì bảng thuộc tính phải nêu được tích chất các đặc điểm đó, ví dụ: giống cột điện hay hố nước, với các thông tin
cụ thể cho từng loại
e Dữ liệu hình học: được định nghĩa là mối quan hệ không gian giữa các yếu
tố bản đồ Trong trường hợp các polygon, có những polygon lại nằm trong ranh giới của một polygon khác Với các yếu tố đường có, những đường tạo nên bởi hai đoạn thẳng (Segment) nối với nhau trực tiếp hoặc nối gián tiếp qua một đoạn thẳng thứ ba, hoặc hai đoạn thẳng hoàn toàn không nối với nhau Với các điểm, các điểm có thể ở cách nhau những khoảng cách khác nhau
s Nhìn chung, vị trí và dữ liệu thuộc tính là tương đối dễ hiểu, song đặc điểm
hình học thì hơi khó hình dung hơn Có một số khái niệm và thuộc tính như sau:
+ Tiếp giáp (Adjacency): hai polygon ở liền nhau thì được gọi là tiếp giáp với nhau Khái niệm tiếp giáp được sử dụng khi phân tích sự liên quan của những yếu tố ở liền kề nhau Ví dụ: giá của một miếng đất sẽ cao hơn giá trung bình của vùng nếu như vùng đất đó nằm liền kể với công viên hoặc khu thương mại
+ Chứa đựng (Containment): biểu thị một yếu tố nào đó nằm trong ranh giới của một polygon Mối quan hệ này cũng quan trọng khi phân tích mối liên quan giữa hai kiểu đối tượng Ví dụ: một mảnh đất nằm trong vùng ngập lụt có thể phải mua bảo hiểm với giá cao hơn
+ Tiếp nối (Connectivity): thể hiện cho hai đoạn thẳng được nối với nhau Khái niệm tiếp nối được xem xét cho việc phân tích, giao thông, tuyến đi để có thể tìm ra phương án mở tuyến tốt nhất
+ Giao nhau (Intersection): được xem là một dạng phức tạp trong mối quan hệ không gian của các yếu tố polygon Giao cắt đối với polygon nghĩa là hai polygon có cùng chung một vùng, vùng này có tính chất thuộc về cả hai polygon Khi xử lý chồng xếp bản đồ thì vùng giao nhau không cần xem xét đến các tính chất hình học Tuy nhiên, thông dụng nhất là các vùng được bố trí tách biệt nhau trong cơ sở dữ liệu
Tóm lại, 3 yếu tố: vị trí, dữ liệu thuộc tính và đặc điểm của dữ liệu là rất quan trọng trong xử lý không gian Tự động hóa bản đồ sẽ giúp ích cho việc trình bày và tổ chức dữ liệu không gian Trong xử lý không gian, tổng hợp các đặc điểm về mối liên
hệ không gian giữa các yếu tố bản đồ được xử lý bởi HTTĐL và nó cung cấp khả năng
xử lý đồng thời cả ba yếu tố Các đối tượng không gian được trình bày dưới dạng đặc điểm về đường, điểm, hoặc polygon Mỗi một đặc điểm lại được thể hiện tập trung vào một số yêu cầu về mặt cơ sở đữ liệu
1.1.7 Tổ chức dữ liệu không gian của hệ thống thông tin địa lý:
Trang 19Trong một HTTĐL điển hình, các đối tượng không gian được liên kết để nghiên cứu các hiện tượng thì nhất thiết phải được trình bày dưới dạng bản đồ với mục đích thiết lập được mối liên quan không gian giữa chúng Cả vị trí và thuộc tính được xử lý thông qua một loạt các chương trình trong HTTĐL Yêu cầu đầu tiên để việc tạo lập dữ liệu một cách có hiệu quả là các đối tượng được thể hiện ở ba yếu tố cơ bản là: điểm (Point), đường (Line) và vùng (Area hay Polygan) Theo quan điểm của Tổ chức Quốc gia Mỹ về dữ liệu bản đồ số thì các yếu tố đó được giải thích như sau
Điểm: là đối tượng có kích thước bằng 0 về mặt hình học Do đó các đối tượng điểm chỉ dùng để xác định vị trí Điểm không có ý nghĩa trong việc đo về kích thước Mặc dù trên bản đồ, các điểm được biểu thị bằng kích thước khác nhau nhưng diện tích của các điểm là không có ý nghĩa thực tế Một số khái niệm về "điểm" như sau:
- Điểm thực tế (Entity Point): dùng để xác định vị trí của các đối tượng dạng điểm như: các toà nhà, các cột Trường hợp đó, xác định chính xác vị trí của các điểm là điều rất quan trọng
- Điểm chỉ tên (Label Point): được sử dụng để hiển thị một tập hợp chữ viết cho các đối tượng bản đồ Đối với những điểm nào thì độ chính xác của vị trí phụ thuộc vào quan niệm bản đồ học Nghĩa là vị trí các điểm chỉ tên cho các đối tượng trên bản đồ được xác định sao cho không có sự lân lộn với nhau
- Điểm có diện tích (Area Point): dùng để xác định một vị trí có thông tin về điện tích Ví dụ, có thể dùng điểm để thể hiện vị trí một quốc gia và độ lớn của điểm chứa đựng thông tin về đất nước đó
- Diém giao nhau (Node): thể hiện vị trí một diện với các dấu hiệu về hình học,
ví dụ: nơi giao nhau hoặc điểm cuối của các yếu tố đường
Các thông tin về điểm có một giá trị trong phân tích không gian mặc dù chúng thể hiện cho các đối tượng có hai kích thước ở trên bản đồ Ví dụ: một điểm biểu thị cho 1 giếng, một điểm biểu thị cho một cột Mặc dù diện tích mà giếng chiếm khác với diện tích của cột chiếm Trong một bản đồ thì không thể nêu được diện tích mà giếng hoặc cột chiếm trên thực tế - do tỷ lệ bản đồ Không đáp ứng Trong phân tích không gian, diện tích giữa các điểm là không tính (trừ trường hợp các điểm có diện tích, lúc
đó điểm đã trở thành vùng)
Khi nói vẻ dữ liệu điểm, phải nói đến số lượng điểm tối thiểu cho một cơ sở dữ liệu điểm Nhìn chung, các yếu tố tối thiểu cho một cơ sở đữ liệu điểm là những thuộc tính về toạ độ, ngoài ra, các tính chất khác của điểm được mô tả trong hàm sau:
P:(X,Y,ZZ2Za Z„)
Trang 206 day:
¡ là Code xác định của mỗi điểm ( Identification Code -ID)
X, Y toạ độ của điểm, được xác định theo toa độ phẳng (x, y trong mặt phẳng Cartesian)
Z 122 Z „ các đặc trưng khác của điểm
Vì điểm có kích thước bằng không (Size = 0) nên nó không có khoảng trống ở giữa, song nó phải có thuộc tính về mặt hình học, đó là toạ độ Thông tin về mối liên quan giữa các điểm có thể xác định bằng công thức toán học Trường hợp có nhiều điểm thì khoảng cách giữa các điểm được xác định bởi vị trí của các điểm đó với nhau Đường: đường là các yếu tố có một kích thước và thể hiện cả vị trí và hướng Độ đài là dấu hiệu đo đạc về kích thước của đối tượng đường Mặc dù các yếu tố đường thường có không gian hai kích thước trên bản đồ nhưng độ rộng của đường là không được xem xét đến trong tính toán hướng của bản đồ
Tính chất của đường: đường được hiểu là tập hợp của rất nhiều điểm Mỗi đường đều có thể chia thành nhiều đoạn thẳng và mỗi đoạn được xác định bởi hai điểm ở hai đầu Để cấu tạo nên yếu tố hình học của đường thì yếu tố cơ bản là hướng của đường Ngoài ra, còn một yếu tố khác, đó là sự tiếp nối giữa các đường Để hiểu sự tiếp nối đó,
ta có thể hình dung tới một đoạn thẳng nối giữa mội điểm này với một điểm khác Như vậy, các yếu tố cơ bản của mỗi đường gồm có:
L; (P1, P2, .Pn, Z1, Z2 Zm, H; Hq)
Ở đây: j Code của đường ( ID)
PI điểm thứ 1; Pn điểm thứ n
Z1 thuộc tính của đoạn thứ l; Zn thuộc tính của đoạn thứ n
Hq - Code ID của đoạn thứ q được nối trong thứ tự của đường (1 n) là hướng của đường từ 1 đến n của đường
Vung: (Area) hoac (Polygone)
Vùng là khái niệm phức tạp nhất trong 3 loại yếu tố không gian của cấu trúc Vector Vùng được hiểu là một diện tích giới hạn bởi một đường khép kín và phần bên trong đó có những tính chất cụ thể
Tính chất của Polygon: polygone dược xác định bởi một loạt các đường vạch định ranh giới Thêm vào đó, Polygon là yếu tố có 2 kích thước Mỗi Polygon được xác định bởi một diện tích nhất định Vì Polygon không có hình dạng và kích thước nhất định, nên mối quan hệ không gian sẽ khó xác định nếu không có những thuộc tính
Trang 21được làm rõ Hai Polygon có thể nằm tách biệt với nhau, hoặc kể nhau, hoặc cái nọ nằm trong cái kia
Trong trường hợp nằm tách biệt hẳn so với nhau thì lại có khả năng chúng được nối với nhau bằng Polygon thứ ba
Yêu cầu về thuộc tính của Polygon bao gồm:
G K(L peeLby “4 - Zim O1-+-Or, Ot Ps, Dy ®)
O day K 1a Code ctia Polygon G, tần số kết nốt của đường từ L; đến L„ và nó xác định ranh giới của Polygon G
Z.„xác định giá trị của thuộc tính thứ n
6) 6, thể hiện một hoặc nhiều Polygon kết nối với nhau tạo nên Polygon K;
@\ 0; xác định có 1 hay nhiều Polygon chứa trong Polygon K ;
®¡ ®, xác định có một hay nhiều polygone nằm trong Polygon K;
Các thông tin hình học bổ sung khác còn có thể là cần thiết đối với các Polygon phức tạp Nhiều thông tin hình học có thể được bổ sung ngay trong những thông tin về đường hoặc được làm đơn giản hoá đi Ví dụ: hai Polygon nam lién ké thì phải có thêm thông tin về một đoạn thẳng chung ở giữa làm biên giới giữa hai Polygon
1.2.Các mô hình cấu trúc cơ sở dữ liệu
1.2.1 Khái quát chung
Tư liệu (Data) được hiểu như những sự hiện diện đã được kiểm tra về thế giới thuc (Graeme F Borinam Carter) Thông tin là tư liệu được tổ chức theo những mẫu thể hiện nhằm dễ dàng tìm kiếm và khai thác
Tư liệu không gian phải được trình bày 'và lưu trữ một cách riêng biệt trong HTTĐL Ví dụ: đường, điểm, vùng, bề mặt, phải được lưu trữ độc lập cùng các thuộc tính của chúng tạo thành những file dữ liệu không gian hoặc phi không gian
Cơ sở dữ liệu (CSDL - Database) là toàn bộ những thông tin cần thiết về đối
tượng được lưu giữ dưới dạng số CSDL có thể là không gian hoặc phi không gian Hệ
théng quan ly CSDL (Database Management Systems - DBMS) 1a tap hop mot s6 chitc năng của phần mềm để lưu giữ, bổ sung và thể hiện đữ liệu Các hệ thống quản lý cơ sở
đữ liệu phi không gian hoặc không gian thường tách biệt nhau Cũng có một số phần mềm tổ chức kết hợp để quản lý cả hai dạng dữ liệu hoặc cung cấp khả năng liên kết với các phần mềm CSDL khác Chương trình này sẽ tập trung giới thiệu các cấu trúc dữ liệu chính là cấu trúc phân nhánh, chia nhỏ và cấu trúc mạng Ngoài ra, các dữ liệu
thuộc tính phi không gian trong mối liên hệ với các thuộc tính không gian cũng được
dé cập đến Cấu trúc dữ liệu không gian là sự tổ chức tư liệu không gian dưới một khuôn dạng phù hợp với máy tính Cấu trúc của dữ liệu phải được tổ chức để có sự liên
Trang 22hệ giữa các mô hình đữ liệu và các khuôn dạng (Format) dữ liệu Thực tế, giữa khái niệm mô hình và cấu trúc dữ liệu ít có sự phân biệt Tuy nhiên, khái niệm mô hình được sử dụng ở phạm vi nguyên lý từ khái quát đến cụ thể, còn cấu trúc là khái niệm mang tính chất kỹ thuật và minh hoạ một cách hệ thống về bản chất và sự liên hệ giữa các thành phần của CSDL
Cấu trúc của đữ liệu Raster được sử dụng rộng rãi trong hệ xử lý ảnh - Raster, còn cấu trúc của dữ liệu Vertor được sử dụng nhiều trong các hé CAD (Computer Aided Design - Thiết kế trợ giúp máy tính), hoặc trong HTTĐL Vertor với những khả năng mạnh về bản đồ Trong thực tế áp dụng nhiều HTTĐL có cả hai hệ thống cấu trúc dạng Raster và Vertor để có thể sử dụng một cách linh hoạt và giao diện với nhau để đáp ứng cho những nhiệm vụ cần giải quyết Những sự giao điện đó được thể hiện cụ thể với việc xử lý một hệ thống đữ liệu mẫu điểm là: có bảng thuộc tính về tính chất và toa
độ các điểm, có khả năng nội suy thuộc tính mẫu thành các File Raster; có khả năng tạo File Vertor và contour của các trường thuộc tính đã được nội suy; có khả năng tạo các mặt phẳng hình học và các mô hình không gian với dữ liệu Raster hoặc Vertor Tuy nhiên, do không phải là những HTTĐL chuyên để mà các HTTĐL tổng hợp thường có một số ưu thế và những hạn chế nhất định
1.2.2 Mô hình cấu trúc dữ liệu Raster
Raster được hiểu là ô hình vuông có kích thước nhất định gọi là Cell hoặc Pixell
(Picture Element - phần tử ảnh), cấu trúc Raster là cấu trúc hình ảnh Mỗi ô vuông có chứa thông tin về một đối tượng hay một hợp phần của đối tượng VỊ trí của đối tượng được xác định bởi vị trí của các ô vuông theo trật tự hàng và cột Cấu trúc đữ liệu Raster đơn giản nhất là cấu trúc dạng bảng, ở đó có chứa các thông tin về toạ độ và thuộc tính phi không gian Thông tin về vị trí được thể hiện ở toa độ theo hàng và cột, tính theo trật tự sắp xếp của dữ liệu Trường hợp có nhiều tính chất thì có thể gọi là thông tin nhiều chiều Bảng thuộc tính hai chiều của đối tượng được gọi là bảng một chiều hay còn gọi là bảng thuộc tính Raster mở rộng (Expanded Raster Table - ERT) Cấu trúc Raster đầy đủ là cấu trúc có đầy đủ số lượng các Pixel sắp xếp theo những vị trí xác định Cấu trúc raster rất tiện lợi cho việc áp dụng các chức năng xử lý không gian dựa trên nguyên tắc chồng xếp thông tin nhiều lớp Các đặc điểm không gian là có thông tin về địa lý, nghĩa là chúng có thể được trình bày trên bất cứ một bản đồ nào của một hệ toạ độ đã biết Cấu trúc Raster yêu cầu mỗi một đặc điểm phải được trình bày thành dạng đơn vị hình ảnh (Picture Element Pixel) Trong trường hợp này một bản đồ được phân chia thành nhiều Pixels, mỗi pixel có vị trí theo hàng và cột Một điểm nhỏ nhất được trình bày bởi một Pixel đơn lẻ và nở chiếm một diện tích bằng kích thước của một Pixel
Trang 23
Hình 1.3: Một đường có thể tổ chức trong cấu trúc Vector (A) và Raster (B)
Một đường trong cấu trúc Raster là một loạt các pixel nối với nhau và một polygon là một đám (Cluster) của các Pixel có cùng một giá tr
Trong cấu trúc này, thực thể không gian được biểu diễn thông qua các ô (Cell)
hoặc ô ảnh (Pixel) của một lưới các ô
Trong máy tính, lưới ô này được lưu trữ dưới dạng ma trận trong đó mỗi Cell là
giao điểm của một hàng, một cột trong ma trận Trong cấu trúc này, điểm được xác định bởi Cell, đường được xác định bởi một số các Cell kề nhau theo một hướng Vùng được xác định bởi số các Cell mà trên đó thực thể phủ lên Ta thấy biểu diễn hai chiều của dữ liệu địa lý theo cấu trúc này là không liên tục nhưng được định lượng hoá để có
thé dé dang đánh giá được độ dài, diện tích
Biểu diễn Raster được xây dựng trên cơ sở hình học phẳng Ocơlit Mỗi mot Cell
sẽ tương ứng với một diện tích vuông trên thực tế Độ lớn của cạnh của ô vuông này còn đợc gọi là độ phân giải của dữ liệu Ta thấy rằng khi không gian càng được chia nhỏ thành nhiều Cell thì tính toán càng chính xác Trong cấu trúc Raster này, phương pháp chồng xếp bản đồ nhờ vào phương pháp đại số bản đồ Hình vẽ V mô tả cách thức biến đổi thông tin tại một Cell, kết quả cuối cùng sẽ là một phép toán trên các lưới Cell Hãy xét một lớp thông tin có cấu trúc Raster như trên hình vẽ II là một thể hiện bản đồ đất, mỗi vùng được đánh dấu bằng các ô theo các giá trị khác nhau Ta có được một lưới các ô có giá trị khác nhau Nếu gán Nước giá trị I, Rừng = 2, dat Nong nghiệp
= 3 ta sẽ có một mảng số liệu từ các giá trị 1, 2, 3
= nite Ring
Dat ning nghidg
Trang 24
Hình 1.4: Biểu diễn raster dữ liệu theo lưới điểm
Dữ liệu Raster có dung lượng rất lớn nếu không có cách lưu trữ thích hợp Ví dụ trên cho ta thấy có rất nhiều giá trị giống nhau, do đó có nhiều phương pháp nén để tệp
dữ liệu lưu trữ trở nên nhỏ hơn Thông thường người ta hay dùng các phương pháp nén thanh File * TIFF; *.RLE; *.JPEG, *.GIF
Hình 1.5: Biểu diễn raster dữ liệu theo cẩu trúc ô chữ nhật phân cấp
Một phương pháp khác để biểu diễn đữ liệu địa lý dưới dạng Raster là phương pháp biểu diễn ô chữ nhật phân cấp Trong cách biểu diễn này người ta chia diện tích vùng đữ iiệu ra thành các ô chữ nhật không đều nhau mà theo cách lần lượt chia đôi các cell bắt đầu từ hình chữ nhật lớn nhất, bao phủ diện tích đữ liệu Quá trình chia cứ tiếp tục khi nào các cell đủ nhỏ để đạt được độ chính xác cần thiết
Trang 25Hình 1.6: Dữ liệu thuộc tính cho cấu trúc ô chữ nhật phân cấp và sự chồng xếp các
lớp thông tin của dữ liệu raster
œ Những ưu điểm cơ bản của cấu trúc Raster:
e Đơn giản và dễ tham khảo
e Việc chồng xếp các lớp bản đồ được thực hiện một cách thuận tiện đưa đến kết quả
e Đối với mô hình không gian, các đơn vị địa lý được xác định trong cấu trúc Raster, bao gồm hình dạng và kích thước Như vậy, trong kết quả mối quan hệ giữa các Pixel là ổn định và dễ dàng vẽ ra được
e Dễ thiết lập một bể mặt liên tục bằng phương pháp nội suy
e Đa số các tư liệu không gian thường được ghi ở dạng Raster như ảnh vệ tinh, ảnh máy bay chụp quết Thông thường các tư liệu Raster đó đễ dàng nhập trực tiếp ma không cần mội sự thay đổi nào
®“ Những nhược điểm của cấu trúc dit liéu Raster:
e Tài liệu thường bị tình trạng quá tải, làm tốn nhiều phần của bộ nhớ trong máy tính Trong rất nhiều trường hợp, các yếu tố bản đồ không nhất thiết phải được gắn thuộc tính (Code hoá) thành các ô lưới đặc trưng Trong cấu trúc dữ liệu Raster, những vùng rất rộng lớn có đặc điểm giống nhau được tồn tại một cách ngẫu nhiên với một giá trị nào đó và là tập hợp của rất nhiều ô lưới Trong khi đó khi thể hiện về độ đốc thì ở vùng có độ dốc tương đối giống nhau, cấu trúc Raster vẫn thể hiện sự khác nhau đo kích thước của các Pixel tao nên đường gồ ghé
e Mối quan hệ về hình học giữa các yếu tố không gian thì khó vẽ và khó thiết lập được, ví dụ với hai bản đồ được xác định bằng hàng, cột thì mối liên hệ hình học giữa các đặc điểm của hai bản đồ đó là rất khó xác định
e Các bản đồ Raster thường thô và kém vẻ đẹp hơn so với bản đồ vẽ bằng đường nét thanh của cấu trúc Vector Trong bản đồ Raster, các yếu tố đường, sông ranh giới thường được biểu hiện bằng các Pixel nên có dạng răng cưa
e Việc chuyển đổi các thuộc tính không gian của cấu trúc Raster thi dé bi nhiễu Ví dụ một con đường khi quay đi một góc nào đó rồi quay lại đúng góc đó nhưng nó có thể bị biến đổi so với hình dạng ban đầu
Đối với phân tích không gian, hạn chế nhất của cấu trúc Raster là độ chính xác thường thấp so với mong muốn (ví dụ khi tính độ dày của một đoạn thẳng sai số thường lớn hơn so với đo trực tiếp) Đây là điều khó tránh khỏi vì kích thước tính được liên
Trang 26quan đến kích thước của các Pixel và vị trí của một đoạn thẳng hay của một điểm cũng được xác định tuỳ thuộc kích thước của Pixel
1.2.3 Mô hình cấu trúc dữ liệu dạng Vector
Như phần trên đã giới thiệu, trong cấu trúc dữ liệu dạng Vector, các đối tượng không gian được trình bày bằng một loạt các Vector Trong khái niệm toán học, một Vector được thể hiện bằng một điểm xuất phát (Staring Poimt) với toạ độ X và Y đã cho, một hướng (Direcrion) nghĩa là có một góc nào đó theo hướng Đông, Tây, Nam, Bắc và một độ dài (Length) Một điểm được thể hiện bởi một Vector bị thoái hoá (Degenerate) với cả hướng và độ đài của nó đều bằng 0 Trong trường hợp này điểm cũng không có cả diện tích
Một đường được thể hiện bởi sự lặp lại của các Vector, mà các Vector này là các đoạn thẳng vì chiều rộng của các Veclor cũng không được xác định nên về ý nghĩa không gian, đường chỉ có một kích thước, đó là độ dài
Một Polygon được thể hiện bởi một loạt các Vector tạo nên một vùng khép kín và diện tích của vùng đó có thể đo được
Tri fg * š
Hinh 1.7: Cau tric dit liéu vecter ctia poligon
Trong cấu trúc Vector, thực thể không gian được biểu điễn thông qua các phần tử
cơ bản là điểm, đường, vùng và các quan hệ Topo (khoảng cách, tính liên thông, tính
kề nhau .) giữa các đối tượng với nhau VỊ trí không gian của thực thể không gian đ- ược xác định bởi tọa độ trong một hệ thống tọa độ thống nhất toàn cầu
18
Trang 27Đối mợọng Toạ độ điểm
Vig (Poly gon)
Hình 1.8: Biểu diễn mô hình Vector của các đối tượng địa lý
Điểm dùng cho tất cả các đối tượng không gian mà được biểu diễn như một cặp toạ độ (X,Y) Ngoài giá trị toạ độ (X,Y), điểm còn thể hiện kiểu điểm, màu, hình dạng và đữ liệu thuộc tính đi kèm Do đó trên bản đồ điểm có thể được biểu hiện bằng
ký hiệu hoặc text
Đường dùng để biểu diễn tất cả các thực thể có dạng tuyến, được tạo nên từ hai hoặc hơn cặp toạ độ (X,Y) Ví dụ đường dùng để biểu diễn hệ thống đường giao thông, hệ thống ống thoát nước Ngoài toạ độ, đường còn có thể bao hàm cả góc quay tại đầu mút
® Vùng là một đối tượng hình học 2 chiều Vùng có thể là một đa giác đơn giản hay hợp của nhiều đa giác đơn giản Mục tiêu của cấu trúc đữ liệu đa giác là biểu diễn cho vùng Do một vùng được cấu tạo từ các đa giác nên cấu trúc dữ liệu của đa giác phải ghi lại được sự hiện diện của các thành phần này và các phần tử cấu tạo nên đa giác
%® Những ưu điểm của cấu trúc Vector:
«e Ít trường hợp tư liệu bị đầy chặt bộ nhớ trong máy tính vì tổ chức dữ liệu Vector thường ở dạng nén, vì có thể chứa được một lượng đữ liệu Vector rất lớn trong
e Các đối tượng riêng biệt được thể hiện một cách rõ ràng và liên tục bằng những đường nét rõ ràng
e Các yếu tố không gian về mặt hình học thì đễ đàng được xác định
se Có độ chính xác cao trong việc tính toán và xử lý các yếu tố không gian
œ Nhược điểm của cấu trúc Vector:
19
Trang 28e Nhược điểm lớn nhất của cấu trúc dữ liệu Vector là xử lý chồng xếp các lớp bản đồ rất khó thực hiện được, ngay cả những việc chồng xếp rất đơn giản của dữ liệu Raster
Ví dụ: Để xác định một điểm nằm trong một polygon không thì ở cấu trúc Raster rất đơn giản khi biết vị trí của điểm theo hàng hay cột Trong khi đó ở cấu trúc Vector thì phái có một sự tính toán rất phức tạp
- Hình bên trái dễ dàng xác định vị trí pixel B ở hàng 7 và cột số 8 hình bên phải các polygon A, B, C, D được xác định bởi một loạt các toạ độ XY
Hình 1.9 So sánh giữa cấu trúc Raster và Vector
- Rất phức tạp Để xác định một điểm có-toạ độ 8,4 (theo toa độ phẳng) (tương ứng với điểm B ở hình bên trái có toa độ hàng 7 cột 8) thì việc tính toán là rất phức tạp mới xác định được điểm đó nằm ở polygon nào
1.2.4 Mô hình cấu trúc dữ liệu cung và điểm nút (Area-Node)
Một mô hình đữ liệu-là một cấu trúc cơ bản của dữ liệu được thiết kế để sao cho việc khai thác và xử lý là thuận tiện nhất Mô hình cung và điểm nút (Are-Node) là mô hình do Cục thống kê của Mỹ thiết kế theo các file dit liệu địa lý từ nam 1980 Trên cơ
sở mô hình này, các đường phố và yếu tố dạng tuyến khác của nước Mỹ cũng được tổ chức theo hệ thống file dữ dạng có hai thuộc tính độc lập về cung và điểm nối (Dual Independence Map Encoding - DIME) (Are-Node Model- mô hình cung điểm nối) Theo m6 hình này, các cung tạo nên phần lớn các đơn vị cơ bản trên bản đồ Khái niệm
vé cung (Area) ở đây khác với khái niệm về cung ở trong Hội Bản đồ của Mỹ quy định
Ở đây mỗi một cung bao gồm hai điểm nút: điểm đầu và điểm cuối Giữa các điểm nối
và cung có thể không có hoặc có các giao điểm của các cung khác Hình dạng và độ dài của cung được xác định bởi vị trí của các điểm nối và các giao điểm (Vertice hoặc Veriex) Một điểm nối khác với giao điểm về tính chất hình học Cụ thể: một điểm nối thì có toa độ x và y và thuộc tính hình học, còn giao điểm (Vertex) thì chỉ có toa độ x
va y mà không có thuộc tính (hình L.10)
20
Trang 29Hướng của một cung được hiểu một cách đặc biệt trong thứ tự của các điểm nối,
đó là điểm đầu và điểm cuối Với một hướngđã biết thì hai phía (phải và trái) của cung cũng được xác định Những thông tin về một cung bao gồm:
Thuộc tính (ID) của cung
Thuộc tính (ID) của điểm nối đầu
Thuộc tính (ID) của điểm nối cuối
Thuộc tính (ID) của polygon bên trái của cung
Toa độ x, y của điểm nối đầu
Toa độ x, y của điểm nối cuối
Toạ độ của tất cả giao điểm
Ngoài ra trường (Field) bao gồm độ dài của một cung cũng được xác định
Điểm nối có ý nghĩa về mặt hình học là nó thể hiện sự tiếp nối giữa hai yếu tố mô hình cung - điểm nối (Area-Node), một điểm được thể hiện bằng một yếu tố đường bị thiếu hụt (Degenerate) với điểm nối đâu trùng lẽn điểm nối cuối và không có điểm giao cắt ở giữa
Như vậy, một điểm được thể hiện bằng một điểm nối (Node) vì điểm nối đầu và điểm nối cuối là giống nhau Đối với polygon như đã nêu ở trên thì mỗi polygon là bao gồm tập hợp các cung và điểm nối Để xác định mối quan hệ không gian của polygon thì mọi điểm giao cắt phải được xác định bằng một điểm nối Uù thế cơ bản của mô hình cung cầu - điểm nối là luôn có thuộc tính không gian và như vậy mức độ chính xác sẽ rất cao, đồng thời dễ xác định được mối quan hệ không gian của các yếu tố Ví
dụ, sự tiếp giáp của hai polygon hay pplygon này nằm trong polygon kia và cách đơn giản là xem ở bảng thống kê các cung mà chúng ta tạo nên 2 polygon đó Trong bảng
Trang 30thống kê nếu có một cung nào đó là một phần của cả hai polygon thì 2 polygon đó là nằm liền kề nhau
Phần mềm ARC/INFO là phần mềm điển hình có tổ chức Vẹctor theo mô hình cung- điểm nối và nó tự động tính và thống kê các thuộc tính của cung, điểm nối, từ đó
đễ đàng cho việc tính toán và xử lý các mô hình không gian
Trong ARC/INFO, có hai dạng bảng thống kê là bảng thống kê thuộc tính của các polygon (Polygon Attribute Table - PAT) và bảng thống kê thuộc tính của các cung
(Arc Attribute Table - AAT)
Bảng 1.1: Bảng thuộc tính của polygon PAT
polygon tiếp theo được gắn các thuộc tính và các giá trị: chu vi, điện tích mà được tính
tự động khi các tính chất chi tiết được thiết lập
Trang 31Bảng AAT mỗi cung được xác định bởi cả số thứ tự và thuộc tính của cung, thuộc tính của điểm đầu, điểm cuối và thuộc tính của các polygone ở bên phải, bên trái của cung Và các polygon này cũng chính là các- polygone ở trong bảng PAT Ví dụ: polygone số 3 trong bảng AAT có số thứ tự là 3 và thuộc tính là 102 t0 bảng PAT
Cả 3 yếu tố quan trọng của vector về tính chất hình học (Topology) là tính chất lién ké (Adjacency), tinh chat chtta dung (Containment) va tính chất nối cầu (Conectivity) là những yếu tố rất quan trọng và là vấn đề cốt lõi của mô hình cung - điểm nối (Are - Node) Các yếu tố này sẽ giúp người phân tích xác định rõ được tính
Ví dụ: Để xác định hai polygon có tiếp giáp nhau hay không, người phân tích chỉ cần xem các cung xác định nên hai polygon đó, nếu có một cung nào cùng tính chất thì
nó chính là vị trí tiếp giáp của hai polygon Trong bảng TAB, hai polygon có số 102 và
103 được tiếp giáp nhau bởi cung số 33 trong bảng AAT
Để xác định tính chất chứa đựng, cách xác định cũng như vậy Muốn xác định polygon A được chứa bởi polygon B hay không thì trước hết phải xác định các cung tạo nên polygon A và thuộc tính của cả hai bên các cung, nếu như xác định thấy A luôn ở mọi phía của cung thì A nhất thiết phải được chứa trong B Ví dụ, cung số 37 trong hình 3 xác định nên polygon số 101, một phía của cung luôn là polygon số 104 thì nhất thiét polygon s6 101 phải được chứa trong polygon số 104 Trong trường hợp một polygon lớn chứa nhiều polygon nhỏ bên trong cũng xác định một cách tương tự
Tính chất tiếp nối của một cung được xác định từ thuộc tính của điểm đầu (F) và điểm cuối (T) trong bảng AAT Hai cung được xem là nối trực tiếp một khi có chung điểm nối Ví dụ trong bảng, cung 33, 38 và 39 là có chung một điểm nối số 3.F Trong khi đó cung số 37 là không được nối với một điểm nào cả vì nó chỉ có một điểm nối riêng của nó (số 2) tạo nên polygon thứ 4 có thuộc tính là 101
Ví dụ trên là ví dụ cho một sự ưu điểm của mô hình cung - điểm nối, nó xác định mối liên hệ hình học của các yếu tố và điều rất quan trọng trong xử lý không gian Mặt khác, vị trí (toạ độ x, y) của mỗi một điểm nối, điểm giao cắt cũng được xác định Các thuộc tính đó cũng được thống kê rõ ràng trong bảng PAT và AAT giúp cho người phân tích dễ dàng xử lý các thông tin Trong thực tế, các tư liệu không gian là rất phức tạp, mô hình are - node là công cụ hữu hiệu cho việc xử lý Hiện nay, các phần mềm ARC/INF va INTERGRAPH duoc xây dựng theo mô hình này Trong khi đó, phần mềm MAP/INEO không được xây dựng theo mô hình cung - điểm nên giao diện giữa chúng không tương thích
Tóm lại: nội dung phần này nhằm giới thiệu tập trưng vào tư liệu không gian, đó
là cơ sở cho việc xử lý HTTĐL Công việc thống kê thuần tuý thì không cần phải có
23
Trang 32các đữ liệu không gian, sự phân tích không gian thì lại rất cấn các thông số đó, đặc biệt
là các thông số về địa lý và bản đồ
Các đối tượng không gian có thể được trình bày dưới các dạng khác nhau là đường, điểm và polygon Các yếu tố cơ bản của chúng cần được xác định đó là vị trí, thuộc tính và tính chất hình học
Việc tổ chức các yếu tố này ở hai dạng cấu trúc Raster và Polygon là khác nhau Nhìn chung, vị trí và thuộc tính thì được tổ chức tương đối giống nhau trong cả hai đạng cấu trúc đữ liệu, song tính chất không gian thì hết sức khác nhau
Trong xử lý không gian, các thông tin quan trọng nhất về hình học và tính chất tiếp giáp, chứa đựng và nối tiếp, cấu trúc Raster có hạn chế cơ bản là không thể hiện được mối quan hệ không gian Thay vào đó, cấu trúc Vector và đặc biệt là cấu trúc cung - điểm nối có ưu điểm là cung cấp đầy đủ các thông tin thuộc tính của điểm, đường và vùng nên nó giúp cho việc xử lý không gian được rõ ràng và hiệu quả
L2.5 Mô hình mạng (Netvwork Model)
Trong mô hình mạng, các cung trở thành mạng được thể hiện trong mạng giao thông (đường sắt, đường bộ, đường không), mạng lưới điện, mạng thông tin, mạng ống gas ống nước Các điểm nối trở thành các điểm nối, điểm dừng hoặc điểm giữa của mạng giống như hệ thống chạc 3 hoặc hệ thống van một cổng dẫn
Các điểm đó là nơi để dừng hoặc tiếp nhận các đối tượng hoặc đưa ra các đối tượng cần lưu thông, tương tự các điểm dừng xe, bến đổ, nơi chuyển tải Trung tâm của mạng là nơi chuyển tải nguồn cung cấp hoặc là nơi có những hoạt động có tính chất cung ứng cho mạng như: siêu thị, bệnh viện, sân bay, trường học, ở qui mô lớn hơn trung tâm có thể là cả một thành phố cung cấp„ chuyển tải cho cả một vùng rộng lớn Như vậy điểm liên hệ trong mạng là những đầu mối và các đường dẫn và mối liên hệ
đó có hướng nhất định theo các điểm quay - đổi chiều Tóm lại, những tính chất như đường nối, điểm nối, các điểm dừng, các trung tâm và các điểm quay là những thông tin thuộc tính của mô hình mạng cơ sở dữ liệu Vector Còn một tính chất khác của mạng là sự cản trở (tương tự điện trở của mạch điện) Sự cẩn trở bởi khối lượng thông tin được truyền và thời gian truyền tải Sự cân trở có liên quan đến nhiều yếu tố của mạng, đồng thời có liên quan đến cả năng lượng truyền Trong mạng của HTTĐL với
dữ liệu Vector, những yếu tố quan trong ảnh hưởng đến sự liên kết trong mạng đó là yếu tố hình học và sự nối tiếp Ngoài ra, các thuộc tính khác của đối tượng cũng phải được bố trí hợp lý cho từng mạng
L2.6 Mô hình dữ liệu hướng đối tượng ;
Có thể hiểu sự tiếp cận “ Hướng đối tượng” là các đặc điểm dễ nhận của một đối tượng đã biết với các kiểu đữ liệu rút gọn (abstract data types - ADT) đã được tóm gọn
Trang 33trong cách thể hiện phân cấp thế hệ cùng với các mối quan hệ nhân quả và quan hệ ràng buộc Có thể hiểu rõ hơn các khái niệm hướng đối tượng thông qua ví dụ sau
Trong GIS thường xuyên phải làm việc với các khoanh vi, các khoanh vi có thể tạo bởi các đoạn thẳng (Hình I.11) Giả sử các hình này được xem như là các kiểu đối tượng hình học, các yếu tố mang tính đồ hoạ.được xác định bởi các các điểm, các vector các đoạn thẳng và các khoanh vi là các kiểu phụ, đây là một ví dụ mang tính phân cấp thế hệ Mỗi kiểu trong trong ADT, cũng đồng nghĩa là tập hợp với nó có thể
là các thuộc tính (properties), hoặc là các biến (instant varlables) cùng với các động thái Các yếu tố đồ hoạ có thể là sự tổng hợp (rong động thái : hiển thị, di chyén, và có thể mở rộng thành các phụ kiểu, nói một cách khác, chúng có các thuộc tính, ví dụ, các điểm có thuộc tính định vị (vị tr0, các vector cớ vị trí xác định điểm đầu và điểm cuối, các đường thẳng và các khoanh vi sẽ có một thuộc tính chung là các vector thành phần Các phụ kiểu liên kết qua lại với nhau phụ thuộc vào từng hành vi cụ thể từ một thủ tục nào đó, các thủ tục khác nhau có thể tạo ra các phụ kiểu khác nhau
\
Hình 1.11: Các kiểu đối tượng của yếu tố hình học
Trang 34Như vậy, với hành vi di chuyển có thể có một thủ tục tương ứng tới một đối tượng là một điểm, dễ dàng nhận thấy sự thay đổi về toa độ vị trí ban đầu tới một vị trí mới Đối với một khoanh vi (polygon) các thủ tục tương ứng có thể yêu cầu đi chuyển
Như vậy có thể rút ra các nhận xét quan trọng là:
e Tiếp cận hướng đối tượng cho phép các đối tượng có thể được phân loại theo hành vi, ngay cả khi chúng không chung các đặc điểm về mặt cấu trúc Đây là một cách nhìn hoàn toàn khác đối với cơ sở dữ liệu truyền thống, phân loại theo thuộc tính
e Các đối tượng có thể được thi hành mà không nhất thiết phải biết được kiểu của nó Chẳng hạn, các đối tượng trong hình 1 có thể biểu diễn như một tập hợp các yếu tố đồ hoạ, và nó được thể hiện thông qua các tương tác của tập hợp đó
e Thuộc tính của một đối tượng bản thân nó là một đối tượng trong số các kiểu do người dùng tự đặt Ví dụ, điểm là có một thuộc tính vị trí (định vị), bản thân nó
là một kiểu có toa độ xác định x, y
e Các cấu trúc phức tạp, như các đa tuyến, nó bao gồm một cách tóm lược các vector (hoặc các toa độ), và được tổ chức như một đơn vị đơn giản Có thể cho rằng hệ thống cơ sở dữ liệu hướng đối tượng OODB được dùng rất phù hợp cho các đối tượng GIS
1.2.7 Mô hình hướng đối tượng cho GIS
Giả sử ta có một kiểu đối tượng đồ họa được gọi là đối tượng không gian 1 (spatial object 1), có thể viết bằng ngôn ngữ lập trình như sau:
object type spatial object 1
properties set(representation: spatial representation),
Trang 35geometry: graphical element
Kiểu hiển thị trung thực đầu xác định hình dạng của đường viền đối tượng, cùng với vị trí và tính định hướng của đối tượng Trong thực tế nó rất cần thiết cho phép các đối tượng hơn một đường viền
Kiểu hiển thị theo tuyến xác định vị trí và tính định hướng của đối tượng, nhưng chúng có giá trị nhỏ và là hằng số, trên đó không có quan hệ đặc biệt nào với các kích thước của một đối tượng thật
Kiểu biện thị quy ước xác định vị trí của đối tượng và một biểu tượng được sử dụng thể hiện cho đối tượng, dĩ nhiên biểu tượng này không có quan hệ đặc biệt nào với đường viền và tính định hướng của đối tượng,
Như đã nhận định ở phần trên, các yếu tố hình học có thể được thể hiện như tập hợp các đối tượng của kiểu đối tượng không gian 1 Để xác định được cấp hành vi thì yếu tố hình học có thể được mô hình hoá trong một kiểu đối tượng cửa số và các một
ao
cách tiến hành Như vậy, kiểu đối tượng “cửa sổ” có thể xác định như một bản đồ được tạo thành bởi việc giao cắt giữa một cửa số màn hình và và tập hợp các đối tượng không gian Như thế, một cửa sổ có thể là một phụ kiểu của đối tượng không gian | va
nó thể hiện các yếu tố hình học này trong một hình chữ nhất
Một kiểu bản đồ đối tượng có thể được mô tả như sau :
Object type map 1
Display Window(window)
CurrentScale Scale Set component Spatial Object 1 Operation
DisplayQ
Window(New Window: Window) Zoom(factor:real)
Trang 36Trong khía cạnh chồng ghép Có 2 kiểu chồng ghép Một là kiểu bản đồ 1, cấu thành từ các đa tuyến không chồng ghép Kiểu này được gọi là kiểu chồng ghép p Kiểu chồng ghép thứ hai gọi là kiểu chồng ghép q và nó được thể hiện như sau:
Object type q overlay
Properties
image quadtree object legend o table band legend b table
Display window(window) `
CurrenScale Scale Operation
DisplayQ) Window(NewWindow: window) Zoom(factor: real)
Pan(Shift, xyCoordinate)
Select object(Old)*quadtree Select Band(Old)*quadtree Kiểu đối tượng bảng o là một bảng xác định quan hệ đối tượng có tên là Old và
có thuộc tính màu Các Old được lưu cùng với các ảnh quadtree Do vậy, việc tiến hành chọn đối tượng có thể chọn một đối tượng đơn từ một ảnh quadtree Các đối tượng được phân loại theo kiểu đối tượng không gian 2, như sau:
Object type Spatial object 2
Properties
Parent q overlay Operation
Display(Scale,origin)
Trang 37Intersaction(object:spatial object 2)
Để hiển thị một đối tượng trong kiểu đối tượng không gian 2, việc tiến hành chọn đối tượng được áp dụng trên lớp chồng ghép đầu tiên cho kết quả hiển thi tai anh quadtree Kiểu bảng b xác định band có quan hệ tới đối tượng được xác định cùng với tên và các màu của band Kiểu đối tượng trong lớp chồng ghép được thể hiện như hình trên
Ở lớp thông tin hình học và lớp chồng ghép có thể được tập hợp lại bằng việc xác định kiểu các đối tượng không gian như sự tổng hợp lại của đối tượng không gian 1
và của đối tượng không gian 2 Cũng như vậy, việc xác định kiểu bản đồ là sự tổng hợp của kiểu bản đồ 1 và tính chồng ghép q Thể hiện trong hình sau
Bán đồ
Cuối cùng trong các yếu tố cơ sở là tổng hợp của các yéu tố đơn giản
Object type feature
Set component(Spatial Object) Description(aspatial object) Operation
Display(Scale,origin)
Explode()
Ở đây các đối tượng mang tính
hiện đơn giản một hệ thống mở là có
thể cung cấp cho người dùng khả năng xác định các phụ kiểu của các đối tượng mang
Trang 38tính không gian với tổ hợp các cấu trúc rút gọn nhất và cung cấp cách thức rút gọn hợp
lý khi lưu trứ các thuộc tính không gian này
1.2.8 Chuyển đổi khuôn dạng dữ liệu
Trong xử lý HTTĐL, ngoài việc chuyển đổi khuôn dạng dữ liệu (Format) với các phần mềm khác thì một trong những chức năng quan trọng cần thiết là chuyển đổi từ Vector sang Raster và ngược lại Chức năng này cho phép sử dụng một cách linh hoạt những lớp thông tin có sắn trong CSDL hoặc các lớp thông tin mới tạo nên để đưa vào
xử lý nhanh chóng trong hệ thống
Chuyển đổi dữ liệu thành Raster (Raster hoá) (Rasterisaton hay Rasterising) là quá trình chuyển đổi dữ liệu từ cơ sở Pixel sang dạng Vector Công việc này rất cần thiết cho nhiều mục đích Khi mà các đường Contour của Vector cần thiết được xử lý phối hợp với tài liệu Raster
Để Raster hoá cần thiết phải tạo lưới với độ phân giải (kích thước Pixel) thích hợp lên toàn bộ bản đồ và tính giá trị Pixel bằng việc lựa chọn các vùng mẫu tại nơi giao nhau của các đường Vector hoặc nơi tiếp giáp của các polygon, từ đó gắn giá trị các Pixel tại nơi tiếp giáp, sao cho nó phân biệt hẳn với các Pixel ở xung quanh Nếu Vector hoá với độ phân giải thấp thì sẽ làm giảm độ chính xác của bản đồ đôi khi làm rối các đường Conftour
Nguyên nhân của việc làm rối, sai lệch các đường là do lựa chọn độ phân giải không thích hợp hoặc chọn vùng mẫu của lưới chưa đúng vị trí Tuy nhiên, trong thực
tế áp dụng các chức năng này đã có sẵn trong các phần mềm nên khi áp dụng người sử dụng ít phải can thiệp và khi cần thiết thì thao tác; quan trọng là xác định độ phân giải
bổ sung các toa độ của các Pixel một cách rõ ràng để phục vụ cho việc định vị các đường Vector được lập
Trang 39
như việc số hoá Quá trình này được thực hiện lần lượt, khi gặp vị trí có sự chuyển
thành nhiều hướng thì đó là các điểm Quá trình này có sự can thiệp của người điều hành thì kết quả sẽ tốt hơn Cũng cần lưu ý rằng chức năng vector hoá chỉ nên áp dụng một khi cần thiết
Sự chuyển đổi từ Vector sang Raster hoặc từ Raster sang Vector là cần thiết khi hai dữ liệu được lưu git trong những mô hình đữ liệu khác nhau
Trang 40
a Chuyển đổi từ Raster sang Vector: có nghĩa là tạo ra các điểm, đường và vùng (xem ví dụ tạo ra đường ở hình VỊI a) Đầu tiên đường cần phải được nhận dạng trên loại hình của các ô một đường chỉ là một tập hợp của các ô được nối với nhau Sau
qua trung tâm của các ô Tạo lập điểm và vùng cũng gần như tương tự Độ chính xác của sự chuyển đổi phụ thuộc vào kích cỡ ô của hệ Rasfer
b Chuyển dữ liệu từ Vector sang Raster: Tức là toàn bộ thông tin cần được chia nhỏ thành các ô Raster Để làm việc này, lưới của các ô được đặt trên bản đồ Vector cơ sở và thông tin ở dưới mỗi ô được gán vào ôð Khi chuyển một điểm sang thành một ô, vị trí chính xác của nó mờ nhạt dân và trở nên kém chính xác Bất kỳ một đối tượng Vector nào cũng sẽ được biểu diễn kém chính xác hơn trong hệ thống Raster
(xem hình VỊIL.b)
Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu Có một số khái niệm nén số liệu phổ biến như sau:
- Mã hoá chạy theo dòng (run lengh code) '
Mã hoá theo chuéi mat xich (chain codes)
Mã hoá theo khối (bloch codes)
Mã hoá theo cách chia thành 4 ô nhỏ (quadtrees )
Nếu so sánh thì độ chính xác của dữ liệu vector cao hơn Raster Tuy nhiên, dù sao khái niệm độ chính xác của các đối tượng trong HTTĐL vẫn chỉ là tương đối Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng tư liệu là điều cần thiết và là tất nhiên
@ Tóm tắt chung:
Phần này đã tập trung giới thiệu để cung cấp một cách nhìn rõ ràng về vấn đề cơ
sở đữ liệu hình thành trong máy tính Trong đó, đã nêu khái quát những đặc điểm của hai đạng dữ liệu cơ bản là Raster và Vector Do dữ liệu Raster thường chiếm khối lượng lớn nên cần thiết phải có các phương pháp nén dữ liệu
Nếu so sánh thì độ chính xác của dữ liệu Vector cao hon Raster Tuy nhiên, dù sao khái niệm độ chính xác của các đối tượng trong HTTĐL vẫn chỉ là tương đối Trong quá trình xử lý theo mô hình không gian thì sự phối hợp giữa hai dạng tư liệu là điều cần thiết và là tất nhiên.Thông thường, các mô hình xử lý tư liệu thường là không gian hai chiều hoặc 3 chiểu Trong tương lai, để theo dõi diễn biến của các đối tượng thì phải xử lý theo đa thời gian và dự báo - đó là khái niệm về chiều không gian thứ 4
của mô hình xu ly HTTDL
1.2.9 Tính chất định lượng của phân tích không gian
32