6 Các bản đồ dạng Raster images được xếp theo các hàng và các cột không miêu tả các đối tượng một cách rõ ràng Source: Defense Mapping School National Imagery and Mapping Agency Đặc
Trang 1HỆ THỐNG THÔNG TIN ĐỊA LÝ (GIS)
(CH3 – CẤU TRÚC DỮ LIỆU GIS)
Phan Trọng Tiến
Bộ môn Công nghệ phần mềm – Khoa CNTT
Học Viện Nông nghiệp Việt Nam
Website: http://timoday.edu.vn
Email: phantien84@gmail.com
Mục tiêu
Giới thiệu các mô hình dữ liệu trong GIS
Sau bài học này sinh viên có thể:
q Mô tả mô hình dữ liệu Vector và cho ví dụ
q Mô tả mô hình dữ liệu Raster và cho ví dụ
q Mô tả mô hình dữ liệu TIN
q Giải thích “topology”
q Mô tả các định dạng chính sử dụng trong GIS
Trang 22
Các đối tượng đồ họa
q Các đối tượng hiển thị trên bản đồ được gọi là
các đối tượng đồ họa hay các đối tượng
q Các đối tượng có thể là tự nhiên hoặc do con
người tạo ra nó
Các đối tượng đồ họa
q Vectors
q Points hoặc Nodes
q Lines hoặc Arcs
Trang 3© Paul Bolstad, GIS Fundamentals
Các loại dữ liệu GIS
Các loại dữ liệu GIS
Trang 4Các bản đồ điện tử ở hai định dạng Raster và
Vector
Trang 5Các nguồn dữ liệu Raster
Ảnh vệ tinh
Ảnh máy bay
Các bản đồ quét
Ảnh số trực giao (Digital Orthophotography)
q Một ảnh được quét, dùng
các công cụ toán học sửa, bỏ
đi, dịch chuyển để có được
hiệu quả mong muốn đó là
các đối tượng luôn hiển thị
vuông góc với mặt đất
q Ảnh trực giao cho ta ảnh
giống như hiện trạng của
trái đất
Trang 66
Các bản đồ dạng Raster (images)
được xếp theo các hàng và các cột
không miêu tả các đối tượng một cách rõ ràng
Source: Defense Mapping School National Imagery and Mapping Agency
Đặc điểm của Raster
q Trông giống trang bản đồ giấy
q Không cho phép tự động loại bỏ
chế độ nền hay sự trợ giúp phân
tích của máy tính
q Lưu trữ không hiệu quả
Source: Defense Mapping School National Imagery and Mapping Agency
Trang 7Dữ liệu dạng Vector
q Một cách lưu trữ thông
minh dữ liệu GIS, ở đó các
đối tượng thế giới thực
Liên kết các thuộc tính và đồ họa
tin GIS kết hợp bản đồ
với hệ quản trị cơ sở dữ
liệu Vì vậy khi phân tích
dữ liệu không gian chỉ
cần “ click ” trên đối
tượng địa lý và tìm thông
q Thông tin về một đối
tượng GIS được gọi là
thuộc tính (attribute)
Trang 8Dữ liệu Vector được phân lớp
Spatial Data Analysis
Connected Detached Area Text
Trang 9Sự thay đổi về mô hình
Các mô hình dữ liệu Raster và Vector
Trang 1010
Mô hình dữ liệu Vector
Dữ liệu GIS được lưu trữ trong các lớp riêng biệt
như Point, Line, Polygon
© Paul Bolstad, GIS Fundamentals
Trang 11Cấu trúc dữ liệu Vector
q Có mối quan hệ giữa các kiểu dữ liệu vector Mỗi
kiểu thường độc lập trên một kiểu khác nhau Khi
miêu tả dữ liệu GIS theo định dạng vector, dữ liệu
phải được lưu trữ:
q Points: là các đối tượng vô hướng có vị trí không
gian, miêu tả các đối tượng GIS như vị trí, hoặc
cây …
q Lines: miêu tả đối tượng một chiều, có vị trí, có
chiều dài như đường, sông Lines được tạo bởi
việc kết nối các điểm với nhau Một đường bắt đầu
và kết thúc tại một điểm gọi là nút (node), và các
điểm tạo nên đường gọi là đỉnh (Vertices)
q Polygons/Area: miêu tả đối tượng hai chiều, có vị
trí, có chiều dài, và có cả chiều rộng như đường
danh giới của cánh đồng, đất đai, hoặc ao hồ …
Nó được tạo bởi việc kết nối các đường, điểm bắt
đầu của polygon cũng là điểm kết thúc
q Point là đối tượng vô hướng có vị trí và thuộc
tính thông tin nhưng quá nhỏ để được biểu
diễn bằng vùng
q Tỷ lệ bản đồ quyết định một đối tượng là điểm
Trang 13Các trung tâm
Lines hoặc Arcs
q Lines là các đối tượng
một chiều, có vị trí, có chiều dài nhưng không
có chiều rộng như đường, sông Lines được tạo bởi việc kết nối các điểm với nhau
Một đường bắt đầu và kết thúc tại một điểm gọi là nút (node), và các điểm tạo nên đường gọi
là đỉnh (Vertices)
Trang 15Polygons
Polygons là đối tượng hai chiều, có vị trí, có chiều dài, và có cả chiều rộng (hay có diện tích)
Trang 17Mô hình dữ liệu Vector
q Điểm: Được thể hiện bằng một cặp toạ độ
q Đường: Được thể hiện bằng một chuỗi các cặp toạ độ
q Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ độ
đầu và cặp toạ độ cuối trùng nhau
KiÓu VÞ trÝ
§iÓm 3,2
§êng 1,5; 3,5; 5,7; 8,8; 11,7 Vïng 5,3; 6,5; 7,4; 9,5; 11,3;
8,2; 5,3
Cấu trúc dữ liệu Vector
KiÓu VÞ trÝ
§iÓm 3,2
§êng 1,5; 3,5; 5,7; 8,8; 11,7 Vïng 5,3; 6,5; 7,4; 9,5; 11,3;
8,2; 5,3
Điểm: Được thể hiện bằng một cặp toạ độ
Đường: Được thể hiện bằng một chuỗi các cặp toạ độ
Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ độ đầu
Trang 1818
Biểu diễn dữ liệu dạng Vector
Mỗi điểm thể hiện bằng một cặp toạ độ
Mỗi đường thể hiện mỗt chuỗi các cặp toạ độ
Mỗi vùng được thể hiện bằng một chuỗi các cặp toạ độ, điểm đầu và điểm cuối trùng nhau
Mô hình Vector
q Dữ liệu ở dạng Vector được tổ chức ở 2 mô
hình:
q Mô hình Spagheti
q Mô hình quan hệ không gian Topology
Trang 19Mô hình dữ liệu Vector Spaghetti
tượng chỉ được lưu trữ bằng các cặp
toạ độ
Mô hình dữ liệu Vector Spaghetti
q Không mô tả được mối quan hệ không gian
giữa các đối tượng, vì thế các phép phân tích,
tính toán không gian đều thực hiện khó khăn
q Dữ liệu dạng vùng, đường ranh giới giữa 2
vùng được ghi nhận 2 lần, mỗi lần cho một
vùng
q Ưu điểm của mô hình là đơn giản, dễ trình bày,
biên tập, in ấn vì vậy vẫn được sử dụng rộng
rãi để thành lập bản đồ
Trang 2020
Mô hình dữ liệu Vector Topology
q Là một mô hình phức tạp, các đối tượng được quản lý
không chỉ bởi toạ độ mà còn bằng cả mối quan hệ không
gian giữa các đối tượng
q Mô tả trọn vẹn các thông tin của các đối tượng không
gian bao gồm:
q Thông tin về vị trí không gian (Spatial data): Thông tin được thể
hiện theo mô hình vector, bằng các tọa độ mô tả vị trí, hình dạng,
đường biên của các đối tượng
q Thông tin về quan hệ không gian (Relational Spatial data –
Topology) Mô hình dữ liệu Topology thể hiện QHKG dưới 3 kiểu
q Nằm trong nhau, phủ nhau
Mô hình dữ liệu Vector Topology
- Thông tin về vị trí trong không gian
+ Dữ liệu không gian các đối tượng vùng là một tập các đối
tượng đường định nghĩa đường bao vùng và một điểm nhãn
+ Điểm nhãn nằm trong đối tượng vùng có ý nghĩa để xác
định cho vùng này.
Trang 21Mô hình dữ liệu Vector Topology
Các quan hệ không gian Các đặc tính không gian
Mỗi một đường (arc) có điểm bắt đầu và
kết thúc tại điểm nút (node)
Độ dài của đường
Hướng đường (Directionality)
Các đường (arc) nối với nhau tại các điểm
nút (node)
Tính liên tục (Connectivity)
Các đường (arc) nối với nhau tạo thành
đường bao của vùng (polygon)
Tính tạo vùng (Diện tích vùng, chu vi vùng) Các đường tham gia định nghĩa vùng ở cả
hai bên : phải và trái
Tính kề nhau (Adjacency or contiguity)
Thông tin về quan hệ không gian
+ Dữ liệu không gian các đối tượng vùng là một tập các đối tượng đường
định nghĩa đường bao vùng và một điểm nhãn
+ Mô hình Topology dùng các quan hệ không gian để định nghĩa các đặc
tính không gian của các đối tượng
Tính liên tục Đầu, cuối giao của đường
Mô hình dữ liệu Vector Topology
Trang 22Áp dụng mô hình topology khi xây dựng CSDL không gian
- Đường ranh giới tạo thành đường bao thửa đất luôn đảm bảo
tính khép kín tuyệt đối về toạ độ
- Các đường ranh giới thửa không được phép giao nhau, phải luôn cắt
nhau tại đầu hoặc cuối đường ( tại điểm nút NODE)
Mô hình dữ liệu Vector Topology
Trang 23DỮ LIỆU KHÔNG GIAN CHUẨN
Cơ sở dữ liệu chuẩn là dữ liệu không còn lỗi như: bắt
quá, bắt chưa tới, vùng chưa khép…
Liên kết dữ liệu thuộc tính
Bảng dữ liệu (Attributes)
© ESRI
Trang 2424
Dữ liệu thuộc tính
Là thông tin cho phép miêu tả một thực thể đã
được trình bày ở đối tượng đồ họa
Dữ liệu thuộc tính
q Mỗi phần thông tin thuộc tính liên quan tới một phần
đối tượng đồ họa
q Các trường thuộc kiểu dữ liệu truyền thống của
Trang 25Courtesy Village of Garden City
Liên kết các thuộc tính
Mô hình dữ liệu Raster
q Dữ liệu GIS được lưu trữ dưới dạng lưới các ô
(cells) hay pixel
q Ảnh viễn thám, ảnh quét (scanner) luôn ở
dạng Raster
Trang 26q Khung cảnh các tai họa
q Sự thiệt hại mùa vụ
q Các hình ảnh về sự vận động địa chất
q Ảnh trực giao
q Các ảnh trên không đã được chỉnh sửa
Dữ liệu Raster
q Là một mảng hai chiều các ô (pixel) Mỗi ô có chiều cao và chiều rộng
cố định và cùng kích thước, trải trên một hình chữ nhật
Trang 27Bảng dữ liệu thuộc tính
q Rasters có giá trị số nguyên các ô (số lượng các ô cùng giá
trị) được ghi trong bảng dữ liệu thuộc tính Mỗi bản ghi
thuộc tính là duy nhất với mỗi giá trị của ô
q Có thể thêm các trường tới bảng dữ liệu
Các kiểu dữ liệu miêu tả trong ô
q Dữ liệu được lưu trữ trong raster có thể được phân loại
một trong các loại sau:
q Dữ liệu tên (Nominal data): dữ liệu được phân loại
theo tên
q Dữ liệu số thứ tự (Ordinal data): dữ liệu được phân
loại theo tên và khoảng giá trị
q Khoảng dữ liệu (Interval data): sắp xếp theo thứ tự
số và có các khoảng khác nhau có ý nghĩa
q Dữ liệu tỷ lệ (Ratio data)
Trang 2828
Các kiểu dữ liệu miêu tả trong ô
Các kiểu dữ liệu miêu tả trong ô
q Kiểu Nominal và Ordinal dùng miêu tả theo các phân loại khác nhau, là cách tốt nhất miêu tả các
ô dữ liệu kiểu integer
q Kiểu Interval và Ratio mô
tả các giá trị liên tục, dùng với các ô dữ liệu là kiểu real
Trang 29PIXEL ( PICTURE ELEMENT )
PIXEL là đơn vị nhỏ nhất trong ảnh Cơ sở hệ
thống GIS là raster, thông tin thuộc tính có thể
được khởi gán tới mỗi pixel
Trang 3030
Cách biểu diễn Raster
q Raster có thể có một hoặc nhiều nhãn Giá trị
của mỗi ô có thể mang các giá trị khác nhau
Có một vài cách để hiển thị raster với giá trị
của ô
q Hiển thị nhãn đơn (single-band)
q Hiển thị nhãn bội (multi-band)
Hiển thị nhãn đơn
Trang 31Hiển thị nhãn bội
Cấu trúc dữ liệu Raster
q Ma trận các ô bằng nhau
Trang 32q Phải được cân nhắc kỹ
q Tính rời rạc của thực thể đang mô tả
q Ứng dụng mong đợi (Các chức năng)
Trang 33Mô hình Raster và Vector
Land
Shoreline
Water
Vector Shoreline Land
Vậy “Định dạng nào là tốt nhất mô tả
các đối tượng trong GIS, raster hay
vector” Câu trả lời là một trong hai hoặc
cả hai Đó là, dùng một trong hai mô
hình dữ liệu là tốt nhất trong mỗi trường
hợp hoặc cả hai mô hình đều thực hiện
các vai trò nhất định trong GIS
Trong ví dụ, nguồn dữ liệu vector miêu
tả đường bờ biển xuất hiện có nhiều chi
tiết hơn và độ chính xác lớn hơn Dữ
liệu Vector có thể lưu trữ thông tin trong
nhiều định dang hơn dữ liệu Raster, và
cũng làm việc tốt với đối tượng thuộc về
chiều dài như dữ liệu mạng lưới
Tuy nhiên, các mô hình dữ liệu Raster
tốt cho miêu tả thông tin liên tục trong tự
nhiên như nhiệt độ nơi mà giá trị nhiệt
độ có thể khác với nơi liền kề
Vector – Những ưu điểm và nhược điểm
q Thuận lợi
q Miêu tả tốt thực tế
q Gắn kết nhiều cấu trúc dữ liệu
q Topology có thể được mô tả trong mạng
q Đồ họa chính xác
q Nhược điểm
q Cấu trúc dữ liệu phức tạp
q Mô phỏng khó khăn
Trang 34q Có nhiều kiểu phân tích không gian khác nhau
q Không thay đổi kích thước và hình dáng
q Công nghệ rẻ
q Nhược điểm
q Số lượng lớn dữ liệu
q Không đẹp
q Thay đổi hệ quy chiếu là khó khăn
q Tỷ lệ khác nhau giữa các lớp có thể là cơn ác mộng
q Có thể mất thông tin ở những vùng giao nhau
© Paul Bolstad, GIS Fundamentals
Các chức năng Raster
Trang 35Các phương pháp nén dữ liệu Raster
q Mục đích: Giảm kích thước lưu trữ
q Có các phương pháp:
q Phương pháp nén theo đường biên vùng (Chain
Code)
q Phương pháp nén theo hàng cột (Run-length code)
q Phương pháp nén theo khối (Block code)
q Phương pháp nén cây tứ phân (Quadtree code)
Phương pháp nén theo đường biên vùng
(Chain Code)
q Các đường biên của các vùng được thể hiện bằng hàng liên
tục các vectơ đơn vị theo hướng 4 phương, được qui ước
bằng các số: hướng Đông = 0, Bắc = 1 Tây = 2 Nam = 3
q Ví dụ trên nếu ta bắt đầu từ cell của hàng 0 theo chiều kim
đồng hồ ta sẽ có dãy giá trị sau thể hiện biên của vùng theo
2
3
Trang 3636
Phương pháp nén theo đường biên vùng
(Chain Code)
q Ưu điểm:
q Là phương pháp nén dữ liệu raster hiệu quả
q Dễ dàng tiến hành tính chu vi và diện tích, nhận biết
lồi lõm, thay đổi hướng đột ngột
q Nhược điểm:
q Khó khăn trong phân tích chồng xếp
q Dư thừa dữ liệu vì đường biên lưu trữ hai lần
Phương pháp nén theo hàng cột (Run-length
code)
q Các điểm trên mỗi đơn vị bản đồ
được lưu trữ theo hàng từ trái qua
phải từ cell đầu đến cell cuối
Trang 37Phương pháp nén theo hàng cột (Run-length
q Khó khăn trong quá trình xử lý và phân tích dữ liệu
Phương pháp nén theo khối (Block code)
q Ví dụ trên có thể viết dưới dạng nén block code
2 n x 2 n như sau:
q 7 block 1 đơn vị ô vuông
q 7 block 4 đơn vị ô vuông
• Phương pháp này có hiệu quả với các vùng có diện tích lớn và
Trang 3838
Phương pháp nén cây tứ phân (Quadtree code)
Phương pháp nén cây tứ phân (Quadtree code)
Thể hiện sự chia liên tục của dạng ma trận 2 n x 2 n thành
dạng cây 4 nhánh ưu điểm của phương pháp nén hình cây:
- Dễ tính toán diện tích chu vi của các vùng có hình dạng
chuẩn
- Có thể giam bớt sự lưu trữ với các độ phân giải khác nhau
Nhược điểm :
- Khó khăn cho việc chọn các mô hình, giải pháp
- Một vùng có thể chia thành rất nhiều phần gây khó khăn
cho việc truy nhập DL
Trang 39TIN(Triangulated Irregular Network)
giác Các đường của
các tam giác gọi là các
cùng và miền phía
trong gọi là bề mặt
(facet)
TIN(Triangulated Irregular Network)
q Mô hình TIN có một vài điểm phức tạp hơn dạng Point,
Line, Polygon trong mô hình Vector, hay mô hình Raster,
nó thực sự hữu ích miêu tả độ cao
q Ví dụ thể hiện lợi ích của TIN:
q Lưới Raster cần phải yêu cầu lưới các ô bao phủ toàn bộ bề mặt đạ
lý
q Vì vây, nếu chúng ta muốn hiển thị chi tiết thì ta phải chia lưới này
thành các ô nhỏ hơn -> nhưng với một bề mặt tương đối bằng
phẳng -> tốn bộ nhớ
q Tuy nhiên, với TIN chúng ta không cần phải dùng nhiều điểm trên
miền bằng phẳng, nhưng cũng có thể thêm nhiều điểm ở vùng để
tăng độ chính xác hơn
Trang 4040
Cấu trúc dữ liệu TIN
q Cấu trúc dữ liệu TIN dựa trên
hai phân tử cơ bản:
q Các điểm với giá trị x,y,z
q Các cung nối các điểm này
q Phép đạc tam giác TIN thỏa
mãn theo tiêu chuẩn Delaunay
Tiêu chuẩn Delaunay
Vòng tròn ngoại tiếp không chứa một nút của bất kỳ phần
tử nào khác Vòng tròn ngoại tiếp của một tam giác là vòng
q ArcGIS hỗ trợ cả hai mô hình độ cao: TIN and lưới
Trang 41Các thành phần TIN
q Nodes: là cơ sở xây dựng các khối của TIN Các nút bắt đầu từ các điểm và
các đỉnh cung chứa từ các nguồn dữ liệu nhập vào
q Edges: Mỗi nút được nối với nút gần nhất theo tiêu chuẩn Delaunay Mỗi cung
có hai nút nhưng một nút có thể có hai hoặc nhiều cung
q Triangles: Mỗi bề mặt tam giác miêu tả một phần của bề mặt TIN
q Hull (bao): được hình thành bới một hoặc nhiều polygon bao gồm toàn bộ tập
dữ liệu các điểm sử dụng xây dựng nên TIN Các Polygon Hull định nghĩa
vùng nội suy của TIN
q Topology: là cấu trúc hình học của TIN định nghĩa mối quan hệ giữa các nút,
các cung và mối quan hệ giữa các tam giác liền kề
gồm các file Tuy nhiên, TIN không bao phủ và không kết
hợp với file INFO Thư mục TIN chứa 7 file bao gồm thông
tin về bề mặt TIN Các file này được mã hóa theo dạng nhị
phân và không đọc được ở chế độ hiển thị văn bản.
Trang 4242
Trang 43Cấu trúc dữ liệu GIS 85
Trang 4444
Chú giải (Annotation)
Là văn bản (text) hoặc nhãn (labels) vẽ trên bản
đồ mà miêu tả hoặc nhận diện một đối tượng
hoặc thêm thông tin khác tới bản đồ
q Là cách thức mà các đối tượng đồ họa hiển thị trong GIS