Mục tiêu Giới thiệu các mô hình dữ liệu trong GIS Sau bài học này sinh viên có thể: Mô tả mô hình dữ liệu Vector và cho ví dụ Mô tả mô hình dữ liệu Raster và cho ví dụ Mô tả mô hình dữ liệu TIN Giải thích “topology” Mô tả các định dạng chính sử dụng trong GIS
Trang 1HỆ THỐNG THÔNG TIN ĐỊA LÝ (GIS)
(Ch3 – Cấu trúc dữ liệu GIS)
Phan Trọng Tiến
Department of Software Engineering
Hanoi University of Agriculture
Office location: 3rd floor, Administrative building
Office phone: (04)38276346, Ext: 132
Website: http://fita.hua.edu.vn/pttien
Email:ptgtien@hua.edu.vn or phantien84@gmail.com
Trang 2Giới thiệu các mô hình dữ liệu trong GISSau bài học này sinh viên có thể:
Mô tả mô hình dữ liệu Vector và cho ví dụ
Mô tả mô hình dữ liệu Raster và cho ví dụ
Mô tả mô hình dữ liệu TIN
Giải thích “topology”
Mô tả các định dạng chính sử dụng trong GIS
Mục tiêu
Trang 3Các đối tượng đồ họa
Các đối tượng hiển thị trên bản đồ được gọi là các đối tượng đồ họa hay các đối
tượng.
Các đối tượng có thể là tự nhiên hoặc do con người tạo ra nó.
Trang 4Các đối tượng đồ họa
Trang 5Các loại dữ liệu GIS
Trang 6Các loại dữ liệu GIS
© Paul Bolstad, GIS Fundamentals
Trang 7Dữ liệu không gian
Trang 8Các bản đồ điện tử ở hai định dạng
Raster và Vector
Trang 9Các nguồn dữ liệu Raster
Ảnh vệ tinh
Ảnh máy bay
Các bản đồ quét
Trang 10các hiệu quả mong muốn
đó là các đối tượng luôn
hiển thị vuông góc với
Trang 11 Thiết lập bởi màu sắc của các pixel
Cách đơn giản một mảng các pixel
được xếp theo các hàng và các cột
Các Pixel là được tô màu, nhưng
không miêu tả các đối tượng một cách
rõ ràng
Rasters có thể có giá trị đi kèm.
Source: Defense Mapping School National Imagery and Mapping Agency
Các bản đồ dạng Raster (images)
Trang 12Đặc điểm của Raster
Trông giống trang bản đồ giấy
Không cho phép tự động loại bỏ
chế độ nền hay sự trợ giúp phân tích của máy tính.
Lưu trữ không hiệu quả
Source: Defense Mapping School National Imagery and Mapping Agency
Trang 13Dữ liệu dạng Vector
Source: Defense Mapping School National Imagery and Mapping Agency
Một cách lưu trữ thông minh dữ liệu
GIS, ở đó các đối tượng thế giới thực
được miêu tả bằng các điểm (Point),
đường (Line) và vùng (Polyline) Một
đối tượng được miêu tả bởi các thuộc
tính và các tọa độ.
Ví dụ:
Các bản đồ số hóa
Dữ liệu GIS
Trang 14 Trong GIS chứa thông
tin GIS kết hợp bản đồ
với hệ quản trị cơ sở dữ
liệu Vì vậy khi phân
tích dữ liệu không gian
chỉ cần “click” trên đối
Thông tin về một đối
tượng GIS được gọi là
thuộc tính (attribute)
Liên kết các thuộc tính và đồ họa
Trang 15Liên kết các thuộc tính với đồ họa
Trang 16Dữ liệu Vector được phân lớp
Spatial Data Analysis
Connected Detached Area
Trang 17Sự thay đổi về mô hình
Trang 18Các mô hình dữ liệu Raster và Vector
Miêu tả Vector
X-AXIS
500 400 300 200 100
600 500
400 300 200
B G G
BK
B B B
G G
G G G
Source: Defense Mapping School National Imagery and Mapping Agency
Trang 19Dữ liệu GIS được lưu trữ trong các lớp riêng biệt như Point, Line, Polygon
Mô hình dữ liệu Vector
Trang 20© Paul Bolstad, GIS Fundamentals
Trang 21Cấu trúc dữ liệu Vector
Có mối quan hệ giữa các kiểu dữ liệu vector Mỗi
kiểu thường độc lập trên một kiểu khác nhau Khi
miêu tả dữ liệu GIS theo định dạng vector, dữ liệu
phải được lưu trữ:
Points: là các đối tượng vô hướng có vị trí không
gian, miêu tả các đối tượng GIS như vị trí, hoặc cây
…
Lines: miêu tả đối tượng một chiều, có vị trí, có
chiều dài như đường, sông Lines được tạo bởi việc
kết nối các điểm với nhau Một đường bắt đầu và
kết thúc tại một điểm gọi là nút (node), và các điểm
tạo nên đường gọi là đỉnh (Vertices).
Polygons/Area: miêu tả đối tượng hai chiều, có vị
trí, có chiều dài, và có cả chiều rộng như đường
danh giới của cánh đồng, đất đai, hoặc hồ … Nó
được tạo bởi việc kết nối các đường, điểm bắt đầu
của polygon cũng là điểm kết thúc
Point
Line
Polygon
Trang 22 Point là đối tượng vô hướng có vị trí và thuộc tính thông tin
nhưng quá nhỏ để được biểu diễn bằng vùng.
Tỷ lệ bản đồ quyết định một đối tượng là điểm hay không.
Trang 24Các cột đèn
Trang 25Các trung tâm
Trang 26sông Lines được tạo bởi
việc kết nối các điểm với
nhau Một đường bắt đầu
và kết thúc tại một điểm
gọi là nút (node), và các
điểm tạo nên đường gọi
là đỉnh (Vertices).
Trang 28Đường phố
Trang 30Ứng dụng Polygons
Các mảnh đất
Parcel ID Number
Dimensions and Area
Đường danh giới
Permeability
Vùng lũ lụt
Trang 31Polygons
Trang 32Polygons
Trang 33Mô hình dữ liệu Vector
Điểm: Được thể hiện bằng một cặp toạ độ
Đường: Được thể hiện bằng một chuỗi các cặp toạ độ
Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ
độ đầu và cặp toạ độ cuối trùng nhau.
Trang 34Cấu trúc dữ liệu Vector
Điểm: Được thể hiện bằng một cặp toạ độ
Đường: Được thể hiện bằng một chuỗi các cặp toạ độ
Vùng: Được thể hiện bằng một chuỗi các cặp toạ độ và cặp toạ độ đầu
và cặp toạ độ cuối trùng nhau
Trang 35độ, có cặp tọa đầu và cặp tọa cuối trùng nhau.
Trang 37Mô hình dữ liệu Vector Spaghetti
• Là mô hình dữ liệu đơn giản, các đối
tượng chỉ được lưu trữ bằng các cặp
toạ độ.
• Thông tin về quan hệ không gian.
• Thông tin thuộc tính.
Trang 38 Không mô tả được mối quan hệ không gian giữa các đối tượng,
vì thế các phép phân tích, tính toán không gian đều thực hiện khó khăn.
Dữ liệu dạng vùng, đường ranh giới giữa 2 vùng được ghi nhận
2 lần, mỗi lần cho một vùng.
Ưu điểm của mô hình là đơn giản, dễ trình bày, biên tập, in
ấn vì vậy vẫn được sử dụng rộng rãi để thành lập bản đồ.
Phần mềm điển hình là Mapinfo.
Mô hình dữ liệu Vector Spaghetti
Trang 39Mô hình dữ liệu Vector Topology
không chỉ bởi toạ độ mà còn bằng cả mối quan hệ không gian giữa các đối tượng
bao gồm:
Thông tin về vị trí không gian (Spatial data):
Thông tin được thể hiện theo mô hình vector, bằng các tọa độ mô tả vị trí, hình dạng, đường biên của các đối tượng.
Thông tin về quan hệ không gian (Relational
Spatial data – Topology) Mô hình dữ liệu Topology thể hiện QHKG dưới 3 kiểu quan hệ là:
Liên thông với nhau: thể hiện dưới dạng file đường - điểm nối (Arc-Node topology)
Kề nhau: thể hiện dưới dạng file mô tả đường bao (Polygon-Arc topology)
Nằm trong nhau, phủ nhau
Trang 40- Thông tin về vị trí trong không gian
+ Dữ liệu không gian các đối tượng
Trang 41-Thông tin về quan hệ không gian
+ Dữ liệu không gian các đối tượng vùng là một tập các đối tượng đường định nghĩa đường bao vùng và một điểm nhãn.+ Mô hình Topology dùng các quan hệ không gian để định nghĩa các đặc tính không gian của các đối tượng
Các quan hệ không gian Các đặc tính không gian
Mỗi một đường (arc) có điểm bắt đầu và
kết thúc tại điểm nút (node) Độ dài của đường Hướng đường
(Directionality)
Các đường (arc) nối với nhau tại các điểm
Các đường (arc) nối với nhau tạo thành
đường bao của vùng (polygon) Tính tạo vùng(Diện tích vùng, chu vi vùng)Các đường tham gia định nghĩa vùng ở cả
hai bên : phải và trái
Tính kề nhau(Adjacency or contiguity)
Mô hình dữ liệu Vector Topology
Trang 44- Các đường ranh giới thửa không được phép giao nhau, phải luôn cắt nhau tại đầu hoặc cuối đường ( tại điểm nút NODE).
Sai Đ ún
g
Sai Sai Đ úng
Áp dụng mô hình topology khi xây dựng CSDL không gian
- Đường ranh giới tạo thành đường bao thửa đất luôn đảm bảo tính khép kín tuyệt đối về toạ độ.
Mô hình dữ liệu Vector Topology
Trang 45DỮ LIỆU KHÔNG GIAN CHUẨN
Cơ sở dữ liệu chuẩn là dữ liệu không còn lỗi như: bắt quá, bắt chưa tới, vùng chưa khép….
Trang 46Liên kết dữ liệu thuộc tính
B ng d li u ả ữ ệ
B ng d li u ả ữ ệ (Attributes)
© ESRI
Trang 47Là thông tin cho phép miêu tả một thực thể đã được trình bày ở đối tượng đồ họa.
Dữ liệu thuộc tính
Trang 48Thông tin về đối tượng đồ họa
Dữ liệu thuộc tính
Mỗi phần thông tin thuộc tính liên quan tới
một phần đối tượng đồ họa
Các trường thuộc kiểu dữ liệu truyền thống của
CSDL
Images
Photos
Video
Trang 49Courtesy Village of Garden City
Liên kết các thuộc tính
Trang 50 Dữ liệu GIS được lưu trữ dưới dạng lưới các ô (cells) hay pixel
Ảnh viễn thám, ảnh quét (scanner) luôn ở dạng Raster
Mô hình dữ liệu Raster
Trang 51 Khung cảnh các tai họa
Sự thiệt hại mùa vụ
Các hình ảnh về sự vận động
Ảnh trực giao
Các ảnh trên không đã được chỉnh sửa
Trang 53Bảng dữ liệu thuộc tính
Rasters có giá trị số nguyên các ô định (số lượng các
ô cùng giá trị) được ghi trong bảng dữ liệu thuộc
tính Mỗi bản ghi thuộc tính là duy nhất với mỗi giá trị của ô.
Bạn có thể thêm các trường tới bảng dữ liệu
Trang 54Các kiểu dữ liệu miêu tả trong ô
Dữ liệu được lưu trữ trong raster có thể được phân
loại một trong các loại sau:
Dữ liệu tên (Nominal data): dữ liệu được
phân loại theo tên.
Dữ liệu số thứ tự (Ordinal data): dữ liệu được
phân loại theo tên và khoảng giá trị.
Khoảng dữ liệu (Interval data): sắp xếp theo
thứ tự số và có các khoảng khác nhau có ý nghĩa.
Dữ liệu tỷ lệ (Ratio data)
Trang 55Các kiểu dữ liệu miêu tả trong ô
Trang 56 Kiểu Nominal và
Ordinal dùng miêu tả theo các phân loại khác nhau, là cách tốt nhất miêu tả các ô dữ liệu kiểu integer.
Kiểu Interval và Ratio
mô tả các giá trị liên
tiếp, dùng với các ô dữ liệu là kiểu real.
Trang 57PIXEL là đơn vị nhỏ nhất trong ảnh Cơ sở hệ thống GIS là raster, thông tin thuộc tính có thể được khởi gán tới mỗi pixel
PIXEL (
PIXEL (PICTURE ELEMENT PICTURE ELEMENT )
Trang 58© ESRI, Modeling Our World
Trang 59Cách biểu diễn Raster
Raster có thể có một hoặc nhiều nhãn Giá trị của mỗi ô có thể
mang các giá trị khác nhau Có một vài cách để hiển thị raster với giá trị của ô.
Hiển thị nhãn đơn (single-band)
Hiển thị nhãn bội (multi-band)
Trang 60Hiển thị nhãn đơn
Trang 61Hiển thị nhãn bội
Trang 62Cấu trúc dữ liệu Raster
Ma trận các ô bằng nhau
Trang 63Vấn đề về độ phân giải
WHEAT
HAY
APPLES WHEAT
HAY
APPLES
Trang 64Raster và Vector
Phải được cân nhắc kỹ
Tính rời rạc của thực thể đang mô tả
Ứng dụng mong đợi (Các chức năng)
Nguồn dữ liệu
Quan tâm sự lưu trữ
Trang 65Một câu hỏi đặt ra:” Định dạng nào là tốt
nhất mô tả các đối tượng trong GIS,
raster hay vector” Câu trả lời là một
trong hai hoặc cả hai Đó là, dùng một
trong hai mô hình dữ liệu là tốt nhất
trong mỗi trường hợp hoặc cả hai mô
hình đều thực hiện các vai trò nhất định
trong GIS.
Trong ví dụ, nguồn dữ liệu vector miêu
tả đường bờ biển xuất hiện có nhiều chi
tiết hơn, và độ chính xác lớn hơn Dữ
liệu Vector có thể lưu trữ thông tin trong
nhiều định dang hơn dữ liệu Raster, và
cũng làm việc tốt với đối tượng thuộc về
chiều dài như luồng các mạng.
Tuy nhiên, các mô hình dữ liệu Raster
rất tốt miêu tả thông tin liên tục trong
tự nhiên như nhiệt độ nơi mà giá trị
nhiệt độ có thể khác với nơi liền kề.
Trang 66Vector – Những ưu điểm và nhược điểm
Thuận lợi
Miêu tả tốt thực tế
Gắn kết nhiều cấu trúc dữ liệu
Topology có thể được mô tả trong mạng
Đồ họa chính xác
Nhược điểm
Cấu trúc dữ liệu phức tạp
Mô phỏng khó khăn
Một vài phân tích không gian là khó khăn
hoặc không thể thi hành.
Trang 67Raster – Ưu điểm và nhược điểm
mộng
Trang 68Các chức năng Raster
© Paul Bolstad, GIS Fundamentals
Trang 69 Phương pháp nén theo khối (Block code)
Phương pháp nén cây tứ phân (Quadtree
code)
Trang 70Phương pháp nén theo đường biên vùng (Chain Code)
Các đường biên của các vùng được thể hiện bằng hàng liên
tục các vectơ đơn vị theo hướng 4 phương, được qui ước
bằng các số: hướng Đông = 0, Bắc = 1 Tây = 2 Nam = 3.
Ví dụ trên nếu ta bắt đầu từ cell của hàng 0 theo chiều kim
đồng hồ ta sẽ có dãy giá trị sau thể hiện biên của vùng theo
mã 1:
02,3,0,1 ,03,32,2,34,02,32,23,1,22,1,22,12,02,32,22,12
2 3
Trang 71Phương pháp nén theo đường biên vùng (Chain Code)
Ưu điểm:
Là phương pháp nén dữ liệu raster hiệu quả.
Dễ dàng tiến hành tính chu vi và diện tích,
nhận biết lồi lõm, thay đổi hướng đột ngột.
Nhược điểm:
Khó khăn trong phân tích chồng xếp.
Dư thừa dữ liệu vì đường biên lưu trữ hai lần.
Trang 72Phương pháp nén theo hàng cột (Run-length code)
Các điểm trên mỗi đơn
vị bản đồ được lưu trữ
theo hàng từ trái qua
phải từ cell đầu đến cell
Trang 73Phương pháp nén theo hàng cột (Run-length code)
Trang 74Phương pháp nén theo khối (Block code)
dưới dạng nén block
7 block 1 đơn vị ô vuông
7 block 4 đơn vị ô
vuông
• Phương pháp này có hiệu quả với các vùng có diện tích lớn và hình dạng các đường biên đơn giản, có thể kiểm tra sự co giãn về hình dạng của vùng.
Trang 75Phương pháp nén cây tứ phân (Quadtree code)
Trang 76Phương pháp nén cây tứ phân
- Khó khăn cho việc chọn các mô hình, giải pháp
- Một vùng có thể chia thành rất nhiều phần gây khó khăn cho việc truy nhập DL
Trang 77TIN(Triangulated Irregular Network)
TIN là một mô hình dữ
liệu được sử dụng để
miêu tả các đối tượng
ba chiều Các điểm miêu
tả bởi các giá trị x,y,z
Dùng các phương thức
tính toán hình học, các
điểm được kết nối vào
nhau gọi là phép đạc
tam giác Các đường của
các tam giác gọi là các
cùng và miền phía trong
gọi là bề mặt (facet)
Trang 78TIN(Triangulated Irregular
Network)
Mô hình TIN có một vài điểm phức tạp hơn dạng
Point, Line, Polygon trong mô hình Vector, hay mô hình Raster, nó thực sự hữu ích miêu tả độ cao
Ví dụ thể hiện lợi ích của TIN:
Lưới Raster có thể thể hiện toàn bộ bề mặt
của miền địa lý
Nếu chúng ta muốn hiển thị chi tiết thì ta
phải chia lưới này thành các ô nhỏ hơn -> nhưng với một bề mặt tương đối bằng
phẳng -> tốn bộ nhớ
Với TIN chúng ta không phải dùng nhiều
điểm trên miền bằng phẳng, nhưng cũng có thể thêm nhiều điểm ở vùng dốc nơi chúng
ta muốn hiển thị nhiều chi tiết hơn.
Trang 79Cấu trúc dữ liệu TIN
Cấu trúc dữ liệu TIN dựa trên
hai phân tử cơ bản:
Phép đạc tam giác TIN thỏa mãn
theo tiêu chuẩn Delaunay
Tiêu chuẩn Delaunay
Vòng tròn ngoại tiếp không chứa một nút của bất kỳ
phần tử nào khác Vòng tròn ngoại tiếp của một tam
giác là vòng tròn đi qua các đỉnh.
Trang 81Các thành phần TIN
Nodes: là cơ sở xây dựng các khối của TIN Các nút bắt đầu từ các điểm và các
đỉnh cung chứa từ các nguồn dữ liệu nhâp vào.
Edges: Mỗi nút được nối với nút gần nhất theo tiêu chuẩn Delaunay Mỗi cung có
hai nút nhưng môt nút có thể có hai hoặc nhiều cung.
Triangles: Mỗi bề mặt tam giác miêu tả một phần của bề mặt TIN
Hull (bao): được hình thành bới một hoặc nhiều polygon bao gồm toàn bộ tập dữ
liệu các điểm sử dụng xây dựng nên TIN Các Polygon Hull định nghĩa vùng nội suy của TIN
Topology: là cấu trúc hình học của TIN định nghĩa mối quan hệ giữa các nút, các
cung và mối quan hệ giữa các tam giác liền kề
các file Tuy nhiên, TIN không bao chứa và không kết hợp với file thông tin (INFO) Thư mục TIN chứa 7 file bao gồm thông tin về bề mặt TIN Các file này được mã hóa theo dạng nhị
phân và không đọc được ở chế độ hiển thị văn bản.
Trang 82© ESRI, Modeling Our World
Trang 86© ESRI, Modeling Our World
Trang 87Chú giải (Annotation)
Là văn bản (text) hoặc nhãn (labels) vẽ trên bản đồ mà miêu tả hoặc
nhận diện một đối tượng hoặc thêm thông tin khác tới bản đồ
Trang 88Chú giải (Annotation)
Thông tin được đặt trên bản đồ cung
cấp thêm thông tin về một đối tương
đồ họa.
Ký hiệu (Symbols)
Là cách thức mà các đối tượng đồ họa
hiển thị trong GIS
Trang 89Các ký hiệu giúp nhận diện các
đặc điểm và cung cấp thông tin về chúng.
q c , P X
Ký hiệu (Symbols)
Trang 90Courtesy Village of Garden City
Annotation, Symbology, and Text
Trang 91Vấn đề về tỷ lệ trong đối tượng mô tả
Phụ thuộc vào tỷ lệ mô tả, một đối tượng có thể nhận
nhiều mẫu khác nhau
Buildings
City
location
Trang 92Tập hợp dữ liệu số miêu tả rõ ràng các đối tượng liền kề, chứa trong nhau và tính liên tục giữa các đối tượng bản đồ mà có thể
lưu trữ và thao tác trên máy tính.
Topology
Trang 93© Paul Bolstad, GIS Fundamentals