CSDL không gian spatial database là sự tập CSDL không gian là một mô hình của thực tế với ý nghĩa là CSDL biểu diễn có lựa chọn các hiện tượng rất gần với thực tế Những hiện tượn
Trang 1Bài giảng
CƠ SỞ DỮ LIỆU GIS
Trang 2KHÁI NIỆM VỀ
CƠ SỞ DỮ LIỆU (CSDL)
Trang 3 CSDL là gì ?
Hệ Quản Trị CSDL là gì ?
Các mô hình CSDL ?
Trang 4 CSDL là gì ?
Là sự tập hợp một hay nhiều file dữ liệu hay dữ
liệu bảng được lưu trữ theo một kiểu cấu trúc
Có mối quan hệ bên trong giữa các thông tin hay
giữa các dữ liệu
Được quản trị bằng phần mềm (DBMS)
Sử dụng phục vụ dữ liệu cho những yêu cầu dữ
liệu khác nhau
Trang 5 Mục đích:
Là phương pháp lưu trữ dữ liệu của các chương
trình truy xuất dữ liệu
Điều khiển và chuẩn hóa quá trình nhập và cập
nhật dữ liệu
Bảo mật dữ liệu truy xuất
Cho phép đa người sử dụng trên những trường
hay bảng dữ liệu xác định
Trang 6 Nhân của hệ
điều khiển quá trình chất vấn
(Query), truy xuất dữ liệu, lưu trữ, quản lý đa người dùng
Liên kết
Giao tiếp ngôn ngữ chất vấn SQL
(structured query language)
Hiển thị dữ liệu
Hệ thống quản lý các dạng màn
hình
Điều khiển các menu
Các báo cáo và giao tiếp ngôn ngữ
lập trình
Trang 9 Là “ một hiện tượng trong thực tế mà không được phân chia nhỏ ra thành những hiện
tượng cùng loại”
Vd Thành phố là một thực thể và được chia nhỏ
ra thành các bộ phận hợp phần nhưng các phần này không được gọi là thành phố, chúng được gọi
là quận
Rừng cây phân chia thành các mảnh rừng nhỏ
hơn
Trang 10 Là “ sự trình bày dạng số của tất cả hoặc một phần của thực thể”
Các hiện tượng phụ thuộc vào tỷ lệ
Vd Một thành phố được trình bày như một điểm
(point) nếu như diện tích nghiên cứu ở qui mô lục địa
Thành phố đó có thể được trình bày như một
vùng (area) nếu như diện tích nghiên cứu một
quốc gia
Trang 11 Kiểu thực thể là nhóm hiện tượng tương tự được thể hiện và lưu trữ cùng kiểu
Vd đường giao thông, sông suối
Xác định kiểu thực thể nhằm:
Giúp cho việc chồng xếp các nhóm thông tin
Trợ giúp cho việc kiểm chứng nội dung của cơ sở
dữ liệu
Trang 12 Là đặc điểm của thực thể biểu diễn
Thường là phi không gian
Một số có thể liên quan tới đặc điểm không gian
Vd diện tích, chu vi
Trang 13 Lớp trình bày một kiểu thực thể hoặc một
nhóm kiểu thực thể quan hệ
Vd Lớp có các đoạn sông hoặc có sông, hồ, bờ
biển
Một số CSDL không gian kết hợp các thực thể vào một lớp
Trang 15 Thế giới thực quá phức tạp trong những nhận thức trực tiếp
Chúng ta tạo "model" thực tế với nỗ lực có
một số nét tương tự với thế giới thực
Những CSDL (databases) được tạo ra từ
những "models" như là những buớc cơ sở
tiến tới hiểu biết về bản chất và trạng thái thế giới thực
Trang 16 CSDL không gian (spatial database) là sự tập
CSDL không gian là một mô hình của thực tế với ý
nghĩa là CSDL biểu diễn có lựa chọn các hiện tượng rất gần với thực tế
Những hiện tượng chọn lựa biểu diễn trong dạng số
nhiều tiện ích để quản lý hợp phần không gian
và thuộc tính các dữ liệu địa lý
Trang 19 Dữ liệu được tổ chức theo lớp
Mỗi lớp biểu diễn những yếu tố có đặc điểm
Trang 24 Không có cấp bậc của trường dữ liệu, mỗi trường dữ liệu được dùng như là key
Thuộc tính quan hệ được lưu trữ trong những bảng khác nhau
Tìm kiếm thực hiện nối hai hoặc
nhiều bảng dùng thuộc tính giống nhau
Hệ thống linh động và thích hợp cho việc sử dụng SQL
Trang 25 Dữ liệu được tổ chức theo cấu trúc hình cây Cấp bậc cao nhất gọi là gốc
Mô hình có lớp trên, lớp dưới
Mọi quan hệ là quan hệ
nhiều – một hoặc quan hệ một – một
Truy tìm dữ liệu hiệu qủa nếu không có nhiều cấp
trung gian
Trang 26MÔ HÌNH VÀ CẤU TRÚC DỮ LIỆU KHÔNG GIAN
Trang 27 1 Mô hình dữ liệu (Spaghetti)
Đơn giản nhất
Về bản chất là mô hình vẽ bản đồ
Điểm, đường, vùng và ký tự được biểu diễn đơn
thuần là vị trí
Không có mô tả rõ ràng quan hệ không gian
Ranh giới chung giữa 2 polygon kề nhau được
ghi 2 lần
Không hữu hiệu trong phân tích không gian
Ưu điểm trong việc tái sản xuất bản đồ số mà
không cần lưu trữ quan hệ không gian
Trang 28 2 Mô hình topology
Cấu trúc topology còn được gọi là cấu trúc cung-nút (arc-node) với phần tử cơ bản là
Trang 29 Trong cấu trúc này:
với những cung độc lập, nút là điểm cuối cùng của cung, không nối liền với bất kỳ cung nào khác
thẳng nối liền nhau, điểm đầu và cuối gọi là nút (node), những điểm giữa cung gọi là đỉnh (vertex)
kín, những cung này chính là đường biên của vùng Một vùng có thể được giới hạn bởi hai đường cong khép kín lồng vào nhau và không cắt nhau
Trang 30Các đối tượng địa lý trong cấu trúc topology được
Trang 31 Các bảng Topology:
được xem như một vùng không xác định cung đường biên
những cung nào
nút và vùng với cung
liên hệ với thế giới thực
Trang 32 Các bảng Topology:
được xem như một vùng không xác định cung đường biên
những cung nào
nút và vùng với cung
liên hệ với thế giới thực
Trang 330 10 20 30 40 50 60 70 0
a3
N2 N1
N3
N4
N6
Trang 34N1
N2 N3 N4 N3 N5 N6
N2
N3 N1 N1 N2 N5 N6
Dữ liệu toạ độ cung
Cung Nút đầu
(x,y) Đỉnh (vertex) (x,y) Nút cuối (x,y)
a1 a2 a3 a4 a5 a6 a7
40,60 70,50 10,25 40,60 10,25 30,20 55,27
70,60 70,10;10,10 10,60 30,50 20,27;30,30;50,32 55,15;40,15;45,27
70,50 10,25 40,60 30,40 70,50 30,20 55,27
Trang 35Bài tập 1 Xây dựng
dữ liệu cung (dữ liệu tọa độ cung) và các bảng cung – nút – vùng cho mô hình
dữ liệu không gian sau:
Trang 36Bài tập2 Cho bảng dữ liệu tọa độ cung sau:
Cung (Arc)
Điểm đầu (From node)
Đỉnh (Verties)
Điểm cuối (To node)
a Hãy xây dựng mô hình dữ liệu không gian của bảng dữ liệu tọa độ trên
b Hãy xây dựng các bảng Topology vùng, Topology nút, Topolygy cung
Trang 372 Thể hiện chiều mũi tên từ điểm đầu đến điểm cuối trên các cung của
mô hình cơ sở dữ liệu không gian (hình vẽ)
Trang 38 Ưu điểm
Các bảng Topology cung, nút, vùng cho phép phân tích các quan hệ giữa các phần
tử trên bản đồ mà khộng cần đến dữ liệu tọa độ Do đó, cấu trúc topology rất thích hợp với những toán tử phân tích không gian, nhất là những bài toán kề (contiguity) và kết nối (connectivity)
Nhược điểm
Phần lớn dữ liệu nhập vào GIS không tồn tại ở dạng cấu trúc dữ liệu topology, việc xây dựng topology bởi phần mềm GIS có thể tốn thời gian và sử dụng nhiều nguồn lực máy tính
Mỗi khi có sự biên tập tác động đến dữ liệu hình học, topology phải xây dựng lại
Trang 39Các mối quan hệ Topology giữa các đối tượng không gian
Trang 40Các mối quan hệ Topology giữa các đối tượng không gian
Quan hệ điểm-điểm
- “Trong giới hạn (is within)”: Nằm trong giới hạn một khoảng cách cụ thể
- “Gần nhất với (is nearest to)”: Gần nhất so với một điểm cụ thể
Quan hệ điểm-đường
- “ Nằm trên đường (on line)”: điểm nằm trên một đường
- “ Gần nhất với (is nearest to)”: Điểm gần nhất so với một đường
Quan hệ điểm-vùng
- “Chứa bên trong vùng (is contained in)”: Điểm chứa bên trong vùng
- “Nằm trên biên (on border of area)”: Một điểm nằm trên đường biên của vùng
Trang 41Các mối quan hệ Topology giữa các đối tượng không gian
Quan hệ đường-đường
- “Giao nhau (intersects)”: Hai đường giao nhau
- “Băng qua (crosses)”: Hai đường băng qua mà không giao nhau
- “Chảy vào (flow into)”: Một nhánh sông chảy vào một dòng sông
Quan hệ đường-vùng
- “Giao nhau (intersects)”: Một đường giao (cắt) với một vùng
- “Đường biên (borders)”: Đường là một phần biên của vùng
Quan hệ vùng-vùng
- “Chồng lớp (overlaps)”: Hai vùng chồng lên nhau
- “Nằm bên trong (is within)”: Một vùng nằm bên trong một vùng khác
- “Kế cận (is adjacent to)”: Hai vùng cùng có một đường biên chung
Trang 43Dữ liệu raster được tạo thành bằng cách chồng lưới các ơ lên trên các đối tượng địa lý
Bản đồ gốc
Lưới chồng lớp (grid overlay)
Giá trị ơ chính là giá trị đo hoặc ghi
nhận được của đối tượng nằm đầy
trong ơ Trong trường hợp đối tượng
khơng nằm đầy ơ, giá trị ơ được gán
theo các nguyên tắc:
- Đối tượng chiếm đa số về diện tích
- Đối tượng tại tâm ơ
- Đối tượng chạm ơ – đối với đối
tượng đường
- hoặc chọn theo trọng số để đảm bảo
các đối tượng cĩ đặc tính quý hiếm
được biểu diễn
Trang 44Giá trị của ô có thể là chữ hoặc là số tùy theo đối tượng được biểu diễn
Giá trị trong “ô lưới” tương ứng với đặc tính của hiện tượng trong không gian tại vị trí ô Sự thay đổi của giá trị phản ánh sự thay đổi của hiện tượng
Một ô đơn được gán chỉ 1 giá trị, do vậy để có thể biểu diễn nhiều đặc tính của cùng 1 đối tượng, 1 hệ thống các lớp dữ liệu raster được sủ dụng Mỗi lớp raster thể hiện 1 loại đặc tính
Lưới ô thường có gốc tọa độ bắt đầu tại vị trí trên trái Vị trí hình
học của các ô được xác định bởi số hàng và số cột
Trang 45Dữ liệu raster có thể đến từ ảnh viễn thám, ảnh chụp máy bay, hoặc raster hóa từ nguồn dữ liệu vector
Trang 46Các đối tượng điểm, đường vùng trong mô hình Raster được biểu diễn như sau:
Đối tượng điểm được biểu diễn bằng các điểm ảnh đơn
Đối tượng đường được biểu diễn bằng một chuỗi các điểm ảnh liên tục và
có độ rộng không đều, có đường biên zic-zac tùy kích thước của điểm ảnh
Đối tượng vùng được biểu diễn bằng 1 mảng các điểm ảnh liên tục
Trang 47 Độ phân giải không gian của mô hình Raster là kích thước của một pixel trên mặt đất Một ô 10m thể hiện bề mặt diện tích
Như vậy ô 10m có độ phân giải không gian tốt hơn ô 30m
đối tượng không gian do có nhiều đối tượng không gian cùng tồn tại trong 1 ô
Kích thước ô nhỏ có thể biểu diễn chính xác vị trí của các đối tượng không gian sẽ làm tăng dung lượng lưu trữ và thời gian
xử lý dữ liệu
Trang 48 Dung lượng lưu trữ của mô hình raster theo độ phân giải
một raster có 1000 hàng và 1000 cột tương ứng với 1 triệu pixel, nếu dùng 1byte để biểu diễn 1 pixel thì dung lượng cần thiết là 0,96MB
MB
Mô hình Raster thường được biểu diễn với các cấu trúc có sử dụng các phương pháp nén dữ liệu để giảm bớt dung lương lưu trữ
Trang 49 Trong cấu trúc raster, đường được biểu diễn bằng những pixel có
xếp theo hàng, cột như một ma trận điểm nên đường ở đây không trơn
mà có dạng zic-zac
mảng gồm nhiều điểm ảnh có cùng
Trang 50Đối tượng điểm (point objects)
Mỗi đối tượng điểm là một điểm ảnh được gán ID điểm, toạ
độ (i, j) và các thuộc tính
Số pixel i
Số hàng j
(i,j) = (5,3);(7,5);(8,2)
Trang 51Đối tượng đường (line objects)
Mỗi đối tượng đường được gán ID đường, chuỗi tọa độ định dạng đường và các thuộc tính
( 1,3);(2,2);(3,2) ;(4,3);
(5,4) ;(6,5) ;(7,5) ;(8,4)
Trang 52Đối tượng vùng (polygon objects)
vùng và thuộc tính
Trang 53 Mã hóa từng ô
Là phương pháp mã hóa đơn giản nhất Một lưới Raster được lưu trữ như 1 ma trận và giá trị ô được ghi vào một tập tin theo hàng và theo cột
Phương pháp này áp dụng rất tốt trong trường hợp giá trị ô biến thiên liên tục
Mô hình độ cao số DEM sử dụng phương pháp này để lưu trữ bởi vì giá trị độ cao của các ô lân cận ít khi nào giống nhau ảnh vệ tinh cũng
sử dụng phương pháp này để lưu trữ
Trang 54 Mã hóa đoạn chạy – Run length
biểu diễn chúng từng loạt pixel có giá trị giống nhau theo từng hàng từ trái qua phải, từ trên xuống dưới
cặp số (chiều dài chuỗi, giá trị của pixel)
của pixel) ít thay đổi Ngược lại, nếu giá trị thuộc tính thay đổi nhiều, đôi khi việc dùng mã này còn làm tăng dung lượng dữ liệu
Trang 55Biểu diễn mã run-length của lớp dữ liệu ảnh raster hình bên: (10,A) (10,A) (4,A) (6,B) (3,A) (7,B) (4,D) (6,B) (5,D) (5,B) (5,D) (5,C) (5,D) (5,C) (5,D) (5,C) (5,D) (5,C)
B
B B
A A
A A
2
A A
A A
1
A
6
A A
B A A 5
A
5
4
A A
A A
8 7
0
B B
A A
D D
D
D D
D D
D
D D
D D
D
D D
D D
D D
D
CD CD
CD CD
CD CD
CD CD
CD CD
CD
CD CD
CD CD
CD CD
Trang 56- Mã run-length tuy có thuật toán nén và giải mã đơn giản nhưng tỉ số nén không cao,
không lưu ý tới tính lân cận
biên theo những đường đọc dữ liệu khác nhau
Trang 57Mã hóa run length cải biên
(24,A) (13,B) (3,A) (13,B) (4,D) (11,B) (10,D) (10,C) (10,D) (10,C) (5,D)
B
B B
A A
A A
2
A A
A A
1
A
6
A A
B A A 5
A
5
4
A A
A A
8 7
0
B B
A A
D D
D
D D
D D
D
D D
D D
D
D D
D D
D D
D
CD CD
CD CD
CD CD
CD CD
CD CD
CD
CD CD
CD CD
CD CD
CD
D
Trang 58Mã hóa phần tư – cây tứ phân
của nhiều pixel trong những vùng có cùng thuộc tính
4 phần, v.v
vùng có cùng thuộc tính
Trang 59Mã hóa phần tư – cây tứ phân
Trang 60Mã hóa phần tư – cây tứ phân
Trang 61Mã hóa phần tư – cây tứ phân
Các thành phần của cây tứ phân
- Gốc: từ đó các nhánh khác được mở rộng
- Lá là điểm mà từ đó quá trình phân nhánh không xảy ra
- Tất cả các điểm còn lại trong cây gọi là nút
Nhiều hệ thống đánh mã đã được phát triển để chỉ định mã nhận dạng đến các nút, trong đó có hệ thống đánh mã Morton Mã chỉ định cho mỗi nút là sự kết hợp của nút ở cấp độ cao hơn và mã ở cấp độ hiện hành VD nút 212 là sự kết hợp của mã 21 ở cấp độ trên và mã 2 ở cấp
độ hiện hành Hệ thống đánh mã này có ưu điểm là lân cận của mỗi nút
có thể được tìm ra từ hệ thống đánh mã VD lân cận của nút 212 là các nút 21x(0, 1, 3) và các nút 2x(20, 21, 22, 23)
Trang 62Mã hóa phần tư – cây tứ phân
Ưu điểm: cho phép tổng quát hóa dữ liệu đến mức độ chi tiết tùy chọn
Hạn chế: tốn nhiều thời gian cho việc tạo ra và hiệu chỉnh Khi bản đồ trở nên phức tạp và dữ liệu phải cập nhật thường xuyên thì tính hiệu quả trong lưu trữ sẽ mất đi
Trang 63Bài tập 1 Cho mô hình dữ liệu không gian sau:
Ghi chú: CS – cao su, Đ – điều, T – tiêu, AT – ăn trái
Hãy mã hóa lớp dữ liệu không gian trên theo:
a phương pháp mã hóa đoạn chạy
b phương pháp mã hóa đoạn chạy cải tiến
c phương pháp mã hóa phần tư
Trang 64Bài tập 2 Cho mô hình dữ liệu không gian sau:
Hãy mã hóa lớp dữ liệu không gian trên theo:
a phương pháp mã hóa đoạn chạy
b phương pháp mã hóa đoạn chạy cải tiến
c phương pháp mã hóa phần tư
Trang 67 Chỉ những hiện tượng quan trọng thu thập biểu diễn trong CSDL
bằng chiều rộng và dài
liệu thích hợp biểu diễn chúng là một phần của quá trình thiết kế CSDL
Vd: trên bản đồ 1:100.000 những ngôi nhà không
phân biệt
mô tả trong tính toàn vẹn chính xác
liệu chấp nhận
Trang 68Mục tiêu:
Nhận biết, nhận diện nội dung CSDL và mô tả nó
trong dạng tóm tắt, hay khái niệm
Xác định mục tiêu CSDL
Cần làm gì ?
Làm sao sẽ thực hiện được ?
Trên cơ sở đó, xác định tất cả các dạng nhu cầu về
dữ liệu nhằm thực hiện mục tiêu nói trên
Trang 69 Đặc điểm
Những mô tả & định nghĩa các thực thể
Xác định thực thể biểu diễn trong CSDL
▪ Vd chọn các đối tượng không gian - points, lines, areas, raster cells
Những yêu cầu qui mô biểu diễn & những mối quan
hệ sẽ biểu diễn
▪ Dựa trên cơ sở quá trình xử lý trên các đối tượng
▪ Vd Cần biểu diễn tòa nhà như diện tích hay point?
▪ Vd nên chia nhỏ đường giao thông như thế nào để liên kết trong CSDL?
Trang 70 Mục tiêu
CSDL được mô tả chi tiết, bao gồm các hạng mục
tin, các mối quan hệ dữ liệu , độ chính xác, các thủ tục đảm bảo sự toàn vẹn dữ liệu
Phần mềm cần xác định nhưng phần cứng không
lệ thuộc
Thiết đặt cấu trúc logic các yếu tố CSDL, Xác định
bởi hệ quản trị dữ liệu-DBMS sử dụng bởi phần mềm
Trang 71 Đặc điểm
Cả phần cứng & mềm đều yêu cầu
Yêu cầu tổ chức file trên máy tính
Triển khai kết quả của mức logic trên các phần
cứng, phần mềm cụ thể