1.Trình bày khái niệm và các thành phần của hệ thống thông tin địa lý Khái niệm: GIS (Geographical Information System) là một hệ thống nhằm thu thập, lưu trữ, truy vấn, tích hợp, thao tác, phân tích và hiển thị dữ liệu không gian. GIS là một trong những công cụ hữu hiệu nhất để hiển thị và phân tích dữ liệu địa lý hay còn gọi là dữ liệu không gian Các thành phần cơ bản của GIS Phần cứng: là hệ thống máy tính và các thiết bị ngoại vi cho cài đặt và vận hành phần mềm GIS. + Máy tính + Máy in + Bàn số hóa + Đĩa CD và ổ USB Phần mềm: cung cấp các chức năng và các công cụ cần thiết để lưu trữ, phân tích và hiển thị thông tin địa lý. + ArgGis + Idrisi + Mapinfo + MicroStation Dữ liệu: là thành phần quan trọng nhất. Dữ liệu được sử dụng trong GIS không chỉ là số liệu địa lý riêng rẽ mà còn được thiết kế trong 1 cơ sở dữ liệu +Bản đồ +Bảng thuộc tính Chuyên gia: GIS đòi hỏi những chuyên viên thông thạo, có kiến thức.. để vận hành GIS thực hiện các chức năng phân tích và xử lý các số liệu Phương pháp: bao gồm toàn bộ các thủ tục và thuật toán liên quan đến nhập, biên tập, chuyển đổi dữ liệu, truy vấn và phân tích dữ liệu + Phân lớp + Chồng xếp + Phân tích lân cận + Phân tích mạng
Trang 1NỘI DUNG ÔN TẬP MÔN HỆ THỐNG THÔNG TIN ĐỊA
LÝ 1.Trình bày khái niệm và các thành phần của hệ thống thông tin địa lý
*Khái niệm: GIS (Geographical Information System) là một hệ
thống nhằm thu thập, lưu trữ, truy vấn, tích hợp, thao tác, phân tích
và hiển thị dữ liệu không gian GIS là một trong những công cụ hữu hiệu nhất để hiển thị và phân tích dữ liệu địa lý hay còn gọi là
dữ liệu không gian
*Các thành phần cơ bản của GIS
- Phần cứng: là hệ thống máy tính và các thiết bị ngoại vi cho cài đặt và vận hành phần mềm GIS
+ Máy tính
+ Máy in
Trang 2+ Đĩa CD và ổ USB
- Phần mềm: cung cấp các chức năng và các công cụ cần thiết để lưu trữ, phân tích và hiển thị thông tin địa lý
+ ArgGis
+ Idrisi
+ Mapinfo
+ MicroStation
- Dữ liệu: là thành phần quan trọng nhất Dữ liệu được sử dụng trong GIS không chỉ là số liệu địa lý riêng rẽ mà còn được thiết kế trong 1 cơ sở dữ liệu
+Bản đồ
+Bảng thuộc tính
- Chuyên gia: GIS đòi hỏi những chuyên viên thông thạo, có kiến thức để vận hành GIS thực hiện các chức năng phân tích và xử lý các số liệu
Trang 3- Phương pháp: bao gồm toàn bộ các thủ tục và thuật toán liên quan đến nhập, biên tập, chuyển đổi dữ liệu, truy vấn và phân tích dữ liệu
+ Phân lớp
+ Chồng xếp
+ Phân tích lân cận
+ Phân tích mạng
2 Trình bày ưu, nhược điểm của dữ liệu vector.
- Dữ liệu lưu tốn ít bộ nhớ hơn
dữ liệu Raster
- Dữ liệu có thể tạo từ độ phân
giải gốc, không có sự khái quát
hóa dữ liệu
- Cấu trúc dữ liệu phức tạp
- Thực hiện các phép toán chồng ghép là rất khó khăn
- Vị trí của mỗi điểm phải lưu trữ một c ách chính xác
Trang 4- Độ chính xác của dự liệu gốc
được duy trì
- Vị trí của các đối tượng định vị
chính xác (nhất là các đối tượng
điểm, đường và đường bao)
- Cho phép tạo topo cho các đối
tượng, thực hiện các phân tích
mạng rất tiện ích
- Cấu trúc này giúp cho người sử
dụng dễ dàng biên tập bản đồ,
chỉnh sửa, in ấn
- Chuyến đổi hệ tọa độ được
thực hiện dễ dàng
- Truy vấn và cập nhật dữ liệu
-Sử dụng cho phân tích không gian,
dữ liệu Vector phải được chuyển sang mô hình Topology Quá trình sửa lỗi để tạo Toppology khá tốn kém thời gian Hơn nữa, dữ liệu Topology phải thường xuyên tạo lại
vì các dữ liệu điểm, đường và đa giác thường xuyên thay đổi
- Các thuật toán áp dụng cho phân tích không gian rất phức tạp
- Các dữ liệu liên tục như dữ liệu
độ cao, độ dốc không được hiển thị hiệu quả với mô hình dữ liệu Vector
Trang 5khá tiện ích và dễ dàng - Phân tích không gian và làm trơn
dữ liệu là không thể thực hiện trong ranh giới của vùng (polygon)
3 Trình bày ưu, nhược điểm của dữ liệu raster.
- Cấu trúc dữ liệu đơn giản,
thành phần cơ bản của bản đồ
chỉ gồm Pixel
- Vị trí của mỗi điểm được lưu
đơn giản bằng tọa độ hàng và
cột của ma trận số
- Dễ thực hiện các chức năng xử
lý và phân tích
- Tốc độ tính toán nhanh, thực
- Độ phân giải của Pixel hạn chế khả năng mô tả chi tiết đối tượng
- Rất khó hiển thị các đối tượng hình tuyến chính xác như đường giao thông, thủy văn
- Kém chính xác về vị trí không gian của đối tượng Khi độ phân giải càng thấp (kích thước pixel
Trang 6hiện các phép toán bản đồ dễ
dàng
- Thích hợp cho mô hình hóa và
tính toán định lượng
- Dễ dàng liên kết với dữ liệu
viễn thám
- Dữ liệu Raster thích hợp với
các thiết bị đầu ra như máy in
(electrostatic plotters) và hiển thị
dữ liệu đồ họa (graphic
terminals)
- Nhiều dữ liệu số như ảnh vệ
tinh, ảnh máy bay sẵn có và đa
dạng, có khả năng cập nhật
lớn) thì sự sai lệch này càng tăng
- Xử lý dữ liệu thuộc tính là khó khăn trong trường hợp cơ sở dữ liệu lớn Mỗi bản đồ Raster chỉ tương ứng với một thuộc tính nhất định
- Hầu hết các dữ liệu đều tồn tại
ở dạng Vector, để sử dụng dữ liệu Raster, ta cần thực hiện chuyển đổi dữ liệu sang dạng Raster
- Các bản đồ Raster thường có màu sắc kém hấp dẫn và đẹp hơn dữ liệu Vector
Trang 7nhanh dữ liệu số này - Chuyển đổi hệ tọa độ thực hiện
khó khăn hơn dữ liệu Vector
4 Trình bày cách nén dữ liệu raster theo phương pháp nén cây
tứ phân
Phương pháp nén cây tứ phân (Quadtree block): Phương pháp nén này dựa trên cơ sở chia liên tục của dạng ma trận 2n x 2n thành các thành phần cây tứ phân Cả vùng bản đồ được chia thành bốn phần liên tục trong khi thỏa mãn điều kiện giữa các ô vuông con phải nằm trọn trong vùng nghiên cứu Giới hạn thấp nhất của phép chia
là một Pixel Cấu trúc khối này có thể trình bày dưới dạng cây tứ phân gọi là Quadtree Toàn bộ mảng gồm 2 n x 2n điểm là nút gốc của cây tứ phân và chiều cao lớn nhất của cây là n tầng Mỗi nút có bốn nhánh cây Nút lá tương ứng với Quadtree mà nó không cần
Trang 8phải tiếp tục chia tiếp để bao trùm vùng nghiên cứu Hình 2-28a,b minh họa phương pháp nén cây tứ phân Từ vùng gốc (Hình 2-28a) chia thành 4 vùng con cấp 1 như A, F Vùng con cấp 1 trên góc trái trên lại phân thành bốn vùng con cấp 2 tiếp như vùng con I, H, G Tiếp tục, ta lại chia mỗi vùng con cấp 2 thành vùng con cấp 3 như vùng 1, 2, 3, 4 (Hình 2-28b)
Trang 9Phương pháp nén hình cây tứ phân có các ưu điểm so với các phương pháp lưu trữ nén khác Nó làm tiện ích tính toán diện tích chu vi của các vùng có hình dạng chuẩn và có thể giảm bớt sự lưu trữ với các độ phân giải khác nhau do đặc điểm nó có thể thay đổi
độ phân giải và giảm lưu trữ ở các khu vực có giá trị thông số thuộc tính đồng đều Tuy nhiên, những vấn đề nảy sinh đối với phương pháp này là các vùng có cùng kích thước và hình dạng có thể được biểu thị bằng những Quadtree khác nhau nên sẽ gây khó khăn cho việc phân tích nhận hình dạng Mặt khác, nó gây khó khăn nếu ta muốn chia nhỏ một vùng hay tạo lỗ trống không một vùng của bản
đồ Ngoài ra, các phương pháp nén khác cũng có thể được sử dụng như phương pháp nén theo đường biên của vùng (Chain codes), phương pháp nén theo khối (Block codes) Các phương pháp nén các lớp dữ liệu của ảnh vệ tinh (các kênh, band) được sử dụng theo
Trang 10phương pháp BSQ (Band sequential), BIL (Band interleaved by line) và BIP (Band interleaved by pixel)
5 Trình bày nguyên lý chuyển từ dữ liệu vector sang raster và ngược lại
6 Trình bày chuẩn trình bày dữ liệu địa lý.
Chuẩn trình bày dữ liệu địa lý được áp dụng để xây dựng danh mục trình bày đối tượng địa lý đối với các loại cơ sở dữ liệu địa lý Khi trình bày dữ liệu địa lý phải áp dụng các nguyên tắc chung Thông tin trình bày dữ liệu địa lý phải được lưu trữ độc lập với tập dữ liệu địa lý Một tập dữ liệu địa lý có thể được trình bày theo nhiều cách khác nhau nhưng không được làm thay đổi nội dung dữ liệu Các quy tắc trình bày được áp dụng cho mỗi kiểu đối tượng địa lý trong lược đồ ứng dụng được tổ chức và lưu trữ trong danh mục trình bày đối tượng địa lý Các chỉ thị trình bày được tổ chức và lưu trữ độc lập với danh mục trình bày đối tượng địa lý Danh mục trình bày
Trang 11dữ liệu địa lý được mã hoá theo mã hóa danh mục trình bày dữ liệu địa lý được thực hiện theo lược đồ XML và được phép áp dụng thêm đặc tả kỹ thuật trình bày của Hiệp hội OpenGIS để xây dựng,
mã hóa danh mục trình bày dữ liệu địa lý
7 Trình bày chuẩn hệ quy chiếu toạ độ
Chuẩn hệ quy chiếu toạ độ được áp dụng để mô tả chi tiết hệ quy chiếu toạ độ sử dụng khi xây dựng cơ sở dữ liệu địa lý Mô hình hệ quy chiếu toạ độ được mô tả thông qua một mô hình khái niệm Thông tin địa lý cơ sở được xây dựng theo Hệ quy chiếu và Hệ toạ
độ quốc gia VN-2000 Hệ quy chiếu độ cao là Hệ độ cao quốc gia Hòn Dấu - Hải Phòng Quy định về mã hệ quy chiếu tọa độ của Hệ quy chiếu và Hệ toạ độ quốc gia VN- 2000 quy định theo quy chuẩn kỹ thuật
8 Trình bày chuẩn mô hình cấu trúc dữ liệu địa lý
Trang 12Chuẩn mô hình cấu trúc dữ liệu địa lý bao gồm ngôn ngữ biểu diễn
mô hình cấu trúc dữ liệu địa lý, kiểu dữ liệu nguyên thủy sau được
áp dụng khi định nghĩa mô hình cấu trúc dữ liệu địa lý, mô hình đối tượng địa lý tổng quát và các quy tắc xây dựng lược đồ ứng dụng Ngôn ngữ biểu diễn mô hình cấu trúc dữ liệu địa lý là ngôn ngữ UML (Unified Modeling Language) để biểu diễn các lược đồ khái niệm và lược đồ lược đồ ứng dụng trong định nghĩa thông tin địa lý
cơ sở và các loại thông tin địa lý khác Các kiểu dữ liệu nguyên thủy sau được áp dụng khi định nghĩa mô hình cấu trúc dữ liệu địa
lý bao gồm kiểu dữ liệu số (Number), kiểu dữ liệu số nguyên (Integer), kiểu dữ liệu số thực (Real), kiểu dữ liệu xâu ký tự (CharacterString), kiểu dữ liệu ngày-tháng-năm (Date), kiểu dữ liệu giờ-phút-giây (Time), kiểu dữ liệu ngày-giờ (DateTime) và kiểu dữ liệu logic (Boolean) Mô hình đối tượng địa lý tổng quát là mô hình đối tượng địa lý tổng quát dùng để mô hình hóa các đặc tính cơ bản
Trang 13của kiểu đối tượng địa lý nhằm mục đích phân loại và định nghĩa kiểu đối tượng địa lý trong danh mục đối tượng địa lý hoặc trong lược đồ ứng dụng, quy định cấu trúc và nội dung danh mục đối tượng địa lý, quy định lược đồ trình bày dữ liệu địa lý Các đặc tính
cơ bản của kiểu đối tượng địa lý bao gồm tên gọi của kiểu đối tượng địa lý, định nghĩa hoặc mô tả về kiểu đối tượng địa lý, các thuộc tính của kiểu đối tượng địa lý, các quan hệ liên kết, các quan
hệ tổng quát hóa và chi tiết hóa Các quy tắc xây dựng lược đồ ứng dụng là các quy tắc xây dựng lược đồ ứng dụng được áp dụng để
mô tả các kiểu đối tượng địa lý được định nghĩa theo mô hình đối tượng địa lý tổng quát, định nghĩa cấu trúc dữ liệu trong một lược
đồ ứng dụng, xây dựng lược đồ ứng dụng cho các loại dữ liệu địa lý
9 Trình bày cách phân loại đối tượng địa lý tự nhiên.
Trang 1410 Trình bày các loại sai số dữ liệu địa lý do thu thập dữ liệu
Sai số do dung lượng mẫu quan trắc: Đã có rất nhiều nghiên cứu
chỉ ra rằng phân bố các điểm mẫu quan trắc ảnh hưởng đến sai số
dữ liệu Tuy vậy, các cơ sở cung cấp dữ liệu bản đồ thường từ chối cung cấp các thông tin liên quan đến quá trình lấy mẫu và thu thập thông tin để xây dựng các bản đồ Hiện nay, thái độ như vậy đang
có chiều hướng thay đổi Ví dụ, Viện điều tra đất Hà Lan cung cấp
cả thông tin về các công ty điều tra đất đã thực hiện công tác điều tra dữ liệu thành lập bản đồ Các thông tin này còn bao gồm cả vị trí và phân loại các điểm lấy mẫu Trung tâm điều tra đất của Anh cũng cung cấp cho khách hàng mua bản đồ những thông tin tương
tự Khi có đầy đủ các thông tin về địa điểm, thời gian lấy mẫu và các thông tin liên quan thì người sử dụng bản đồ có thể sử dụng những công cụ thống kê như lý thuyết thông kê lấy mẫu, kỹ thuật
Trang 15xử lý thống kê địa vật lý, v.v để xem xét và đánh giá với mức độ tin cậy hợp lý cho các kết quả phân tích dữ liệu GIS
Sai số do thiết bị quan trắc: Nhìn chung các thiết bị quan trắc đều
có sai số ở một mức độ nhất định Đặc biệt, dữ liệu thu thập có thể
có sai số lớn nếu thiết bị quan trắc cũ hay bị hư hỏng được sử dụng
Sai số do phân tích trong phòng thí nghiệm: Sai số dữ liệu có thể
xuất hiện trong quá trình phân tích mẫu trong phòng thí nghiệm Ví
dụ, việc phân tích các chỉ tiêu lý, hóa và sinh học đất trong phòng thí nghiệm có thể xuất hiện những sai số dữ liệu Tuy nhiên, nhìn chung chất lượng dữ liệu thu thập thông qua phân tích trong phòng thí nghiệm bao giờ cũng sai số ít hơn so với thu thập dữ liệu bằng các phương pháp khác Lưu ý rằng dữ liệu phân tích cùng một mẫu với cùng một phương pháp trong các phòng thí nghiệm khác nhau thường cho ra kết quả khác nhau Một nghiên cứu so sánh kết quả
Trang 16về đất (International Soil Reference and Information Center, Wageningen, 1986) cho biết biến động về kết quả phân tích của của một mẫu đất có thể là hơn ± 11% đối với thành phần sét, ±20% đối với mức độ trao đổi ion (±25% cho thành phần sét), ±10% đối với mức độ bão hòa và ±0.2 đơn vị đối với số đo pH
Sai số do số hóa bản đồ: Nguồn gốc sai số trong quá trình số hóa
chủ yếu từ sai số của bản đồ gốc Với đối tượng điểm, sai số thường là sai lệch vị trí Với đối tượng đường, sai số chủ yếu là do kích thước đường biên quanh đối tượng vùng lớn Nguyên tắc chung là lấy đường ở giữa đường biên làm đường biên khi số hóa Ngoài ra, kỹ năng số hóa của kỹ thuật viên cũng ảnh hưởng đến sai
số dữ liệu
Sai lệch vị trí do đối tượng địa lý liên tục: Dữ liệu ranh giới của
các thửa đất có thể hiển thị đạt độ chính xác cao Tuy nhiên, các đường biên của các đơn vị đất và kiểu phân bố thực vật thì rất khó
Trang 17đạt được độ chính xác cao Ví dụ, đối với bản đồ phân loại thực vật thì ranh giới giữa hai loại thực vật không rõ ràng và bao giờ cũng
có vùng chuyển tiếp do sự chuyển tiếp về khí hậu, loại đất, chế độ nước và địa hình Hơn nữa, ranh giới về sự biến đổi chế độ thủy văn và độ dốc cũng không có ranh giới rõ ràng Những khó khăn trong hiển thị ranh giới của đối tượng địa lý là nguyên nhân dẫn đến sự sai lệch vị trí
Sai lệch dữ liệu thuộc tính: Độ chính xác của dữ liệu thuộc tính
phụ thuộc vào mức độ tin cậy của dữ liệu khi chúng được gán vào các thực thể điểm, đường và vùng của bản đồ Người ta phân biệt
độ chính xác về định tính và độ chính xác định lượng Độ chính xác định tính liên quan đến bản chất của dữ liệu thuộc tính Ví dụ, một thửa đất hoặc một đơn vị sử dụng đất đang trồng cây hoa màu thì chú thích là cây ăn quả Độ chính xác định lượng liên quan đến ước
Trang 18chỉnh tốt có thể gây sai số cao hơn một đơn vị pH cho tất cả các số đo
11 Trình bày một số lợi ích chính của chuẩn hoá đối tượng địa lý
- Chuẩn hóa dữ liệu địa lý mang lại hiệu quả kinh tế rõ rệt như giảm chi phí thu thập và xử lý dữ liệu Sự chuẩn hóa dữ liệu địa lý thúc đẩy sự trao đổi thông tin giữa các nhóm sử dụng thông tin được thuận lợi và hiệu quả Ở khía cạnh kinh tế, nó góp phần giảm chi phí cho xây dựng cơ dữ liệu và biên tập cơ sở dữ liệu Đặc biệt,
sự chuẩn hóa dữ liệu giúp cho các nhà phát triển phần mềm hệ thống GIS hình thành tiêu chuẩn chung
- Chuẩn hóa giảm thiểu được sự sai số và mất mát dữ liệu Nếu dữ liệu xây dựng theo các định dạng và cấu trúc khác nhau Dữ liệu chuyển đổi từ dạng này sang dạng khác sẽ gây ra hiện tượng mất
dữ liệu và sai số dữ liệu so với dữ liệu gốc
Trang 19- Chuẩn hóa tạo điều kiện cho chia sẻ dữ liệu cho các nhóm người
sử dụng các phần mềm GIS khác nhau
- Chuẩn hóa tạo thuận lợi cho công tác đào tạo và sử dụng các hệ GIS Ví dụ, sự phát triển các phần mềm chuẩn sẽ cho phép nhiều người có thể sử dụng cùng một phần mềm cho nhiều mục đích khác nhau, giảm cho phí phát triển phần mềm không cần thiết
- Nâng cao chất lượng quản lý dữ liệu và giảm sai số dữ liệu
12 Trình bày chuẩn chất lượng dữ liệu địa lý
Chuẩn chất lượng dữ liệu địa lý được áp dụng để xây dựng các quy định về chất lượng cho các loại dữ liệu địa lý và xây dựng các quy trình đánh giá chất lượng cho các loại dữ liệu địa lý Để đánh giá chất lượng dữ liệu địa lý, áp dụng hai nhóm tiêu chí đánh giá chất lượng là nhóm tiêu chí đánh giá chất lượng theo định lượng và nhóm tiêu chí đánh giá chất lượng theo định tính Để đánh giá chất
Trang 20pháp là phương pháp đánh giá chất lượng dữ liệu trực 144 tiếp và phương pháp đánh giá chất lượng dữ liệu gián tiếp Các phương pháp đánh giá chất lượng dữ liệu địa lý được quy định cụ thể theo quy chuẩn kỹ thuật