Mỗi pixel được xác định vị trí bằng cặp toạ độ x,y là số thứ tự của hàng 1.6 Cấu trúc dữ liệu Raster: Cấu trúc dữ liệu raster có hai đặc điểm cần lưu ý:... • Ordinal biến thứ tự: một gi
Trang 1Các đối tượng địa lý khi được biểu diễn trên máy tính được biết đến ở 2dạng: cấu trúc dữ liệu raster và cấu trúc dữ liệu vector
A Cấu trúc Raster:
1.Khái niệm
Mô hình raster biểu diễn không gian như là một ma trận số nguyên, mỗi giá trị sốnguyên đại diện cho một thuộc tính, vị trí của số nguyên chính là vị trí của đốitượng
Thí dụ:
Hình 1.1: Mô hình dữ liệu raster và vector
Trang 2Hình 1.2: Mô hình dữ liệu raster và vector
Liên hệ với thế giới thực: mỗi pixel sẽ tương ứng với một ô nào đó trong thế giớithực
Trong cấu trúc raster:
- Đường được biểu diễn bằng những pixel có cùng giá trị f(x,y) liên tiếpnhau
- Vùng được xác định thành một mạng gồm nhiều pixel có cùng giá trị thuộctính f(x,y)
Hình 1.3: Cấu trúc dữ liệu raster
Cấu trúc lưu trữ raster cơ bản:
- Cấu trúc lưu mã chi tiết (exhaustive enumeration)
- Cấu trúc lưu mã run length (run-length encoding)
Trang 3Đối với cấu trúc lưu mã chi tiết, mỗi một điểm lưới được gắn với giá trị duy nhất,
vì vậy dữ liệu không được nén gọn
Cấu trúc lưu mã chạy dài có ý nghĩa như là một kỹ thuật nén dữ liệu nếu raster
chứa các nhóm điểm lưới có cùng một giá trị Khi đó thay vì phải lưu trữ riêng chotừng điểm lưới, cấu trúc này lưu trữ theo từng thành phần có một giá trị duy nhất
và số lượng điểm lưới chứa đựng giá trị đó
Hình :1.4 Minh họa cấu trúc mã chi tiết
Hình 1.5: Minh họa cấu trúc mã run length
Mô hình raster chia không gian thành những ô lưới đều hình vuông (chữnhật, tam giác, hoặc lục giác) gọi là điểm ảnh (pixel) (bộ môn địa tin học,ĐHQG
TP Hồ Chí Minh, ĐH Bách Khoa)
Trang 4Mỗi pixel được xác định vị trí bằng cặp toạ độ (x,y) là số thứ tự của hàng
1.6 Cấu trúc dữ liệu Raster:
Cấu trúc dữ liệu raster có hai đặc điểm cần lưu ý:
Trang 5- Mỗi điểm ảnh chỉ biểu diễn một thuộc tính, xác định bởi giá trị f(x,y)
- Khi thay đổi độ phân giải (kích thước điểm ảnh thay đổi), dung lượng dữliệu thay đổi theo Dung lượng dữ liệu tăng theo bình phương tỉ lệ gia tăng độphân giải
2.Nguồn dữ liệu raster
Ảnh chụp từ vệ tinh, ảnh chụp từ máy bay, ảnh quét, ảnh chụp Trong đó ảnhchụp từ vệ tinh là cách lấy dữ liệu tốn kém nhất nhưng lại có ý nghĩa to lớn trongviệc nghiên cứu tình hình biến đổi của các sự vật trên trái đất theo thời gian Ảnhchụp từ máy bay giúp ta vẽ bản đồ một cách chi tiết
Ngoài ra raster còn có thể được tạo ra bằng cách chuyển đổi từ nhiều nguồn dữliệu khác như vector hay TIN
3.Các thành phần dữ liệu
Raster được tạo nên bởi một mảng 2 chiều các điểm ảnh hay pixel
Pixel :
Cell là một đơn vị đồng nhất biểu diễn một vùng xác định trên trái đất
Các cell đều có cùng kích thước
Gốc toạ độ của hệ được đặt tại cell nằm tại đỉnh góc trái
Mỗi cell được xác định bởi chỉ số dòng và chỉ số cột, đồng thời nó chứa một
số nguyên (hoặc số thực) biểu diễn kiểu hay giá trị thuộc tính xuất hiện trên bản
đồ
Kích thước của cell trong raster phụ thuộc nhiều vào độ phân giải dữ liệu Cellphải có kích thước đủ nhỏ để có thể thu thập được chi tiết dữ liệu, nhưng cũngphải có kích thước đủ lớn để có thể phân tích dữ liệu một cách thuận tiện
Giá trị của cell sẽ định nghĩa các nhóm, lớp tại vị trí của cell Cell tại nhữngđiểm có cùng một giá trị xác định một vùng, miền
Các cell trong cùng một miền không cần phải liên kết với nhau Khi một sốnguyên được chỉ định cho một tập các cell, thì số nguyên này có thể là mã phânbiệt giữa các nhóm cell Điều này tạo nên một quan hệ một - nhiều giữa mã và cáccell có cùng giá trị
Trang 6Ví dụ: các cell có giá trị là 400 được gán mã là 4, các cell có giá trị 500 được gán
mã là 5 Mã này có thể xuất hiện nhiều lần trong raster, nhưng chỉ xuất hiện mộtlần trong bảng giá trị thuộc tính (hình vẽ) Bảng này lưu các giá trị thuộc tính cho
mã, điều này giúp việc cập nhật đơn giản hơn Một thay đổi nhỏ của giá trị thuộctính sẽ làm thay đổi cách thể hiện của hàng trăm đối tượng trên bản đồ
Mỗi cell trong một raster đều có một giá trị Giá trị này biểu diễn một trongbốn kiểu dữ liệu sau:
• Nominal (biến tên): một giá trị thuộc kiểu dữ liệu nominal sẽ xác định
một thực thể từ một thực thể khác Những giá trị này được phân loại để tạo thànhcác nhóm Trong mỗi nhóm, thực thể địa lý sẽ liên kết với cell tại vị trí của cell đó.Nominal được dùng trong rất nhiều kiểu mã như mã sử dụng đất, kiểu đất trồng
• Ordinal (biến thứ tự): một giá trị thuộc dữ liệu ordinal sẽ xác định vị trí
của một thực thể so với các thực thể khác như thực thể được đặt ở vị trí thứ nhất,thứ hai, hoặc thứ ba Nhưng các giá trị này không thiết lập tỷ lệ tương quan giữacác thực thể Chúng ta không thể suy luận được thực thể này lớn hơn, cao hơn haynặng hơn thực thể khác bao nhiêu
• Interval (biến thời gian): một giá trị thuộc dữ liệu interval biểu diễn một
phép đo trên một tỷ lệ như thời gian trong ngày Những giá trị này nằm trên một tỷ
lệ xác định và không liên hệ với một điểm thực nào
Ratio (biến tỷ lệ): một giá trị thuộc kiểu ratio có thể biểu diễn một phép đo trên
một tỷ lệ với một điểm cố định và mang ý nghĩa
4 Hệ thống Raster
Mô hình dữ liệu dạng raster phản ánh toàn bộ vùng nghiên cứu dưới dạng một lướicác ô vuông hay điểm ảnh (pixcel) Mô hình raster có các đặc điểm:
• Các điểm được xếp liên tiếp từ trái qua phải và từ trên xuống dưới
• Mỗi một điểm ảnh (pixcel) chứa một giá trị
Trang 7• Một tập các ma trận điểm và các giá trị tương ứng tạo thành một lớp(layer)
• Trong cơ sở dữ liệu có thể có nhiều lớp
Mô hình dữ liệu raster là mô hình dữ liệu GIS được dùng tương đối phổ biến trongcác bài toán về môi trường, quản lý tài nguyên thiên nhiên
Mô hình dữ liệu raster chủ yếu dùng để phản ánh các đối tượng dạng vùng là ứngdụng cho các bài toán tiến hành trên các loại đối tượng dạng vùng: phân loại;chồng xếp
Các nguồn dữ liệu xây dựng nên dữ liệu raster có thể bao gồm:
• Quét ảnh
• Ảnh máy bay, ảnh viễn thám
• Chuyển từ dữ liệu vector sang
• Lưu trữ dữ liệu dạng raster
• Nén theo hàng (Run lengh coding)
• Nén theo chia nhỏ thành từng phần (Quadtree)
• Nén theo ngữ cảnh (Fractal)
Trong một hệ thống dữ liệu cơ bản raster được lưu trữ trong các ô (thường hìnhvuông) được sắp xếp trong một mảng hoặc các dãy hàng và cột Nếu có thể, cáchàng và cột nên được căn cứ vào hệ thống lưới bản đổ thích hợp
Việc sử dụng cấu trúc dữ liệu raster tất nhiên đưa đến một số chi tiết bị mất Với lý
do này, hệ thống raster-based không được sử dụng trong các trường hợp nơi có cácchi tiết có chất lượng cao được đòi hỏi
Trang 8Hình 1.7: Sự biểu thị kết quả bản đồ dưới dạng Raster
4.1 Chuyển đổi cơ sở dữ liệu dạng vector và raster
Việc chọn của cấu trúc dử liệu dưới dạng vector hoặc raster tuỳ thuộc vào yêu cầucủa người sử dụng, đối với hệ thống vector, thì dữ liệu được lưu trữ sẽ chiếm diệntích nhỏ hơn rất nhiều so với hệ thống raster, đồng thời các đường contour sẽchính xác hơn hệ thống raster Ngoài ra cũng tuỳ vào phần mềm máy tính đang sửdụng mà nó cho phép nên lưu trữ dữ liệu dưới dạng vector hay raster Tuy nhiênđối với việc sử dụng ảnh vệ tinh trong GIS thì nhất thiết phải sử dụng dưới dạngraster
Một số công cụ phân tích của GIS phụ thuộc chặt chẽ vào mô hình dữ liệu raster,
do vậy nó đòi hỏi quá trình biến đổi mô hình dữ liệu vector sang dữ liệu raster, haycòn gọi là raster hoá Biến đổi từ raster sang mô hình vector, hay còn gọi là vectorhoá, đặc biệt cần thiết khi tự động quét ảnh Raster hoá là tiến trình chia đườnghay vùng thành các ô vuông (pixcel) Ngược lại, vector hoá là tập hợp các pixcel
để tạo thành đường hay vùng Nết dữ liệu raster không có cấu trúc tốt, thí dụ ảnh
vệ tinh thì việc nhận dạng đối tượng sẽ rất phức tạp
Nhiệm vụ biến đổi vector sang raster là tìm tập hợp các pixel trong không gianraster trùng khớp với vị trí của điểm, đường, đường cong hay đa giác trong biểudiễn vector Tổng quát, tiến trình biến đổi là tiến trình xấp xỉ vì với vùng khônggian cho trước thì mô hình raster sẽ chỉ có khả năng địa chỉ hoá các vị trí toạ độ
Trang 9nguyên Trong mô hình vector, độ chính xác của điểm cuối vector được giới hạnbởi mật độ hệ thống toạ độ bản đồ còn vị trí khác của đoạn thẳng được xác địnhbởi hàm toán học.
Hình 1.8:Sự chuyển đổi dữ liệu giữa raster và vector (Nguồn : Tor Bernhardsen,1992)
4.2 Thuận lợi của hệ thống cơ sở dữ liệu raster
• Vị trí địa lý của mỗi ô được xác định bởi vị trí của nó trong ô biểu tượng,hình ảnh có thể được lưu trữ trong một mảng tương xứng trong máy vi tínhcung cấp đủ dữ liệu bất kỳ lúc nào Vì vậy mỗi ô có thể nhanh chóng và dễdàng được định địa chỉ trong máy theo vị trí địa lý của nó
• Những vị trí kế cận được hiện diện bởi các ô kế cận, vì vậy mối liên hệ giữacác ô có thể được phân tích một cách thuận tiện
• Quá trình tính toán đơn giản hơn và dễ dàng hơn cơ sở hệ thống dữ liệuvector
• Đơn vị bản đồ ranh giới thửa được trình bày một cách tự nhiên bởi giá trị ôkhác nhau, khi giá trị thay đổi, việc chỉ định ranh giới thay đổi
Trang 104.3 Bất lợi của hệ thống dữ liệu raster
• Khả năng lưu trữ địi hỏi lớn hơn nhiều so với hệ thống cơ sở dữ liệuvector
• Kích thước ơ định rõ sự quyết định ở phương pháp đại diện ở phương phápđại diện Điều này đặc biệt khĩ dễ cân xứng với sự hiện diện đặc tính thuộc
về đường thẳng
Thường hầu như hình ảnh gần thì nối tiếp nhau, điều này cĩ nghĩa là nĩ phảitiến hành một bản đồ hồn chỉnh chính xác để thay đổi 1 ơ đơn Quá trình tiếnhành của dữ liệu về kết hợp thì chống nhiều chỗ hơn với 1 hệ thống cơ sở vector
Dữ liệu được đưa vào hầu như được số hố trong hình thức vector, vì thế nĩphải chính xác 1 vector đến sự thay đổi hoạt động raster để đổi dữ liệu hệ số hốvào trong hình thức lưu trữ thích hợp
Điều này thì khĩ hơn việc xây dựng vào trong bản đồ từ dữ liệu raster
II.Cấu trúc full Raster
255 (một byte cho mỗi Pixel)
• Sự sắp xếp chuỗi trong một cấu trúc Full raster thường theo thứ tự cộtbắt đầu từ góc trên bên bên trái và quét từ trái qua phải, từ trên xuống dưới Thực tế có thể có Cấu trúc full raster được sử dụng rộng rãi trong các hệthống xử lý ảnh nhiều thứ tự sắp xếp khác nhau và điều này liên quan đếnnhiều cấu trúc nén như mã Run-Length và cây tứ phân
• Cấu trúc Full Raster có thể được tổ chức theo BSQ (Band Sequential)
Trang 11- Các giá trị của một dải đơn hoặc một thuộc tính được sắp xếp theothứ tự cột như đã đề cập trong phần trên
- Nếu có nhiều hơn một thuộc tính thì dải thứ hai bắt đầu tại vị trídải thứ nhất kết thúc
• Cấu trúc BSQ (Band Sequential)
• Interleaved by Cấu trúc BSQ (Band Sequential) ùc BIL (BandInterleaved by Line) hoặc BIP (Band Pixel)
Với cấu trúc BIL, mỗi cột
- ảnh đa giải cũng có thể được lưu theo cấu tru Những các Pixelđược lặp lại m lần với mà l số dải, trước khi di chuyển tới cột tiếptheo
(1,1) (1,2) (1,3)(2,1) (2,2)(3,1)
(i,j)
(1,1) (1,2) (1,3)(2,1) (2,2)(3,1)
(i,j)
(1,1) (1,2) (1,3)(2,1) (2,2)(3,1)
(i,j)
Band 1
Band 2 Band 3
Band 1 Band 2 Band 3
Trang 12Địa chỉ của Pixel: i: chỉ số dòng
• Cấu trúc BIL (Band Interleaved by Line)
Địa chỉ của Pixel:
i: chỉ số dòng J: chỉ số pixel
Band 1
Band 2 Band 3
Band 1 Band 2
Trang 13H Hình cấu trúc BIL
• Các định dạng BIL và BIP thuận lợi trong các thao tác liên quan đến sựkết hợp giữa các ảnh vì những địa chỉ vật lý của các giá trị thuộc tính đối vớicùng một pixel thì rất gần nhau
• Tuy nhiên, đối với việc hiển thị nhanh chóng một thuộc tính đơn từ mộttập dữ liệu đa dải lớn thì BSQ hiệu quả hơn
• Những cấu trúc ảnh Raster phổ biến nhất chỉ lưu trữ những số nguyêndương có tầm trị trong khoảng từ 0-255 (một byte)
• Dữ liệu ảnh lưới địa lý thường yêu cầu tầm trị lớn hơn 0-255 bởi vì tầnsố không gian cao
• Thông tin tần số cao bị mất khi lượng tử vào trong một miền trị số nhỏ,
do vậy những ảnh địa lý thường yêu cầu nhiều hơn một byte cho mỗi Pixel
** Ưu, nhược điểm của cấu trúc dữ liệu Raster
1 Ưu điểm
• Vị trí địa lý của mỗi ơ được xác định bởi vị trí của nĩ trong ơ biểu tượng,hình ảnh cĩ thể được lưu trữ trong một mảng tương xứng trong máy vi tính cungcấp đủ dữ liệu bất kỳ lúc nào Vì vậy mỗi ơ cĩ thể nhanh chĩng và dễ dàng đượcđịnh địa chỉ trong máy theo vị trí địa lý của nĩ
• Những vị trí kế cận được hiện diện bởi các ơ kế cận, vì vậy mối liên hệ giữacác ơ cĩ thể được phân tích một cách thuận tiện
• Quá trình tính tốn đơn giản hơn và dễ dàng hơn cơ sở hệ thống dữ liệuvector
• Đơn vị bản đồ ranh giới thửa được trình bày một cách tự nhiên bởi giá trị ơkhác nhau, khi giá trị thay đổi, việc chỉ định ranh giới thay đổi
2 Nhược điểm
• Khả năng lưu trữ địi hỏi lớn hơn nhiều so với hệ thống cơ sở dữ liệuvector
Trang 14• Kích thước ô định rõ sự quyếtđịnh ở phương pháp đại diện ởphương pháp đại diện Điều này đặc biệt khó dễ cân xứng với sự hiện diệnđặc tính thuộc về đường thẳng
• Thường hầu như hình ảnh gần thì nối tiếp nhau, điều này có nghĩa là nóphải tiến hành một bản đồ hoàn chỉnh chính xác để thay đổi 1 ô đơn Quátrình tiến hành của dữ liệu về kết hợp thì choáng nhiều chỗ hơn với 1 hệthống cơ sở vector
• Dữ liệu được đưa vào hầu như được số hoá trong hình thức vector, vì thế nóphải chính xác 1 vector đến sự thay đổi hoạt động raster để đổi dữ liệu hệ
số hoá vào trong hình thức lưu trữ thích hợp.Điều này thì khó hơn việc xâydựng
III.Đặc điểm hình học của cấu trúc Vector
**** Khái niệm
Các đối tượng không gian khi biểu diễn ở cấu trúc dữ liệu vector được tổchức dưới dạng điểm (point), đường (line) và vùng (polygon) (xem hình 3.4), vàđược biểu diễn trên một hệ thống tọa độ nào đó Đối với các đối tượng biểu diễntrên mặt phẳng, mỗi đối tượng điểm được biểu diễn bởi một cặp tọa độ (x, y); đốitượng đường được xác định bởi một chuỗi liên tiếp các điểm (vertex), đoạn thẳngđược nối giữa các điểm (vertex) hay còn gọi là cạnh (segment), điểm bắt đầu vàđiểm kết thúc của một đường gọi là các nút (node); đối tượng vùng được xác địnhbởi các đường khép kín
Hình 3.1: Minh họa đối tượng đường gồm có các nút, điểm, cạnh
1.Kiểu đối tượng điểm (Points)
Trang 15Điểm được xác định bởi cặp giá trị đ Các đối tượng đơn, thông tin về địa lý chỉgồm cơ sở vị trí sẽ được phản ánh là đối tượng điểm Các đối tượng kiểu điểm cóđặc điểm:
• Là toạ độ đơn (x,y)
• Không cần thể hiện chiều dài và diện tích
Hình 1
Hình 3.2: Số liệu vector được biểu thị dưới dạng điểm (Point)
Tỷ lệ trên bản đồ tỷ lệ lớn, đối tượng thể hiện dưới dạng vùng Tuy nhiêntrên bản đồ tỷ lệ nhỏ, đối tượng này có thể thể hiện dưới dạng một điểm Vì vậy,các đối tượng điểm và vùng có thể được dùng phản ánh lẫn nhau
2.Kiểu đối tượng đường (Arcs)
Đường được xác định như một tập hợp dãy của các điểm Mô tả các đối tượng địa
lý dạng tuyến, có các đặc điểm sau:
• Là một dãy các cặp toạ độ
• Một arc bắt đầu và kết thúc bởi node
• Các arc nối với nhau và cắt nhau tại node
• Hình dạng của arc được định nghĩa bởi các điểm vertices
• Độ dài chính xác bằng các cặp toạ độ
Trang 16Hình 2
Hình 3.3: Số liệu vector được biểu thị dưới dạng Arc
3.Kiểu đối tượng vùng (Polygons)
Vùng được xác định bởi ranh giới các đường thẳng Các đối tượng địa lý có diệntích và đóng kín bởi một đường được gọi là đối tượng vùng polygons, có các đặcđiểm sau:
• Polygons được mô tả bằng tập các đường (arcs) và điểm nhãn (label points)
• Một hoặc nhiều arc định nghĩa đường bao của vùng
• Một điểm nhãn label points nằm trong vùng để mô tả, xác định cho mỗimột vùng