Quy tắc mã hóa encoding rule Tập hợp đồng nhất các quy tắc chuyển đổi mà định nghĩa việc mã hóa cho một cấu trúc dữ liệu cụ thể[ISO 19118:2005] 4.1.16 Đối tượng địa lý feature Sự chiết x
Trang 1TIÊU CHUẨN QUỐC GIA TCVN 12154:2018 ISO/TS 19129:2009
THÔNG TIN ĐỊA LÝ - KHUNG DỮ LIỆU ẢNH, Ô LƯỚI VÀ PHỦ
Geographic information - Imagery, gridded and coverage data framework
Lời nói đầu
TCVN 12154:2018 hoàn toàn tương đương ISO/TS 19129:2009 - Geographic information - Imagery, gridded and coverage data framework
TCVN 12154:2018 do Trung tâm Công nghệ phần mềm và GIS phối hợp với Trung tâm Ứng dụng và Chuyển giao công nghệ - Cục Công nghệ thông tin và Dữ liệu tài nguyên môi trường - Bộ Tài nguyên
và Môi trường biên soạn, Bộ Thông tin và Truyền thông đề nghị, Tổng cục Tiêu chuẩn Đo lường Chất lượng thẩm định, Bộ Khoa học và Công nghệ công bố
THÔNG TIN ĐỊA LÝ - KHUNG DỮ LIỆU ẢNH, Ô LƯỚI VÀ PHỦ
Geographic information - Imagery, gridded and coverage data framework
1 Phạm vi áp dụng
Tiêu chuẩn này xác định khung cho dữ liệu ảnh, ô lưới và dữ liệu phủ Khung này định nghĩa mô hình nội dung cho kiểu nội dung ảnh và các kiểu nội dung cụ thể khác mà có thể được biểu diễn như là dữ liệu phủ Các mô hình nội dung này được biểu diễn như là một tập các mẫu UML chung cho các lược
3 Tài liệu viện dẫn
Các tài liệu viện dẫn sau là cần thiết cho việc áp dụng tiêu chuẩn này Đối với các tài liệu viện dẫn ghi năm công bố thì áp dụng bản được nêu Đối với các tài liệu viện dẫn không ghi năm công bố thì áp dụng phiên bản mới nhất, bao gồm cả các sửa đổi (nếu có)
ISO 19107, Geographic information - Spatial schema (Thông tin địa lý - Lược đồ không gian).
ISO 19109:2005, Geographic information - Rules for application schema (Thông tin địa lý - Các quy tắc cho lược đồ ứng dụng).
ISO 19115, Geographic information - Metadata (Thông tin địa lý - Siêu dữ liệu).
ISO 19115-2, Geographic information - Metadata - Part 2: Extensions for imagery and gridded data
(Thông tin địa lý - Siêu dữ liệu - Phần 2: Mở rộng cho dữ liệu ảnh và ô lưới).
ISO 19123, Geographic information - Schema for coverage geometry and functions (Thông tin địa lý - Lược đồ hình học phủ và các hàm).
4 Thuật ngữ và định nghĩa
4.1 Thuật ngữ
Các thuật ngữ và định nghĩa dưới đây được áp dụng cho tiêu chuẩn này:
4.1.1
Lược đồ ứng dụng (application schema)
Lược đồ khái niệm cho dữ liệu được yêu cầu bởi một hoặc nhiều ứng dụng [ISO 19101:2002]
4.1.2
Mô hình nội dung (content model)
Nhìn nhận theo khía cạnh thông tin của một lược đồ ứng dụng
CHÚ THÍCH: thuật ngữ “Nhìn nhận theo khía cạnh thông tin” (information view) xuất phát từ tiêu chuẩn ISO về Mô hình tham chiếu cho xử lý phân tán mở (Open distributed Processing - RM-ODP),
Trang 2được mô tả trong ISO 19101 - 2.
4.1.3
Phủ liên tục (continuous coverage)
Phủ trả về các giá trị khác nhau cho thuộc tính đối tượng địa lý tương tự nhau tại các vị trí trực tiếp khác nhau bên trong một đối tượng không gian đơn, một đối tượng thời gian hoặc đối tượng không gian - thời gian trong miền giá trị của đối tượng đó [ISO 19123:2005]
CHÚ THÍCH Mặc dù miền giá trị không gian - thời gian của phủ bề mặt liên tục thường được giới hạntrong các thuật ngữ thuộc phạm vi không gian của phủ đó, phủ đó có thể được chia nhỏ ra trong số lượng vô hạn các vị trí trực tiếp
Hệ quy chiếu tọa độ (coordinate reference system)
Hệ thống tọa độ mà được liên kết với một đối tượng thông qua tham số gốc [ISO 19111:2007]
CHÚ THÍCH Trong trắc địa và tham số độ cao sẽ liên quan tới trái đất
4.1.6
Phủ (coverage)
Đối tượng địa lý mà hoạt động như một hàm trả về các giá trị xuất phát từ phạm vi của đối tượng địa
lý đó với vị trí trực tiếp bất kỳ trong miền giá trị không gian, thời gian, hoặc miền giá trị không gian - thời gian của đối tượng địa lý đó [ISO 19123:2005]
VÍ DỤ Các ví dụ bao gồm một ảnh quét, lớp phủ đa giác hoặc ma trận kỹ thuật số độ cao
4.1.7
Thu gọn dữ liệu (data compaction)
Sự giảm số lượng phần tử dữ liệu, băng thông đường truyền, giá trị và thời gian cho việc tạo lập, truyền tải và lưu trữ dữ liệu mà không mất thông tin bằng việc loại bỏ sự dư thừa, không liên quan hoặc sử dụng phương pháp mã hóa đặc biệt [ANSI T1.523-2001]
CHÚ THÍCH 1 Trong khi thu gọn dữ liệu làm giảm số lượng dữ liệu được sử dụng để biểu diễn một lượng thông tin được đưa ra, nhưng nén dữ liệu thì không
CHÚ THÍCH 2 Thu gọn dữ liệu có thể được thực hiện thông qua việc kết tập của các giá trị giống nhau trong các ô lưới liền kề, lược đồ lắp ghép hoặc các cách khác để loại ra các thông tin không liên quan
4.1.8
Nén dữ liệu (data compression)
Sự giảm số lượng không gian lưu trữ được yêu cầu để lưu trữ số lượng dữ liệu đưa ra hoặc là sự giảm chiều dài của thông điệp được yêu cầu để để truyền đi một lượng thông tin được đưa ra
CHÚ THÍCH 1 đã làm thích hợp với ANSI T1.523-2001
CHÚ THÍCH 2 Nén dữ liệu có tính xác suất tự nhiên dựa trên các trường hợp cụ thể của dữ liệu ảnh,
ô lưới hoặc phủ và có liên quan với mã hóa và nằm ngoài phạm vi của tiêu chuẩn này
4.1.9
Trao đổi dữ liệu (data interchange)
Sự giao, nhận và giải thích dữ liệu [ISO 19118:2005]
4.1.10
Tập dữ liệu (dataset)
Tập hợp dữ liệu đồng nhất [ISO 19115:2003]
4.1.11
Vị trí trực tiếp (direct position)
Vị trí được mô tả bằng một tập đơn lẻ các tọa độ trong hệ quy chiếu tọa độ [ISO 19107:2003]
Trang 3Phủ rời rạc (discrete coverage)
Phủ mà trả các giá trị thuộc tính đối tượng địa lý giống nhau với mỗi vị trí trực tiếp trong bất kỳ đối tượng không gian đơn, đối tượng thời gian hoặc đối tượng không gian - thời gian thuộc miền giá trị của nó [ISO 19123:2005]
CHÚ THÍCH Miền giá trị không gian - thời gian của phủ rời rạc bao gồm một tập hữu hạn các đối tượng hình học
Quy tắc mã hóa (encoding rule)
Tập hợp đồng nhất các quy tắc chuyển đổi mà định nghĩa việc mã hóa cho một cấu trúc dữ liệu cụ thể[ISO 19118:2005]
4.1.16
Đối tượng địa lý (feature)
Sự chiết xuất, trích rút ra một khía cạnh cụ thể của các hiện tượng trong thế giới thực [ISO
Thông tin địa lý (geographic information)
Thông tin liên quan đến các hiện tượng được liên kết hoàn toàn hoặc rõ ràng với một vị trí liên quan tới mặt trái đất [ISO 19101:2002]
Tọa độ lưới (grid coordinates)
Dãy của hai hoặc nhiều các số chỉ rõ một vị trí có hướng tới vị trí của nó trên một lưới [ISO 2:2009]
19115-4.1.22
Điểm lưới (grid point)
Điểm được đặt ở vị trí giao của hai hoặc nhiều đường cong trong một lưới [ISO 19123:2005]
Trang 4Dữ liệu ô lưới (gridded data)
Các giá trị thuộc tính của dữ liệu được liên kết với các vị trí trên hệ tọa độ lưới [ISO 19115-2:2009]
Siêu dữ liệu (metadata)
Dữ liệu về dữ liệu [ISO 19115:2003]
4.1.27
Điểm ảnh (Pixel)
Phần tử nhỏ nhất của hình ảnh kỹ thuật số được gán các thuộc tính [ISO/TS 19101-2:2008]
CHÚ THÍCH 1 Thuật ngữ này bắt nguồn từ rút gọn của “phần tử hình ảnh"
CHÚ THÍCH 2 Liên quan tới khái niệm của một ô lưới
4.1.28
Điểm (point)
Hình học nguyên thủy 0-chiều, biểu diễn một vị trí [ISO 19107:2003]
CHÚ THÍCH: Đường bao của một điểm là tập rỗng
4.1.29
Phủ dạng điểm (point coverage)
Phủ mà có miền giá trị bao gồm các điểm [ISO 19123:2005]
Lưới quét (raster)
Khuôn mẫu hình chữ nhật thông thường của việc tạo thành các dòng quét song song, hoặc tương ứng với màn hình hiển thị trên một ống tia âm cực [ISO 19123:2005]
CHÚ THÍCH một lưới quét là một kiểu của lưới
CHÚ THÍCH Thuật ngữ «dữ liệu lưới quét» thường được sử dụng trong lĩnh vực thông tin địa lý để xác định lớp dữ liệu nơi mà hình học không gian được tổ chức thành một lưới Mô tả về «dữ liệu lưới quét» được đưa ra trong ISO 19123 và các khái niệm toàn diện hơn về phủ cũng được mô tả trong tiêu chuẩn đó
Trang 5Miền giá trị không gian - thời gian (spatiotemporal domain)
Miền giá trị bao gồm các đối tượng không gian - thời gian [ISO 19123:2005]
CHÚ THÍCH Miền giá trị không gian - thời gian của phủ liên tục bao gồm một tập các vị trí trực tiếp được định nghĩa trong mối quan hệ tới một tập các đối tượng không gian - thời gian
4.1.35
Đối tượng không gian - thời gian (spatiotemporal object)
Đối tượng biểu diễn một tập các vị trí trực tiếp trong không gian và thời gian [ISO 19123:2005]
Phân vùng không gian (tessellation)
Phân vùng không gian thành một tập các không gian con có đường ranh giới chung và cùng chiều [ISO 19123:2005]
CHÚ THÍCH Một phân vùng không gian bao gồm một tập các đa giác đều tương đẳng hoặc đa diện đều là một phân vùng không gian đều; phân vùng không gian bao gồm đa giác đều, nhưng không tương đẳng hoặc đa diện không đều là một phân vùng không gian không đều
4.1.38
Thứ tự ô lưới (traversal order)
Chuỗi mà trong đó các ô lưới được đánh số
4.1.39
Mẫu UML (UML template)
Phần tử mô hình được tham số hóa mà mô tả hoặc xác định mẫu cho một nhóm các kiểu phần tử cụ thể [IBM Rational System Developer]
Phần tử mô hình mô tả hoặc xác định các mẫu cho một nhóm các phần tử của loại hình cụ thể
4.2 Thuật ngữ viết tắt
BIIF (Basic Image Interchange Format) Định ảnh trao đổi cơ bản
DEM (Digital elevation model) Mô hình số độ cao
GCP (Ground Control Point) Điểm khống chế mặt đất
GeoTIFF (Geographic TIFF) Dữ liệu địa lý dạng TIFF
GIS (Geographic Information System) Hệ thống thông tin địa lý
GML (Geography Markup Language) Ngôn ngữ đánh dấu địa lý
HDF-EOS (Hierarchical Data Format - Earth
Observing System) Định dạng cấu trúc dữ liệu-Hệ thống quan trắc trái đấtJPEG (Joint Photographic Experts Group) Ảnh nén dạng JPEG
RGB (Red Green Blue) Chế độ màu sắc Đỏ-Xanh lá cây-Xanh dươngTIFF (Tagged Image File Format) Định dạng tệp ảnh được gắn kèm thông tin
TIN (Triangulated Irregular Network) Mạng tam giác (Mạng tam giác không đều)
UML (Unified Modeling Language) Ngôn ngữ mô hình hóa thống nhất
XML (eXtensible Markup Language) Ngôn ngữ đánh dấu mở rộng
Trang 6Tiền tố Thuộc tiêu chuẩn Gói dữ liệu trong UML
CV 19123 Phủ cơ bản và Phủ rời rạc (Coverage Core &
MD 19115 Tập thông tin siêu dữ liệu thực thể (Metadata
entity set information
MI 19115-2 Siêu dữ liệu thực thể ảnh (Metadata entity set
imagery)
5 Nền tảng khung
5.1 Kế thừa các khái niệm và thuật ngữ
Các nỗ lực giải quyết vấn đề về tương thích giữa các chuẩn và các đặc tả dữ liệu ảnh và ô lưới bị cảntrở vì trong thực tế các chuẩn và các đặc tả này sử dụng các thuật ngữ khác nhau hoặc sử dụng các thuật ngữ giống nhau để biểu diễn các khái niệm khác nhau Ba thuật ngữ quan trọng (ảnh, lưới quét,
và ma trận) được gán nhiều ý nghĩa dẫn đến sự nhầm lẫn tiềm ẩn Thuật ngữ ảnh, lưới quét và ma trận được định nghĩa trong điều 4 Thuật ngữ “dữ liệu dạng ma trận (matrix data)” trong một vài trường hợp được sử dụng để mô tả một tập các giá trị thuộc tính về đo lường được tổ chức trong mộtlưới Trong một vài ngữ cảnh thuật ngữ này lại hàm ý loại trừ các dữ liệu dạng lưới quét hoặc dữ liệu ảnh Sử dụng thuật ngữ “dữ liệu dạng ma trận” theo hàm ý này thì không đúng vì mâu thuẫn với khái niệm dữ liệu ô lưới và không rõ ràng Thật không may, việc sử dụng phổ biến và thông tục tất cả các thuật ngữ này dẫn đến trùng lặp trùng nhau, và cung cấp một từ điển hạn chế Trong mục 4, các thuậtngữ này đưa ra ý nghĩa kỹ thuật chính xác hơn Tuy nhiên, vì các thuật ngữ này thường xuyên được
sử dụng trong các chuẩn mở hoặc các đặc tả kỹ thuật không chính xác hoặc theo các cách khác, điềuquan trọng là phải hiểu được các ý nghĩa của thuật ngữ đưa ra tương ứng với các trường hợp
5.2 Sự tách biệt giữa phần mang theo và nội dung
Có nhiều chuẩn trao đổi dữ liệu ảnh và dữ liệu ô lưới mô tả các kiểu dữ liệu cho phép, ý nghĩa và các mối quan hệ của các kiểu dữ liệu trong các thuật ngữ định dạng mã hóa đã từng được sử dụng để mang theo dữ liệu Cách tiếp cận này có thể bị hạn chế vì những hạn chế của cơ chế trao đổi và luôn luôn có một số hạn chế được áp dụng trong việc mô tả dữ liệu Bộ tiêu chuẩn thông tin địa lý có một hướng tiếp cận khác để định nghĩa các cấu trúc dữ liệu nơi mà các kiểu dữ liệu được cho phép, ý nghĩa và các mối quan hệ của chúng được định nghĩa theo cách trừu tượng bằng việc sử dụng ngôn ngữ mô hình hóa UML Một hoặc một vài các quy tắc mã hóa khác nhau có thể được áp dụng cho dữ liệu khi đó để mã hóa cho việc truyền tải hoặc lưu trữ trên các phần mang theo dữ liệu khác nhau đó Tất nhiên hướng tiếp cận này không loại trừ các hạn chế vốn có của một vài kỹ thuật mã hóa, hướng tiếp cận này chỉ làm thay đổi vấn đề với quy tắc mã hóa đã từng được sử dụng để mã hóa mô hình trừu tượng thành một định dạng mã hóa đặc thù Đây chính xác là các hạn chế, ví dụ như độ dài bit của các số để hiện ra thì chúng có thể được xử lý bằng các ngoại lệ trong việc mã hóa nếu cần thiết Bởi vì có một lượng lớn các dữ liệu liên quan, nên tách biệt giữa phần mang theo và nội dung của dữ liệu ảnh, dữ liệu ô lưới và dữ liệu phủ là đặc biệt quan trọng
Mô hình tham chiếu ISO/TS 19101 - 2 cho hình ảnh thông tin địa lý sử dụng các khái niệm của Mô hình tham chiếu cho xử lý phân tán mở (RM-ODP) trong tiêu chuẩn ISO/IEC 10746 Khái niệm của ISO/TS 19101 -2 và RM-ODP là việc tổ chức các hệ thống theo năm quan điểm nhìn nhận khác nhau
“Nhìn nhận theo khía cạnh thông tin” có liên quan đến mặt ngữ nghĩa của thông tin và xử lý thông tin Điều này khác với “nhìn nhận theo khía cạnh tính toán” liên quan đến sự tương tác giữa các dịch vụ
mà là một phần của hệ thống lớn hơn bao gồm việc mã hóa dữ liệu để trao đổi Điều này cũng khác biệt với quan điểm “kỹ thuật” hoặc “công nghệ” liên quan đến việc triển khai và cơ sở hạ tầng Các
Trang 7nhìn nhận của RM-ODP và các ứng dụng của chúng đối với hình ảnh được mô tả trong ISO 19101 - 2:2008, trong mục 6 tới 9 và Phụ lục B ISO/TS 19101 - 2:2008, mục 7.3.5.1 cũng chỉ ra sự cần thiết phải tách biệt phần mang với nội dung.
Các khái niệm của RM-ODP được củng cố bởi các tiêu chuẩn ISO về Kết nối các hệ thống mở (OSI) ISO/IEC 7498-1 Các tiêu chuẩn OSI chia một hệ thống được thiết kế cho việc trao đổi dữ liệu thành bảy lớp khác nhau Hai lớp cao nhất là “lớp ứng dụng” và “lớp trình diễn” Lớp ứng dụng giải quyết ý nghĩa ngữ nghĩa của việc trao đổi dữ liệu và lớp trình diễn giải quyết việc mã hóa Các lớp thấp hơn cung cấp cơ chế trao đổi OSI hỗ trợ sự tách biệt giữa phần mang và nội dung
Một tập dữ liệu ảnh, ô lưới hoặc dữ liệu phủ được cấu trúc như một tập các đối tượng giá trị phủ bao gồm một ma trận giá trị lưới, các tam giác TIN, các điểm hoặc các cặp giá trị hình học có mô tả của hàm phủ (coverage funtion) và siêu dữ liệu liên kết Khi mã hóa để sử dụng cho trao đổi dữ liệu hoặc lưu trữ dữ liệu có thể mô tả một cách độc lập với việc cấu trúc hóa các dữ liệu này
5.3 Mô hình nội dung
Khái niệm về mô hình nội dung là một phần quan trọng của tài liệu khung này Bộ tiêu chuẩn về thông tin địa lý sử dụng khái niệm của lược đồ ứng dụng Lược đồ ứng dụng là lược đồ khái niệm cho dữ liệu được yêu cầu bởi một hoặc nhiều ứng dụng Mô hình nội dung là nhìn nhận theo hướng thông tin của một lược đồ ứng dụng, chỉ ra thông tin cần thiết để mô tả ngữ nghĩa của dữ liệu, không bao gồm định dạng trao đổi hoặc về trình bày dữ liệu
Mô hình nội dung cho tập dữ liệu ô lưới bao gồm tập giá trị thuộc tính được tổ chức trong một lưới cùng với siêu dữ liệu để mô tả ý nghĩa giá trị thuộc tính và thông tin tham chiếu không gian tới vị trí dữliệu Siêu dữ liệu có thể bao gồm các thông tin về nhận dạng, thông tin chất lượng và các thông tin dữliệu khác mà bộ cảm biến tập hợp được Thông tin tham chiếu không gian bao gồm các thông tin về cách thiết lập giá trị thuộc tính tham chiếu tới trái đất, thông tin tham chiếu không gian được diễn tả như siêu dữ liệu
Các thông tin phụ cũng được diễn tả dưới dạng siêu dữ liệu, nhằm hỗ trợ trình bày hoặc mã hóa Tuy nhiên nội dung cơ bản có thể trình bày theo các cách khác nhau hoặc được mang theo bằng việc sử dụng cơ chế trao đổi khác nhau, trong đó thông tin phụ không là một phần của mô hình nội dung dữ liệu ảnh và ô lưới Hình 1 minh họa cấu trúc đơn giản của dữ liệu ô lưới
Hình 1 - Cấu trúc đơn giản của dữ liệu ô lưới
Các kiểu khác của dữ liệu phủ tương đối đơn giản, bao gồm một tập các đối tượng giá trị phủ và mô
tả của hàm phủ ISO 19123 hỗ trợ lưới phủ bao gồm lưới phủ lục giác, tập điểm, đa giác Thiessen, lưới phủ tứ giác, phủ các đoạn đường cong và TIN
Bộ tiêu chuẩn thông tin địa lý cung cấp một tập các khối xây dựng mà ngoài tất cả các kiểu thông tin địa lý còn bao gồm cả dữ liệu ảnh, dữ liệu ô lưới có thể được kết hợp vào đó Các khối xây dựng này cung cấp các đối tượng thông tin mà có thể được liên kết bằng cách sử dụng lược đồ ứng dụng Điểm mạnh của lược đồ ứng dụng là về cấu trúc dữ liệu và nội dung dữ liệu vì vậy trong trường hợp
dữ liệu ảnh, dữ liệu ô lưới và dữ liệu phủ điểm mạnh là tập các đối tượng giá trị phủ với siêu dữ liệu liên kết
Trang 8Lược đồ ứng dụng nhấn mạnh vào nội dung và cấu trúc dữ liệu, trong trường hợp dữ liệu ảnh, ô lưới
và phủ được nhấn mạnh trong tập các đối tượng có giá trị phủ liên kết với siêu dữ liệu Phương thức
mã hóa và trình bày cấu trúc, nội dung thông tin được tách biệt Bằng việc tách đính kèm với nội dung, mô hình nội dung được xác định tách biệt với quy tắc mã hóa sử dụng cho việc đính kèm hoặc lưu trữ nội dung dữ liệu và tách biệt với quy tắc biểu diễn hoặc các quy tắc sử dụng cho việc trình bàynội dung Có thể bổ sung dữ liệu đính kèm cùng với nội dung dữ liệu để hỗ trợ cho việc trình bày Phương thức mã hóa và biểu diễn cấu trúc thông tin và nội dung được tách biệt với dữ liệu của chúng Bằng việc tách biệt phần mang theo với nội dung, thì mô hình nội dung được định nghĩa một cách tách biệt với quy tắc mã hóa được sử dụng để mang theo hoặc lưu trữ nội dung dữ liệu, tách biệt với quy tắc biểu diễn hoặc các quy tắc được sử dụng để trình bày nội dung Có thể có dữ liệu bổ sung được yêu cầu để mang theo với nội dung dữ liệu, nhằm mục đích hỗ trợ việc trình bày Ví dụ một số lớp hình ảnh trong bảng màu (ánh xạ màu) có thể được định nghĩa bằng cách gán các màu được biểu diễn với các giá trị được mã hóa trong ma trận giá trị lưới
6 Mô hình đối tượng địa lý tổng quát áp dụng cho dữ liệu ảnh và dữ liệu ô lưới
6.1 Các phủ là các đối tượng địa lý
ISO 19109 xác định “đơn vị cơ bản của thông tin địa lý được gọi là một đối tượng” và chỉ ra rằng phương pháp tiếp cận mô hình hóa thông tin địa lý tuân thủ theo kiến trúc 4 lớp được mô tả trong ISO19109:2005, Phụ lục B Mô hình đối tượng địa lý tổng quát định nghĩa trong ISO 19101 được áp dụng cho tất cả thông tin địa lý bao gồm cả dữ liệu ảnh, ô lưới và phủ Trong mô hình tham chiếu trong ISO
19101 một đối tượng được định nghĩa là một “sự chiết xuất của các hiện tượng trong thế giới thực”.Một phủ là một kiểu đối tượng địa lý, phủ khác với các kiểu đối tượng địa lý khác bởi một vài thuộc tính phi không gian của nó được liên kết với các thuộc tính không gian thông qua một hàm phủ, hàm phủ này liên kết các giá trị của các thuộc tính tới vị trí mà liên quan đến các thuộc tính không gian, trong khi các thuộc tính không gian và phi không gian của các kiểu đối tượng địa lý khác độc lập với nhau
Đối với một ảnh ô lưới đơn giản, có thể có một đối tượng địa lý tương ứng với ảnh đó với phần hình học được định nghĩa phù hợp với một cấu trúc lưới Có thể thêm vào một số thuộc tính chủ đề cho đốitượng địa lý, còn các thuộc tính khác được xác định bằng việc sử dụng hàm phủ cho từng vị trí trong phạm vi của hàm
Ưu điểm lớn nhất của việc coi tất cả thông tin địa lý như là các đối tượng địa lý hướng dữ liệu đó là cho phép dữ liệu phủ kết hợp với dữ liệu véc tơ và dữ liệu phủ khác trong một lược đồ ứng dụng đơn giản và trong tập dữ liệu đơn giản Mối quan hệ giữa các đối tượng địa lý của tất cả các kiểu có thể được định nghĩa
Ví dụ về tập dữ liệu kết hợp, một ảnh vệ tinh có thể được phân tích và xác định các tuyến đường Tập
dữ liệu kết hợp bao gồm hình ảnh cùng với một véc tơ biểu diễn các tuyến đường Tập dữ liệu kết hợp sẽ bao gồm đối tượng địa lý tương ứng với ảnh phủ và đối tượng địa lý tương ứng với các tuyến đường
6.2 Mối quan hệ đối tượng địa lý bổ sung
Mô hình đối tượng địa lý tổng quát mô tả trong ISO 19109 chỉ ra các đặc trưng của kiểu đối tượng địa
lý (GF_FeatureType) là các thuộc tính (GF_PropertyType), thuộc tính có ba kiểu đó là GF_Operation, GF_AttributeType, và GF_AssociationRole Các kiểu thuộc tính có thể là GF_TemporalAttributeType, GF_Spatial AttributeType, GF_LocationAttributeType, GF_MetadataAttributeType, hoặc
GF_ThematicAttributeType Vì ISO 19109 được phát triển để xử lý các kiểu dữ liệu véc tơ là chủ yếu,
nó chỉ xác định các thuộc tính không gian thuộc kiểu GM_Object hoặc TP_Object được định nghĩa trong lược đồ không gian trong tiêu chuẩn ISO 19107
7 Khung
7.1 Cấu trúc khung
Khung định nghĩa trong tiêu chuẩn này mô tả mối quan hệ giữa mô hình nội dung và thông tin khác được yêu cầu cho việc trao đổi và trình bày Khung này được xây dựng dựa trên ISO/TS 19101-2 cho
dữ liệu ảnh và dữ liệu ô lưới
Khung này đưa ra năm mẫu cho một loạt các kiểu dữ liệu ảnh, dữ liệu ô lưới và dữ liệu phủ phù hợp với ISO 19123 Một sự lựa chọn nhỏ của các mẫu được cung cấp để định nghĩa khả năng tương thích
cơ bản giữa các tập dữ liệu ảnh, dữ liệu ô lưới và dữ liệu phủ khác nhau Tập hợp các cấu trúc được định nghĩa trước này được biểu diễn như là các mẫu lượng đồ ứng dụng riêng cũng là các mẫu UML Khả năng tương thích có thể đạt được giữa hình ảnh khác nhau và các tiêu chuẩn dữ liệu ô lưới bằngcách bảo đảm rằng nội dung thông tin chung được xác định và có thể được mô tả phù hợp với các mẫu này Như minh họa trong các trường hợp sử dụng được xác định trong Phụ lục B, bốn cấu trúc lưới cơ bản và một cấu trúc phủ phi- lưới được mô tả
Các cấu trúc được định nghĩa cho:
a) Phủ dạng lưới tứ giác liên tục (continuous quadrilateral grid coverage);
Trang 9b) Phủ dạng lưới tứ phân (quadtree grid coverage (Riemann hyperspatial multidimensional grid coverage));
c) Phủ dạng TIN (TIN coverage);
d) Phủ dạng điểm rời rạc (discrete point coverage);
e) Phủ dạng bề mặt lưới rời rạc (discrete surface grid coverage)
Khung dữ liệu ảnh, ô lưới và phủ sử dụng các phần từ định nghĩa trong các chuẩn ISO về thông tin địa lý Hình 2 biểu diễn các gói được áp dụng cho dữ liệu ảnh, ô lưới và phủ Hình này chỉ ra các phần tử liên kết trong khung như thế nào Một nửa các gói được liên kết cung cấp siêu dữ liệu, siêu
dữ liệu này có thể được sử dụng trong liên kết với dữ liệu ảnh và ô lưới
Hình 2 - Tổng quan mối quan hệ bên trong và bên ngoài khung 7.2 Các phần tử của cấu trúc khung
7.2.1 Tổng quan về khung
Dữ liệu ảnh, lưới và phủ được mô tả ở nhiều mức khác nhau như trong Hình 3 dưới đây Đây là các mức: mức khái quát (được diễn tả trong ISO 19123), mức mô hình nội dung và mức mã hóa Việc mã hóa sử dụng các cấu trúc được định nghĩa trong ISO 19118 Điều này cho phép một mã hóa dựa trên XML cũng như cho phép nhiều lược đồ mã hóa riêng biệt Việc mã hóa có thể bao gồm GML (ISO 19136) cùng với JPEG 2000 (ISO 15444), BIIF (ISO 12087-5) hoặc một trong nhiều định dạng mã hóaảnh khác được xác định trong ISO/TR 19121
Hầu hết các chuẩn trao đổi hiện có liên quan đến dữ liệu ảnh, ô lưới và phủ mô tả các thông tin trong các thuật ngữ của việc biểu diễn trong một định dạng trao đổi Định dạng này định nghĩa các trường
dữ liệu và mô tả nội dung, ý nghĩa của các trường dữ liệu này Định dạng trao đổi này cũng ngầm địnhnghĩa nội dung thông tin có thể được mang theo cũng với định dạng trao đổi Một vài chuẩn thậm chí tách phần thông tin của chúng ra khỏi việc mã hóa bên trong việc mô tả chuẩn Nhưng cuối cùng nó là
mã hóa mà định nghĩa các chuẩn này Các mô hình nội dung phổ biến trong tiêu chuẩn này cho phép một ánh xạ tới các cấu trúc dữ liệu được định nghĩa trong các chuẩn mã hóa
Trang 10Hình 3 - Mối quan hệ tổng thể giữa các phần tử của khung 7.2.2 Mức khái quát
Mức khái quát cung cấp một cấu trúc khái quát chung cho tất cả các kiểu hình học phủ bao gồm các hình học dữ liệu ô lưới Cấu trúc khái quát này được định nghĩa trong ISO 19123 Tiêu chuẩn này sử dụng các định nghĩa từ ISO 19123 đó là: hình học phủ, tập điểm, TIN và lưới tứ giác
7.2.3 Mức mô hình nội dung
Một mô hình nội dung của dữ liệu ảnh, ô lưới và phủ mô tả nội dung thông tin của tập thông tin địa lý, bao gồm lược đồ không gian, đối tượng địa lý xác định và siêu dữ liệu liên kết, trong đó các khía cạnhkhác như: chất lượng, tham chiếu địa lý (geo-referencing), được biểu diễn trong siêu dữ liệu Mô hình nội dung không bao gồm việc trình bày, mã hóa hoặc tổ chức dữ liệu để phù hợp với phương tiện lưu trữ và trao đổi Siêu dữ liệu trao đổi mà mô tả thông tin về một trao đổi dữ liệu cũng không là một phần của thông tin được định nghĩa bởi mô hình nội dung
Mức mô hình nội dung của khung này bao gồm một tập các cấu trúc nội dung được định nghĩa trước, các cấu trúc nội dung này đóng vai trò cốt lõi trong các lược đồ ứng dụng để phát triển cho dữ liệu ảnh, ô lưới và phủ Mô hình nội dung tổng quát cho dữ liệu ô lưới bao gồm một tập nhỏ các lưới liên kết với thứ tự ô lưới cung cấp cho tổ chức không gian của dữ liệu ảnh và ô lưới TIN và tập điểm là các cấu trúc phủ phi lưới định nghĩa ở mức mô hình nội dung trong khung này Bên cạnh các lưới này
và các cấu trúc phi lưới là siêu dữ liệu được định nghĩa, chất lượng và tham chiếu không gian Tài liệutham khảo là các tiêu chuẩn ISO về thông tin địa lý cho các phần tử này khi chúng có sẵn
Mô hình đối tượng địa lý định nghĩa trong ISO 19109 áp dụng cho dữ liệu ảnh, ô lưới và phủ Mặc dù cách tiếp cận thông thường được sử dụng trong nhiều tiêu chuẩn hình ảnh mở rộng là xem xét ảnh như một thực thể duy nhất và không xem xét cấu trúc đối tượng Tốt hơn nên xem xét dữ liệu ảnh, ô lưới và phủ như là đối tượng hướng dữ liệu Trong dạng đơn giản nhất, một ảnh, lưới hoặc tập dữ liệu khác được tổ chức như phủ có thể được xem xét như là một đối tượng đơn lẻ Ví dụ một ảnh vệ tinh được xem xét như một biểu diễn của đối tượng mà đối tượng này là sự chiết xuất của các hiện tượng trong thế giới thực, được xem bởi cảm biến tạo ra ảnh Tuy nhiên, nó cũng có thể làm đối tượng được chiết xuất trên một ảnh, nơi các tập điểm ảnh biểu diễn hình học của các đối tượng địa lýkhác nhau Một lược đồ ứng dụng có thể chứa một mô hình đối tượng địa lý, nơi thành phần hình họccủa mô hình đối tượng địa lý bao gồm các tập điểm hình học tương ứng với các phần tử ảnh (các điểm ảnh) Trong một cấu trúc lưới cho một ảnh Nếu một cấu trúc đối tượng địa lý chứa nhiều hơn
Trang 11một đối tượng địa lý được liên kết với một ảnh, thì cấu trúc đối tượng địa lý cần cung cấp một phươngthức để liên kết các ID của đối tượng địa lý tới từng điểm ảnh trong ảnh Ví dụ một ảnh có thể được biểu diễn dưới dạng một lưới đơn bao gồm một tập các hàng và các cột cung cấp tổ chức cho một tậpcác điểm ảnh Mỗi điểm ảnh chứa dữ liệu thuộc tính như là màu sắc, cường độ ánh sáng nhìn thấy tạithời điểm đó Ngoài ra mỗi điểm ảnh có thể chứa một thuộc tính bổ sung, thuộc tính này chỉ ra rằng IDđối tượng địa lý liên kết với điểm ảnh, vì vậy mà các điểm ảnh tương ứng với hình ảnh của một cây cầu được đánh dấu là đối tượng cầu, và các đường tương ứng với một con song được đánh dấu là sông Các cấu trúc khác hiệu quả hơn cũng có thể được định nghĩa để xác định các tập ô lưới hoặc các điểm ảnh tương ứng với một đối tượng được đưa ra.
Một lược đồ ứng dụng cho dữ liệu ảnh, lưới phải tuân theo mô hình đối tượng địa lý tổng quát trong ISO 19109, cùng với các mối quan hệ thêm vào được xác định trong điều 7, và sẽ liên kết các cặp giátrị điểm điều khiển hàm phủ với ít nhất một đối tượng Với dữ liệu ảnh và ô lưới chứa nhiều hơn một đối tượng thì lược đồ ứng dụng sẽ cung cấp một phương thức liên kết các ID đối tượng riêng hoặc tập các cặp giá trị điểm
Chuẩn ISO 19123 cung cấp phạm vi tương đối rộng cho các cấu trúc phủ Trong tiêu chuẩn này, lựa chọn một lưới tứ giác như là một tổ chức dữ liệu ô lưới cơ bản Ngoài ra cấu trúc mô hình nội dung được định nghĩa để hỗ trợ một vài lưới phức hợp ví dụ như là các lưới với ô lưới dạng biến trong không gian 2 và n chiều
Hình 4 minh họa cho cấu trúc dữ liệu dạng lưới, ảnh và phủ trong tiêu chuẩn này
Mô hình nội dung bao gồm cấu trúc không gian và siêu dữ liệu, cấu trúc mã hóa là riêng biệt nhưng cóliên quan đến mô hình nội dung Việc thu gọn dữ liệu là loại bỏ thông tin dựa trên nội dung ngữ nghĩa trong khi nén dữ liệu, là loại bỏ thông tin dựa trên cấu trúc bit độc lập với ý nghĩa Thu gọn dữ liệu là một phần của mô hình nội dung còn nén dữ liệu thì không Một ví dụ của thu gọn dữ liệu là loại bỏ thông tin mà ứng dụng không cần thiết Nén dữ liệu loại bỏ các thông tin không cần thiết xuất hiện ngẫu nhiên, ví dụ chiều dài của 1 bit trong hệ thống có thể xóa và nén mã hóa chiều dài Cả hai kiểu đều giảm kích thước tập dữ liệu nhưng thu gọn dữ liệu là một phần của cấu trúc mã hóa, trong khi đó nén dữ liệu là một phần của mô hình nội dung
CHÚ THÍCH: siêu dữ liệu xuất hiện ở các mức khác nhau Siêu dữ liệu ngữ cảnh là một phần của mô hình nội dung như là phần của điểm nhìn thông tin trong khi mã hóa và trình bày là một phần của điểm nhìn theo hướng kỹ thuật trong RM-ODP
Hình 4 - Sơ đồ thành phần dữ liệu ảnh và ô lưới
Trang 12Hình 5 minh họa tổng quan mô hình nội dung cho dữ liệu ảnh, lưới và phủ Hình này là mở rộng của Hình 4, phần thể hiện cấu trúc và trình bày thông tin không được biểu diễn vì không thuộc mô hình nộidung Cơ chế thu gọn dữ liệu không được biểu diễn trực tiếp vì liên quan đến cấu trúc của ma trận giátrị lưới Ví dụ một mạng lưới sắp xếp dạng lắp ghép thể hiện thu gọn dữ liệu khi các miếng ghép chỉ được xác định cho những vùng dữ liệu có thể Thu gọn dữ liệu cũng tồn tại trong cấu trúc ô kích thước dạng biến khi các điểm ảnh lân cận của các giá trị thuộc tính giống nhau có thể kết tập trong một ô đơn lớn hơn.
Thu gọn dữ liệu liên quan tới tổ chức dữ liệu Một cây tứ phân biểu diễn thu gọn dữ liệu tới các ô kích thước dạng biến Điều này cũng đúng cho một TIN với tam giác kích thước dạng biến Việc nén dữ liệu nói chung là cầu nối giữa thông tin và các mức kỹ thuật, cần có cấu trúc thông tin ở mức mô hình thông tin trong khung nhìn thông tin để có thể giảm được khối lượng dữ liệu cho quá trình nén dữ liệu
ở mức kỹ thuật
Hình 5 - Các thành phần trong mô hình nội dung của dữ liệu ảnh và ô lưới
7.3 Mức mã hóa
7.3.1 Định dạng trao đổi và phương tiện lưu trữ
ISO 19118 định nghĩa qui tắc mã hóa là: “Một tập xác định của các qui tắc chuyển đổi mà định nghĩa việc mã hóa cho một cấu trúc dữ liệu cụ thể” Các quy tắc mã hóa chỉ ra các kiểu dữ liệu được chuyểnđổi cũng như cú pháp, cấu trúc và lược đồ mã hóa được sử dụng trong các cấu trúc dữ liệu kết quả.Một quy tắc mã hóa được áp dụng cho lược đồ ứng dụng chỉ rõ cấu trúc dữ liệu để tạo ra hệ thống cấu trúc dữ liệu độc lập phù hợp với việc truyền tải hoặc lưu trữ Quy tắc mã hóa này cũng định nghĩamột dịch vụ mã hóa thực hiện việc đọc cấu trúc dữ liệu đầu vào để chuyển đổi các trường hợp cụ thể thành cấu trúc dữ liệu đầu ra và ngược lại
Mô hình nội dung định nghĩa cấu trúc để một quy tắc mã hóa có thể áp dụng Có rất nhiều các phương thức mã hóa khác nhau sử dụng cho dữ liệu ảnh, ô lưới và dữ liệu phủ Nhiều phương thức
mã hóa được sử dụng rộng rãi cho các chuẩn định dạng trao đổi ISO/TS 19101-2:2008, điều 7.3.5
mô tả bốn kiểu mã hóa thông dụng và sáu lược đồ nén dữ liệu sử dụng trong mã hóa Một dạng mã hóa đó là JPEG 2000 với file liên kết XML hoặc GML theo ISO 19136 liên kết tới dữ liệu JPEG 2000
Dữ liệu ô lưới và phủ là một trong những cấu trúc dữ liệu thông tin địa lý đơn giản nhất Tuy nhiên những tập dữ liệu này là các mảng lớn, bao gồm một lượng lớn các phần tử ảnh, các ô lưới, các điểmhoặc các tam giác giá trị TIN Có hai tập thông tin khác nhau được mã hóa đó là các phần tử giá trị (các điểm ảnh, ô lưới, điểm hoặc tam giác giá trị) và siêu dữ liệu của các giá trị phần tử này Các tập này được mã hóa theo chuẩn tích hợp giống nhau hoặc dưới dạng hai bộ thông tin được liên kết riêng
Trang 13biệt Ngoài ra hầu hết các quy tắc mã hóa dữ liệu ảnh, lưới và phủ đều bao gồm luôn cả các quy tắc nén dữ liệu để giảm lượng dữ liệu của giá trị phần tử dữ liệu.
Có một số các tiêu chuẩn ISO được phát triển trong hệ thống tiêu chuẩn ISO/IEC JTC 1 về công nghệthông tin mà được chỉ định để mã hóa hình ảnh và dữ liệu ảnh, các dữ liệu này có thể áp dụng các cấu trúc mô hình nội dung được định nghĩa trong tiêu chuẩn này Các tiêu chuẩn có thể được áp dụngbao gồm các tiêu chuẩn của ISO/IEC JTC 1/SC29 và ISO/IEC JTC 1/ SC 24 Các tiêu chuẩn này nên được sử dụng Ngoài ra cũng có một số các tiêu chuẩn thương mại hoặc các tiêu chuẩn thuộc các tổ chức khác cũng có thể sử dụng ISO/TR 19121 báo cáo kết quả khảo sát về các tiêu chuẩn này
Để thúc đẩy việc tương thích trong trao đổi dữ liệu thì cần có một định dạng mã hóa trung lập phổ biến ngay cả khi định dạng đó không phải là tối ưu cho tập dữ liệu cụ thể Một mã hóa trung lập bao gồm việc sử dụng mã hóa XML để mô tả siêu dữ liệu của dữ liệu ảnh, ô lưới và phủ và một cơ chế mãhóa phần tử giá trị riêng thuộc bộ tiêu chuẩn ISO/IEC JTC 1/SC 29 về mã hóa hình ảnh mà hỗ trợ việcnén Một chuẩn cụ thể là ISO 15444 có thể sử dụng cùng với mã XML như một mã hóa trung lập Chi tiết của mã hóa này nằm ngoài phạm vi của tiêu chuẩn này
7.3.2 Các quy tắc mã hóa
ISO 19118 qui định một số quy tắc mã hóa khác nhau sử dụng để mã hóa thông tin địa lý phù hợp vớimột ngữ cảnh cụ thể Mã hóa XML được biểu diễn như là mã hóa trung lập để hỗ trợ trao đổi không rõràng Các kỹ thuật mã hóa gán các mẫu bit cho các phần tử dữ liệu và đóng gói dữ liệu để chỉ ra nơi
mà các phần tử dữ liệu bắt đầu và kết thúc trong một luồng dữ liệu Có một số phương pháp đóng gói
có sẵn Phổ biến nhất là phương pháp giới hạn thẻ, chẳng hạn như sử dụng trong XML hoặc phương thức con trỏ có luồng bit dài, ví dụ như sử dụng trong ISO 8211 và ISO 8825 Một số kỹ thuật xây dựng việc đóng gói vào cấu trúc mã hóa Điều này có thể có hiệu quả đối với các mảng dữ liệu lớn thông thường cũng như là có hiệu quả đối với các tập dữ liệu ô lưới Tất cả các kỹ thuật đóng gói bao gồm các thông tin bổ sung để phân định và xác định các phần tử nội dung Đây được gọi là chi phí mãhóa Khối lượng lớn liên quan đến dữ liệu ảnh, ô lưới yêu cầu sử dụng các kỹ thuật giảm thiểu chi phí này Tiêu chuẩn kỹ thuật này không định nghĩa các quy tắc mã hóa
Nội dung thông tin được mô tả phù hợp với lược đồ ứng dụng mô tả trong tiêu chuẩn này được đóng gói và mã hóa sử dụng các quy tắc mã hóa khác nhau phù hợp với ngữ cảnh trao đổi dữ liệu
7.4 Trình bày dữ liệu ảnh và ô lưới
Thông tin điều khiển việc mô tả định dạng một phần của mô hình nội dung, mặc dù cơ chế của việc trình bày thì nằm ngoài phạm vi của tiêu chuẩn này Kiểu thông tin có thể cần được mang theo cung với tập dữ liệu ảnh và ô lưới nhằm hỗ trợ cơ chế trình bày mở rộng bao gồm các thông tin về hệ thống màu sắc, giá trị thuộc tính màu sắc và giá trị dữ liệu có thể được tải lên trong bảng màu LUT
7.5 Quan hệ đối tượng địa lý cho các bảng LUT
Kiểu giá trị của một ảnh có thể được mã hóa bằng việc sử dụng bảng màu LUT Giá trị trong lưới được mã hóa tương ứng với các màu sắc Một mã trong ma trận giá trị được sử dụng như một địa chỉtrong bảng LUT tương ứng với các giá trị màu sắc Màu sắc trong LUT được sắp xếp theo một thuật toán với hàm nội suy để xác định cho phủ, nếu không có hàm nội suy thì màu sắc có thể được xác định theo một trật tự tùy ý Hình 6 minh họa cách sử dụng của một LUT
Trang 14Hình 6 - Cách sử dụng của một màu sắc trong bảng LUT
8 Tham chiếu không gian của dữ liệu ảnh, ô lưới và phủ
Tham chiếu không gian cho dữ liệu ô lưới, dữ liệu dạng tập điểm, và dữ liệu TIN được xử lý khác nhau Dữ liệu tập điểm bao gồm một tọa độ vị trí trực tiếp tương ứng với mỗi điểm trong tập điểm, dữ liệu ô lưới tham chiếu đến lưới, dữ liệu TIN bao gồm vị trí trực tiếp tương ứng với mỗi đỉnh tam giác TIN Hai thuộc tính không gian của dữ liệu ô lưới mô tả không gian mở rộng được sắp xếp theo kiểu lắp ghép trong các đơn vị nhỏ và tham chiếu không gian tới bề mặt trái đất Tham chiếu không gian được mô tả trong ISO/TS 19101-2 và ISO/TS 19130
9 Cấu trúc dữ liệu ảnh, ô lưới và phủ (IGCD)
9.1 Cấu trúc IGCD và siêu dữ liệu
Một mẫu cấu trúc tổng quát của dữ liệu ảnh, ô lưới và phủ được đưa ra trong Hình 7 dưới đây, chỉ ra một tập dữ liệu bao gồm tập hợp của một hoặc nhiều phủ với siêu dữ liệu liên kết Các khái niệm về những thay đổi của tập dữ liệu giữa các định dạng trao đổi khác nhau, được sử dụng để mang theo
dữ liệu Vì lý do này mà có khái niệm về sự chuyển giao (transmittal) Một sự chuyển giao xác định các thông tin được trao đổi, có thể là một tập dữ liệu, một phần của tập dữ liệu hoặc một loạt các tập
dữ liệu Có nhiều định dạng trao đổi hỗ trợ khái niệm chuyển giao, nhưng theo các phương thức khác nhau Trong một vài trường hợp một định dạng trao đổi cho phép trao đổi toàn bộ tập dữ liệu Một vài trường hợp khác thì cho phép trao đổi một phần của tập dữ liệu, với trường hợp này thì cơ chế chuyển giao sẽ cung cấp thông tin cần thiết để xác định phần dữ liệu được trao đổi Cơ chế cập nhật
là một kiểu đặc tả trong một phần của tập dữ liệu trao đổi Một vài định dạng trao đổi cũng cho phép trao đổi nhiều tập dữ liệu logic trong một lần truyền
Khái niệm về sự chuyển giao được hỗ trợ khác nhau ở các chuẩn trao đổi khác nhau, nhưng việc chuyển đổi giữa các cấu trúc chuyển giao là tương đối dễ dàng Tập dữ liệu đầy đủ có thể được chia
ra làm các phần hoặc bộ phận khác nhau thành các tập dữ liệu kết tập Hình thức của sự chuyển giaonày sử dụng ứng dụng có tính phụ thuộc cao Một vài định dạng phù hợp với dữ liệu có dung lượng lớn, một vài định dạng khác lại phù hợp với việc trao đổi dữ liệu từng phần nhỏ như trong dịch vụ trựctuyến hoặc cơ chế cập nhật
Tập dữ liệu bao gồm tập hợp của một hoặc nhiều phủ Một phần của một phủ cũng chính là một phủ, các phủ có thể có nhiều thể hiện cụ thể của cùng một kiểu hoặc các kiểu khác nhau
Liên kết với mỗi tập dữ liệu và tập hợp là siêu dữ liệu Siêu dữ liệu được tổ chức theo các cách khác nhau, và các định dạng trao đổi khác nhau hỗ trợ các phần tử siêu dữ liệu khác nhau theo các cách khác nhau Tiêu chuẩn này phân chia siêu dữ liệu liên kết cho dữ liệu ảnh, lưới và phủ theo các phân loại Việc này hỗ trợ ánh xạ siêu dữ liệu giữa mô hình nội dung của các kiểu dữ liệu và các định dạng trao đổi hỗ trợ các cấu trúc Phần đầu tiên là ngữ cảnh siêu dữ liệu mô tả về môi trường hoặc ngữ
Trang 15cảnh dữ liệu, và nội dung siêu dữ liệu về ngữ nghĩa hoặc ý nghĩa của dữ liệu hoặc có thể chia nhỏ hơn nữa như chất lượng, cấu trúc siêu dữ liệu Tuy nhiên không có quy định tuyệt đối nào cho việc xác định các phần tử siêu dữ liệu này Một thuộc tính trong định dạng trao đổi này có thể là siêu dữ liệu trong định dạng khác, ở mức độ thông tin hoặc mức độ khác thì một tập giá trị các đối tượng là siêu dữ liệu Siêu dữ liệu vẫn bất biến với định dạng trao đổi hoặc phương tiện lưu trữ là nội dung siêu dữ liệu, phần còn lại là ngữ cảnh siêu dữ liệu Sự phân chia thành bốn kiểu cũng liên quan tới chuẩn ISO sử dụng để mô tả siêu dữ liệu Siêu dữ liệu khai phá được mô tả trong ISO 19115, và siêu
dữ liệu cấu trúc cũng được mô tả trong ISO 19115 và ISO 19115-2, ISO 19115 và ISO 19115-2 là các danh sách mở rộng của các phần tử siêu dữ liệu có khả năng áp dụng Sự thu nhận và các phần tử siêu dữ liệu chất lượng cũng có thể được lấy từ danh sách này ISO/TS 19130 và ISO/TS 19138 cũngcung cấp thêm các phần tử siêu dữ liệu Siêu dữ liệu khai phá có thể áp dụng cho một tập dữ liệu trong đó với bất kỳ một tập dữ liệu nào cũng đều có thể được xác định Tất cả các siêu dữ liệu đều chứa siêu dữ liệu khám phá áp dụng cho một tập hợp
Hình 7 - Cấu trúc IGCD và siêu dữ liệu 9.2 Các lớp cấu trúc khung
9.2.1 Lớp IF_DataSet
Một tập dữ liệu là một tập hợp xác định của dữ liệu được biểu diễn trong một định dạng trao đổi hoặc lưu trữ trên một phương tiện lưu trữ Một tập dữ liệu có thể biểu diễn tất cả hoặc một phần của tập hợp và có thể bao gồm một hoặc nhiều phần ghép của dữ liệu Nội dung của tập dữ liệu được định nghĩa bởi các đặc điểm kỹ thuật sản phẩm cho kiểu sản phẩm dữ liệu cụ thể và thường phù hợp với việc sử dụng dữ liệu đó Đặc điểm kỹ thuật sản phẩm cho một loại hình sản phẩm dữ liệu cụ thể cần phải mô tả tổ chức của sản phẩm dữ liệu đó Ví dụ, một sản phẩm hình ảnh có thể chỉ có một lưới phủ
và một lược đồ lắp ghép để chỉ ra rằng mỗi tập dữ liệu đều chứa một phần ghép Các sản phẩm phứctạp hơn có thể bao gồm một số các phủ và nhiều lược đồ lắp ghép phức tạp như cây tứ phân dựa trên lược đồ lắp ghép có kích thước dạng biến Tập dữ liệu là thực thể logic có thể được xác định bởi siêu dữ liệu liên kết không phải là thực thể vật lý của sự trao đổi Lớp IF_DataSet triển khai lớp DS_DataSet được mô tả trong ISO 19115
cơ chế trao đổi siêu dữ liệu khác cần thiết cho việc định tuyến và phân phối của sự chuyển giao Một
cơ chế trao đổi phổ biến sẽ mang theo toàn bộ tập dữ liệu trên một phương tiện vật lý ví dụ như một đĩa CD - ROM Thông tin siêu dữ liệu chuyển giao không được hiển thị ngoại trừ các thông tin trong
mô đun siêu dữ liệu khám phá, việc này phụ thuộc vào cơ chế sử dụng để trao đổi và có thể khác nhau giữa các phương tiện trao đổi hay định dạng mã hóa này với phương tiện trao đổi hay định dạng
mã hóa khác Ví dụ về sự chuyển giao siêu dữ liệu đó là việc đếm số lượng các byte dữ liệu trong mộtđơn vị trao đổi
9.2.3 Lớp IF_DiscoveryMetadata