Hệ thống thông tin thủy văn CUAHSI (HIS) là một hệ thống dựa trên internet để chia sẻ dữ liệu thủy văn. Nó bao gồm cơ sở dữ liệu và máy chủ, kết nối thông qua các dịch vụ web, các ứng dụng của khách hàng, cho phép xuất bản, phát hiện và truy cập dữ liệu. Hệ thống thông tin thủy văn CUAHSI (HIS) đã được phát triển như một mạng lưới phân phối về mặt địa lý của nguồn dữ liệu thủy văn và sử dụng dịch vụ web để kết nối các dữ liệu với nhau.
Trang 1MỤC LỤC
I Tổng quan CUAHSI 2
II Mô hình dữ liệu quan trắc ODM 3
1 Định nghĩa ODM 3
2 Mô tả cấu trúc 5
3 Ý nghĩa các bảng 6
4 Mối quan hệ giữa các bảng 33
III Demo ứng dụng CUAHSI 39
PHỤ LỤC: WaterML và WaterOneFlow 48 Tài liệu tham khảo
Trang 2I Tổng quan về CUAHSI
Hệ thống thông tin thủy văn CUAHSI (HIS) là một hệ thống dựa trên internet để chia sẻ
dữ liệu thủy văn Nó bao gồm cơ sở dữ liệu và máy chủ, kết nối thông qua các dịch vụ web, các ứng dụng của khách hàng, cho phép xuất bản, phát hiện và truy cập dữ liệu
Hệ thống thông tin thủy văn CUAHSI (HIS) đã được phát triển như một mạng lưới phân phối về mặt địa lý của nguồn dữ liệu thủy văn và sử dụng dịch vụ web để kết nối các dữ liệu với nhau
Hệ thống HIS để lưu trữ và xử lý dữ liệu bao gồm:
- Trung tâm HIS - chứa các bản sao của siêu dữ liệu nhằm tạo điều kiện tìm kiếm; hoạt động như một công cụ tìm kiếm, trong đó nó thu thập siêu dữ liệu từ các máy chủ và cho phép các máy khách được tìm kiếm những dữ liệu đó
- HydroServer – lưu trữ, tổ chức và công bố dữ liệu; cho phép siêu dữ liệu được thu thập bằng Trung tâm HIS và dữ liệu được chia sẻ với máy khách
- Máy khách (client) (như HydroDesktop) - cung cấp cho người dùng một giao diện thuận tiện để truy cập dữ liệu; lấy siêu dữ liệu từ Trung HIS và lấy dữ liệu từ HydroServers
Ba loại dịch vụ web cho phép các máy tính giao tiếp qua mạng Internet:
- Dịch vụ dữ liệu - cho phép dữ liệu nước và các dữ liệu không gian có liên quan được lấy ra bởi các Client (như HydroDesktop)
Trang 3- Dịch vụ tìm kiếm - cho phép các máy khách để thực hiện tìm kiếm dữ liệu ở Trung tâm HIS
- Dịch vụ siêu dữ liệu - cho phép trung tâm HIS lấy dữ liệu cần thiết để xây dựng danh mục tìm kiếm
Ứng dụng của HIS:
- Tích hợp dữ liệu từ nhiều nguồn khác nhau, đây là những nghiên cứu mà trước đó chưa thực hiện được
- Phát hiện dữ liệu, giao tiếp dữ liệu với các mô hình, giao tiếp với thiết bị cảm biến
- Nhận dạng công việc, hỗ trợ ấn phẩm nghiên cứu
- Công bố dữ liệu được uỷ quyền của cơ quan tài trợ
- Để hỗ trợ khoa học ở Mỹ và thúc đẩy hợp tác
- Chuẩn hóa truy cập dữ liệu (cả trong lẫn ngoài)
- Tiết kiệm thời gian trong việc phát triển một hệ thống xuất bản
- Mang lại lợi ích công cộng
- Hoàn vốn đầu tư - những người có thể nhận được dữ liệu mình mà không đòi hỏi một "người trung gian”
- Kết nối dữ liệu giữa các nước
Cách tương tác với CUAHSI-HIS:
- Data User: Dữ liệu người dùng - tìm kiếm dữ liệu, lấy dữ liệu, tổ chức dữ liệu, phân tích dữ liệu hoặc sử dụng dữ liệu cho mô hình
- Data Publishers: Nhà xuất bản dữ liệu - tổ chức dữ liệu, lưu trữ dữ liệu phục vụ cho khách hàng
- Tool and Technique Developers: Nhà phát triển công cụ và kỹ thuật - tạo và chia sẻ các công cụ bổ sung và các kỹ thuật tương thích với hệ thống CUAHSI-HIS Trong khi CUAHSI-HIS đã phát triển rất nhiều các công cụ chính và kỹ thuật cho HIS, nhóm nghiên cứu chỉ sản xuất một vài trong số đó để có thể được tích hợp vào hệ thống này Điều này
mở nhiều cơ hội cho những người khác, trong cộng đồng thủy văn, góp phần xây dựng HIS, bằng cách phát triển các công cụ bổ sung và kỹ thuật
Một ứng dụng của CUAHSI HIS là một lược đồ CSDL tiêu chuẩn để sử dụng trong việc lưu trữ các điểm quan sát trong một CSDL quan hệ Nó được gọi là mô hình dữ liệu quan trắc (ODM) và được thiết kế cho phép phân tích toàn diện về thông tin được thu thập bởi nhiều nhà điều tra cho các mục đích khác nhau
II Mô hình dữ liệu quan trắc ODM
1 Định nghĩa ODM
ODM là một lược đồ đại diện cho các điểm quan trắc, sử dụng các bảng liên kết với nhau
bởi các mối quan hệ giữa các trường
Ứng dụng:
Trang 4- Mở rộng khả năng phân tích dữ liệu
- Lưu trữ các quan trắc thủy văn bằng siêu dữ liệu
- Cấu trúc đơn giản, có thể dung để lưu trữ những dữ liệu khác
- Truy vấn dễ dàng, hỗ trợ cho việc phân tích dữ liệu
- Mở rộng quan sát thông qua CUAHSI
ODM đáp ứng mọi nhu cầu trong cộng đồng thủy văn cho một cấu trúc CSDL quan
trắc, trình bày quan trắc từ nhiều nguồn khác nhau và nhiều loại khác nhau trong một cấu trúc thích hợp
Nó được thiết kế để mở rộng khả năng phân tích dữ liệu bằng cách cung cấp một cấu trúc chuẩn để chia sẻ dữ liệu giữa các nhà điều tra và tạo điều kiện phân tích thông tin từ các nguồn khác nhau cả trong một khu vực nghiên cứu đơn lẻ hoặc đài quan sát
thủy văn
ODM còn được thiết kế để lưu trữ các quan sát thủy văn với đầy đủ thông tin phụ trợ
(siêu dữ liệu) liên quan đến các dữ liệu cung cấp cho việc theo dõi những dữ liệu trước đó
từ những số liệu thô đến những thông tin hữu dụng cho phép chúng ta có thể giải thích một cách rõ rang và sử dụng chúng
Mặc dù thiết kế đặc biệt với các dữ liệu quan sát thủy văn trong bộ nhớ, mô hình dữ
liệu này có một cấu trúc đơn giản và nói chung nó cũng sẽ chứa được các dữ liệu khác,
chẳng hạn như từ đài quan sát môi trường khác hoặc từ mạng lưới quan sát
ODM sử dụng cấu trúc CSDL quan hệ để cho phép truy vấn dễ dàng và hỗ trợ cho việc phân tích dữ liệu thu được
Sự phụ thuộc vào CSDL và các bảng trong CSDL cũng cung cấp khả năng mở rộng mô hình từ các quan sát của một điều tra viên trong một dự án khi chỉ thông qua các liên kết cộng đồng điều tra với một đài quan sát thủy văn và cuối cùng là toàn bộ các quan sát có sẵn cho cộng đồng CUAHSI
ODM là trọng tâm trong quan trắc được thực hiện tại một điểm Một mô hình CSDL quan hệ với các quan trắc riêng lẻ được ghi nhận là hồ sơ cá nhân đã được lựa chọn để cung cấp sự linh hoạt tối đa trong phân tích dữ liệu thông qua khả năng truy vấn và chọn các bản ghi quan trắc Cách tiếp cận này mang gánh nặng của siêu dữ liệu mức kỷ lục, vì vậy nó không phải là thích hợp cho tất cả các biến có thể được quan sát thấy Ví dụ, cá nhân giá trị điểm ảnh trong hình ảnh viễn thám lớn hoặc lưới không phù hợp với mô hình này
Mô hình dữ liệu này được trình bày như là một mẫu chung cho một CSDL quan sát điểm, không có tài liệu tham khảo để thực hiện cụ thể trong một hệ thống quản lý CSDL Điều này được thực hiện để thiết kế tổng thể không giới hạn bất kỳ phần mềm độc
quyền cụ thể Chúng ta có thể thực hiện ODM trong một loạt các hệ thống quản lý CSDL
Trang 5quan hệ, hoặc thậm chí trong một tập hợp các bảng văn bản hoặc mảng biến trong một chương trình máy tính
2 Mô tả cấu trúc
Quan trắc thủy văn được xác định bởi các đặc điểm cơ bản sau đây:
- Các vị trí mà tại đó các quan trắc đã được thực hiện (không gian)
- Ngày và thời gian mà thực hiện quan trắc (thời gian)
- Các biến mà đã được quan trắc, chẳng hạn như dòng chảy, độ cao mặt nước, nồng
độ chất lượng nước, vv (biến)
Ba đặc điểm cơ bản có thể được biểu diễn như là một khối dữ liệu hình lập phương, mục tiêu quan sát D tại vị trí quan sát dữ liệu L, thời gian quan sát (T), và biến quan sát (dòng chảy, lượng mưa …) (V), tạo thành D (L, T, V)
Ngoài những đặc điểm cơ bản còn có nhiều thuộc tính phân biệt khác đi kèm với dữ liệu quan sát
Ví dụ, vị trí của một điểm quan trắc có thể được thể hiện như là một chuỗi văn bản, hoặc như vĩ độ và kinh độ để xác định được vị trí chính xác của các điểm quan trắc Các thuộc tính khác có thể cung cấp bối cảnh quan trọng trong việc giải thích các dữ liệu quan sát Chúng bao gồm các ý kiến dữ liệu đủ điều kiện và thông tin về các tổ chức thu thập dữ liệu
Nguyên tắc thiết kế cơ bản quyết định việc liên kết với ODM bao gồm việc chọn những thông tin phụ trợ nào sẽ được đưa vào CSDL và hay lưu trong một bảng riêng biệt với một trường đặt làm khóa chính để liên kết với các bảng phụ trợ khác Bảng 1 trình bày các thuộc tính chung liên quan đến một quan sát thời điểm đó chúng tôi đánh giá nên được bao gồm trong thiết kế ODM chung
Trang 6Thuộc tính Định nghĩa
DataValue Bảng dùng để liên kết tất cả các bảng phụ trợ lại với nhau
Accuracy Độ chính xác về cách thức quan trắc đối của những giá trị quan trắc
Date and time Ngày giờ quan trắc, thường tuân theo hệ UTC
Variable Name Tên của những thuộc tính quan trắc: dòng chảy, lượng mưa, nhiệt độ
Speciation Những thông số quan trắc: QT nước: N, NH 4 , NO 3
Location Vị trí quan trắc, thường là dung hệ tọa độ (longtude/latitude)
Units Hê thống đơn vị của các giá trị quan trắc được
Interval Khoảng thời gian trên mà mỗi quan trắc được thu thập
Offset Khoảng cách giữa điểm đại diện quan trắc với vị trí quan trắc
Offset Type/
Reference Point
Điểm tham chiếu của các điểm quan trắc từ vị trí được đo (bề mặt như nước, bờ suối,
bề mặt tuyết) Data Type Cách thức đo (ví dụ như đo liên tục, tối thiểu, tối đa, hoặc đo lường tích lũy)
Organization Tổ chức cung cấp hệ thống đo lường
Censoring Chỉ số cho biết các quan trắc có được kiểm duyệt hay không
Data Qualifying
Comments
Ghi chú kèm theo dữ liệu có thể ảnh hưởng đến cách dữ liệu được sử dụng hoặc giải thích (ví dụ như thời gian nắm giữ vượt quá, mẫu bị ô nhiễm, tạm thời đối tượng dữ liệu thay đổi, vv)
Source Thông tin về nguồn gốc của các quan trắc (ví dụ từ một tổ chức cụ thể, cơ quan, hoặc
điều tra cơ sở dữ liệu bên thứ 3) Sample Medium Môi trường mà mẫu được thu thập (ví dụ như nước, không khí, trầm tích, vv
Value Category Chỉ số cho biết giá trị dữ liệu đại diện cho một phép đo thực tế, giá trị tính toán, hoặc
là kết quả của một mô hình mô phỏng
3 Ý nghĩa của các bảng trong cấu trúc ODM
Sau đây là mô tả các bảng trong mô hình quan sát dữ liệu, danh sách các trường có trong mỗi bảng, mô tả các dữ liệu chứa trong từng trường và kiểu dữ liệu của nó , ví dụ các trường lưu trữ thông tin sao cho phù hợp, hạn chế của mỗi trường, và thảo luận về cách tổ chức các trường dữ liệu cho hợp lý
Mỗi bảng dưới đây bao gồm một cột "ràng buộc" Giá trị trong cột này chỉ định mỗi trường trong bảng là một trong những điều sau đây:
Bắt buộc (M) - Một giá trị trong trường này là bắt buộc và không thể NULL
Tùy chọn (O) - Một giá trị trong trường này là tùy chọn và có thể NULL
Lập trình xuất phát (P) - Thừa hưởng từ các trường trước đó Giá trị trong trường này
sẽ tự động được cập nhật như là kết quả của một truy vấn và không bắt buộc người sử dụng phải nhập vào
Trang 7Bổ sung những hạn chế là dữ liệu bổ sung trong cột Constraint Ngoài ra, khi bổ sung vào, mỗi bảng có chứa một cột "Default Value" Giá trị trong cột này là giá trị mặc định cho các trường liên quan
Trang 93.1 Monitoring Site Locations
trí lấy mẫu
Duy nhất Khóa chính SiteCode Text (50) Mã được sử dụng bởi tổ chức
thu thập các dữ liệu để xác định các vị trí
“10109000”
(USGS Gage number)
M Duy nhất
SiteName Text
(255)
Tên đầy đủ của vị trí lấy mẫu Logan River
Above State Dam, Near Logan,Ut
M Cannot contain tab, line feed, or carriage return characters
(>=-90 and V=90
Longitude Real Kinh độ thập phân Đông tích
cực, tiêu cực Tây
-100.47 M
(>= -180 and
<= 360) LatLongDatumI
D
Integer Định danh tham chiếu đến hệ
thống quan hệ không gia của vĩ
độ và kinh độ trong bảng SpatialReferences
Khóa ngoại
0
Elevation_m Real Độ cao của vị trí lấy mẫu (m)
Nếu giá trị này không được cung cấp nó cần phải được thu được từ lập trình mô hình DEM dựa trên thông tin địa điểm
LocalProjectionI
D
Integer Định danh tham chiếu đến hệ
thống quan hệ không gian của
Khóa ngoại
NULL
Trang 10các tọa độ địa phương trong bảng SpatialReferences
Trường này là cần thiết nếu tọa
độ địa phương được đưa ra
PosAccuracy_m Real Giá trị chính xác mà các thông
tin vị trí được xác định bằng mét
NULL
Comments Text
(unlimite d)
1 Trường SiteID là khóa chính, phải là một số nguyên duy nhất, và không thể là NULL Trường này cần được thực hiện như một trường số tự động / nhận dạng
2 Trường SiteCode là một văn bản mô tả về vị trí thu thập dữ liệu Các giá trị trong trường này phải là duy nhất và có thể là một thay thế cho bảng SiteCodes không thể chứa bất kỳ
ký tự khác với AZ, 0-9, thời gian, dấu gạch ngang ".", "- ", Và nhấn mạnh "_"
3 Trường LatLongDatumID là khóa chính Các giá trị trong trường này phải tương ứng với một giá trị trong trường SpatialReferenceID của bảng SpatialReference Nếu mốc đo không xác định được thì mặc định là 0
4 Nếu trường Elevation_m được nhập với một giá trị số phải có một giá trị tương ứng được xác định trong trườngVerticalDatum TrườngVerticalDatum chỉ có thể được nhập từ những thuật ngữ đã được sử dụng từ bảng VerticalDatumCV Nếu không xác định được mốc Datum thì sử dụng giá trị mặc định là “Unknown”
5 Nếu các trường LocalX và LocalY được nhập với giá trị số phải có một giá trị tương ứng được xác định trong trường LocalProjectionID Các giá trị trong trường này phải tương
Trang 11ứng với một giá trị trong trường SpatialReferenceID của bảng SpatialReference Nếu hệ thống tham chiếu không gian của các tọa độ địa phương là không rõ thì sử dụng giá trị mặc định là 0
6 Nếu SiteType được xác định, nó phải sử dụng một thuật ngữ từ bảng SiteType CV
3.1.2 Bảng SiteTypeCV
Bảng SiteTypeCV chứa các thuật ngữ cho các trường SiteType trong bảng Sites
3.1.3 Bảng SpatialReferences
SpatialReferences Interger Số nguyên duy nhất
ứng với mỗi Hệ thống quan hệ không gian
Duy nhất Khóa chính SRSID Interger Số nguyên đại diện
cho Hệ thống quan hệ không gian theo tran web:
http://www.epsg.org/
SRSName Text(255) Tên của Hệ thống
quan hệ không gian
Không được chứa tab, line feed, carriage return character
IsGeoGraphic Boolean Giá trị biểu thị hệ
thống quan hệ không gian có dung hệ tọa
độ địa lý hay không
True, False O
Notes Text (unlimited) Mô tả những thông tin
về Hệ thống quan hệ không gian Trường này định nghĩa những
hệ thống địa lý địa phương khong đúng với chuẩn và bao gồm những mô tả thông tin
về vùng đó Ví dụ như
vị độ, kinh độ có thể chiếu theo thông tin địa phương
O
Bảng SpatialReferences cung cấp thông tin về các hệ thống không gian sử dụng trong
hệ tọa độ (vĩ độ và kinh độ) cũng như phối hợp các hệ thống địa phương trong bảng Sites
Trang 123.1.4 Bảng VerticalDatumCV
Bảng VerticalDatumCV chứa các thuật ngữ cho trường VerticalDatum trong bảng Sites
Term Text(255) Danh mục từ viết tắt của các
VerticalDatum
Duy nhất Khóa chính Không chứa … Definition Text
(Unlimited)
Giải thích các danh mục viết tắt trên Định nghĩa là tùy chọn nếu thuật ngữ này tự giải thích được
North American Vertical Datum of
1988
O
3.2 Units & Offsets
3.2.1 Bảng Units
Bảng Units cung cấp cho các đơn vị và UnitsType liên quan với các biến, hỗ trợ thời gian
và hiệu số Đây là một bảng thuật ngữ được kiểm soát
UnitsID Integer
Identity
Số nguyên duy nhất để nhận dạng từng đơn vị
Unique Primary key UnitsName Text (255) Tên đầy đủ của
đơn vị
Milligrams Per Liter
M Cannot contain tab, line feed, or carriage return characters UnitsType Text (255) Giá trị văn bản quy
định cụ thể kích thước của các đơn
Cannot contain tab, line feed, or carriage return characters
Trang 133.2.2 Bảng OffsetTypes:
Bảng OffsetTypes liệt kê đầy đủ thông tin mô tả cho mỗi đo lường offsets
1 Mặc dù cả ba trường trong bảng này là bắt buộc, bảng này sẽ chỉ được nhập nếu giá trị
dữ liệu đo tại một Offset đã được nhập vào cơ sở dữ liệu ODM
2 Trường OffsetTypeID là khóa chính, phải là một số nguyên duy nhất, và không thể là NULL Trường này cần được thực hiện như một trường số tự động / nhận dạng
3 Trường OffsetUnitsID cần tương ứng với một ID hợp lệ từ trường UnitsID trong bảng Units Vì bảng Units là một thuật ngữ được kiểm soát, chỉ có đơn vị đã tồn tại trong bảng đơn vị có thể được sử dụng như là các đơn vị thuộc Offset
4 Trường OffsetDescription nên được điền vào với một văn bản mô tả đầy đủ của các offset, cung cấp đủ thông tin để giải thích các loại offset được sử dụng
OffsetTypeID Integer
Identity
Số nguyên được định danh để xác định khoảng đo lường
Duy nhất Khóa chính OffsetUnitsID Integer Số nguyên mà
tham khảo các bản ghi trong bảng đơn vị cho các đơn vị thuộc OffsetValue
“Above Ground Level”
M
3.3 Variable
Trang 143.3.1 Bảng Variables
Bảng Variable liệt kê đầy đủ thông tin mô tả về những gì các biến đã được đo
Tên trường Kiểu dữ
liệu
định VariableID Integer
Identity
Số nguyên duy nhất định danh cho mỗi biến
Duy nhất Khóa chính VariableCode Text (50) Mã kí tự được sử dụng
bởi các tổ chức thu thập các dữ liệu để xác định các biến
“00060” used by
discharge
M Duy nhất Allows only characters in the range of A-
insensitive),
0-9, and “.”, “-“, and “_”
VariableName Text (255) Tên văn bản đầy đủ của
biến được đo, quan sát,
mô hình hóa, vv
“Discharge” M
Khóa ngoại Speciation Text (255) Mã kí tự viết tắt của giá
trị dữ liệu quan trắc được thể hiện (ví dụ, tổng nồng
độ phốt pho thể hiện là P) Những giá trị này có được từ bảng SpeciationCV
“P”, “N”, “NO3” M
Khóa ngoại
“Not Applicable
”
VariableUnitsID Integer Những số nguyên được
định danh tương ứng với các bản ghi trong bảng Units cho các đơn vị của các giá trị dữ liệu liên quan đến biến
Khóa ngoại
SampleMedium Text (255) Môi trường mà mẫu hoặc
quan sát đã được thực hiện hoặc thực hiện Điều này có được từ bảng SampleMediumCV
“Surface Water”
“Sediment”
“Fish Tissue”
M Khóa ngoại
“Unknown
”
ValueType Text (255) Giá trị văn bản chỉ ra
những loại giá trị dữ liệu được ghi lại Điều này cần được từ bảng ValueTypeCV
“Field Observation”
“Laboratory Observation”
“Model Simulation Results”
M Khóa ngoại
“Unknown
”
IsRegular Boolean Giá trị cho biết các giá trị
dữ liệu từ chuỗi thời gian
có thường xuyên lấy mẫu hay không
“True”
Trang 15TimeSupport Real Giá trị số cho biết thời
gian đo lường của giá trị
dữ liệu 0 được sử dụng
để chỉ ra các giá trị dữ liệu liên tục Các giá trị khác cho biết thời gian qua đó các giá trị dữ liệu được ngầm hay trung bình hoặc tổng hợp
TimeUnitsID Integer Số nguyên được đinh
danh có trong các bản ghi trong bảng Units cho các đơn vị có thời gian hỗ trợ Nếu TimeSupport là
0, cho thấy một sự quan sát ngay lập tức
“Categorical”
M Khóa ngoại
“Climate”
“Water Quality”
“Groundwater Quality”
M Khóa ngoại
“Unknown
”
NoDataValue Real Giá trị số được sử dụng
để mã hóa dữ liệu không
có giá trị cho biến này
" "- ", Và nhấn mạnh "_"
3 Trường variablename phải tương ứng với dòng hiệu lực kể từ bảng thuật ngữ VariableNameCV được kiểm soát
4 Trường Speciation phải tương ứng với một dòng từ bảng thuật ngữ SpeciationCV
5 Trường VariableUnitsID phải tương ứng với một UnitsID hợp lệ từ bảng UnitsTable
Trang 166 Chỉ có điều khoản từ bảng SampleMediumCV có thể được sử dụng để cập nhật trong Trường SampleMedium Giá trị mặc định của "Unknown" được sử dụng khi các phương tiện mẫu là không rõ
7 Chỉ có điều khoản từ bảng ValueTypeCV có thể được sử dụng để cập nhật trong trường ValueType Giá trị mặc định của "Unknown" được sử dụng khi các kiểu giá trị là không
rõ
8 Mặc định cho các TrườngTimeSupport là 0 Này tương ứng với giá trị tức thời Nếu trường TimeSupport được đặt thành một giá trị khác hơn 0, một TimeUnitsID thích hợp phải được xác định TrườngTimeUnitsID chỉ có thể tương ứng với giá trị UnitsID hợp lệ
từ các đơn vị kiểm soát bảng từ vựng Nếu trường TimeSupport được thiết lập là 0, bất kỳ đơn vị thời gian có thể được sử dụng (ví dụ, giây , phút, giờ , vv), tuy nhiên giá trị mặc định 103 đã được sử dụng , tương ứng với giờ
9 Chỉ có thuật ngữ từ bảng DataTypeCV có thể được sử dụng để cập nhật ở trường DataType Giá trị mặc định của "Unknown" có thể được sử dụng khi kiểu dữ liệu là không
là -9999
3.3.2 Bảng VariavleNameCV
Bảng VariableName CV chứa các thuật ngữ cho trường VariableName trong bảng Variable
và bảng SeriesCatalog
Term Text (255) Từ điều khiển cho
VariableName
“temperature” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa VariableName kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
O
Trang 173.3.3 Bảng SpeciationCV
Bảng SpeciationCV chứa các thuật ngữ cho trường Speciationtrong bảng Variable
Term Text (255) Từ điều khiển cho Speciation “P” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa Speciation kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
“Biểu diễn như phốt pho”
O
3.3.4 Bảng SampleMediumCV
Bảng SampleTypeCV chứa thuật ngữ của loại mẫu
Term Text (255) Từ điều khiển cho
SampleMedium
“temperature” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa SampleMedium kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
O
3.3.5 Bảng ValueTypeCV
Bảng ValueTypeCV chứa các thuật ngữ cho trường ValueType trong bảng Variable và bảng SeriesCatalog
Term Text (255) Từ điều khiển cho
ValueType
“nước mặt” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa ValueType kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
Mẫu lấy từ nguồn nước mặt như một dòng suối, sông, hồ, ao,
hồ, biển, vv
O
Trang 183.3.6 Bảng DataTypeCV
Bảng này bao gồm danh sách các lệnh thực thi trong các kiểu dữ liệu Mỗi giá trị trong trường Field của bảng có thể được cập nhật trong trường DataTypes của bảng Variable
Term Text (255) Từ điều khiển cho
DataType
“liên tục” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa DataType kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
Một số lượng quy định tại một khoảnh khắc đặc biệt trong thời gian đo có
đủ tần số (khoảng cách nhỏ) được xem như là một kỷ lục liên tục của hiện tượng này
O
3.3.7 Bảng GernernalCategoryCV
Bảng này bao gồm những thuật ngữ như Biota, Hydrology, Climate … Trường GeneralCategory trong bảng Variables chỉ có thể được nhập giá trị từ trường Term của bảng này
Term Text (255) Từ điều khiển cho
GeneralCategory
“thủy văn” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa GeneralCategory kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
Dữ liệu liên quan đến các biến thủy văn hoặc các quá trình
O
3.4 Categories
Trang 19Bảng danh mục định nghĩa các loại cho các biến phân loại Hồ sơ được yêu cầu cho các biến nơi DataType được quy định như "chủng loại" Nhiều mục cho mỗi VariableID, với DataValues khác nhau cung cấp các bản đồ từ DataValue để mô tả loại
liệu
VảiableID Integer Giá trị tham chiếu bản ghi Variables
của một biến phân loại
Khóa ngoại DataValue Real Giá trị số định nghĩa các loại 1.0 M
2 Bảng này nên được nhập trước bảng DataValues
3.5 Observation Values
Trang 20Đồng nhất
Nhận dạng số nguyên duy nhất cho mỗi giá trị dữ liệu
Duy nhất Khóa chính DataValue Real Giá trị số của các quan sát Đối với
các biến chủng loại, một số được lưu trữ ở đây Bảng Variables có DataType như Categorical và các Categories bản đồ bảng từ DataValue vào Category Description
34.5 M
ValueAccuracy Real Giá trị số mô tả chính xác giá trị đo
lường dữ liệu Nếu không có, được
AM
M
UTCOffset Real Bù đắp trong giờ UTC từ thời điểm
tương ứng giá trị LocalDateTime -7 M DateTimeUTC Date/Ti
PM
M
SiteID Integer Nhận dạng số nguyên tham chiếu
đến vị trí mà tại đó các quan trắc được đo
Điều này liên kết các giá trị dữ liệu vào vị trí của chúng trong bảng Sites
Khóa ngoại (FK)
VariableID Integer Nhận dạng số nguyên tham chiếu
đến biến được đo Điều này liên kết các giá trị dữ liệu để biến của chúng trong bảng Variables
Khóa ngoại (FK)
OffsetValue Real Khoảng cách từ một điểm mốc đo
lường hoặc điểm kiểm soát đếm điểm mà tại đó giá trị dữ liệu được quan sát
Nếu không đưa ra thì OffsetValue
là 0, hoặc không có liên quan/
không cần thiết
= no Offset
OffsetTypeID Integer Dạng số nguyên tương ứng với giá
Trang 21QualifierID Integer Dạng số nguyên tương ứng với giá
trị trong bảng Qualifiers Nếu Null,
dữ liệu không đủ điều kiện
Khóa ngoại
Null
MethodID Integer Dạng số nguyên tương ứng với
phương pháp tài liệu tham khảo trong bảng Method
Khóa ngoại
0=không
có phương pháp xác định SourceID Integer Dạng số nguyên tương ứng với bản
ghi trong bảng Source cho biết nguồn gốc của dữ liệu
Khóa chính
Null
SampleID Integer Giá trị tham chiếu đến bảng
Sample Yêu cầu khi mẫu được xử
lý trong phòng thí nghiệm
Khóa ngoại
Null
DẻivedFromID Integer Giá trị tham chiếu đến bảng
DerivedFrom cho biết nguồn gốc của dữ liệu Nếu Null, giá trị giữ liệu không có nguồn
QualityControlLe
velID
Integer Giá trị tham chiếu đến bảng
QualityControlLevels biểu diễn cho mức độ kiểm soát chất lượng
mà giá trị đã phải chịu
Khóa chính
-9999 = không biết
Các quy tắc và thực hành:
1 ValueID là khóa chính, bắt buộc, và không thể NULL Trường này cần được thực hiện như một trường nhận dạng Mỗi ValueID là một số nguyên duy nhất, không được trùng lặp
2 Mỗi dòng trong bảng này phải là duy nhất Điều này được thực hiện bởi sự ràng buộc trên tất cả các trường trong bảng này (không bao gồm ValueID) để bản ghi không bị trùng lặp
3 Các trường LocalDateTime, UTCOffset , và DateTimeUTC phải được nhập vào để đảm bảo rằng các UTCOffset chính xác được sử dụng , đặc biệt là ở những khu vực quan sát ngắn ngày Nếu LocalDateTime và DateTimeUTC được đưa ra, các UTCOffset có thể được tính là sự khác biệt giữa hai giá trị trên
4 SiteID phải tương ứng với một SiteID hợp lệ từ bảng Sites Khi thêm dữ liệu cho một vị trí mới, bảng Sites nên được nhập trước khi thêm giá trị dữ liệu vào bảng DataValues
5 VariableID phải tương ứng với một VariableID hợp lệ từ bảng Variables Khi thêm dữ liệu cho một biến mới, nên nhập vảo bảng Variables trước khi nhập vào bảng này
6 OffsetValue và OffsetTypeID là tùy chọn, vì không phải tất cả các giá trị dữ liệu đều có Trường hợp không có offset nào được sử dụng, cả hai trường cần được thiết lập để NULL chỉ ra rằng không có các giá trị dữ liệu ở cột này Nhưng nếu 1 trong 2 trường được cập
Trang 22nhật thì trường kia cũng phải có số liệu tương ứng để đảm bảo hợp lệ trong bảng OffsetTypes Bảng OffsetTypes nên được cập nhật trước khi thêm giá trị dữ liệu vào trường OffsetTypeID của bảng DataValues
7 CensorCode là bắt buộc và không thể NULL Giá trị mặc định của "nc" được sử dụng cho trường này Những Term từ bảng CensorCodeCV được sử dụng nhập trong trường này
8 Các trường QualifierID là tùy chọn Trường hợp không có vòng loại áp dụng, trường này nên được đặt thành NULL Khi một QualifierID được nhập trong trường này thì phải
đề cập đến một QualifierID hợp lệ trong bảng Qualifier Trường QualifierID của bảng Qualifier được nhập trước bảng DataValues
9 MethodID phải tương ứng với một MethodID hợp lệ từ bảng Method và không được NULL Giá trị mặc định là 0 được sử dụng trong trường hợp không có phương pháp được quy định hoặc phương pháp được sử dụng để tạo ra các quan sát là không rõ Bảng Method được nhập trước khi thêm giá trị dữ liệu với một MethodID đặc biệt vào bảng DataValues
10 Sourceid phải tương ứng với một sourceid hợp lệ từ bảng Source và không được NULL Khi thêm giá trị dữ liệu, bảng Source nên được nhập trước bảng DataValues với một SourceID duy nhất
11 SampleID là tùy chọn và nên được nhập vào nếu giá trị dữ liệu được khởi tạo từ một mẫu đã được gửi đến phòng thí nghiệm để phân tích Các SampleID phải tương ứng với một SampleID hợp lệ trong bảng Sample, và bảng Sampe nên được nhập trước khi thêm giá trị dữ liệu với một SampleID đặc biệt vào bảng DataValues
12 DerivedFromID là tùy chọn và chỉ nên được nhập nếu giá trị dữ liệu được bắt nguồn từ giá trị dữ liệu khác cũng được lưu trữ trong cơ sở dữ liệu ODM
13 QualityControlLevelID là bắt buộc, không được NULL, và phải tương ứng với một QualityControlLevelID hợp lệ trong bảng QualityControlLevels Giá trị mặc định của -
9999 được sử dụng cho trường này trong trường hợp các QualityControlLevelID là không
rõ Bảng QualityControlLevels nên nhập trước khi thêm số của dữ liệu với một QualityControlLevelID đặc biệt vào bảng DataValues
3.5.2 CensorCodeCV
Bảng CensorCodeCV bao gồm định nghĩa của các thuật ngữ Mỗi giá trị từ trường
Term trong bảng CensorCodeCV được sử dụng trong trường CensorCode trong bảng DataValues
Trang 23Tên trường Kiểu dữ liệu Mô tả Ví dụ Hạn chế
Term Text (255) Từ điều khiển cho
CensorCode
“lt”, “gt”, “nc” M – duy nhất
Khóa chính Không chứa tab, nguồn cấp dữ liệu hay kí tự quay về Definition Text
(unlimited)
Định nghĩa CensorCode kiểm soát Term Là tùy chọn nếu thuật ngữ này tự giải thích
ValueID Integer Giá trị tham chiếu giá trị dữ
liệu từ một nhóm nguồn gốc Giá trị này tương ứng với ValueID trong bảng DataValues
1,2,3,4,5 M
Mặc dù tất cả các trường trong bảng này đều bắt buộc phải có, nhưng nó chỉ cần nhập vào nếu giá trị dữ liệu nguồn và giá trị dữ liệu đó được nhập vào từ CSDL nếu không có dữ liệu nguồn từ bảng DataValues thì bảng này có thể bỏ trống
3.6 Data sources
3.6.1 Sources:
Bảng Sources liệt kê các nguồn gốc của dữ liệu, cung cấp đầy đủ thông tin để truy xuất và tái tạo lại các giá trị dữ liệu từ các tập tin dữ liệu gốc nếu cần thiết
Trang 24Tên trường Kiểu dữ
liệu
mặc định SourceID Integer
Đồng nhất
Số nguyên duy nhất nhận dạng một nguồn
dữ liệ
Khóa chính Organization Text
(255)
Tên tổ chức thu thập dữ liệu Là cơ quan, tổ chứ thu thập dữ liệu, ngay
cả khi dữ liệu được tập hợp từ nhiều nguồn như STORET
“Phòng chất lượng nước Utah”
M Không chứa tab, nguồn cấp
dữ liệu hay kí
tự quay về SourceDescription Text
(unlimit ed)
Mô tả đầy đủ nguồn gốc dữ liệu
Văn bản tập tin lấy từ hệ thống EPA STORET cho thấy dữ liệu ban đầu từ Utah Phòng Chất lượng nước
M
SourceLink Text
(500)
Liên kết có thể được chỉ vào tập tin dữ liệu gốc và /hoặc siêu dữ liệu liên quan được lưu trữ trong thư viện kỹ thuật số hoặc URL của nguồn dữ liệu
M Không chứa tab, nguồn cấp
dữ liệu hay kí
tự quay về
“không biết”
M Không chứa tab, nguồn cấp
dữ liệu hay kí
tự quay về
“Không biết”
dữ liệu hay kí
tự quay về
“Không biết”
M Không chứa tab, nguồn cấp
dữ liệu hay kí
tự quay về
“Không biết”
(255)
Thành phố của người liên hệ
“Hồ Chí Minh”
biết”
Trang 25Không chứa tab, nguồn cấp
Viết tắt cho Mỹ và đầy
đủ với quốc gia khác
“Việt Nam” M
Không chứa tab, nguồn cấp
dữ liệu hay kí
tự quay về
“không biết”
(255)
Không chứa tab, nguồn cấp
dữ liệu hay kí
tự quay về
“Không biết”
(unlimit ed)
Chuỗi trích dẫn từ các nguồn tài liệu tham khảo
"Dữ liệu được thu thập bởi USU là một phần của dự
án giường ngủ Little Bear sông thử nghiệm”
biết”
MetadataID Integer Số nguyên tham chiếu
đến bản ghi trong bảng ISOMetadata cho nguồn này
không biết hoặc siêu dữ liệu chưa được khởi tạo
1 Trường SourceID là khóa chính, phải là một số nguyên duy nhất, và không thể là NULL Trường này cần được thực hiện như một trường số tự động / nhận dạng
2 Các trường Organization cần có một mô tả văn bản của cơ quan, tổ chức đã tạo ra dữ liệu
3 Trường SourceDescription cần có một mô tả chi tiết hơn về nơi mà dữ liệu đã thực sự thu được
4 Giá trị mặc định của "Unknown" có thể được sử dụng để liên lạc các trường chứa thông tin nguồn trong trường hợp thông tin này không được biết đến
5 Mỗi nguồn phải gắn với một dòng siêu dữ liệu trong bảng ISOMetadata Như vậy, MetadataID phải tương ứng với một MetadataID hợp lệ từ bảng ISOMetadata Bảng ISOMetatadata nên được nhập với một dòng phù hợp trước khi thêm một nguồn vào bảng