Đồng thời áp dụng phương pháp địa thống kê để phân tích xử lý một số loại số liệu trắc địa như số liệu trọng lực, số liệu đo cao vệ tinh, dị thường độ cao và xây dựng mô hình Geoid, mô h
Trang 1Bé GI¸O DôC Vµ §µO T¹O TR¦êNG §¹I HäC Má - §ÞA CHÊT
HÀ NỘI - 2015
Trang 2LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của tôi Tất cả quá trình nghiên cứu; các số liệu tính toán; báo cáo và kết quả nghiên cứu đƣợc trình bày trong luận văn là trung thực, chính xác và chƣa từng đƣợc công bố trong công trình nào khác Tôi xin chịu trách nhiệm về các nội dung đƣợc trình bày trong luận văn
Hà Nội, tháng 10 năm 2015
Tác giả luận văn
Vy Thị Thùy
Trang 3MỤC LỤC
LỜI CAM ĐOAN i
MỤC LỤC iii
DANH MỤC CÁC BẢNG vi
DANH MỤC CÁC HÌNH vii
MỞ ĐẦU 1
Chương 1: DỮ LIỆU ĐỊA KHÔNG GIAN VÀ LÝ THUYẾT ĐỊA THỐNG KÊ 4
1.1 Dữ liệu địa không gian (Geospatial Data) 4
1.1.1 Khái quát về dữ liệu quan trắc phân bố trong không gian 4
1.1.2 Hệ quy chiếu trắc địa đối với dữ liệu địa không gian 7
1.1.3 Vấn đề mô hình hóa dữ liệu địa không gian 12
1.2 Khái lược về lý thuyết địa thống kê 13
1.2.1 Tính quy luật và tính ngẫu nhiên của dữ liệu địa không gian 13
1.2.2 Trường ngẫu nhiên không gian và phân loại 14
1.2.3 Phân tích sơ bộ dữ liệu địa không gian 15
1.2.4 Lập bản đồ địa thống kê cho dữ liệu địa không gian 19
1.3 Một số đặc trưng địa thống kê của dữ liệu địa không gian 21
1.3.1 Phương sai, hiệp phương sai và bán phương sai 21
1.3.2 Hiệp phương sai thực nghiệm và hàm hiệp phương sai lý thuyết 22
1.3.3 Bán phương sai thực nghiệm và hàm bán phương sai lý thuyết 26
1.3.4 Mối quan hệ giữa hiệp phương sai và bán phương sai 31
1.4 Thuật toán Kriging 32
1.4.1 Hệ phương trình Kriging và phân loại Kriging 32
1.4.2 Quy trình tính toán nội suy Kriging 36
1.5 Thuật toán Collocation 38
1.5.1 Công thức cơ bản của Collocation 38
1.5.2 Quy trình tính toán nội suy Collocation 42
Trang 4Chương 2: CÁC HỆ THỐNG ĐỘ CAO VÀ DỊ THƯỜNG ĐỘ CAO 45
2.1 Các hệ thống độ cao 45
2.1.1 Hệ thống độ cao chính 45
2.1.2 Hệ thống độ cao chuẩn 46
2.1.3 Hệ độ cao trắc địa 47
2.2 Dị thường độ cao, phân loại và phương pháp xác định 48
2.2.1 Dị thường độ cao và phân loại 48
2.2.2 Phương pháp xác định dị thường độ cao 49
2.2.3 Geoid và Quasigeoid, mối liên hệ giữa chúng 51
2.2.4 Mô hình trọng trường Trái đất EGM2008 56
2.3 Phương pháp đo cao GPS 58
2.3.1 Nguyên lý đo cao GPS 58
2.3.2 Vai trò của mô hình dị thường độ cao (mô hình Geoid) trong đo cao GPS 63
2.3.3 Triển vọng ứng dụng của phương pháp đo cao GPS 63
Chương 3: DỮ LIỆU DỊ THƯỜNG ĐỘ CAO GPS-THỦY CHUẨN VÙNG TÂY NGUYÊN 65
3.1 Dữ liệu dị thường độ cao GPS-thủy chuẩn vùng Tây nguyên 65
3.1.1 Giới thiệu chung về khu vực Tây Nguyên 65
3.1.2 Dữ liệu dị thường độ cao GPS-thủy chuẩn khu vực Tây Nguyên 66
3.1.3 Dị thường độ cao EGM2008 vùng Tây Nguyên 69
3.1.4 Dữ liệu dị thường độ cao phần dư vùng Tây Nguyên 70
3.2 Các đặc trưng địa thống kê của dữ liệu dị thường độ cao phần dư 71
3.2.1 Phương sai, bán phương sai và hiệp phương sai thực nghiệm 71
3.2.2 Các tham số của hàm bán phương sai lý thuyết (hàm cầu, hàm mũ) 73
3.2.3 Các tham số hàm hiệp phương sai lý thuyết (hàm Markov bậc 3) 74
Chương 4: SỬ DỤNG PHƯƠNG PHÁP KRIGING ĐỂ MÔ HÌNH HÓA DỮ LIỆU DỊ THƯỜNG ĐỘ CAO VÙNG TÂY NGUYÊN 77
4.1 Mô hình hóa dữ liệu dị thường độ cao bằng nội suy Kriging 77
Trang 54.1.1 Mô hình hóa dữ liệu dạng lưới chuẩn (Grid) 77
4.1.2 Quy trình tính toán nội suy trong xây dựng mô hình dị thường độ cao dựa trên dữ liệu dị thường độ cao phần dư 77
4.2 Khảo sát nội suy Kriging (OK và SK) 83
4.2.1 Phân tích sơ bộ dữ liệu số dư dị thường độ cao 83
4.2.2 Nội suy Kriging (SK) sử dụng hàm bán phương sai cầu theo R thay đổi 87 4.3 Nội suy Collocation và so sánh với kết quả nội suy Kriging 91
4.3.1 Nội suy collocation sử dụng hàm hiệp phương sai Markov bậc 3 91
4.3.2 So sánh kết quả nội suy Kriging sử dụng hàm bán phương sai cầu theo R thay đổi và nội suy collocation 94
KẾT LUẬN VÀ KIẾN NGHỊ 97
TÀI LIỆU THAM KHẢO 99
PHỤ LỤC 100
Trang 6DANH MỤC CÁC BẢNG
Bảng 2.1 Thống kê dữ liệu g(5’ 5’) mGal 57
Bảng 4.1 Bảng số dư dị tường độ cao theo thống kê sơ bộ 86
Bảng 4.2 Bảng kết quả tính bán phương sai thực nghiệm 89
Bảng 4.3 Bảng kết quả hàm xấp xỉ cầu (trọng số bằng nhau) 90
Bảng 4.4 Bảng số liệu quan trắc (với sai số đơn vị 004) 90
Bảng 4.5 Bảng các tham số hàm bán phương sai cầu 90
Bảng 4.6 Bảng kết quả tính hiệp phương sai thực nghiệm (với dung sai khoảng cách 2.0km) 92
Bảng 4.7 Bảng kết quả xấp xỉ hàm Markov bậc 3 (trọng số bằng nhau 93
Bảng 4.8 Bảng số liệu quan trắc (sai số đơn vị: 39.612) 93
Bảng 4.9 Bảng các tham số hàm Markov bậc 3 93
Bảng 4.10 Bảng so sánh kết quả tính toán nội suytheo hai phương pháp Kriging và collocation 95
Trang 7DANH MỤC CÁC HÌNH
Hình 2.1 Các hệ thống độ cao 48
Hình 2.2 Mô hình Geoid EGM2008 – Việt Nam 58
Hình 3.1 Khu vực Tây Nguyên và duyên hải Nam Trung Bộ ảnh chụp từ vệ tinh 66 Hình 3.2: Phạm vi phân bố các điểm song trùng 68
Hình 3.3 Mô hình Geoid EGM2008 vùng Tây Nguyên 70
Hình 4.1 Nguyên lý vòng tròn chuyển động bán kính thay đổi 80
Hình 4.2 Tạo mô hình Geoid cục bộ (grid) từ mô hình toàn cầu 81
Hình 4.3 Quy trình tính toán chính xác hóa dị thường độ cao 82
Hình 4.4 Biểu đồ tần suất thực nghiệm 87
Hình 4.5 Các điểm được chọn để nội suy Kriging 88
Hình 4.6 Đồ thị hàm bán phương sai cầu 91
Hình 4.7 Đồ thị hàm hiệp phương sai Markov bậc 3 94
Hình 4.8 Mô hình EGM08TN vùng Tây Nguyên sau xử lý địa thống kê phần dư dị thường độ cao 96
Trang 8MỞ ĐẦU
1 Tính cấp thiết của đề tài
Trong thời đại công nghệ GNSS (Global Navigation Satellite System), vị trí điểm trên bề mặt Trái Đất đã được giải quyết một cách hiệu quả, nhưng độ cao của điểm lại chưa thể giải quyết trọn vẹn nếu như không có thông tin về vị trí của Geoid hay Quasigeoid trong hệ quy chiếu Trái Đất Chính vì thế vấn đề nghiên cứu trọng trường và xây dựng mô hình Geoid/Quasigeoid trên phạm vi toàn cầu cũng như cục
bộ luôn là nhiệm vụ quan trọng của ngành Trắc địa nói riêng và các ngành khoa học Trái Đất nói chung Đồng thời áp dụng phương pháp địa thống kê để phân tích xử lý một số loại số liệu trắc địa như số liệu trọng lực, số liệu đo cao vệ tinh, dị thường độ cao và xây dựng mô hình Geoid, mô hình số địa hình DTM vv…Thuật toán Kriging – cung cấp giải pháp nội suy tối ưu, với ước lượng tuyến tính tốt nhất tại mỗi vị trí,
sử dụng tới mô hình bán phương sai xác định vị trí cho các dữ liệu không gian
Hiện nay, nhiều nhà khoa học tự nhiên đang hướng nghiên cứu vào lĩnh vực thống kê và địa thống kê để tìm các lời giải tối ưu cho nhiều bài toán phức tạp của khoa học Trái Đất Cùng với xu thế đó chúng tôi đã lựa chọn đề tài luận văn là:
“Ứng dụng địa thống kê trong phân tích và mô hình hóa dữ liệu dị thường độ cao vùng Tây Nguyên – Việt Nam”
2 Mục đích nghiên cứu của luận văn:
Nghiên cứu phát triển ứng dụng phương pháp địa thống kê trong xử lý số liệu phục vụ xây dựng mô hình Geoid hoặc Quasigeoid khu vực
3 Đối tượng và phạm vi nghiên cứu:
- Địa thống kê và ứng dụng chúng trong phân tích, mô hình hóa dữ liệu dị thường độ cao
- Phương pháp Kriging và một số phương pháp nội suy khác
- Nghiên cứu dữ liệu dị thường độ cao vùng Tây Nguyên – Việt Nam
4 Nội dung nghiên cứu:
- Tìm hiểu về lý thuyết địa thống kê;
- Dữ liệu dị thường độ cao và ứng dụng trong đo cao GPS;
Trang 9- Các đặc trưng địa thống kê của dữ liệu dị thường độ cao vùng Tây Nguyên;
- Lập chương trình để tính toán thực nghiệm nội suy Kriging và so sánh với kết quả tính theo phương pháp Collocation
5 Phương Pháp nghiên cứu:
- Phương pháp thu thập tài liệu, số liệu: Thu thập các tài liệu đã có; cập nhập các thông tin trên mạng Internet; tìm kiếm các số liệu tọa độ GPS, độ cao thủy chuẩn có đủ độ chính xác tin cậy phục vụ cho nghiên cứu
- Phương pháp phân tích: Tìm hiểu lý thuyết địa thống kê; các hàm phương sai, bán phương sai và thuật toán nội suy Kriging, Collocation
- Phương pháp so sánh: So sánh ưu và nhược điểm của các thuật toán hoặc các phương pháp sử dụng trong nghiên cứu, để tìm ra phương án tối ưu
- Phương pháp tổng hợp: Tập hợp các kết quả nghiên cứu, tìm được thuật toán chính xác hóa dị thường độ cao
Phương pháp ứng dụng công nghệ tin học: Lập chương trình tính toán cho máy tính thực hiện quy trình mô hình hóa dữ liệu dị thường độ cao
6 Ý nghĩa khoa học và thực tiễn của đề tài:
Phân tích các đặc trưng thống kê của bộ dữ liệu số dư dị thường độ cao tính từ
mô hình Geoid EGM2008 và dị thường độ cao GPS-thủy chuẩn vùng Tây Nguyên
Sử dụng thuật toán Kriging để mô hình hóa Geoid được làm khớp các dữ liệu trên Chính xác hóa mô hình Geoid phục vụ cho công tác Trắc địa – Bản đồ nói chung và
đo cao GPS nói riêng
7 Cấu trúc luận văn
- Lời mở đầu
- Chương 1: Dữ liệu địa không gian và lý thuyết địa thống kê
- Chương 2: Các hệ thống độ cao và dị thường độ cao
- Chương 3: Dữ liệu dị thường độ cao GPS – Thủy chuẩn vùng Tây Nguyên
- Chương 4: Sử dụng phương pháp Kriging để mô hình hóa dữ liệu dị thường
độ cao vùng Tây Nguyên
- Kết luận và kiến nghị
Trang 10Tôi xin cảm ơn sự hướng dẫn nhiệt tình của PGS.TS Đặng Nam Chinh cùng các thầy cô trong bộ môn trắc địa cao cấp đã giúp đỡ tôi hoàn thành luận văn này
Tôi xin chân thành cảm ơn!
Trang 11Chương 1
DỮ LIỆU ĐỊA KHÔNG GIAN VÀ LÝ THUYẾT ĐỊA THỐNG KÊ
1.1 Dữ liệu địa không gian (Geospatial Data)
1.1.1 Khái quát về dữ liệu quan trắc phân bố trong không gian
Có nhiều dạng dữ liệu quan trắc được phân bố trong không gian như các trị
đo trọng lực, các số liệu đo độ sâu của một vùng biển, các số liệu khảo sát địa chất công trình, địa chất thủy văn, địa vật lý, môi trường, sinh thái v.v…Sau đây sẽ giới thiệu một vài loại dữ liệu như sau: [1]
1.1.1.1 Trường trọng lực và dị thường trọng lực
Các đặc trưng của thế trọng trường Trái đất liên quan tới sự phân bố vật chất
và mật độ vật chất trong lòng trái đất Nếu xét theo phương hướng vào trọng tâm, quy luật phân bố vật chất mang tính quy luật rõ rệt (tạo thành các quyển vòng và được coi là có cùng mật độ vật chất), nhưng xét theo phương ngang, mật độ vật chất phân bố một cách ngẫu nhiên, tạo nên một trường ngẫu nhiên và có thể sử dụng lý thuyết hàm ngẫu nhiên để nghiên cứu nó Martin Vermeer gọi đó là quá trình ngẫu nhiên trên bề mặt Trái đất Mật độ vật chất trong lòng đất ở một vùng xét nào đó sẽ liên quan trưc tiếp đến lực hấp dẫn cục bộ và ảnh hưởng đến giá trị gia tốc trọng trường ở đó Thế trọng trường thực của Trái đất là tổng hợp của thế hấp dẫn và thế
ly tâm Dị thường trọng lực ∆g là một đặc trưng quan trọng của thế trọng trường thực của Trái đất Dị thường trọng lực được tính theo công thức:
∆g = g – γ (1.1) Trong (1.1), g là giá trị trọng lực đo tại điểm I (đã được tính toán hiệu chỉnh
để chuyển về mặt quy chiếu hoặc để thỏa mãn một số yêu cầu trong xử lý số liệu trọng trường v.v…), γ là giá trị trọng lực chuẩn (trên mặt Ellipsoid chuẩn thường được tính theo công thức đã biết theo các tham số vật lý trái đất đã biết (GM), ví dụ theo công thức:
Trang 12Ngoài ra còn có thể tính giá trị trọng lực chuẩn theo công thức Somigliana như sau:
p e
b K
a, b là các bán trục lớn và nhỏ của Ellipsoid
γe , γp là các giá trị trọng lực chuẩn tại Xích đạo và các Cực e2
là tâm sai thứ nhất Hiện nay người ta lấy gía trị trọng lực chuẩn tại Cực và Xích đạo như sau:
γp = 9,8321849378m/s 2 (1.5)
γe = 9,7803253359m/s 2
Tùy thuộc vào phương pháp hiệu chỉnh vào giá trị trọng lực đo g để chuyển
về mặt quy chiếu mà giá trị dị thường trọng lực tính theo (1.1) sẽ có ý nghĩa khác nhau và có tên gọi khác nhau như dị thường trọng lực chân không, dị thường trọng lực Bouguer v.v…
Về bản chất, giá trị dị thường trọng lực gphụ thuộc vào nhiều yếu tố khác nhau như sự phân bố ngẫu nhiên vật chất trong lòng trái đất, ảnh hưởng của địa hình
và chứa cả sai số quan trắc, nhưng tính chất của sai số quan trắc lại không phải là tính chất cơ bản của dị thường trọng lực và một đặc điểm quan trọng của dị thường trọng lực là liên quan trực tiếp đến đạo hàm của một hàm điều hòa
Phương sai dị thường trọng lực trên toàn cầu được tính theo công thức:
21
ar
4
V g E g g g d (1.6) Trong đó dζ là vi phân diện tích trên mặt Ellipsoid chung và tích phân được lấy trên toàn cầu
Công thức (1.6) là trị trung bình của phương sai dị thường trọng lực, là một đặc trưng quan trọng của trường trọng lực
Trong thực tế, các điểm đo trọng lực không thể hiện liên tục mà được thực hiện theo các điểm đo rời rạc theo một mật độ nào đó, được đặc trưng bởi khoảng
Trang 13cách giữa các điểm đo Như vậy công thức tích phân (1.6) để tính phương sai dị thường trọng lực sẽ được chuyển về công thức thực dụng có dạng tổng như sau
1.1.1.2 Dị thường độ cao và số dư dị thường độ cao
Độ cao Geoid là khoảng cách từ Geoid đến mặt Ellipsoid tại điểm xét nào
đó trên bề mặt trái đất, còn dị thường độ cao là khoảng cách từ mặt Quasigeoid đến mặt Ellipsoid tại điểm xét đó Sự khác biệt giữa Geoid và Quasigeoid chính là sự khác biệt giữa hai hệ thống độ cao chính và hệ thống độ cao chuẩn
Nếu trên một vùng nào đó chúng ta có các điểm được đo GPS và đo thủy chuẩn hình học sẽ tạo thành các điểm song trùng GPS – TC phân bố trên vùng xét
có vị trí xác định trong khung quy chiếu trái đất quốc tế (ITRF) Tại mỗi điểm song trùng luôn xác định được độ cao trắc địa H và độ cao thủy chuẩn h, từ đó sẽ xác định được dị thường độ cao GPS/TC theo công thức:
GPS TC H h (1.8)
Mặt khác, nếu trên khu vực khảo sát và xung quanh đó (với bản kính đủ lớn) có số liệu trọng lực, chúng ta cũng có thể xác định được dị thường độ cao trọng lực tuyệt đối theo công thức Stokes (11) như sau:
trong đó: là hàm Stokes, được xác định theo công thức:
Từ đó ta có thể tính được số dư dị thường độ cao:
GPS TC TL (1.11)
Trang 14Có thể nhận thấy rằng các giá trị số dư dị thường độ cao tính được theo (1.11) của nhiều điểm phân bố trên một vùng rộng lớn có thể coi là một trường ngẫu nhiên Nếu như độ chính xác của dị thường độ cao GPS – TC đủ tin cậy để làm số liệu gốc, thì việc xử lý trường ngẫu nhiên số dư dị thường độ cao xác định theo công thức (1.11) được áp dụng để xây dựng mô hình Geoid dựa vào số liệu trọng lực và được làm khớp với số liệu GPS – TC
Trong một số trường hợp, đã có sẵn một mô hình Geoid hay một mô hình Quasigeoid nào đó, chúng ta có thể coi dị thường độ cao xác định từ mô hình có sẵn này là dị thường độ cao tiên nghiệm, ký hiệu là Model và có thể xác định được tại mọi điểm trên khu vực nghiên cứu Tại các điểm song trùng ta cũng sẽ lập được số
dư dị thường độ cao theo công thức:
M GPS TC Model (1.12) Tập hợp các giá trị số dư dị thường độ cao tính theo công thức (1.12) cũng được xem là một trường ngẫu nhiên Xử lý số liệu trường ngẫu nhiên M để xác định một mô hình Geoid mới, phù hợp với dị thường độ cao GPS – TC được gọi là
chính xác hóa mô hình tiên nghiệm theo phương pháp làm khớp (fitting)
Lưu ý là các số dư dị thường độ cao tính theo công thức (1.11) và (1.12) phụ thuộc (có quy luật hệ thống) vào dị thường độ cao GPS – TC, về bản chất là phụ thuộc vào hệ quy chiếu xác định độ cao trắc địa H và mặt khởi tính độ cao thủy chuẩn h Chính vì thế tập hợp các giá trị số dư dị thường độ cao hoặc
Mkhông hoàn toàn thỏa mãn yêu cầu đối với một trường ngẫu nhiên không gian Gauss Để biến đổi về trường ngẫu nhiên không gian Gauss cần phải qua bước xử lý chuẩn hóa
1.1.2 Hệ quy chiếu trắc địa đối với dữ liệu địa không gian
Phân tích dãy số liệu đo bằng công cụ địa thống kê luôn kèm theo yêu cầu bắt buộc là phải có vị trí của giá trị quan trắc trong hệ quy chiếu nào đó Nếu các đối tượng nghiên cứu tạo thành trường ngẫu nhiên trên mặt đất hoặc trong không gian thì cần xác định các trị quan trắc trong hệ tọa độ trắc địa hoặc hệ tọa độ vuông
Trang 15góc không gian Yêu cầu về độ chính xác của vị trí quan trắc tùy thuộc vào mức độ
biến thiên (gradient) của đại lượng đo theo vị trí (theo mặt bằng hoặc theo độ cao),
sao cho sai số vị trí ảnh hưởng tới giá trị không lớn hơn cỡ 1/3 độ lớn của sai số quan trắc.[1]
1.1.2.1 Hệ tọa độ trắc địa và hệ tọa độ vuông góc không gian địa tâm
Ellipsoid trái đất (là ellipsoid tròn xoay) có bán trục lớn a và độ dẹt f được lấy làm mặt quy chiếu của hệ tọa độ trắc địa Chính vì thế, tọa độ trắc địa còn được
gọi là tọa độ Ellipsoid (ellipsoid coordinates) Tọa độ trắc địa biểu thị vị trí của
điểm Q trong không gian bởi ba thành phần tọa độ là độ vĩ trắc địa B, độ kinh trắc địa L và độ cao trắc địa H Độ vĩ trắc địa (B) là góc hợp bởi pháp tuyến qua điểm xét và mặt phẳng xích đạo Độ kinh trắc địa (L) là góc nhị diện giữa mặt phẳng kinh tuyến trắc địa gốc (qua Greenwich) và mặt phẳng kinh tuyến trắc địa qua điểm xét
Q Độ cao trắc địa (H) là khoảng cách tính theo phương pháp tuyến từ điểm xét Q đến mặt Ellipsoid
Độ vĩ trắc địa và độ kinh trắc địa được sử dụng để thể hiện vị trí mặt bằng của điểm, còn độ cao trắc địa thể hiện vị trí theo phương thẳng đứng
Bằng hệ tọa độ trắc địa (B, L, H) cho phép xác định đơn trị vị trí mọi điểm trên mặt đất, nhưng hệ tọa độ này không thỏa mãn các tiên đề của không gian Euclid được sử dụng cho trường ngẫu nhiên Tuy vậy, mọi điểm có tọa độ B, L, H của một điểm, có thể tính được tọa độ không gian địa tâm X, Y, Z theo các công thức sau:
Trang 16Nếu điểm xét P nằm ngay trên mặt Ellipsoid thì độ cao trắc địa của điểm P bằng 0, khi đó từ các phương trình (1.13) ta có:
Công thức Bowring tính đổi tọa độ X, Y, Z sang B, L, H như sau:
'2 3
2 3
.sinArctan
os
Z e b B
Mối quan hệ vi phân giữa cung kinh tuyến với độ vĩ B là:
Ds = M.dB (1.21)
trong đó ds là vi phân cung kinh tuyến, dB là vi phân độ vĩ trắc địa, M là bán kính cung kinh tuyến tại điểm xét, được tính:
2 3
Trang 17Do vòng vĩ tuyến là vòng tròn bán kính (r) cho nên mối quan hệ vi phân giữa cung vĩ tuyến và độ kinh khá đơn giản:
ds ' = r.dL = N.cosB.dL (1.23)
trong đó ds’ là vi phân cung vĩ tuyến, dL là vi phân độ kinh trắc địa, N là bán kính cung vòng thẳng đứng thứ nhất tại điểm xét, được tính theo (1.14)
1.1.2.2 Hệ tọa độ vuông góc không gian địa diện chân trời
Hệ tọa độ vuông góc không gian địa tâm (X, Y, Z) có ưu điểm là cho phép biểu diễn mọi điểm trên bề mặt trái đất trong cùng một hệ tọa độ, nhưng lại có một nhược điểm là đối với người sử dụng ở tại vị trí nào đó trên trái đất, hệ địa tâm (X,
Y, Z) lại không thể hiện được tính trực quan về mặt bằng và độ cao Trong trường hợp này chúng ta có thể sử dụng hệ tọa độ vuông góc không gian địa diện chân trời (x, y, z), có gốc tọa độ (0) là một điểm xét (Q) trên bề mặt trái đất, trục ox hướng về cực Bắc, trục oz trùng với phương pháp tuyến tại gốc (0), trục oy hướng về Đông và vuông góc với hai trục ox, oz Mặt phẳng xoy là mặt phẳng chân trời vì vuông góc với phương pháp tuyến tại gốc (0) Hệ tọa độ vuông góc không gian địa diện đáp ứng được yêu cầu của không gian Euclid đối với trường ngẫu nhiên xác lập trên bề mặt đất trong một phạm vi gần điểm gốc địa diện [1]
Các công thức tính đổi tọa độ giữa hệ vuông góc không gian địa tâm (X, Y, Z) và hệ vuông góc không gian địa diên chân trời (x, y, z) như sau:
2
cosB.cosLcosB.sinL
Trang 18sin osL sin cosB.cosL
Các giá trị tọa độ x, y, z trong hệ địa diện chân trời cũng thường được ký
hiệu tương ứng là N, E, U (North – East – Up)
1.1.2.3 Hệ tọa độ vuông góc phẳng
Trên một khu vực nào đó, chúng ta có thể sử dụng hệ tọa độ vuông góc phẳng để biểu thị vị trí của các dữ liệu không gian Có thể thiết lập hệ tọa độ vuông góc phẳng theo hai cách như sau [1]:
* Sử dụng phép chiếu bản đồ
Đây là cách thiết lập hệ tọa độ vuông góc phẳng thường dùng nhất, được xác lập trong hệ tọa độ nhà nước Ở nước ta sử dụng phép chiếu hình trụ ngang đồng góc UTM, theo phép chiếu này, hệ tọa độ vuông góc phẳng được thiết lập cho từng múi chiếu 6 độ hoặc 3 độ Về nội dung phép chiếu này đã được trình bày trong các môn học như toán bản đồ, trắc địa cao cấp đại cương hoặc trắc địa mặt cầu v.v…
* Thiết lập hệ tọa độ vuông góc phẳng độc lập (giả định)
Với khu vực không lớn, chúng ta có thể tự thiết lập một hệ tọa độ vuông góc phẳng giả định độc lập với hệ tọa độ nhà nước để làm hệ quy chiếu giả định cho toàn bộ dữ liệu quan trắc trên khu vực đó Phạm vi khu vực sử dụng hệ tọa độ phẳng giả định này chỉ nên trong bán kính khoảng 20km
1.1.2.4 Hệ thống độ cao
Trong thực tế người ta sử dụng hệ thống độ cao chuẩn (Normal Height) hoặc
hệ thống độ cao chính (Orthometric Height) Nếu ký hiệu là dị thường độ cao và
N là độ cao Geoid tại điểm xét, thì mối quan hệ giữa độ cao chuẩn và độ cao chính h với độ cao trắc địa H của điểm xét sẽ được thể hiện qua các biểu thức sau: g
H h (1.27)
Trang 19H h g N (1.28) Khi đã nói đến độ cao Geoid N hay dị thường độ cao là phải xét đến mối liên quan đến Ellipsoid nào Ví dụ, độ cao Geoid N xác định từ mô hình Geoid toàn cầu được xác định trên Ellipsoid WGS-84 [1]
1.1.3 Vấn đề mô hình hóa dữ liệu địa không gian
Mô hình số địa hình DTM (Digital Terrain Model) là một hình thức biểu
diễn bề mặt đất tự nhiên được sử dụng rộng rãi trong phân tích địa hình phục vụ cho nhiều mục đích khác nhau Trong trắc địa, có một số phương pháp được sử dụng để xây dựng mô hình số địa hình Phân tích địa thống kê được ứng dụng để xem xét đánh giá sai số của một mô hình số DTM và làm chính xác hóa mô hình số DTM tiên nghiệm (đã có) bằng các trị đo độ cao địa hình bổ sung
Để đánh giá sai số của một mô hình số địa hình (DTM) đã có, người ta thực hiện đo đạc kiểm định độ cao địa hình bằng công nghệ chính xác, với độ tin cậy cao như sử dụng phương pháp đo cao hình học v.v…Các điểm đo kiểm định cũng cần được thiết kế với phân bố hợp lý trên một diện đủ lớn để có thể thực hiện phương pháp phân tích địa thống kê Tại vị trí các điểm đo kiểm định ta xác định được số dư
độ cao địa hình theo công thức:
Mô hình số độ cao DEM (Digital Elevation Model) là dạng mô hình số có
thể biểu diễn mọi yếu tố có thể định lượng trong hệ quy chiếu tọa độ mặt bằng x, y Yếu tố định lượng đó là thành phần thứ 3 (ký hiệu là z) trong khái niệm không gian
3 chiều (3D) Thành phần thứ ba đó có thể là dị thường trong lực, dị thường độ cao,
độ ẩm của đất, hay một chỉ số định lượng của môi trường tự nhiên v.v…
Trang 20Như vậy mô hình số địa hình DTM chỉ là một trường hợp của mô hình số độ cao DEM Cách xử lý mô hình DEM cũng hoàn toàn thực hiện như mô hình số địa hình.[1]
1.2 Khái lược về lý thuyết địa thống kê
1.2.1 Tính quy luật và tính ngẫu nhiên của dữ liệu địa không gian
Trong tự nhiên, bản chất của đối tượng nghiên cứu có thể là trường liên tục (ví dụ như trường trọng lực), nhưng bằng quan trắc, đo đạc chúng ta chỉ có thể nhận được các dữ liệu rời rạc Từ các dữ liệu quan trắc rời rạc chúng ta lại phải khái quát hóa để xây dựng lại mô hình liên tục của đối tượng nghiên cứu
Để tiếp cận vấn đề trên, chúng ta hãy xem xét một bộ sưu tập Z(si) các dữ liệu không gian trong một khu vực nhất định (miền D) với thuộc tính của bộ dữ liệu không gian đó là chúng đã được đo hoặc được quan trắc, mỗi giá trị đo hoặc quan trắc Z(si) luôn xác định tại vị trí trong không gian (si) của hệ quy chiếu và luôn kèm theo sai số đo (còn gọi là nhiễu) tuân theo quy luật phân bố chuẩn (phân bố Gauss), khi đó chúng ta đã có một trường ngẫu nhiên, cụ thể hơn là một mô hình trường
ngẫu nhiên không gian SRF (Spatial Random Field Model) Như vậy, trường ngẫu
nhiên được hiểu là tập hợp các giá trị đo (hay quan trắc) mang tính ngẫu nhiên phân
bố trên một miền nào đó Tập hợp đó được ký hiệu là Z(s1), Z(s2), …, Z(sn) Z(s) được gọi là biến ngẫu nhiên và được viết:
Z s :s D R d (1.30) trong đó: D là không gian xét, Rd là miền số thực không ngẫu nhiên, s là véc
tơ tọa độ, khi d = 2, s = [x,y]
Một đặc điểm trong xây dựng dữ liệu không gian là phải xác định vị trí của các điểm khảo sát Thông thường người ta chỉ cần xác định vị trí mặt bằng trong hệ tọa độ quy ước, trong một vài trường hợp có thể phải xác định cả độ cao của điểm khảo sát Nhiệm vụ này, do những người làm trắc địa – bản đồ thực hiện bằng các thiết bị máy móc và các phương pháp đo đạc đã biết
Dữ liệu không gian luôn chứa thông tin đặc thù mà chúng ta quan tâm là vị trí của dữ liệu đó Ví dụ chúng ta có thể tập hợp một số lượng lớn các dữ liệu về hệ sinh thái, địa chất, hải dương học, khí tượng, tài nguyên rừng, dịch tễ học v.v…đều
Trang 21có liên quan tới vị trí địa lý của dữ liệu Vị trí là một bộ dữ liệu về tọa độ như độ vĩ,
độ kinh, đối với một số loại dữ liệu có vị trí được xác định bởi 3 thành phần tọa độ (không gian) là độ vĩ, độ kinh và độ cao.[1]
1.2.2 Trường ngẫu nhiên không gian và phân loại
Trường ngẫu nhiên không gian được định nghĩa là một quá trình ngẫu nhiên
(Random Processes or Stochastic Processes) mà các tham số của nó được xác định
trong không gian Euclid (Rn), có số chiều n không ít hơn 1
Với tiêu chí phân loại khác, có khái niệm trường ngẫu nhiên không gian liên tục, trường ngẫu nhiên không gian rời rạc, trường ngẫu nhiên có tính dừng yếu hay
có tính dừng bậc hai (weak stationarity, second order stationarity), trường ngẫu nhiên có tính dừng nội tại (intrinsic stationarity), trường ngẫu nhiên có tính dừng mạnh (strict stationarity) v.v…
Trường ngẫu nhiên không gian có tính dừng bậc hai là loại trường ngẫu nhiên thường gặp trong giải quyết các bài toán của lĩnh vực khoa học trái đất như địa chất, địa vật lý, thủy văn, môi trường, hải dương học, trắc địa cao cấp v.v…
Một trường ngẫu nhiên không gian Z(s) được coi là có tính dừng yếu hay có tính dừng bậc hai nếu:
E[Z(s)] = = constant và (1.31) Cov[Z(s i ), Z(s j )] = C(s i – s j ) = C(h) (1.32)
Ký hiệu (1.32) ở trên có nghĩa là hàm hiệp phương sai độc lập vị trí của các điểm mà chỉ phụ thuộc vào hiệu số của các véc tơ điểm Như vậy cũng có nghĩa là phương sai của trường ngẫu nhiên chính là hiệp phương sai ứng với hiệu các véc tơ bằng 0, tức là:
Var[Z(s)] = C(0) (1.33) Một trường ngẫu nhiên dừng bậc hai là đẳng hướng (isotropic) nếu hàm hiệp phương sai C(h) chỉ phụ thuộc vào khoảng cách của véc tơ h mà không phụ thuộc vào hướng của nó
Một trường ngẫu nhiên có tính dừng nội tại nếu:
E[Z(s)] = = constant và (1.34) Var[Z(s i ) – Z(s j )] = f(s i – s j ) (1.35)
Trang 22Ký hiệu (1.35) ở trên biểu diễn f cũng là một hàm của hiệu các véc tơ điểm
và độc lập với từng vị trí các điểm xét [6]
Một trường ngẫu nhiên được coi là có tính dừng mạnh nếu kỳ vọng toán học của chúng là hằng số và phân phối xác suất không thay đổi khi dịch chuyển vị trí xét bởi một khoảng (h) trong không gian xét D, tức là thỏa mãn đẳng thức:
P(Z(s 1 ) < z 1 , Z(s 2 ) < z 2 , …, Z(s n ) < z n ) =
= P(Z(s 1 + h) < z 1 , Z(s 2 + h) < z 2 , …, Z(s n + h) < z n (1.36) Đối với trường ngẫu nhiên luôn có một số đặc trưng phân phối như phương sai, hàm hiệp phương sai, hàm bán phương sai v.v… Trong các trường ngẫu nhiên không gian có tính dừng bậc hai (có các mô mem thống kê bậc hai), chúng ta quan
tâm chủ yếu tới nhóm các trường ngẫu nhiên không gian Gauss GSRF (Gaussian Spatial Random Fields) hay một quá trình Gauss (Gaussian Processes) Nhóm
trường ngẫu nhiên không gian Gauss là nhóm trường ngẫu nhiên có tính dừng bậc hai và có tính dừng mạnh [1]
1.2.3 Phân tích sơ bộ dữ liệu địa không gian
Phân tích sơ bộ dữ liệu giúp đánh giá quy luật phân phối của dữ liệu thực tế (thực nghiệm) để biết được một số đặc trưng chung của bộ dữ liệu như trị lớn nhất, trị nhỏ nhất, trị trung bình, độ phân tán của dữ liệu, tính bất đối xứng, tính đẳng
hướng, xu thế biến đổi (trend) v.v… Dựa vào các tham số sơ bộ nêu trên có thể kết
luận về tính chất của trường ngẫu nhiên đó và trả lời cho câu hỏi là đó có phải là trường ngẫu nhiên không gian Gauss hay không? Có thỏa mãn tính chất của một trường ngẫu nhiên có tính dừng bậc hai hay không? Điều này có ý nghĩa rất quan trọng đối với bước thứ hai là phân tích tương quan của dữ liệu Trong bước này cũng có thể phát hiện được những trị quan trắc có chứa sai số thô để loại bỏ chúng
ra khỏi trường dữ liệu ngẫu nhiên [1]
1.2.3.1 Lập biểu đồ tần suất
Biểu đồ tần suất (histogram) còn gọi là biểu đồ tần suất thông thường (ordinary histogram) là cách biểu diễn chung nhất về mật độ phân bố dữ liệu thực nghiệm Nếu có một chuỗi số liệu với n trị đo z i (với i=1,2,…,n), chúng ta sắp xếp
Trang 23chúng theo chiều tăng dần của các giá trị sao cho z 1 < z 2 < … < z n Trong khoảng giá trị nhỏ nhất và lớn nhất ta chia thành m khoảng nhỏ, được ký hiệu tương ứng
với các điểm chia là a 0 , a 1 , …, a m-1 , a m
trong đó: z max là giá trị lớn nhất, z min là giá trị nhỏ nhất
Số lượng phân khoảng tính theo (1.37) phải được làm tròn thành số nguyên (m)
Theo công thức biểu diễn hàm phân phối của đại lượng ngẫu nhiên:
Ở đây, chúng ta sẽ xác định mật độ thực nghiệm (experimental density) bằng
cách đếm số lượng có giá trị nằm trong phân khoảng thứ m thỏa mãn:
ak 1 z ak (1.40)
Ký hiệu n k là số trị đo nằm trong phân khoảng thứ k (theo 1.40) Tỷ số n k /n
sẽ thể hiện tần suất trị đo trong phân khoảng thứ k Biểu đồ với trục tung thể hiện số
trị đo n k hoặc tần suất là tỷ số n k /n và trục hoành biểu thị các phân khoảng a 0 , a 1 , …,
a m-1 , a m cho ta biểu đồ tần suất của dữ liệu trường ngẫu nhiên
Lưu ý tới công thức tổng quát xác định mô men bậc k của đại lượng ngẫu nhiên liên tục:
Nếu biểu đồ tần suất thể hiện số lượng trị quan trắc trên trục tung thì tổng số lượng của tất cả phân khoảng phải bằng đúng n, tức là:
Trang 24m k k
Còn nếu trục tung của biểu đồ tần suất thể hiện tần suất là tỷ số n k /n của các
trị đo trong các phân khoảng thì:
1.2.3.2 Lập biểu đồ phân phối tích lũy thực nghiệm
Biểu đồ tần suất tích lũy (cumulative histogram) còn được gọi là đường cung nhọn (Ogive) là biểu đồ phân phối tích lũy thực nghiệm [3] Đối với bộ dữ liệu đã được sắp xếp theo thứ tự tăng dần: z 1 < z 2 < … < z n và cũng được chia ra m phân khoảng như trên Trong mỗi phân khoảng ta kiểm đếm số lượng trị đo và lập tỷ số
n k /n là tần suất thực nghiệm Từ đó chúng ta lập các tổng theo các phân khoảng để
xác định tần suất tích lũy theo công thức:
1
i k i
k
n p
(với i=1,2,…,m)
Cũng có thể không tính tổng các tỷ số n k
n mà tính tổng số lượng trong các phân khoảng theo công thức:
1
i k i
k
n p
(với i=1,2,…,m)
Trên trục tung thể hiện tần suất tích lũy theo (1.44) hoặc số lượng tích lũy
theo (1.45), còn trên trục hoành thể hiện các giá trị a i, khi đó sẽ nhận được một đường gẫy khúc (bậc thang) gọi là biểu đồ tần suất tích lũy
1.2.3.3 Thống kê tổng thể
Thống kê tổng thể hay thống kê tóm lược (summary statistics) sẽ xác định
một số đặc trưng khái quát của bộ dữ liệu không gian nhưng chưa xét tới các đặc
Trang 25trưng liên quan tới vị trí, do đó giá trị các tham số tính toán sẽ được thực hiện tương
tự như đối với biến ngẫu nhiên vô hướng
* Trị trung bình số học
Trị trung bình số học là giá trị cần quan tâm đầu tiên đối với bộ dữ liệu của trường ngẫu nhiên Trị trung bình số học cho ta thông tin về mức chuẩn chung
(Typical) hay giá trị trọng tâm (Central) của bộ dữ liệu Trị trung bình số học được
tính theo công thức đơn giản đã biết:
1 2
1
1 n n
i i
l l
z z
z z với l = (n+1)/2, nếu n lẻ (1.47)
với l = n/2, nếu n chẵn
Lưu ý là giá trị trung tuyến (z m ) không phải là trị trung bình số học mà là giá trị ở giữa của bộ dữ liệu (tức 0,5), đương nhiên về độ lớn của giá trị trung tuyến cũng gần với trị trung bình số học
* Độ phân tán
Sau khi xác định được trị trung bình của bộ dữ liệu, chúng ta có thể xác
định độ phân tán, còn được gọi là độ trải rộng (spread) của dữ liệu qua giá trị trung
bình bình phương của hiệu số của từng giá trị với trị trung bình theo công thức sau:
Một chỉ tiêu khác biểu thị độ phân tán của dữ liệu là khoảng cách liên tứ
phân vị (interquartile range) ký hiệu là , còn gọi là độ phân tán Q (Q-spread)
Khoảng cách liên tứ phân vị được tính theo công thức:
I q = Q(0,75) – Q(0,25) (1.49)
Trang 26trong đó: Q(0,75) gọi giá trị là tứ phân vị trên (upper quartile) và Q(0,25) là giá trị tứ phân vị dưới (lower quartile) Ưu điểm của khoảng cách liên tứ phân vị là
ít nhạy cảm (ít tác động) bởi một vài giá trị lớn như độ lệch chuẩn Với lý do đó, độ phân tán Q thường được sử dụng để phân tích khám phá ban đầu, còn độ lệch chuẩn thường được sử dụng tiếp theo cho dữ liệu có phân phối gần với phân phối chuẩn
* Độ đối xứng
Trong các đặc trưng phân phối, độ đối xứng là một đặc tính nổi bật và quan trọng Có thể thấy rằng, độ phân tán đặc trưng bởi một con số đơn lẻ, nhưng độ đối xứng của dữ liệu đã cho thấy được quy luật phân bố của chúng quanh trị trung tâm
Đó chính là ưu điểm của độ đối xứng
Độ đối xứng được thể hiện bởi một hệ số gọi là độ lệch hay độ xiên
(skewness coefficient) tính theo công thức sau:
3 1
1 3
1 n i s
n k
1.2.4 Lập bản đồ địa thống kê cho dữ liệu địa không gian
Bản đồ được con người sử dụng để biểu thị các yếu tố trên mặt đất Với quan điểm của địa thống kê, bản đồ là một hình thức thống kê dữ liệu không gian
Mọi số liệu đo đạc hay quan trắc trong lĩnh vực khoa học Trái đất và môi trường luôn gắn với một hệ quy chiếu không gian – thời gian nào đó Một hệ quy chiếu không gian – thời gian được xác định bởi ít nhất 4 tham số sau [10]:
- Vị trí địa lý (là tọa độ địa lý φ, λ hoặc tọa độ vuông góc phẳng x, y)
- Độ cao
- Thời gian (năm, tháng, ngày, giờ, phút…)
Trang 27- Dãn cách không gian – thời gian của các trị quan trắc (mật độ, tần suất…) Với thuộc tính không gian của dữ liệu quan trắc, cho phép chúng ta thực hiện các phân tích và hiển thị dữ liệu bằng ngôn ngữ bản đồ, đó chính là bản đồ địa thống kê
Bản đồ địa thống kê là phương pháp thể hiện có tính trực quan, giúp chúng ta
có cách nhìn khái quát, tổng thể về sự phân bố của đối tượng nghiên cứu trên một không gian xác định Nếu xem xét bản đồ địa thống kê theo quan điểm của bản đồ
học, thì bản đồ địa thống kê là một dạng bản đồ chuyên đề (thematic map) có một
số lớp thông tin, trong đó có lớp thông tin của đối tượng cần nghiên cứu
Hiện nay, với sự hỗ trợ của công nghệ thông tin và máy tính, phương pháp bản đồ địa thống kê đã trở thành công cụ thường dùng và có hiệu quả trong phân tích dữ liệu không gian – thời gian Nó được ứng dụng phổ biến trong các lĩnh vực như: công nghiệp mỏ, địa chất, nông nghiệp, khí tượng, môi trường, sinh thái, hải
dương học và kể cả trong các lĩnh vực khác như dịch tễ học (epidemiology), địa lý nhân văn (human geography), địa hình thái định lượng (geomorphometry) v.v…
Phương pháp bản đồ địa thống kê không những được sử dụng để thể hiện các
dữ liệu quan trắc thô (chưa xử lý, phân tích) mà còn dùng để thể hiện kết quả mô
phỏng (simulation) của trường dữ liệu sau bước phân tích, xử lý Trong mọi trường
hợp, phương pháp bản đồ địa thống kê với sự hỗ trợ của công nghệ thông tin là phương pháp cho chúng ta nhận thức đối tượng nghiên cứu dễ dàng, sinh động và phong phú
Các đường đẳng trị của dữ liệu không gian trên bản đồ hoặc sơ đồ thống kê
là cơ sở để xem xét nghiên cứu cấu trúc của dữ liệu và có thể đánh giá được tính
đẳng hướng (isotropic) hay không đẳng hướng (anisotropy), phân bố đều hay không
đều của bộ dữ liệu quan trắc Đây là cách phân tích dữ liệu theo phương pháp phổ
(Spectral Method) Điều này là hết sức quan trọng để áp dụng phương pháp xác
định các tham số đặc trưng phụ thuộc không gian của dữ liệu như bán phương sai hay hiệp phương sai [1]
Trang 281.3 Một số đặc trưng địa thống kê của dữ liệu địa không gian
1.3.1 Phương sai, hiệp phương sai và bán phương sai
1.3.1.1 Phương sai
Phương sai (độ lệch bình phương trung bình) của đại lương ngẫu nhiên X, kí hiệu Var (X) hay D (X), được định nghĩa bằng công thức:
Var(X) = E{[X – E(X)]2} (1.51)
Nếu X là đại lượng ngẫu nhiên rời rạc nhận các giá trị có thể x 1 , x 2 , …, x n với
các xác suất tương ứng p 1 , p 2 , …, p n thì
2
1ar
1.3.1.2 Hiệp phương sai
Hàm hiệp phương sai của trường ngẫu nhiên đó được ký hiệu là C(h) và được viết: Cov[Z(s), Z(s + h)] = C(h) (1.55)
Hàm hiệp phương sai của trường ngẫu nhiên đẳng hướng chỉ phụ thuộc vào một biến số duy nhất là khoảng cách h giữa các trị quan trắc trong trường ngẫu nhiên tức là khoảng cách giữa biến ngẫu nhiên trong không gian xét D Xét cho trường hợp đặc biệt khi biến số h = 0, ta sẽ có giá trị của hàm hiệp phương sai, chính là phương sai của trường ngẫu nhiên
Trang 29Hàm hiệp phương sai là dạng hàm cơ bản của địa thống kê, nó phản ánh đặc trưng phân phối (cấu trúc) nội tại của một trường ngẫu nhiên dừng bậc hai đẳng hướng Thứ nguyên (đơn vị) của hiệp phương sai cũng bằng bình phương của thứ nguyên đối tượng xét Z(s)
Hiệp phương sai xác định theo (1.55) hay (1.57) là hiệp phương sai (nội bộ) của một trường ngẫu nhiên, do đó có thể hiểu là hiệp phương sai cùng loại để phân biệt với hiệp phương sai của các biến ngẫu nhiên khác loại hay còn gọi là hiệp
phương sai chéo (cross-covariance) [1]
1.3.1.3 Bán phương sai
Đối với một trường ngẫu nhiên dừng bậc hai Z(s) đẳng hướng, chúng ta xét gia số của các cặp giá trị ngẫu nhiên ở các vị trí cách nhau bằng khoảng dịch chuyển
h, tức là hiệu số Z(s + h) – Z(s) Dễ nhận thấy rằng, các hiệu số đó có tính chất ngẫu
nhiên nên luôn có:
E[Z(s + h) – Z(s)] = 0 (1.58)
Var Z s h Z s 2 h (1.59) Giá trị γ(h) là hàm của khoảng cách h, được gọi là hàm bán phương sai
(semivariance) nhưng thường dùng hơn là thuật ngữ variogram, đó là hàm cơ bản
của địa thống kê, nó phản ánh đặc trưng phân phối (cấu trúc) nội tại của một trường ngẫu nhiên dừng bậc hai đẳng hướng Thứ nguyên (đơn vị) của bán phương sai bằng bình phương thứ nguyên của đối tượng xét Z(s) [1]
1.3.2 Hiệp phương sai thực nghiệm và hàm hiệp phương sai lý thuyết
1.3.2.1 Hiệp phương sai thực nghiệm
* Công thức tính hiệp phương sai thực nghiệm
- Tính hiệp phương sai thực nghiệm cùng loại
Hiệp phương sai thực nghiệm (Experimental Covariance) cùng loại được
tính theo công thức thực dụng sau:
Trang 30E Z s (1.61) Trong trường hợp này, để tính hiệp phương sai thực nghiệm có thể sử dụng các công thức thực dụng như sau:
- Tính hiệp phương sai thực nghiệm khác loại (hiệp phương sai chéo)
Giá trị hiệp phương sai thực nghiệm khác loại theo khoảng cách h được tính theo công thức:
Trang 31Những tham số thể hiện mối liên hệ cấu trúc như hiệp phương sai chéo, hệ số tương quan chéo theo khoảng cách cần triển khai nghiên cứu trên các trường dữ liệu khác loại thực xác lập trên cùng hệ quy chiếu không gian như giữa dị thường trọng lực với dị thường độ cao, giữa số liệu đo cao vệ tinh với dị thường trọng lực, giữa
độ cao địa hình với dị thường độ cao, giữa điểm ảnh vệ tinh (hoặc ảnh hàng không) với đối tượng trên thực tế, giữa mức độ ô nhiễm với sức khỏe cộng đồng, giữa độ
ẩm đất với năng suất cây trồng v.v…
Trong các tài liệu về địa thống kê, giới thiệu khá nhiều mô hình hàm bán phương sai lý thuyết, mô hình hàm hiệp phương sai lý thuyết, nhưng mô hình hàm bán phương sai chéo và hàm tương quan chéo (lý thuyết) hầu như không có Đây là vấn đề cần nghiên cứu thêm để có thể có những đóng góp về phương diện lý thuyết cũng như về ứng dụng thực tiễn [1]
* Phương pháp tính hiệp phương sai thực nghiệm
Tương tự như tính bán phương sai thực nghiệm, việc tính các giá trị hiệp phương sai thực nghiệm theo các khoảng cách h được thực hiện theo công thức (1.62) hoặc (1.63) Về kỹ thuật tính cũng được thực hiện theo nguyên tắc vòng tròn động với dung sai xác định là ∆h/2 Các cặp điểm có khoảng cách h thỏa mãn các bất đẳng thức:
h h h (1.67)
đều được đưa vào để tính hiệp phương sai Số cặp điểm thỏa mãn (1.67) là N(h)
Cũng cần kiểm tra tính đẳng hướng của trường dữ liệu trước khi tính hiệp phương sai thực nghiệm [1]
1.3.2.2 Hàm hiệp phương sai lý thuyết
Các hàm hiệp phương sai lý thuyết về bản chất là các hàm hiệp phương sai đẳng hướng, chỉ phụ thuộc vào khoảng cách (h), trong một số trường hợp sử dụng khoảng cách cầu ψ [1]
- Hàm Hirvonen
Năm 1962, Hirvonen R.A (1908 – 1989) đã đưa ra công thức tính hiệp phương sai dị thường trọng lực lý thuyết có dạng như sau:
Trang 322 2 0
C
trong đó C 0 = C(0) và ψ0 là các tham số đặc trưng của trường trọng lực
C 0 là phương sai dị thường trọng lực, còn được gọi là phương sai tín hiệu
(signal variance), còn ψ0 được gọi là khoảng cách liên hệ (correlation length) hay
C
C h
Như vậy thay vì trong (1.68) đã sử dụng tham số đặc trưng ψ0 có đơn vị góc
(radian), trong công thức (1.70) đã sử dụng tham số đặc trưng là h 0 với đơn vị chiều dài
Hàm Hirvonen, hiệp phương sai giảm nhanh khi khoảng cách tăng lên Ngoài hàm Hirvonen (1.68) và (1.70) có thể sử dụng hàm hiệp phương sai Hirvonen tổng quát có dạng như sau:
0
2 2 0
Trang 33Ngoài các hàm Hirvonen, hàm Markov bậc ba, người ta còn sử dụng một số hàm hiệp phương sai lý thuyết khác như:
C h C e (1.73)
trong đó, C 0 và h 0 cũng là các tham số đặc trưng
Theo công thức hàm mũ Kaula (1.73) có thể thấy rằng khi h = 0 thì hiệp
phương sai bằng C 0, cũng chính là giá trị phương sai
B h
C h C e (1.75)
Đặc điểm của hàm hiệp phương sai (1.75) là đạo hàm bậc nhất của C(h) theo
h tại h = 0, có giá trị bằng 0 (không có đột biến tại các điểm xét)
Với hàm mũ, người ta lấy khoảng cách tương quan d0 khi C(h 0 ) = 0,5.C(0),
1.3.3 Bán phương sai thực nghiệm và hàm bán phương sai lý thuyết
1.3.3.1 Bán phương sai thực nghiệm
Trang 34được gắn với hệ quy chiếu tọa độ quy ước Trong trường hợp này, chỉ xác định
được các giá trị bán phương sai thực nghiệm (Experimental Variogram) tương ứng
với khoảng cách xét (h) nào đó Từ công thức (1.77), chúng ta có công thức thực dụng để tính bán phương sai thực nghiệm như sau:
2
1
12
trong đó: N(h) là số cặp giá trị Z(s) và Z(s+h) có vị trí cách nhau cùng một
khoảng cách h (cho phép khác nhau trong phạm vi dung sai)
Từ giá trị bán phương sai thực nghiệm, sẽ tính được hệ số tương quan thực
nghiệm (Experimental Correlation) ở khoảng cách h như sau:
1
0
h h
C (1.79)
trong đó: C(0) là phương sai
Nếu sử dụng hệ tọa độ vuông góc phẳng xoy, khoảng cách h giữa hai điểm
i,k được tính theo công thức quen thuộc:
Về kỹ thuật tính toán, chúng ta sẽ áp dụng phương pháp vòng tròn động bán kính thay đổi với dung sai xác định
Số khoảng cách (h) và giãn cách giữa các khoảng cách (h) tính toán là vấn đề cần xem xét cho trường hợp cụ thể để có thể khái quát hết được quy luật tương quan không gian của trường dữ liệu Khoảng cách h tính toán phải đủ lớn để xác định được khoảng cách ảnh hưởng Dung sai khoảng cách ∆h/2 cần xác lập sao cho số lượng cặp điểm chọn được ở các khoảng cách h không quá ít, không thể tính được bán phương sai thực nghiệm, hoặc là tính được với độ tin cậy thấp
Trang 35Sau khi tính xong chuỗi giá trị bán phương sai thực nghiệm theo các khoảng cách h tăng dần, cần triển lên đồ thị để có thể nhận dạng quy luật biến đổi của nó theo khoảng cách Dựa vào quy luật biến đổi của bán phương sai thực nghiệm, có thể chọn được hàm bán phương sai lý thuyết phù hợp Dựa trên phương pháp làm
khớp (fitting) hàm lý thuyết với số liệu thực nghiệm chúng ta sẽ xác định được các
tham số của hàm bán phương sai lý thuyết, chúng có vai trò quan trọng trong nội suy Kriging [1]
1.3.3.2 Hàm bán phương sai lý thuyết
Hàm bán phương sai lý thuyết là dạng hàm toán học liên tục được đưa ra để xấp xỉ tốt nhất với các giá trị bán phương sai thực nghiệm, phục vụ cho các tính toán nội suy, làm trơn, dự báo hoặc xây dựng mô hình của trường ngẫu nhiên Hầu hết các hàm bán phương sai có dạng đường cong, tuy nhiên cũng có trường hợp người ta sử dụng hàm bán phương sai là hàm tuyến tính (đường thẳng) [13] Sau đây là một số dạng hàm bán phương sai lý thuyết thường được áp dụng:
* Các hàm bán phương sai có hai tham số
Phần lớn các hàm bán phương sai lý thuyết thường dùng là hàm có hai tham
số là giá trị ngưỡng c và khoảng cách ảnh hưởng L, như các hàm sau:
- Hàm bán phương sai cầu
Hàm bán phương sai cầu (Spherical) có dạng:
31,5 h 0,5 h
g h c
L L nếu h ≤ L (1.81)
và g(h) = c nếu h > L
trong đó: h là khoảng cách trễ (lag) chính là biến số của hàm bán phương sai
Trong hàm bán phương sai cầu có hai tham số cần xác định: c là tham số giá trị
ngưỡng (sill), L là tham số khoảng cách ảnh hưởng (rang of influence) hay khoảng cách thực hành (practical range)
- Hàm bán phương sai mũ
Hàm bán phương sai mũ (Exponential) có dạng đơn giản:
Trang 36g h c 1 Exp h
L (1.82) hoặc có dạng:
g h c 1 Exp 3h
L (1.83) Dạng hàm bán phương sai mũ (1.83) thường được sử dụng nhiều hơn
- Hàm bán phương sai Gauss
Hàm bán phương sai Gauss (Gaussian) có dạng:
2 2
3
L (1.84)
- Hàm bán phương sai lũy thừa
Hàm bán phương sai dạng lũy thừa (Power) có dạng:
g(h)=c.h ω (1.85) trong (1.85) có hai tham số cần xác định là c và
* Hàm bán phương sai có ba tham số
Trong một vài tài liệu có giới thiệu dạng hàm bán phương sai có ba tham số Trong đó đưa thêm tham số thứ ba với mục đích làm trơn hơn đồ thị của hàm với các giá trị bán phương sai thực nghiệm
Hàm bán phương sai có ba tham số có dạng:
Giá trị v thường lấy là 1 hoặc ½, còn delta Kronecker được xác định bởi:
Đối với hàm bán phương sai ba tham số việc làm khớp sẽ phức tạp hơn, ngay
cả khi sử dụng phương pháp làm khớp tự động (xấp xỉ hàm) theo quy trình tính lặp
Trang 37Xấp xỉ hàm (Functional Approximation) là phương pháp tính toán dựa trên
nguyên lý bình phương nhỏ nhất để xác định các tham số của một hàm lý thuyết Y
= f(X) dựa trên các số liệu thực nghiệm rời rạc, còn được gọi là phương pháp ước lượng tham số
Trong trường hợp giữa hai dãy số liệu thực nghiệm xi và yi đã biết mối quan
hệ của chúng dưới dạng một hàm lý thuyết có các tham số cần xác định (ví dụ có 3 tham số a, b, c) Hàm lý thuyết có dạng là:
Trang 38v v V
n
l l L l
(1.96)
Nếu số giá trị quan trắc (n) lớn hơn số tham số (trong trường hợp này là n > 3), ta sẽ xác định da, db, dc theo nguyên lý bình phương nhỏ nhất Hệ phương trình chuẩn sẽ là:
Phương pháp xấp xỉ hàm được xử dụng trong nghiên cứu các quy luật tự nhiên dựa trên các số liệu đo đạc hay quan trắc Các giá trị của hàm được xác định theo phương pháp xấp xỉ (theo nguyên lý bình phương nhỏ nhất) là cơ sở có độ tin cậy cần thiết để sử dụng cho tính toán nội suy, mô phỏng hoặc dự báo các quy luật
tự nhiên nào đó [1]
1.3.4 Mối quan hệ giữa hiệp phương sai và bán phương sai
Đối với trường ngẫu nhiên dừng bậc hai, bán phương sai có tính chất sau:
Var[Z(s + h) – Z(s)] = Var[Z(s)] + Var[Z(s + h) – 2cov[Z(s), Z(s + h)] =
2Var Z s 2 cov Z s Z s, h 2 C 0 C h 2 h (1.99)
Trang 39s s V Z s Z s (1.101) hoặc viết theo công thức kỳ vọng (1.77)
Quy luật chung của bán phương sai là khi s = 0 giá trị γ(h) = 0 và tăng tới
một giới hạn nào đó gọi là ngưỡng (Sill) hoặc là biên độ (amplitude) Giới hạn trên của bán phương sai sẽ có khoảng cách tương ứng gọi là độ trễ (lag) Đó là cơ sở để
xác định khoảng cách ảnh hưởng hay khoảng cách giới hạn
Hiệp phương sai và bán phương sai đều là các chỉ tiêu thống kê về mức độ
(đo) mức tương quan không gian nội bộ (Spatial Autocorrelation) hay đặc trưng cho
tính chất biến đổi không gian của trường ngẫu nhiên.[1]
1.4 Thuật toán Kriging
1.4.1 Hệ phương trình Kriging và phân loại Kriging
1.4.1.1 Hệ phương trình Kriging
Giả sử chúng ta có một trường ngẫu nhiên dừng bậc hai với các giá trị quan
trắc là Z(s 1 ), Z(s 2 ), …, Z(s n ) tại các vị trí s i khác nhau (i=1, 2, …, n) Để ước lượng một giá trị
n
i i i
Trang 40Z s Z s Z s Z s (1.103)
trong đó coi λ 1 , λ 2 , …, λ n là các trọng số của n trị đo Z(s 1 ), Z(s 2 ), …, Z(s n ) tại
n điểm lân cận với điểm cần nội suy
Như giả thiết ở trên, ở đây người ta coi các giá trị quan trắc Z(s 1 ), Z(s 2 ), …, Z(s n ) và cả giá trị hiện thời (actual value) Z(s 0 ) (nếu được quan trắc) tại điểm cần
nội suy là các biến ngẫu nhiên dừng bậc hai có phân phối xác suất như nhau và kỳ vọng toán học là µz Sự khác biệt giữa chúng chỉ là khoảng cách h Sự khác biệt giữa chúng có thể mô tả bằng hàm bán phương sai mũ đơn giản có dạng:
L (1.104)
Đó chính là mô hình ngẫu nhiên của bài toán ước lượng theo (1.101)
Ký hiệu Z s0 là giá trị thực tại điểm cần ước lượng, khi đó ta có công thức tính sai số, chính là hiệu số giữa trị ước lượng với trị thực:
- Không chệch (Unbiasedness)
- Phương sai tối thiểu (Minimum variance)
Để ước lượng là không chệch, thì trị trung bình sai số của các giá trị ước lượng phải bằng 0, tức là:
(1.107)