tiểu luận địa thống kế TIỂU LUẬN ĐỊA THỐNG KÊ Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation.,Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation."Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation."
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KỸ THUẬT ĐỊA CHẤT VÀ DẦU KHÍ
--
TIỂU LUẬN ĐỊA THỐNG KÊ
Giảng viên hướng dẫn: Thầy Phạm Sơn Tùng
Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán
Variogram 2D, Ordinary Kriging, Validation.
Họ và tên : Phạm Gia Nghĩa
MSSV : 1914324
MỤC LỤC
Trang 2CHƯƠNG 1 : GIỚI THIỆU
CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ QUY TRÌNH TÍNH TOÁN
1 Hàm cấu trúc -Variogram [(h)] [3]
1.1 Định nghĩa
1.2 Các tính chất của hàm cấu trúc – Variogram [γ(h)]
1.3 Các mô hình hàm cấu trúc
1.3.1 Mô hình hình cầu
1.3.2 Mô hình hàm mũ
1.3.3 Mô hình Gaussian
2 Ordinary Kriging (OK):
CHƯƠNG 3 : QUY TRÌNH TÍNH TOÁN
CHƯƠNG 5 : KẾT QUẢ VÀ PHÂN TÍCH KẾT QUẢ
CHƯƠNG 6 : KẾT LUẬN
Trang 3MỤC LỤC HÌNH ẢNH
Hình 1 Biểu đồ hàm cấu trúc 7
Hình 2 Mô hình cầu 8
Hình 3 Mô hình hàm mũ 9
Hình 4 Mô hình Gaussian 9
Hình 5 Sơ đồ khối quá trình tính toán Variogram 2D 12
Hình 6 Sơ đồ khối quá trình tính toán Kriging 12
Hình 7 Sơ đồ khối quá trình tính toán Validation 13
Hình 8 Dữ liệu gốc của bộ dữ liệu khảo sát đất của Trạm thí nghiệm Broom's Barn 13
Hình 9 Đồ thị Variogram cho bộ dữ liệu khảo sát 15
Hình 10 Kết quả tính toán Variogram của bộ dữ liệu 15
Hình 11 Kết quả khảo sát mô hình Variogram đồng nhất từ phần mềm GS+ 16
Hình 12 Khu vực nội suy ở khoảng tọa độ X = [1,5], Y=[27,31] 17
Hình 13 Các điểm cần nội suy và các điểm quan sát được ở xung quanh nó 17
Hình 14 Giao diện nhập tọa độ điểm cần nội suy và 4 điểm quan sát xung quanh trong Excel 18
Hình 15 Giao diện nhập tọa độ điểm cần nội suy và 6 điểm quan sát xung quanh trong Excel 18
Hình 16 Hai ma trận A và B được xây dựng trong Excel cho nội suy từ 4 và 6 điểm xung quanh 19
Hình 17 Kết quả các trọng số Kriging, giá trị ước tính và phương sai khi nội suy với 4 điểm và 6 điểm xung quanh 19
Hình 18 Kết quả tra từ đồ thị Kriging có từ phần mềm GS+ 19
Hình 19 Bảng giá trị nội suy bằng phương pháp Ordinary Kriging em có được thông qua thuật toán xây dựng trên phần mềm Excel 20
Hình 20 Bảng giá trị thực và giá trị nội suy từ phương pháp em xây dựng lại trên phần mềm Excel 21
Hình 21 Biểu đồ đối chứng giữa các giá trị thực và giá trị nội suy từ phương pháp Ordinary Kriging 22
Hình 22 Kết quả đường hồi quy của những điểm khảo sát giá trị thực và giá trị nội suy không quá trùng đường thẳng có hệ số góc bằng tan(45o) = 1 22
Hình 23 Kết quả đối chứng validation với mô hình Variogram Isotropic 22
Hình 24 Kết quả đối chứng validation với mô hình Variogram Anisotropic 23
Hình 25 Hình ảnh kết quả đồ thị Kriging biểu diễn trên mặt phẳng thực hiện bằng Excel.23 Hình 26 Hình ảnh kết quả đồ thị Kriging biểu diễn dạng 3D thực hiện bằng Excel 24
Hình 27 Kết quả nội suy Ordinary Kriging từ mô hình Variogram đồng nhất 25
Hình 28 Kết quả nội suy Ordinary Kriging từ mô hình Variogram không đồng nhất phân bố theo đúng hướng 140o đã thiết lập trước đó 26
Trang 4Hình 29 Vùng dữ liệu mà em chọn thực hiện nội suy, kết quả nhìn từ từ phần mềm GS+.26
Trang 5CHƯƠNG 1 : GIỚI THIỆU
Địa thống kê là một phương pháp mới và đang được tiếp tục hoàn thiện Đã từ nhiều năm,phương pháp được xem là hiện đại, và đang trở lên rất phổ biến, đặc biệt là các nước tư bảnphát triển: Pháp, Mỹ, Canada, Anh Địa thống kê không chỉ áp dụng rộng rãi trong khảosát thăm dò mỏ, địa vật lý, địa chất thuỷ văn, địa chất công trình, địa hoá, dầu khí, khai thác
mỏ mà còn ở nhiều lĩnh vực khác: Nông nghiệp, sinh học, khí tượng thuỷ văn, ngư nghiệp,
đề luôn được quan tâm khi nghiên cứu một hiện tượng, vật chất chính là dữ liệu của hiệntượng, vật chất đó nhưng không phải lúc nào chúng ta đều có thể thu thập hết toàn bộ và đầy
đủ những dữ liệu cần thiết cho quá trình phân tích và nghiên cứu Từ những khó khăn này,các nhà nghiên cứu đã tìm tòi và phát triển các mô hình, phương pháp giúp ước tính (nộisuy) các dữ liệu chưa biết từ những dữ liệu đã biết, nổi bật trong những mô hình, phươngpháp đó chính là hàm cấu trúc Variogram và Kriging Nắm bắt được tầm quan trọng củanhững phương pháp trên em tiến hành nghiên cứu và tính toán Variogram , Kriging 2D,Validation bằng phần mềm Excel kết hợp so sánh với phần mềm thương mại GS+ Version 9.Mục tiêu của Bài tập lớn là xây dựng lại phương pháp Variogram 2D và Ordinary Kring
để giúp em cũng hiểu sâu hơn về bản chất và cách thức tác giả xây dựng nên phương pháp,hiểu được các khái niệm, định nghĩa và mục đích ứng dụng của hai phương pháp này
Phạm vi và đối tượng nghiên cứu của Bài tập lớn là sử dụng bộ dữ liệu khảo sát độ thấmcủa khu vực đất Trạm thí nghiệm Broom's Barn để tiến hành phân tích dữ liệu và tính toán.Phương pháp nghiên cứu của em là chọn lọc các thông tin từ tài liệu tìm được, kết hợpcác mô hình cũng như so sánh các kết quả có được để đưa ra kết luận Để hiểu rõ hơn về bảnchất và cách thức tác giả xây dựng nên phương pháp thông qua sử dụng phần mềm Excelxây dựng thuật toán nội suy, đánh giá hiệu quả nội suy,vẽ ra đồ thị độ thấm một khu vực nhỏ
và so sánh các kết quả trực quan có được với phần mềm thương mại GS+ Version 9
Em xin gửi lời cảm ơn chân thành nhất đến các thầy bộ môn địa kĩ thuật và địa thống kê,Khoa Kỹ thuật Địa chất & Dầu khí nói chung và Thầy Phạm Sơn Tùng nói riêng Xuyênsuốt quá trình học và làm các bài tập của em, em đã nhận được sự trợ giúp cũng như lànhững kiến thức đã được giảng dạy một cách nhiệt tình từ quý giảng viên, đặc biệt là thầyTùng, từ đó tạo cho em vốn kiến thức cần có để có thể hoàn thành bài tiểu luận Tuy nhiên,trong quá trình làm bài tiểu luận do kiến thức chuyên ngành của em về môn học này còn hạnchế nên không thể tránh khỏi một vài thiếu sót khi trình bày và đánh giá vấn đề Rất mongnhận được sự góp ý, đánh giá của quý thầy cô để kiến thức của em thêm hoàn thiện hơn.Một lần nữa em xin chân thành cảm ơn quý thầy cô !!!
Trang 6CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ QUY TRÌNH TÍNH TOÁN
1 Hàm cấu trúc -Variogram [(h)] Error: Reference source not found
Khi xét đến những đặc tính không gian của đối tượng nghiên cứu, lý thuyết toán cơ bảnđược dùng là “lý thuyết biến số vùng” Biến số đó biến đổi một cách liên tục từ điểm quansát này đến điểm quan sát khác song rất khó mô hình hóa bằng một hàm thông thường
giá trị trung bình và nhận được biến số quy tâm Z'(x) bằng cách trừ các biến số vùng cho giátrị trung bình Lấy trung bình bình phương biến số Z(x):
- tương ứng với phương sai mẫu của biến vùng
Dễ nhận thấy rằng, giá trị trong một điểm quan sát nào đó có liên quan đến giá trị tổngcác điểm khác phân bố cách nhau một khoảng cách nhất định Đồng thời ảnh hưởng củanhững mẫu ở khoảng cách xa ít ảnh hưởng hơn những mẫu có khoảng cách gần nhau Hơnnữa cũng có thể xảy ra trường hợp mức độ ảnh hưởng của mẫu còn phụ thuộc vào phương vịkhông gian của vị trí lấy mẫu (khi có tính dị hướng) Để phản ánh sự phụ thuộc này, người tathường dùng vectơ khoảng cách h có phương vị xác định Mức độ phụ thuộc giữa các điểm
đo (lấy mẫu) nằm trên một khoảng cách hi và theo một hướng xác định nào đó được phảnánh bằng momen tương quan và có thể biểu diễn bằng đồ thị
Vì vậy, Matheron đã đề ra lý thuyết variogram hay còn gọi là hàm cấu trúc:
Variogram hoặc hàm cấu trúc
Hàm cấu trúc đã giải quyết tốt vấn đề giá trị ước lượng bị ảnh hưởng nhiều bởi nhữngđiểm ở xa Đồng thời, phương vị không gian lấy mẫu cũng sẽ ảnh hưởng đến tính tươngquan của mẫu
1.1 Định nghĩa
Hàm cấu trúc được sử dụng trong kỹ thuật địa thống kê để mô tả mối quan hệ không gian.Hàm cấu trúc được định nghĩa như là một nửa kỳ vọng toán học của biến ngẫu nhiên Z:
Trang 7Hàm cấu trúc thực nghiệm được xác định bằng trung bình bình phương của một hiệu giữacác giá trị khác biệt một khoảng h:
N(h) = số lượng cặp điểm nghiên cứu
1.2 Các tính chất của hàm cấu trúc – Variogram [γ(h)]
Các hàm cấu trúc – variogram có những khái niệm sau:
a = bán kính ảnh hưởng là khoảng cách mà variogram đạt giá trị trần Khi khoảng
quan hệ tương quan lẫn nhau
liệu quá nhỏ so với khoảng nội suy Có sự gián đoạn trong dữ liệu hoặc dữ liệu cókhoảng cách lag rất lớn
Trang 8 Nếu covariance tồn tại thì variogram tồn tại, ngược lại, nếu variogram tồn tại thì chưachắc tồn tại hàm covariance.
1.3 Các mô hình hàm cấu trúc
Trong phần này sẽ nói về những phương pháp được sử dụng để mô phỏng các mô hìnhvariogram Ước lượng variogram chỉ cho phép chúng ta biết các giá trị variogram tại mộtkhoảng lag nhất định
1.3.1 Mô hình hình cầu
Mô hình hình cầu là loại mô hình variogram phổ biến nhất và được đặc trưng bởi mộtđường tuyến tính ở những khoảng lag nhỏ, sau khi vượt qua bán kính ảnh hưởng (a) thì giátrị variogram sẽ không thay đổi và bằng Sill (C)
Trang 9Hình 3 Mô hình hàm mũ
1.3.3 Mô hình Gaussian
Mô hình Gaussian có độ tương quan cao trên bán kính ảnh hưởng ngắn và được dùng để
mô hình hóa các biến có tính liên tục cao Mô hình Gaussian chỉ có thể tiệm cận nhưngkhông bao giờ hoàn toàn đạt đến trần Sill (~95%)
khi
Hình 4 Mô hình Gaussian
2 Ordinary Kriging (OK):
Kriging là một nhóm phương pháp địa thống kê dùng để nội suy số liệu của một trường
ngẫu nhiên tại một điểm (một khối) chưa biết giá trị (ví dụ: không lấy được mẫu phân tích,
…) từ những giá trị đã biết ở những điểm lân cận
Trang 10 Kriging là một bộ nội suy chính xác và phương sai nội suy tương ứng bằng không.
Kriging không chỉ xem xét khoảng cách giữa các điểm quan sát và điểm cần ướclượng mà còn cả vị trí tương đối của các điểm quan sát
Trọng số (λ) không bị ảnh hưởng bởi giá trị tại điểm đo Ví dụ: nếu cấu trúc phân
bố điểm giống nhau xuất hiện ở hai vị trí khác nhau, trọng số kriging sẽ giốngnhau, không phụ thuộc vào các giá trị đo được
Trọng số Kriging cho thấy hiệu ứng sàng lọc, các điểm ở xa điểm cần ước tính sẽ
có trọng số thấp hơn và ngược lại các điểm ở gần điểm cần ước tính sẽ có trọng sốlớn hơn (sức ảnh hưởng lớn)
Kriging giả định rằng không gian đang được nghiên cứu là tĩnh; nghĩa là phân phốixác suất chung không thay đổi trong toàn bộ không gian nghiên cứu
Kriging cũng giả định một đặc tính gọi là đẳng hướng; rằng có sự đồng nhất theo mọihướng
Độ chính xác của mô hình sẽ bị hạn chế nếu dữ liệu không tương quan về mặt khônggian hoặc phạm vi trải rộng của dữ liệu bị hạn chế hoặc số lượng điểm dữ liệu nhỏ
Ordinary Kriging là kriging chưa biết giá trị trung bình, dựa chủ yếu vào giả thuyết hàm
source not found:
Trong đó:
= các trọng số
= các thông số quan sát được ở lân cận điểm (hoặc khối) cần ước lượng
* Điều kiện tối ưu của phép ước lượng Phép ước lượng phải đảm bảo:
Thứ nhất: Không có sai số hệ thống, sai số trung bình phải xấp xỉ bằng 0 Viết lại dướidạng:
Trang 11 Thứ hai: Phương sai của ước lượng là nhỏ nhất Để phù hợp với điều kiện tối ưu trên,theo phương pháp phân tử Lagrange, ta nhận được hệ phương trình trọng số Kriging
Trong đó:
α =1, 2, 3, …, N
: Giá trị Variogram tính theo mô hình được lựa chọn
Để giải phương trình trọng số Kriging ta đưa về dạng ma trận:
Trang 12CHƯƠNG 3 : QUY TRÌNH TÍNH TOÁN
Hình 5 Sơ đồ khối quá trình tính toán Variogram 2D.
Hình 6 Sơ đồ khối quá trình tính toán Kriging.
Trang 13Hình 7 Sơ đồ khối quá trình tính toán Validation.
CHƯƠNG 4 : SỐ LIỆU ĐẦU VÀO
Em lựa chọn phần mềm Excel để thực hiện tính toán variogram 2D/Ordinary Kriging cho
dữ liệu độ thấm (K) của bộ dữ liệu khảo sát đất của Trạm thí nghiệm Broom's Barn
Hình 8 Dữ liệu gốc của bộ dữ liệu khảo sát đất của Trạm thí nghiệm Broom's Barn.
Trang 14CHƯƠNG 5 : KẾT QUẢ VÀ PHÂN TÍCH KẾT QUẢ
Em chọn h = 1 đơn vị đo chiều dài trong cách tính tọa độ của bộ dữ liệu, và thực hiện tínhtoán vẽ được đồ thị Variogram:
Trang 15Hình 5 Đồ thị Variogram cho bộ dữ liệu khảo sát.
Hình 6 Kết quả tính toán Variogram của bộ dữ liệu.
Dựa vào đồ thị trong Excel nhóm sinh viên xác định:
Trang 16 Variogram biến thiên và có tính chu kỳ.
hàm mũ (Exponential) nhất
Hình 7 Kết quả khảo sát mô hình Variogram đồng nhất từ phần mềm GS+.
Kết quả của phần mềm cho thấy khá sát với kết quả nhóm sinh viên tính toán từ excel.Sill, Range, hình dạng đồ thị cho ra từ phần mềm GS+ khá là tương đồng với kết quả từExcel Tuy mô hình phần mềm chọn có khác mô hình xác định từ Excel nhưng để có nhậnđịnh chính xác nhất về hiệu quả của phần mềm nhóm sẽ để phần mềm tự fit mô hình màkhông sửa lại Có thể có một nguyên nhân khác dẫn đến tình trạng trên là khi tính bìnhphương sai lệch giữa 2 giá trị ở hai vị trí khác nhau, phần mềm xác định được triệt để hơncác điểm đang ở đúng khoảng cách i x h để tính, trong khi ở trong phần mềm Excel emchỉ tính bình phương sai lệch giữa hai giá trị ở hai vị trí điểm dễ phát hiện nhất
Do số lượng điểm cần nội suy quá nhiều nên em quyết định chỉ làm rõ phương phápOrdinary Kriging ở một khu vực số liệu nhất định để thu nhỏ phạm vi cần nội suy
Trang 170 2 4 6 8 10 12 14 16 18 20 0
5 10 15 20 25 30 35
Hình 8 Khu vực nội suy ở khoảng tọa độ X = [1,5], Y=[27,31]
em chọn nội suy các điểm ở giữa (các điểm màu đỏ) các điểm đã biết (các điểm màuxanh dương) Đối với số lượng các điểm quan sát ở xung quanh điểm cần nội suy, emchia thành 2 loại: có 4 điểm quan sát và 6 điểm quan sát để khi thực hiện chia thành 2nhóm thuật toán để nội suy 2 loại điểm có vị trí khác nhau
Hình 9 Các điểm cần nội suy và các điểm quan sát được ở xung quanh nó.
Trang 18Khi bắt đầu quá trình nội suy ta phải nhập thủ công tọa độ điểm cần nội suy và cácđiểm quan sát xung quanh.
1a Data and Estimate Locations and Values
Hình 10 Giao diện nhập tọa độ điểm cần nội suy và 4 điểm quan sát xung quanh trong
1b Data and Estimate Locations and Values
Hình 11 Giao diện nhập tọa độ điểm cần nội suy và 6 điểm quan sát xung quanh trong
Excel.
Thông qua các bước trung gian (tính khoảng cách giữa các điểm, tính giá trịVariogram) thì ta có ma trận để giải các trọng số Kriging được xây dựng theo công thức ởphần có sở lý thuyết
Trang 190 10.79535363 10.795354 14.88646 1 10.79535363 0 14.886457 10.79535 1 10.79535363 14.88645668 0 10.79535 1 14.88645668 10.79535363 10.795354 0 1
4a Matrix A 6a Matrix B
19.13406103 19.13406103 8.60187206 8.60187206 1
0 10.79535 20.32222 10.79535 14.88645668 22.40272637 1 10.79535 0 10.79535 14.88646 10.79535363 14.88645668 1
8b Kriging Results
Hình 13 Kết quả các trọng số Kriging, giá trị ước tính và phương sai khi nội suy với 4
điểm và 6 điểm xung quanh
So sánh các kết quả trên và đa số các điểm nội suy được, em nhận thấy 2 bộ kết quảcũng khá sát nhau Tuy nhiên vẫn còn một số điểm khá lệch nhau, nguyên nhân có thểgiải thích là do em chỉ làm ở quy mô nhỏ, nên kết quả không thể quá chính xác so vớiphần mềm, đặc biệt đây còn là phần mềm thương mại
Hình 14 Kết quả tra từ đồ thị Kriging có từ phần mềm GS+
Ta nhận thấy như trên đây điểm [X,Y] = [4.5, 27] có kết quả nội suy cũng khá sát sovới phần mềm GS+ (chỉ lệch khoảng 1mD, bằng 5.6% giá trị độ thấm nội suy tra từ phầnmềm GS+), còn điểm [X,Y] = [4, 29.5] lại cho kết quả khá chênh lệch (chênh lệch 2.4
mD, bằng khoảng 15% giá trị nội suy tra từ phần mềm GS+)
Trang 20Thực hiện trên phần mềm Excel cho đến hết các điểm xác định cần nội suy ta đượcbảng giá trị:
Hình 15 Bảng giá trị nội suy bằng phương pháp Ordinary Kriging em có được thông
qua thuật toán xây dựng trên phần mềm Excel.
Để đánh giá độ tin cậy của phương pháp, thì em thực hiện lại chính phương pháp trêncác điểm quan sát đã có, để so sánh, đối chiếu giá trị thực và giá trị vừa nội suy, nếu haigiá trị này gần nhau chứng tỏ phương pháp xây dựng đây có hiệu quả chấp nhận được vàngược lại
Có thể thấy các giá trị nội suy có được nhờ cách làm tương tự đối với thuật toán trênphần mềm Excel cũng khá sát với giá trị thực tế Nhưng em nhận thấy đối với các giá trịthực càng lớn thì kết quả nội suy có được lại khá chênh lệch, nguyên nhân khá dễ hiểu vì
số lượng điểm quan sát chọn xung quanh điểm cần nội quy vẫn còn ít và bản chất quả nộisuy thì không thể nào cho kết quả lớn hơn các giá trị quan sát xung quanh, vậy nên sựchênh lệch ở quy mô nhỏ mà em chọn thực hiện có thể vẫn chấp nhận được Điều này cóthể nhận thấy khá rõ khi quan sát đồ thị, các điểm có giá trị thực càng lớn thì giá trị nội
20