Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation.Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation.Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation.Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính toán Variogram 2D, Ordinary Kriging, Validation.
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA KỸ THUẬT ĐỊA CHẤT
VÀ DẦU KHÍ
-TIỂU LUẬN ĐỊA THỐNG KÊ
Giảng viên hướng dẫn: Thầy Phạm Sơn Tùng
Đề tài: Sử dụng phần mềm Excel kết hợp GS+ Version 9 để tính
toán Variogram 2D, Ordinary Kriging, Validation.
Họ và tên : Phạm Gia Nghĩa
MSSV : 1914324
Trang 2CHƯƠNG 1 : GIỚI THIỆU
CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ QUY TRÌNH TÍNH TOÁN
1 Hàm cấu trúc -Variogram [ (h)] [3]
1.1 Định nghĩa
1.2 Các tính chất của hàm cấu trúc – Variogram [γ(h)]
1.3 Các mô hình hàm cấu trúc
1.3.1 Mô hình hình cầu
1.3.2 Mô hình hàm mũ
1.3.3 Mô hình Gaussian
2 Ordinary Kriging (OK):
CHƯƠNG 3 : QUY TRÌNH TÍNH TOÁN
CHƯƠNG 5 : KẾT QUẢ VÀ PHÂN TÍCH KẾT QUẢ
CHƯƠNG 6 : KẾT LUẬN
Trang 32
Trang 4Hình 8 Dữ liệu gốc của bộ dữ liệu khảo sát đất của Trạm thí nghiệm Broom's Barn 13
Hình 11 Kết quả khảo sát mô hình Variogram đồng nhất từ phần mềm GS+ 16
Hình 12 Khu vực nội suy ở khoảng tọa độ X = [1,5], Y=[27,31] 17
Hình 13 Các điểm cần nội suy và các điểm quan sát được ở xung quanh nó 17
Hình 14 Giao diện nhập tọa độ điểm cần nội suy và 4 điểm quan sát xung quanh trong
Hình 17 Kết quả các trọng số Kriging, giá trị ước tính và phương sai khi nội suy với 4 điểm
Hình 18 Kết quả tra từ đồ thị Kriging có từ phần mềm GS+ 19
Hình 19 Bảng giá trị nội suy bằng phương pháp Ordinary Kriging em có được thông qua
Hình 20 Bảng giá trị thực và giá trị nội suy từ phương pháp em xây dựng lại trên phần mềm
Hình 21 Biểu đồ đối chứng giữa các giá trị thực và giá trị nội suy từ phương pháp Ordinary
Trang 5không quá trùng đường thẳng có hệ số góc bằng tan(45o) = 1 22
Hình 23 Kết quả đối chứng validation với mô hình Variogram Isotropic 22
Hình 24 Kết quả đối chứng validation với mô hình Variogram Anisotropic 23
Hình 25 Hình ảnh kết quả đồ thị Kriging biểu diễn trên mặt phẳng thực hiện bằng Excel.23Hình 26 Hình ảnh kết quả đồ thị Kriging biểu diễn dạng 3D thực hiện bằng Excel 24
Hình 27 Kết quả nội suy Ordinary Kriging từ mô hình Variogram đồng nhất 25
Hình 28 Kết quả nội suy Ordinary Kriging từ mô hình Variogram không đồng nhất phân bố
3
Trang 6Hình 29 Vùng dữ liệu mà em chọn thực hiện nội suy, kết quả nhìn từ từ phần mềm GS+.26
Trang 7CHƯƠNG 1 : GIỚI THIỆU
Địa thống kê là một phương pháp mới và đang được tiếp tục hoàn thiện Đã từ nhiều năm,phương pháp được xem là hiện đại, và đang trở lên rất phổ biến, đặc biệt là các nước tư bảnphát triển: Pháp, Mỹ, Canada, Anh Địa thống kê không chỉ áp dụng rộng rãi trong khảosát thăm dò mỏ, địa vật lý, địa chất thuỷ văn, địa chất công trình, địa hoá, dầu khí, khai thác
mỏ mà còn ở nhiều lĩnh vực khác: Nông nghiệp, sinh học, khí tượng thuỷ văn, ngư nghiệp,
xã hội học, cơ học và môi trường Error: Reference source not found Trong địa thống kê,vấn đề luôn được quan tâm khi nghiên cứu một hiện tượng, vật chất chính là dữ liệu của hiệntượng, vật chất đó nhưng không phải lúc nào chúng ta đều có thể thu thập hết toàn bộ và đầy
đủ những dữ liệu cần thiết cho quá trình phân tích và nghiên cứu Từ những khó khăn này,các nhà nghiên cứu đã tìm tòi và phát triển các mô hình, phương pháp giúp ước tính (nộisuy) các dữ liệu chưa biết từ những dữ liệu đã biết, nổi bật trong những mô hình, phươngpháp đó chính là hàm cấu trúc Variogram và Kriging Nắm bắt được tầm quan trọng củanhững phương pháp trên em tiến hành nghiên cứu và tính toán Variogram , Kriging 2D,Validation bằng phần mềm Excel kết hợp so sánh với phần mềm thương mại GS+ Version 9.Mục tiêu của Bài tập lớn là xây dựng lại phương pháp Variogram 2D và Ordinary Kring
để giúp em cũng hiểu sâu hơn về bản chất và cách thức tác giả xây dựng nên phương pháp,hiểu được các khái niệm, định nghĩa và mục đích ứng dụng của hai phương pháp này
Phạm vi và đối tượng nghiên cứu của Bài tập lớn là sử dụng bộ dữ liệu khảo sát độ thấmcủa khu vực đất Trạm thí nghiệm Broom's Barn để tiến hành phân tích dữ liệu và tính toán.Phương pháp nghiên cứu của em là chọn lọc các thông tin từ tài liệu tìm được, kết hợpcác mô hình cũng như so sánh các kết quả có được để đưa ra kết luận Để hiểu rõ hơn về bảnchất và cách thức tác giả xây dựng nên phương pháp thông qua sử dụng phần mềm Excelxây dựng thuật toán nội suy, đánh giá hiệu quả nội suy,vẽ ra đồ thị độ thấm một khu vực nhỏ
và so sánh các kết quả trực quan có được với phần mềm thương mại GS+ Version 9
Em xin gửi lời cảm ơn chân thành nhất đến các thầy bộ môn địa kĩ thuật và địa thống kê,Khoa Kỹ thuật Địa chất & Dầu khí nói chung và Thầy Phạm Sơn Tùng nói riêng Xuyênsuốt quá trình học và làm các bài tập của em, em đã nhận được sự trợ giúp cũng như lànhững kiến thức đã được giảng dạy một cách nhiệt tình từ quý giảng viên, đặc biệt là thầyTùng, từ đó tạo cho em vốn kiến thức cần có để có thể hoàn thành bài tiểu luận Tuy nhiên,trong quá trình làm bài tiểu luận do kiến thức chuyên ngành của em về môn học này còn hạnchế nên không thể tránh khỏi một vài thiếu sót khi trình bày và đánh giá vấn đề Rất mongnhận được sự góp ý, đánh giá của quý thầy cô để kiến thức của em thêm hoàn thiện hơn Mộtlần nữa em xin chân thành cảm ơn quý thầy cô !!!
Trang 8CHƯƠNG 2 : CƠ SỞ LÝ THUYẾT VÀ QUY TRÌNH TÍNH TOÁN
1 Hàm cấu trúc -Variogram [ (h)] Error: Reference source not found
Khi xét đến những đặc tính không gian của đối tượng nghiên cứu, lý thuyết toán cơ bảnđược dùng là “lý thuyết biến số vùng” Biến số đó biến đổi một cách liên tục từ điểm quansát này đến điểm quan sát khác song rất khó mô hình hóa bằng một hàm thông thường.Giả sử ta có dẫy mẫu (điểm đo) trong các điểm đo xi của ô mạng hình vuông và đo đượcbiến số Z(xi) tương ứng; nếu biến số này thuộc kiểu ổn định (dừng) thì có thể xác định đượcgiá trị trung bình và nhận được biến số quy tâm Z'(x) bằng cách trừ các biến số vùng cho giátrị trung bình Lấy trung bình bình phương biến số Z(x):
- tương ứng với phương sai mẫu của biến vùng
Dễ nhận thấy rằng, giá trị trong một điểm quan sát nào đó có liên quan đến giá trị tổngcác điểm khác phân bố cách nhau một khoảng cách nhất định Đồng thời ảnh hưởng củanhững mẫu ở khoảng cách xa ít ảnh hưởng hơn những mẫu có khoảng cách gần nhau Hơnnữa cũng có thể xảy ra trường hợp mức độ ảnh hưởng của mẫu còn phụ thuộc vào phương vịkhông gian của vị trí lấy mẫu (khi có tính dị hướng) Để phản ánh sự phụ thuộc này, người tathường dùng vectơ khoảng cách h có phương vị xác định Mức độ phụ thuộc giữa các điểm
đo (lấy mẫu) nằm trên một khoảng cách hi và theo một hướng xác định nào đó được phảnánh bằng momen tương quan và có thể biểu diễn bằng đồ thị
Vì vậy, Matheron đã đề ra lý thuyết variogram hay còn gọi là hàm cấu trúc:
| là hàm của số gia Z(x1)-Z(x2), đã được Matheron gọi biểu đồ phương sai hay Variogram hoặc hàm cấu trúc
Hàm cấu trúc đã giải quyết tốt vấn đề giá trị ước lượng bị ảnh hưởng nhiều bởi nhữngđiểm ở xa Đồng thời, phương vị không gian lấy mẫu cũng sẽ ảnh hưởng đến tính tươngquan của mẫu
1.1 Định nghĩa
Hàm cấu trúc được sử dụng trong kỹ thuật địa thống kê để mô tả mối quan hệ không gian.Hàm cấu trúc được định nghĩa như là một nửa kỳ vọng toán học của biến ngẫu nhiên Z:
Trang 9Hàm cấu trúc thực nghiệm được xác định bằng trung bình bình phương của một hiệu giữa các giá trị khác biệt một khoảng h:
N(h) = số lượng cặp điểm nghiên cứu
1.2 Các tính chất của hàm cấu trúc – Variogram [γ(h)]
Các hàm cấu trúc – variogram có những khái niệm sau:
a = bán kính ảnh hưởng là khoảng cách mà variogram đạt giá trị trần Khi khoảng cách lag h > a thì giá trị nghiên cứu biến đổi hoàn toàn ngẫu nhiên và không có mối quan hệ tương quan lẫn nhau
C = Giá trị trần Sill là giá trị mà variogram không tăng nữa
Nugget = là hiệu ứng tự sinh khi (h=0) # 0 Hiệu ứng này xảy ra khi khoảng cách
dữ liệu quá nhỏ so với khoảng nội suy Có sự gián đoạn trong dữ liệu hoặc dữ liệu
Trang 10Nếu covariance tồn tại thì variogram tồn tại, ngược lại, nếu variogram tồn tại thì chưa chắc tồn tại hàm covariance.
1.3 Các mô hình hàm cấu trúc
Trong phần này sẽ nói về những phương pháp được sử dụng để mô phỏng các mô hìnhvariogram Ước lượng variogram chỉ cho phép chúng ta biết các giá trị variogram tại mộtkhoảng lag nhất định
1.3.1 Mô hình hình cầu
Mô hình hình cầu là loại mô hình variogram phổ biến nhất và được đặc trưng bởi mộtđường tuyến tính ở những khoảng lag nhỏ, sau khi vượt qua bán kính ảnh hưởng (a) thì giátrị variogram sẽ không thay đổi và bằng Sill (C)
Trang 11Hình 3 Mô hình hàm mũ
1.3.3 Mô hình Gaussian
Mô hình Gaussian có độ tương quan cao trên bán kính ảnh hưởng ngắn và được dùng để
mô hình hóa các biến có tính liên tục cao Mô hình Gaussian chỉ có thể tiệm cận nhưngkhông bao giờ hoàn toàn đạt đến trần Sill (~95%)
khi
Hình 4 Mô hình Gaussian
2 Ordinary Kriging (OK):
Kriging là một nhóm phương pháp địa thống kê dùng để nội suy số liệu của một trường
ngẫu nhiên tại một điểm (một khối) chưa biết giá trị (ví dụ: không lấy được mẫu phân tích,
…) từ những giá trị đã biết ở những điểm lân cận
Ưu điểm của Kriging bao gồm Error: Reference source not found:
Trang 12Kriging là một bộ nội suy chính xác và phương sai nội suy tương ứng bằng không Kriging không chỉ xem xét khoảng cách giữa các điểm quan sát và điểm cần ướclượng mà còn cả vị trí tương đối của các điểm quan sát.
Trọng số (ž) không bị ảnh hưởng bởi giá trị tại điểm đo Ví dụ: nếu cấu trúc
phân bố điểm giống nhau xuất hiện ở hai vị trí khác nhau, trọng số kriging sẽ giống nhau, không phụ thuộc vào các giá trị đo được
Trọng số Kriging cho thấy hiệu ứng sàng lọc, các điểm ở xa điểm cần ước tính sẽ
có trọng số thấp hơn và ngược lại các điểm ở gần điểm cần ước tính sẽ có trọng
số lớn hơn (sức ảnh hưởng lớn)
Nhược điểm của Kriging Error: Reference source not found:
Kriging giả định rằng không gian đang được nghiên cứu là tĩnh; nghĩa là phân
phối xác suất chung không thay đổi trong toàn bộ không gian nghiên cứu
Kriging cũng giả định một đặc tính gọi là đẳng hướng; rằng có sự đồng nhất theo mọi hướng
Độ chính xác của mô hình sẽ bị hạn chế nếu dữ liệu không tương quan
về mặt không gian hoặc phạm vi trải rộng của dữ liệu bị hạn chế hoặc
số lượng điểm dữ liệu nhỏ
Ordinary Kriging là kriging chưa biết giá trị trung bình, dựa chủ yếu vào giả thuyết hàm
ngẫu nhiên ổn định (tĩnh) Các bài toán dạng này thường giả định rằng: có n giá trị Z1, Z2,
….Zn ứng với các giá trị điểm đo x1, x2,…xn phân bố ở lân cận điểm cần ước lượng x0 (hoặckhối ước lượng V0) Giá trị ước lượng tuyến tính cho x0 (hoặc V0) có dạng Error: Reference
Trong đó:
= các trọng số
= các thông số quan sát được ở lân cận điểm (hoặc khối) cần ước lượng
* Điều kiện tối ưu của phép ước lượng Phép ước lượng phải đảm bảo:
Thứ nhất: Không có sai số hệ thống, sai số trung bình phải xấp xỉ bằng 0 Viết lại dưới dạng:
Trang 13Thứ hai: Phương sai của ước lượng là nhỏ nhất Để phù hợp với điều kiện tối ưutrên, theo phương pháp phân tử Lagrange, ta nhận được hệ phương trình trọng sốKriging để xác định λβ
Trong đó:
…, N μ :hệ số
Lagrange
: Giá trị Variogram tính theo mô hình được lựa chọn Để
giải phương trình trọng số Kriging ta đưa về dạng ma trận:
Với là ma trận nghịch đảo của ma trận , là ma trận chuyển vị của ma trận
Trang 14CHƯƠNG 3 : QUY TRÌNH TÍNH TOÁN
Hình 5 Sơ đồ khối quá trình tính toán Variogram 2D.
Hình 6 Sơ đồ khối quá trình tính toán Kriging.
Trang 15Hình 7 Sơ đồ khối quá trình tính toán Validation.
CHƯƠNG 4 : SỐ LIỆU ĐẦU VÀO
Em lựa chọn phần mềm Excel để thực hiện tính toán variogram 2D/Ordinary Kriging cho dữ liệu độ thấm (K) của bộ dữ liệu khảo sát đất của Trạm thí nghiệm Broom's Barn
Hình 8 Dữ liệu gốc của bộ dữ liệu khảo sát đất của Trạm thí nghiệm Broom's Barn.
Trang 16CHƯƠNG 5 : KẾT QUẢ VÀ PHÂN TÍCH KẾT QUẢ
Em chọn h = 1 đơn vị đo chiều dài trong cách tính tọa độ của bộ dữ liệu, và thực hiện tínhtoán vẽ được đồ thị Variogram:
Trang 17Hình 5 Đồ thị Variogram cho bộ dữ liệu khảo sát.
Hình 6 Kết quả tính toán Variogram của bộ dữ liệu.
Dựa vào đồ thị trong Excel nhóm sinh viên xác định:
Variogram tăng sau đó ổn định dần ở trị số = C, Sill - Giá trị ngưỡng (trần) C = 91.873
Trang 18Hiệu ứng tự sinh (nugget effect) không có do
15
Trang 19Variogram biến thiên và có tính chu kỳ.
Độ thấm khảo sát không có tính xu hướng
Qua khảo sát bằng excel thì Variogram của thông số độ thấm này gần với mô
hình hàm mũ (Exponential) nhất.
Hình 7 Kết quả khảo sát mô hình Variogram đồng nhất từ phần mềm GS+.
● Kết quả của phần mềm cho thấy khá sát với kết quả nhóm sinh viên tính toán từexcel Sill, Range, hình dạng đồ thị cho ra từ phần mềm GS+ khá là tương đồng vớikết quả từ Excel Tuy mô hình phần mềm chọn có khác mô hình xác định từ Excelnhưng để có nhận định chính xác nhất về hiệu quả của phần mềm nhóm sẽ để phầnmềm tự fit mô hình mà không sửa lại Có thể có một nguyên nhân khác dẫn đến tìnhtrạng trên là khi tính bình phương sai lệch giữa 2 giá trị ở hai vị trí khác nhau, phầnmềm xác định được triệt để hơn các điểm đang ở đúng khoảng cách i x h để tính,trong khi ở trong phần mềm Excel em chỉ tính bình phương sai lệch giữa hai giá trị ởhai vị trí điểm dễ phát hiện nhất
●
● Do số lượng điểm cần nội suy quá nhiều nên em quyết định chỉ làm rõ phương phápOrdinary Kriging ở một khu vực số liệu nhất định để thu nhỏ phạm vi cần nội suy
Trang 20Data Location
35 30
25
Nor 20
th
15 10
5
00
2 4 6 8 10 12 14 16 18 20
East
Hình 8 Khu vực nội suy ở khoảng tọa độ X = [1,5], Y=[27,31]
em chọn nội suy các điểm ở giữa (các điểm màu đỏ) các điểm đã biết (các điểm màuxanh dương) Đối với số lượng các điểm quan sát ở xung quanh điểm cần nội suy, emchia thành 2 loại: có 4 điểm quan sát và 6 điểm quan sát để khi thực hiện chia thành 2nhóm thuật toán để nội suy 2 loại điểm có vị trí khác nhau
Hình 9 Các điểm cần nội suy và các điểm quan sát được ở xung quanh nó.
17
Trang 21Khi bắt đầu quá trình nội suy ta phải nhập thủ công tọa độ điểm cần nội suy và các điểm quan sát xung quanh.
1a Data and Estimate Locations and Values
Trang 224a Matrix A 6a Matrix B
0 10.79535363 10.795354 14.88646 1 19.13406103 10.79535363 0 14.886457 10.79535 1 19.13406103 10.79535363 14.88645668 0 10.79535 1 8.60187206 14.88645668 10.79535363 10.795354 0 1 8.60187206
0 10.79535 20.32222 10.79535 14.88645668 22.40272637 1 19.13406103 10.79535 0 10.79535 14.88646 10.79535363 14.88645668 1 8.60187206
Hình 13 Kết quả các trọng số Kriging, giá trị ước tính và phương sai khi nội suy với 4
So sánh các kết quả trên và đa số các điểm nội suy được, em nhận thấy 2 bộ kết quảcũng khá sát nhau Tuy nhiên vẫn còn một số điểm khá lệch nhau, nguyên nhân có thểgiải thích là do em chỉ làm ở quy mô nhỏ, nên kết quả không thể quá chính xác so vớiphần mềm, đặc biệt đây còn là phần mềm thương mại
Hình 14 Kết quả tra từ đồ thị Kriging có từ phần mềm GS+
Trang 23mềm GS+), còn điểm [X,Y] = [4, 29.5] lại cho kết quả khá chênh lệch (chênh lệch 2.4
mD, bằng khoảng 15% giá trị nội suy tra từ phần mềm GS+)
19
Trang 24Thực hiện trên phần mềm Excel cho đến hết các điểm xác định cần nội suy ta được bảng giá trị:
9 Synthesis data of KRIGING
Trang 25● Để đánh giá độ tin cậy của phương pháp, thì em thực hiện lại chính phương pháp trêncác điểm quan sát đã có, để so sánh, đối chiếu giá trị thực và giá trị vừa nội suy, nếuhai giá trị này gần nhau chứng tỏ phương pháp xây dựng đây có hiệu quả chấp nhậnđược và ngược lại.
●
● Có thể thấy các giá trị nội suy có được nhờ cách làm tương tự đối với thuật toán trênphần mềm Excel cũng khá sát với giá trị thực tế Nhưng em nhận thấy đối với các giátrị thực càng lớn thì kết quả nội suy có được lại khá chênh lệch, nguyên nhân khá dễhiểu vì số lượng điểm quan sát chọn xung quanh điểm cần nội quy vẫn còn ít và bảnchất quả nội suy thì không thể nào cho kết quả lớn hơn các giá trị quan sát xungquanh, vậy nên sự chênh lệch ở quy mô nhỏ mà em chọn thực hiện có thể vẫn chấpnhận được Điều này có thể nhận thấy khá rõ khi quan sát đồ thị, các điểm có giá trịthực càng lớn thì giá trị nội suy không thể lớn bằng được và nằm xa đường thẳng có
hệ số góc bằng tan(45o)=1
20