Đề tài luận văn “Nghiên cứu áp dụng phương pháp Khoảng cách– Tần suất – Nhận dạng mới trong phân tích- xử lý số liệu Địa vật lý” mà học viên lựa chọn nhằm tìm hiểu, áp dụng phương pháp
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Nguyễn Thị Thu Hiền
NGHIÊN CỨU ÁP DỤNG PHƯƠNG PHÁP KHOẢNG CÁCH –TẦN SUẤT – NHẬN DẠNG MỚI TRONG XỬ LÝ- PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – 2016
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
Nguyễn Thị Thu Hiền
NGHIÊN CỨU ÁP DỤNG PHƯƠNG PHÁP KHOẢNG CÁCH – TẦN SUẤT – NHẬN DẠNG MỚI TRONG XỬ LÝ- PHÂN TÍCH SỐ LIỆU ĐỊA VẬT LÝ
Chuyên ngành: Vật lý địa cầu
Mã số: 60440111
LUẬN VĂN THẠC SĨ KHOA HỌC
Người hướng dẫn khoa học
PGS.TS.VÕ THANH QUỲNH
Hà Nội - 2016
Trang 3LỜI CẢM ƠN
Để hoàn thành quyển luận văn này, trước tiên, với lòng kính trọng và biết ơn
sâu sắc, tôi xin gửi lời cảm ơn tới PGS.TS Võ Thanh Quỳnh - người thầy trực tiếp
hướng dẫn khoa học và chỉ bảo tôi trong suốt quá trình thực hiện đề tài
Tôi xin gửi lời cảm ơn tới ThS Nguyễn Viết Đạt người đã tận tình giúp đỡ
tôi trong suốt quá trình làm luận văn Tôi chân thành cảm ơn các thầy cô trong Bộ môn Vật lý Địa cầu – Trường Đại học Khoa học tự nhiên – Đại học Quốc gia Hà Nội đã trang bị kiến thức và có những đóng góp hết sức quý báu để tôi hoàn thành luận văn này
Cuối cùng cho phép tôi bày tỏ lòng biết ơn vô hạn tới gia đình và bạn bè, những người đã luôn quan tâm, động viên và là chỗ dựa tinh thần vững chắc của tôi trong những thời khắc khó khăn nhất
Do điều kiện thời gian và trình độ nên bản luận văn không tránh khỏi những thiếu sót, rất mong nhận được sự góp ý quý báu của thầy cô và các bạn
Tôi xin chân thành cảm ơn!
Hà Nội, ngày 16 tháng 2 năm 2016
Học viên
Nguyễn Thị Thu Hiền
Trang 4MỤC LỤC
MỞ ĐẦU 1
CHƯƠNG 1.CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ 3
1.1 Lý thuyết xử lý tổ hợp số liệu Địa Vật lý 3
1.1.1 Xây dựng mô hình và xác định phương pháp 3
1.1.2 Ước lượng và đánh giá các đặc trưng của đối tượng chuẩn 4
1.1.3 Chọn thuật toán xử lý 6
1.1.4 Định nghiệm về sự tồn tại của đối tượng 7
1.1.5 Đánh giá chất lượng xử lý 7
1.2 Lý thuyết các thuật toán nhận dạng 7
1.2.1 Các thuật toán nhận dạng có mẫu chuẩn 7
1.2.2 Các thuật toán nhận dạng không có mẫu chuẩn 11
CHƯƠNG 2.HỆ PHƯƠNG PHÁP PHÂN TÍCH TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY 13
2.1 Các phương pháp phân tích tài liệu địa vật lý máy bay 13
2.1.1 Các phương pháp tách trường 13
2.1.2 Nhóm các phương pháp thống kê nhận dạng 13
2.1.3 Các phương pháp thống kê thực nghiệm 14
2.1.4 Một số phương pháp khác 14
2.2 Phương pháp Tần suất - Nhận dạng 15
2.2.1 Nội dung cơ bản của phương pháp phân tích tần suất 15
2.2.2 Phương pháp Tần suất-Nhận dạng 17
2.3 Phương pháp Khoảng cách- Tần suất- Nhận dạng 20
2.3.1 Nội dung cơ bản của phương pháp phân tích khoảng cách khái quát 20
2.3.2 Phương pháp Khoảng cách – Tần suất – Nhận dạng 22
Trang 5CHƯƠNG 3: KẾT QUẢ PHÂN TÍCH THỰC NGHIỆM TRÊN TÀI
LIỆU THỰC TẾ VÙNG KHÁNH THƯỢNG 28
3.1 Thông tin về khu vực nghiên cứu 28
3.2 Tài liệu thu thập, tính toán về khu vực nghiên cứu 30
3.2.1 Tài liệu thu thập về khu vực 30
3.2.2 Thực hiện phân tích thử nghiệm phương pháp Khoảng cách - tần suất - nhận dạng 34
3.2.3 Phân tích thử nghiệm với mục tiêu phân định một ranh giới địa chất theo tài liệu địa vật lý máy bay 41
KẾT LUẬN 55
TÀI LIỆU THAM KHẢO 57
PHỤ LỤC 59
Trang 6DANH MỤC HÌNH
Hình 2.1.Sơ đồ các bước của phương pháp phân tích Tần suất – Nhận dạng 19
Hình 2.2.Sơ đồ các bước thực hiện phân tích theo phương pháp Khoảng cách – Tần suất – Nhận dạng 24
Hình 3.1.Vị trí khu vực nghiên cứu 28
Hình 3.2.Địa hình khu vực nghiên cứu 28
Hình 3.3.Bản đồ hàm lượng Uran 31
Hình 3.4.Bản đồ hàm lượng Thori 31
Hình 3.5.Bản đồ hàm lượng kali 32
Hình 3.6.Bản đồ hàm lượng kênh tổng 32
Hình 3.7.Kết quả phân vùng triển vọng khoáng sản theo đề án bay đo cho khu vực nghiên cứu 33
Hình 3.8.Kết quả phân chia các thành tạo địa chất của khu vực theo tài liệu địa vật lý máy bay 42
Hình 3.9.Vùng chọn để xác định lại ranh giới các thành tạo (vùng khoanh màu xanh) 43
Hình 3.10.Vị trí lấy đối tượng mẫu để thực hiện phân tích thử nghiệm 43
Hình 3.11 Sơ đồ đường đồng mức hệ số đồng dạng thành lập từ kết quả phân tích 53
Hình 3.12 Sơ đồ 2 lớp đường đồng mức và lớp phân chia thành tạo ban đầu 53
Hình 3.13.Ranh giới của 2 thành tạo được phân chia theo phương pháp Khoảng cách – Tần Suất – Nhận dạng 54
Trang 7DANH MỤC BẢNG
Bảng 3.1.Tổng hợp các tính chất thu thập và tính toán được của khu vực 34
Bảng 3.2.Bảng kết quả 35
Bảng 3.3.Bảng kết quả sắp xếp lại các tính chất theo thứ tự giảm dần 36
Bảng 3.4.Kết quả xác định khoảng giá trị đặc trưng các tính chất của đối tượng mẫu 37
Bảng 3.5.Ma trận thông tin của đối tượng 1 được chuyển đổi bằng khoảng giá trị đặc trung của đối tượng mẫu: 38
Bảng 3.6.Kết quả phân tích hệ số đồng dạng cho 8 đối tượng với đối tượng 6 là đối tượng mẫu 40
Bảng 3.7.Bảng số liệu đối tượng mẫu 1 44
Bảng 3.8.Bảng số liệu đối tượng mẫu 2 46
Bảng 3.9.Bảng trích lược số liệu của lưới điểm 51
Bảng 3.10.Kết quả phân tích Khoảng cách – Tần suất – Nhận dạng cho vùng diện tích đã chọn 52
Trang 8MỞ ĐẦU
Địa vật lý hàng không ( Airborne Geophysics) là một lĩnh vực của Địa Vật
lý thăm dò, dùng máy bay làm phương tiện để bay đo các trường Địa vật lý trên đất liền hoặc thăm dò trên thềm lục địa, nhằm nghiên cứu thạch quyển – thủy quyển Những kết quả đạt được của công tác địa vật lý hàng không ở nước ta trong thời gian qua đã và đang ngày càng phát huy vai trò và hiệu quả to lớn trong việc tìm kiếm và dự báo các khoáng sản có ích
Những kết quả đạt được của công tác địa vật lý máy bay ở nước ta trong thời gian qua đã có hiệu quả to lớn trong việc tham gia giải quyết nhiều nhiệm vụ địa chất quan trọng, đặc biệt là trong việc tìm kiếm và dự báo các khoáng sản có ích Tuy nhiên, trong thực tế công tác địa vật lý máy bay cũng đang bộc lộ một số hạn chế, mà chủ yếu là ở khâu xử lý và phân tích tài liệu, cần được đầu tư nghiên cứu khắc phục, nhằm không ngừng nâng cao hơn nữa hiệu quả của phương pháp.Trong những năm gần đây công tác xử lí và phân tích tài liệu địa vật lý máy bay ở nước ta cũng đã có được những bước tiến đáng kể Thông qua các đề tài nghiên cứu, một số tác giả cũng đã tiến hành những nghiên cứu, phân tích thử nghiệm trên các tài liệu thực tế bằng nhiều phương pháp khác nhau, trong đó đáng chú ý là nhóm các phương pháp thống kê-nhận dạng và thu được kết quả tốt
Các phương pháp nhận dạng đóng vai trò hết sức quan trọng trong xử lý, phân tích tài liệu địa vật lý, đặc biệt là đối với các dạng số liệc có đặc tính phân bố ngẫu nhiên như các số liệu địa hóa, các số liệu phổ gamma v.v… Hiện nay trong địa vật lý có rất nhiều thuật toán nhận dạng hiện đại, được tự động hóa bằng các hệ phần mềm mạnh chuyên dụng, đáng chú ý là bộ chương trình phân tích phổ-thống
kê do Giáo sư, Viện sĩ Ni-Ki-Tin cùng các đồng sự đề xuất, xây dựng Tuy nhiên trên thực tế khối lượng tài liệu cũng như số lượng các chủng loại thông tin thu được trên các đối tượng địa chất ngày càng rất lớn Trong đó số lượng các tham số đầu vào của các chương trình phân tích nhận dạng hiện có thường bị giới hạn Việc
sử dụng các tổ hợp thông tin khác nhau để tiến hành phân tích nhận dạng nhiều khi cho những kết quả rất khác nhau Để nâng cao độ tin cậy của các phương pháp phân tích nhận dạng đã có những công trình nghiên cứu theo hướng ứng dụng lớp
Trang 9bài toán đánh giá lựa chọn thông tin để lựa chọn những tổ hợp thông tin chất lượng cao trước khi tiến hành phân tích nhận dạng
Phương pháp khoảng cách – tần suất – nhận dạng là một trong các phương pháp phân tích tài liệu mới đã được áp dụng và mang lại kết quả khả quan trong công tác xử lý phân tích tài liệu Địa Vật lý máy bay, một nguồn tài liệu đồ sộ và hết sức phong phú nhưng chưa được khai thác triệt để ở nước ta hiện nay
Đề tài luận văn “Nghiên cứu áp dụng phương pháp Khoảng cách– Tần suất – Nhận dạng mới trong phân tích- xử lý số liệu Địa vật lý” mà học viên lựa chọn
nhằm tìm hiểu, áp dụng phương pháp phân tích tổ hợp các tài liệu địa vật lý máy bay góp phần đẩy nhanh và nâng cao chất lượng của công tác xử lí phân tích tài liệu địa vật lý máy bay
Luận văn được thực hiện với nhiệm vụ chính sau:
- Tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin
- Tìm hiểu về các phương pháp phân tích trong xử lý phân tích số liệu Địa vật lý
- Đánh giá, phân tích thử nghiệm phương pháp với tài liệu thực tế vùng Khánh Thượng trên cơ sở áp dụng bổ sung phương pháp Khoảng cách– Tần suất – Nhận dạng mới
Từ những nhiệm vụ trên, luận văn được viết với cấu trúc gồm:
- Mở đầu
- Chương 1: Cơ sở lý thuyết phân tích- xử lý số liệu Địa vật lý
- Chương 2: Hệ phương pháp phân tích tài liệu Địa vật lý máy bay
- Chương 3: Kết quả phân tích thực nghiệm trên tài liệu thực tế vùng Khánh Thượng
- Kết luận
Trang 10CHƯƠNG 1.CƠ SỞ LÝ THUYẾT XỬ LÝ TỔ HỢP SỐ LIỆU ĐỊA VẬT LÝ 1.1 Lý thuyết xử lý tổ hợp số liệu Địa Vật lý
Xử lí số liệu về cơ bản là dựa trên nhiều loại thông tin khác nhau để giải quyết được các nhiệm vụ đặt ra phù hợp với điều kiện kinh tế và kĩ thuật cho phép Không chỉ riêng trong địa vật lý mà nhiều lĩnh vực khác cũng sử dụng xử lí tổ hợp
dữ liệu để nâng cao chất lượng xử lí
Xử lý số liệu Địa vật lý là một quá trình phức tạp phụ thuộc vào mục đích nghiên cứu và dạng các số liệu khác nhau Một cách khái quát có thể phân chia quá trình này theo các bước cơ bản sau:
- Xây dựng mô hình và xác định phương pháp
- Ước lượng và đánh giá các đặc trưng của đối tượng chuẩn
- Chọn thuật toán xử lý
- Định nghiệm về sự tồn tại của đối tượng cần tìm
- Đánh giá chất lượng xử lý
1.1.1 Xây dựng mô hình và xác định phương pháp [1] [10]
Để xử lý tổ hợp số liệu Địa vật lý người ta chủ yếu sử dụng các mô hình thống kê vì các đối tượng khảo sát cần nghiên cứu có vị trí, kích thước, tính chất vật lý không biết trước nên chúng được xem như các đối tượng ngẫu nhiên Mặt khác, các trường vật lý do các đối tượng địa chất tạo ra thường bị các loại nhiễu làm méo nên các dấu hiệu trường Địa vật lý khảo sát cũng mang tính ngẫu nhiên Với mô hình để được nhiệm vụ tiếp theo là lựa chọn các phương pháp nhận dạng tương ứng, tiến hành xử lý theo mô hình và giải quyết các nhiệm vụ bài toán đặt ra
Hiện nay trong công tác xử lý-phân tích số liệu địa vật lý có rất nhiều phương pháp nhận dạng, có thể chia chúng thành hai nhóm: nhóm các phương pháp nhận dạng theo đối tượng chuẩn và nhóm các phương pháp nhận dạng không
có đối tượng chuẩn
Nhóm các phương pháp nhận dạng theo đối tượng chuẩn được áp dụng khi chúng ta biết được lớp đối tượng và biết được đặc trưng thống kê của các trường địa vật lý đối với từng lớp đối tượng
Trang 11Khi xử lý số liệu địa vật lý bằng thuật toán nhận dạng có mẫu chuẩn, nhiệm vụ đặt ra là cần xây dựng các thuật toán hay đề xuất các chỉ tiêu nhận dạng đảm bảo để phân loại các đối số liệu quan sát thành hai lớp hoặc với số lớp nhiều hơn 2 khi có trước các đặc trưng thống kê của mỗi loại dấu hiệu ứng với các đối tượng chuẩn.Vấn
đề mang tính quyết định là lựa chọn đối tượng chuẩn, trên đó tiến hành nghiên cứu các đặc trưng thông kê của các dấu hiệu (các trường địa vật lý) Điều này đặc biệt quan trọng khi khảo sát các diện tích có cấu trúc địa chất phức tạp, ở đó các trường địa vật
lý quan sát được biến đổi mạnh ngay cả ở những diện tích nhỏ
Nhóm các phương pháp nhận dạng không có đối tượng chuẩn được áp dụng khi chúng ta không biết trước các đặc trưng thống kê của các dấu hiệu ứng với các lớp đối tượng cần tìm Khi đó quá trình nhận dạng đơn thuần chỉ thực hiện nhiệm vụ phân loại trường
Phương pháp xử lý số liệu bằng thuật toán nhận dạng không có đối tượng chuẩn được thực hiện như sau: bằng thuật toán phân loại trường lựa chọn được, tiến hành chia các điểm quan sát thành một số nhất định các diện tích đồng nhất về dấu hiệu tổ hợp Bản chất địa chất của từng diện tích phân ra được có thể không xác định được; để xác định chúng đòi hỏi phải có các số liệu khoan hoặc nghiên cứu bổ sung về tính chất vật lý của đá
1.1.2 Ƣớc lƣợng và đánh giá các đặc trƣng của đối tƣợng chuẩn.[1] [10]
a Ước lượng các đặc trưng thống kê
Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì công việc mang tính quyết định là lựa chọn các mẫu chuẩn và xác định các đặc trưng thống kê các trường địa vật lý của chúng
Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan
và các số liệu địa chất khác đã xác định được bản chất địa chất của các đối tượng gây ra trường địa vật lý Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các đối tượng chuẩn được lựa chọn khác nhau
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người ta tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng Các đặc trưng này bao gồm:
Trang 12 Đường cong biến phân (hàm phân bố mật độ xác suất thực nghiệm)
Kỳ vọng và phương sai của trường (thông qua đường cong biến phân ) Ngoài ra khi cần người ta còn tính cả hệ số tương quan giữa các dấu hiệu, phương chủ đạo của các dị thường…
Điều đặc biệt cần lưu ý để công tác phân tích nhận dạng đạt hiệu quả tốt thì cần lựa chọn các đối tượng chuẩn sao cho các diện tích tồn tại đối tượng chuẩn phải nằm xen kẽ với các phần diện tích khảo sát cần nhận dạng
Đối với nhóm các phương pháp nhận dạng không có đối tượng chuẩn để xác định các đặc trưng thống kê của trường người ta chia khu vực khảo sát thành các diện tích cơ sở – cửa sổ Kích thước của các diện tích cơ sở hay số lượng điểm quan sát trên mỗi diện tích cơ sở được lựa chọn dựa vào tỉ lệ bản đồ và kích thước
dị thường mà các đối tượng trường tạo ra Diện tích cơ sở có thể nhỏ nhất cần chọn
để trong tương lai có thể đề nghị (hoặc không đề nghị) đưa vào thăm dò hoặc khảo sát chi tiết Diện tích cơ sở cũng có thể xem như cửa sổ trượt, các đặc trưng thống
kê của trường trong cửa sổ đó được gán cho điểm trung tâm cửa sổ
b Đánh giá lượng tin của dấu hiệu
Lượng tin của dấu hiệu là khả năng mà dấu hiệu đó có thể phân biệt được các đối tượng khác nhau với nhau Khả năng này phụ thuộc vào việc các đối tượng của cùng một lớp có thường xuyên cho những giá trị cố định của dấu hiệu đó hay không và các giá trị đó có phân bố rộng ra ngoài giới hạn của các đối tượng của lớp
đó hay không
Người ta đưa ra các khái niệm lượng tin từng phần, lượng tin tổng (tích phân) và lượng tin tổng hợp Lượng tin từng phần là lượng tin của những dải giá trị hay của nhóm các giá trị riêng biệt của một dấu hiệu nhất định Lượng tin tổng là lượng tin chứa toàn bộ các giá trị của một dấu hiệu (một loại trường) nào đó Lượng tin tổng hợp là lượng tin tính cho những dạng kết hợp khác nhau của nhiều dấu hiệu
Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đi
Trang 13các thông tin hữu ích Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không làm tăng mà ngược lại làm giảm chất lượng nhận dạng đối tượng Chính vì vậy, trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó chọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu
quan với nhiều loại đất đá và các yếu tố kiến tạo khác nhau
b Đặc điểm chứa thông tin của số liệu gốc
Nếu các số liệu địa vật lý chứa thông tin ở hai mức: mức “có”- mức dị thường và mức “không”- mức phông thì người ta sử dụng các thuật toán logic Trong trường hợp các số liệu địa vật lý chứa các thông tin định lượng thì người ta
sử dụng các thuật toán kiểm chứng thống kê
c Tính độc lập và không độc lập
Khi các dấu hiệu trường địa vật lý độc lập nhau thì có thể sử dụng các thuật toán đơn giản Còn trong trường hợp các dấu hiệu liên quan với nhau thì các thuật toán được sử dụng phức tạp hơn
d Mức độ đầy đủ của các thông tin tiên nghiệm
Mức độ đầy đủ của các thông tin tiên nghiệm chính là mức độ hoàn chỉnh của các mô hình vật lý địa chất Trong trường hợp tồn tại các đối tượng chuẩn, nghĩa là khi biết rõ mô hình vật lý địa chất của các đối tượng thì để xử lý người ta
sử dụng các thuật toán nhận dạng có mẫu chuẩn để phân loại trường
Trang 141.1.4 Định nghiệm về sự tồn tại của đối tƣợng [1] [10]
Đối với các thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ yếu dựa vào chỉ số tương đồng Chỉ số này xác định mức độ giống nhau hoặc khác nhau giữa đối tượng nghiên cứu với đối tượng chuẩn theo lượng thông tin tổng hợp của toàn bộ các dấu hiệu
Đối với các thuật toán nhận dạng không có mẫu chuẩn thì quá trình nhận dạng chỉ đơn thuần thực hiện việc phân chia diện tích khảo sát thành các phần đồng nhất theo tổng hợp các dấu hiệu Việc phân loại ở đây được tiến hành dựa vào các chỉ tiêu định nghiệm khác nhau Chỉ tiêu này phụ thuộc rất nhiều vào số lượng các lớp đối tượng cần phân chia là bao nhiêu
Đối với các thuật toán nhận dạng không đối tượng chuẩn người ta sử dụng xác suất nhận dạng sai lầm để đánh giá chất lượng xử lý Xác suất này được tính dựa vào việc tính tích phân hàm phân bố mật độ xác suất của một hệ số gọi là hệ số tương thích Các hàm này được xác định riêng cho các đối tượng kiểm chứng của từng lớp một
1.2 Lý thuyết các thuật toán nhận dạng [1] [10]
Hiện nay, trong địa vật lý người ta sử dụng nhiều phương pháp nhận dạng hiện đại, được tự động hóa bằng các phần mềm mạnh Tuy nhiên có thể chia chúng thành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông tin tiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn (không có thông tin tiên nghiệm)
1.2.1 Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định bản chất địa chất của các đối tượng dựa vào việc so sánh tập hợp các dấu hiệu địa
Trang 15vật lý đặc trưng cho đối tượng chuẩn với tập hợp các dấu hiệu địa vật lý của đối tượng nghiên cứu Dưới đây là một số thuật toán điển hình
a Thuật toán logic
Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người ta tính lượng tin tổng, hoặc là xác định khoảng cách tổng
Công việc đầu tiên, người ta tiến hành mã hóa các dấu hiệu trường bằng mã nhị phân gồm tập số 0 và 1
Nếu xkl là giá trị trường thứ l của mẫu thứ k thì:
- xkl = 0 khi mẫu k không chứa giá trị thứ l
- xkl = 1 khi mẫu k chứa giá trị thứ l
Bằng cách trên toàn bộ các mẫu được mã hóa
Tiếp theo dựa vào các tổ hợp số 0 và 1(từ thông tin) xác lập trên các mẫu chuẩn người ta xác định các từ thông tin chuẩn cho từng lớp đối tượng Từ thông tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng chuẩn của lớp đó và không gặp lần nào ở các đối tượng chuẩn thuộc lớp khác Đối với một lớp đối tượng người ta có thể chọn vài từ thông tin chuẩn Các thông tin này được gọi là tổ hợp dấu hiệu phức hợp Trong các tổ hợp dấu hiệu phức hợp đặc trưng cho các đối tượng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trưng cho số lượng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó sẽ có lượng tin lớn hơn
Cuối cùng là nhận dạng các đối tượng nghiên cứu Ở bước này người ta tiến hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đối tượng nghiên cứu Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào
đó nhiều hơn số lần gặp các tổ hợp phức hợp của lớp khác thì đối tượng nghiên cứu được xếp vào lớp đó
b Thuật toán hồi quy
Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối quan hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được
Giả sử ta lập một quan hệ hàm giữa tham số địa chất Y và các dấu hiệu địa vật lý x1, x2…, xk Hàm f(x1, x2…, xk) mà ta cần tìm phải thỏa mãn:
E(Y-f(x1, x2…, xk))2 đạt cực tiểu
Trang 16Lớp hàm thường được dùng là các hàm đa thức, thường chỉ là bậc 1 (hàm tuyến tính) hoặc bậc 2
0 ) (
ji i
k i
x x c x
b a
1 1 1
k j
k i
l c x x x
b a
c Thuật toán định nghiệm thống kê
Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tượng chuẩn trong phân tích số liệu địa vật lý thường sử dụng các thông số như: Tỉ số sự thật L(x) và tổng lượng thông tin J(1:2,x)
Trang 17Giá trị các thông số đó được tính theo công thức:
L(x) = P1(x)/ P2(x) J(1:2,x) = log[P1(x)/ P2(x)]
Trong đó:
P1(x), P2(x): là xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng tương ứng của lớp 1 và lớp 2 (lớp quặng và lớp không quặng) Khi sử dụng đối tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P2(x) được thay bằng 1
x: là vectơ giá trị các dấu hiệu được sử dụng, x1,x2…xk (ví dụ các hàm lượng qU, qTh, qK…)
Khi các dấu hiệu x1,x2…xk được xem là không phụ thuộc nhau thì xác suất của đại lượng n chiều của tổ hợp n dấu hiệu được tính
P(x) = P(x1) P(x2)… P(xk)
)() (
)
()(xP
)(xP
)
(xP
)(xP
)(xP
)
(xP
)
k 2 2
2 1 2
k 1 2
1 1 1
k
x L x
L x L x
sử dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số
x1,x2…xn Các hàm này được biểu diễn như sau:
k j
x x b
ci (trong trường hợp các dấu hiệu phụ thuộc nhau) Sau đó tính giá trị L(x), J(1:2,x) hoặc R1, R2, phổ các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên
Trang 18bản đồ Đối sánh các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết
và khoanh định được các diện tích đồng dạng với đối tượng chuẩn Các dấu hiệu được lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được
1.2.2 Các thuật toán nhận dạng không có mẫu chuẩn
a Thuật toán kiểm chứng thống kê
Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toàn độc lập nhau Ban đầu người ta sử dụng các bộ lọc để tách các dị thường ra khỏi phông nhiễu cho từng dấu hiệu trường Kết quả lọc cho phép nhận được các số liệu trường chủ yếu gồm các dị thường Tiếp theo là phân loại các dị thường thành các lớp dị thường Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê giống nhau Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo sát thành các diện tích cơ sở, sau đó dựa vào kết quả phân cấp các giá trị trường ở mỗi cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó Cuối cùng để phân lớp các dị thường người ta sử dụng chỉ tiêu để so sánh và xếp loại 2các đường cong biến phân Các diện tích có ước lượng phân bố mật độ xác suất giống nhau được xếp vào một lớp
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến hành xác định số hiệu của lớp tổng hợp
Với mục đích này, dựa vào các đường cong biến thiên dựng được cho từng dấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trị trung bình theo thứ tự tăng dần Sau đó dựa vào chỉ tiêu xác suất hậu nghiệm cực đại người ta quyết định xếp loại đối tượng khảo sát vào các lớp khác nhau Bằng cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích có hình dạng
bất kì, ở đó dị thường của các dấu hiệu khác nhau chồng lên nhau
b Thuật toán K trung bình
Nội dụng của thuật toán như sau: Giả sử tồn tại n đối tượng Nhiệm vụ đặt
ra là phân chia toàn bộ n đối tượng thành M lớp với M << n
Để giải quyết nhiệm vụ trên, lúc đầu người ta chọn ngẫu nhiên từ n đối tượng ra k đối tượng, k đối tượng được chọn này được xem như là các mẫu chuẩn xuất phát Tiếp theo là tiến hành chính xác hóa liên tiếp các mẫu chuẩn chọn được
Trang 19bằng cách so sánh các mẫu chuẩn với các đối tượng còn lại Sau mỗi lần chọn tập hợp các mẫu chuẩn Eν chọn được ở lần chọn thứ ν sẽ thay cho các mẫu chuẩn chọn được ở lần ν -1 (lần trước đó)
Nếu kí hiệu tập hợp mẫu chuẩn Ev chọn được ở lần thứ v là:
Sau quá trình hiệu chỉnh ở vòng 1, bằng phương pháp mô tả trên thuật toán
sẽ tiến hành hiệu chỉnh ở các lần tiếp theo, cho đến khi đối tượng cuối cùng được gọi ra
Sau khi tập hợp các mẫu chuẩn được chính xác hóa, thuật toán tiến hành phân loại toàn bộ số lượng n các đối tượng theo tập hợp các dấu hiệu thành M lớp dựa vào nguyên tắc khoảng cách tối thiểu
Trang 20CHƯƠNG 2.HỆ PHƯƠNG PHÁP PHÂN TÍCH TÀI LIỆU ĐỊA VẬT
LÝ MÁY BAY
2
2.1 Các phương pháp phân tích tài liệu địa vật lý máy bay
Công tác phân tích tài liệu địa vật lý máy bay nói riêng và phân tích tổ hợp tài liệu nói chung để giải thích các vấn đề địa chất và dự báo triển vọng khoáng sản người ta sử dụng rất nhiều phương pháp khác nhau tùy thuộc vào từng mục tiêu, từng bước và từng điều kiện cụ thể, trong đó có các phương pháp thông kê - nhận dạng được áp dụng rộng rãi có hiêu quả hơn cả Một số nội dung cơ bản của các
phương pháp như sau:
2.1.2 Nhóm các phương pháp thống kê nhận dạng[10]
a Các phương pháp nhận dạng theo đối tượng chuẩn
Trong các phương pháp phân tích nhận dạng có đối tượng chuẩn thì việc quan trọng nhất là chọn đối tượng chuẩn, tiếp đến là chọn tập hợp các dấu hiệu dùng để phản ánh và nhận dạng các đối tượng Tùy thuộc vào các mục đích nghiên cứu khác nhau mà việc lựa chọn các đối tượng chuẩn sẽ khác nhau
b Các phương pháp nhận dạng không có đối tượng chuẩn
Trong điều kiện khi diện tích khảo sát chưa được nghiên cứu kỹ và không
có được các đối tượng chuẩn tin cậy người ta có thể sử dụng các phương pháp nhận dạng không có mẫu theo nguyên lý tự điều chỉnh để phát hiện và khoanh định các diện tích trường dị thường dựa trên một số dấu hiệu đã được chọn trước theo nguyên tắc: xác suất nhỏ, tương quan yếu và có tính trội của một nguyên tố nào đó
Trang 21Người ta đặc biệt quan tâm đến các diện tích dị thường (có khả năng liên quan với các khoáng sản) được khoanh định theo các dấu hiệu nên trên khi có các đặc điểm như:
Loại thường gặp trong các lớp đất đá khác nhau nhưng rất giống nhau
Loại không điển hình cho lớp đất đá của nó hoặc trên toàn vùng Các phương pháp nhận dạng không có mẫu theo nguyên lý tự điều chỉnh để đánh giá triển vọng khoáng sản nói chung đạt hiệu quả không cao, thường chỉ có thể tham gia vào việc phát hiện và khoanh định các diện tích, dự báo là có thể có
liên quan với khoáng sản
2.1.3 Các phương pháp thống kê thực nghiệm[10]
Các phương pháp thống kê thực nghiệm được thiết lập trên cơ sở các quan niệm lý thuyết, những kinh nghiệm thực tế, sự tự điều chỉnh để tìm kiếm lời giải đúng trong quá trình phân tích Bằng mô hình toán học và thông qua chúng có thể phân chia các lớp dấu hiệu đối với các dị thường quặng và không quặng Các thông số (được biểu diễn qua các biểu thức toán học) thường được sử dụng đó là:
Các thông số Dominal : (K Th)(1x)/2
K
Th q q e
D Trong đó:
K K K
quan với khoáng sản
2.1.4 Một số phương pháp khác
Ngoài một số phương pháp phân tích mang tính chuyên dụng thường được
áp dụng trong phân tích tài liệu phổ gamma hàng không, trong thực tế người ta còn
Trang 22sử dụng rất nhiều phương pháp phân tích khác theo hướng khai thác và sử dụng triệt để thông tin như các phương pháp đạo hàm, phương pháp phân tích các thành phần chính, các phương pháp phân tích bản đồ bóng, các phương pháp chồng chập thông tin
Hầu hết các phương pháp nói trên ( bao gồm các phương pháp tách trường, các phương pháp nhận dạng, các phương pháp thống kê thực nghiệm v.v…) nói chung đều xử lý trên các số liệu liên tục theo tuyến hoặc theo diện, nghĩa là phân tích trên các bản đồ trường (cường độ bức xạ gamma, hàm lượng các nguyên tố phóng xạ U, Th, K)
2.2 Phương pháp Tần suất - Nhận dạng
Phương pháp Tần suất - Nhận dạng là một trong các nội dung liên quan trực tiếp tới luận văn mà cụ thể, phương pháp này liên quan khá mật thiết với nội dung của phương pháp phân tích Khoảng cách – Tần suất – Nhận dạng Do đó việc tìm hiểu cơ bản nội dung của phương pháp Tần suất - Nhận dạng là một nội dung quan trọng cho các mục tiêu tiếp theo của luận văn
Phương pháp phân tích Tần suất – Nhận dạng được tác giả PGS.TS Võ Thanh Quỳnh đề xuất và công bố năm 2007 trong bài bài báo khoa học “ Một cách tiếp cận mới giải quyết bài toán nhận dạng trong xử lý phân tích tài liệu địa vật lý” đăng trên TC Địa chất, A/302 : 76-80 Hà Nội Và nhóm tác giả Võ Thanh Quỳnh, Nguyễn Xuân Bình, Nguyễn Đức Vinh tiếp tục nghiên cứu hoàn thiện và mở rộng khả năng ứng dụng của phương pháp vào những năm gần đây Từ các kết quả công
bố cho thấy các thử nghiệm bước đầu của phương pháp cho kết quả tốt khi phân tích tài liệu thực tế
Phương pháp Tần suất – Nhận dạng dựa trên cơ sở là phương pháp phân tích tần suất, một phương pháp có khả năng đánh giá chất lượng của mỗi loại thông tin
2.2.1 Nội dung cơ bản của phương pháp phân tích tần suất [6]
Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sự xuất hiện đồng thời các dấu hiệu do Griffths-Vinni đưa ra tiến hành trên một loại đối tượng mẫu có nội dung tóm tắt như sau:
Trang 23Giả sử ta có ma trận thông tin các tính chất của đối tượng nghiên cứu:
n
k k
dt j i
2 22
21
1 12 11
,
Trong đó:
k : số loại tính chất của ma trận thông tin
n : số lượng mẫu chứa các thông tin về các tính chất của đối tượng
: được biểu diễn bằng các khái niệm logic: “yes” hoặc “no” hoặc bằng các số 1 hoặc 0
Theo Griffths-Vinni, lượng thông tin tương đối của dấu hiệu thứ “i” được xác định theo công thức:
2
1 1
n h
hj hi i
k n
1
* 1
m
i i m
Trang 24Như vậy bản chất của phương pháp phân tích tần suất theo thuật toán Giffiths - Vinni là đưa ra được một cách đánh giá về chất lượng của từng chủng loại thông tin trong nhận thức đối tượng, trên cơ sở đó lựa chọn tập hợp các chủng loại thông tin
có giá trị cao phục vụ các mục đích nghiên cứu
Tiếp sau đó, cũng từ nội dung phương pháp phân tích tần suất, tác giả đã đề xuất một cách tiếp cận, trực tiếp tham gia giải quyết bài toán nhận dạng và xây dựng thành một phương pháp mới: “Phương pháp tần suất - nhận dạng” [6]
2.2.2 Phương pháp Tần suất-Nhận dạng
Xây dựng ma trận thông tin của đối tượng mẫu
Để đánh giá và lựa chọn tổ hợp thông tin theo thuật toán Griffths-Vinni, trước hết cần có ma trận thông tin của đối tượng mẫu Ma trận này được xây dựng theo các bước sau:
-Xác định tính chất của các tham số dùng để xây dựng ma trận thông tin:
Xác định tính chất của các tham số là xác định các khoảng giá trị đặc trưng chung tương ứng của nó, làm cơ sở cho việc xây dựng các đơn vị thông tin ma trận
-Xác định giá trị của từng đơn vị thông tin ( “ yes” , “ no” hoặc “1”, “0”) cho các tính chất của ma trận: Sau khi có được các khoảng giá trị đặc trưng , sử
dụng chúng làm “cửa sổ quét” để tạo ra các đơn vị thông tin cho từng chủng loại thông tin của từng phần tử Đối với mỗi phần tử của mỗi chủng loại thông tin, nếu
nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm ngoài sẽ nhận giá trị
là 0 Bằng cách đó sẽ chuyển được một ma trận thông tin với các số liệu địa chất, địa vật lý về ma trận thông tin chuẩn theo yêu cầu của thuật toán với các phân tử là các giá trị 1 hoặc 0 Vì vậy để xây dựng được ma trận thông tin đòi hỏi phải có tập hợp số liệu nhiều và phong phú
Đánh giá, lựa chọn tổ hợp thông tin
Để tiến hành phân tích đối tượng, xác định các đối tượng đồng dạng, trước hết cần đánh giá lựa chọn tổ hợp thông tin có chất lượng cao từ tập hợp tất cả các chủng loại thông tin có được về đối tượng nghiên cứu Số lượng chủng loại thông tin m được lựa chọn tùy thuộc vào giá trị ngưỡng của Pm cho trước
Trang 25 Phân tích đối sánh, xác định các đối tượng đồng dạng
- Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối với đối
tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu
- Tiến hành đánh giá tỉ trọng thông tin cho tất cả các tính chất của đối tượng đối
sánh bằng phương pháp phân tích tần suất theo thuật toán Griffiths-Vinin
- Tính tỉ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượng mẫu cho đối tượng đối sánh Có thể xem giá trị này tương tự như hệ số đồng dạng, ta gọi nó là chỉ số đồng dạng, kí hiệu P*m.
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P*m có giá trị đạt mức giá trị ngưỡng nào đó
Các bước phân tích của phương pháp Tần suất-Nhận dạng được thực hiện theo sơ đồ hình 2.1
Phương pháp được nhóm tác giả nhận định: “Phương pháp này hoàn toàn có thể ứng dụng để giải quyết nhiệm vụ tìm kiếm và dự báo triển vọng khoáng sản trong xử lý, phân tích tài liệu địa vật lý máy bay, một nguồn tài liệu hết sức phong phú ở nước ta hiện nay Về nguyên tắc, phương pháp này có thể mở rộng phân tích cho các tài liệu địa vật lý khác nhau Tuy nhiên, hiện chưa có kết quả phân tích trên các dạng tài liệu địa vật lý khác Đây cũng là hướng nghiên cứu tiếp theo của tác giả
để hoàn thiện hơn nữa nội dung của phương pháp Những kết quả đạt được cũng mở
ra hướng nghiên cứu tiếp cận mới giải quyết bài toán nhận dạng trong địa vật lý trên
cơ sở khai thác ứng dụng lớp các bài toán đánh giá lựa chọn thông tin.” [5]
Trang 26Hình 2.1.Sơ đồ các bước của phương pháp phân tích Tần suất – Nhận dạng
Số liệu vào
- Số liệu của đối tượng mẫu và các đối tượng đối sánh
Bước 1 Xác định các khoảng giá trị đặc trưng của các tính chất của đối tượng mẫu
Bước 2 Xây dựng ma trận thông tin cho đối tượng mẫu
Bước 3
Xử lý ma trận thông tin
Bước 4 -Phương án 1: phân tích đối sánh, xác định các đối tượng đồng dạng với đối tượng mẫu -Phương án 2: tính giá trị Pm* tại các vị trí điểm đo trên toàn diện tích khảo sát
In kết quả -Kết quả đánh giá và lựa chọn thông tin
-Danh sách các đối tượng đồng dạng(đối với phương án 1)
-File giá trị Pm* theo tọa độ ( đối với phương án 2)
Trang 272.3 Phương pháp Khoảng cách- Tần suất- Nhận dạng
Phương pháp Khoảng cách – Tần suất – Nhận dạng do PGS.TS Võ Thanh Quỳnh đề xuất và công bố năm 2008 trên Tạp chí Địa chất Cơ sở của phương pháp
là thuật toán phân tích khoảng cách khái quát do Poguouob đề xuất cùng với phương thức nhận dạng thực hiện dựa trên cơ sở của phương pháp Tần suất – Nhận dạng Phương pháp này do nhóm tác giả Võ Thanh Quỳnh, Nguyễn Xuân Bình, nghiên cứu hoàn thiện
Là phương pháp nhận dạng thuộc nhóm các phương pháp thống kê nhận dạng có đối tượng mẫu, phương pháp Khoảng cách – Tần suất – Nhận dạng có khả năng nhận dạng các đối tượng tương đồng với mẫu dựa trên tập hợp nhiều thông tin từ các đối tượng mẫu Tuy nhiên, phương pháp có một vài đặc điểm riêng như sau:
- Sử dụng 2 đối tượng mẫu đối nghịch (mẫu chuẩn và mẫu đối nghịch với mẫu chuẩn)
- Sử dụng các tính chất có khả năng phân biệt 2 đối tượng mẫu nhiều nhất
để thực hiện nhận dạng
- Ngoài mục tiêu nhận dạng theo mẫu chuẩn phương pháp phân tách được các đối tượng tương đồng với mẫu đối nghịch ra khỏi tập hợp kết quả nhận dạng
Nguyên nhân chủ yếu dẫn tới những đặc điểm riêng này đến từ phương pháp phân tích khoảng cách khái quát Các tính chất có khả năng phân biệt nhiều nhất giữa 2 đối tượng xác định được thông qua phương pháp này
2.3.1 Nội dung cơ bản của phương pháp phân tích khoảng cách khái quát
Phương pháp phân tích khoảng cách khái quát do Paguonov đề xuất nhằm xác định mức độ thông tin của các tính chất có khả năng phân biệt đối tượng thông qua độ dài khoảng cách khái quát trong không gian dấu hiệu giữa hai loại đối tượng mẫu đối nghịch nhau Nội dung phương pháp được tóm tắt như sau:
Giả sử ta có 2 đối tượng mẫu đối nghịch nhau (ví dụ quặng và không quặng; sau đây gọi là đối tượng quặng và đối tượng không quặng) có k loại dấu hiệu (k tính chất) mỗi dấu hiệu có n giá trị (với đối tượng quặng) và m giá trị (với đối
Trang 28tượng không quặng) đã biết Khi đó ta có các ma trận thông tin của các đối tượng mẫu như sau:
Đối tượng quặng:
Đối tượng không quặng:
Các ma trận này phải có cùng số loại tính chất, nghĩa là có số cột bằng nhau, còn số dòng tùy ý
Theo Paguonov, lượng thông tin của tính chất thứ “i” được đánh giá theo bình phương khoảng cách khái quát giữa trọng tâm các đám mây trong không gian dấu hiệu:
(2.3) [7]
Trong đó:
, : giá trị trung bình của tính chất “i” đối với quặng và không quặng , : phương sai của các giá trị của tính chất “i” đối với quặng và không quặng
Trang 29Sắp xếp { } theo thứ tự giảm dần và gọi nó là { } Khi đó, thông tin tổng của j tính chất đầu trong toàn bộ k tính chất được tính theo công thức:
(2.4) [7]
Trị số có quan hệ với sai số nhận biết, phân biệt đối tượng như sau:
(2.5) Như vậy, từ nội dung của phương pháp phân tích tần suất đã nêu ở trên và nội dung của phương pháp phân tích khoảng cách khái quát cho thấy bản chất của chúng là đưa ra được một cách đánh giá về chất lượng của từng chủng loại thông tin trong nhận biết đối tượng, trên cơ sở đó lựa chọn tập hợp các chủng loại thông tin có giá trị cao phục vụ các mục đích nghiên cứu
2.3.2 Phương pháp Khoảng cách – Tần suất – Nhận dạng
Xây dựng ma trận thông tin đối tượng mẫu
Các ma trận thông tin của đối tượng mẫu (quặng và không quặng) theo phương pháp phân tích khoảng cách khái quát dễ dàng có được trực tiếp từ số liệu địa vật lý trên các đối tượng mẫu đó Ma trận thông tin của đối tượng mẫu trong phương pháp phân tích tần suất được xây dựng từ chính ma trận mẫu quặng như sau:
Từ tập hợp số liệu của các chủng loại thông tin của đối tượng mẫu quặng trong phương pháp phân tích khoảng cách khái quát xây dựng các đường cong biến phân (đường cong mật độ phân bố) Từ các đường cong biến phân xác định khoảng giá trị đặc trưng cho từng tham số Sau khi có được các khoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn vị thông tin cho từng chủng loại thông tin, nếu nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm ngoài sẽ nhận giá trị là 0 Bằng cách này sẽ chuyển được một ma trận thông tin với các số
Trang 30liệu địa chất, địa vật lý bất kì về ma trận thông tin chuẩn theo yêu cầu của thuật toán với các phần từ là các giá trị 1 hoặc 0
Đánh giá lựa chọn tổ hợp thông tin
Việc đánh giá lựa chọn tổ hợp thông tin được tiến hành trên cơ sở vận dụng kết hợp cả 2 phương pháp theo cách như sau:
- Tiến hành phương pháp phân tích khoảng cách khái quát trên ma trận thông tin của 2 đối tượng mẫu (quặng và không quặng) xác định tập {i2}
- Tiến hành phương pháp phân tích tần suất trên ma trận thông tin của đối tượng mẫu quặng thông qua các giá trị Qh
Phân tích đối sánh xác định các đối tượng đồng dạng
Các đối tượng cần đối sánh với đối tượng mẫu để xem nó có đồng dạng với đối tượng mẫu hay không được thực hiện theo cách như sau:
- Tiến hành đánh giá lượng tin Ii cho tất cả các tính chất của đối tượng đối sánh bằng phương pháp phân tích tần suất và xác định được tập {Ii} Ở đây ma trận thông tin của đối tượng đối sánh được xây dựng thông qua chính các khoảng giá trị đặc trưng của đối tượng mẫu với cách làm như đã nêu
- Tính tỉ trọng thông tin tương đối của h tính chất đầu đã được lựa chọn ở mục 2 theo công thức cho đối tượng đối sánh, ký hiệu là Q*h
Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi Q*h ≥ Qh Phương pháp Khoảng cách – Tần suất – Nhận dạng với nôi dung được trình bày ở trên được thực hiện phân tích với các bước theo sơ đồ hình 2.2
Trang 31Hình 2.2.Sơ đồ các bước thực hiện phân tích theo phương pháp Khoảng cách –
Tần suất – Nhận dạng
Số liệu vào -Số liệu của đối tượng mẫuvà các đối tượng đối sánh
Bước 1 Xác định các khoảng giá trị đặc trưng của các tính chất của đối tượng mẫu
Bước 2 Xây dựng ma trận thông tin cho đối tượng quặng và không quặng
(Sử dụng các khoảng giá trị đặc trưng của đối tượng mẫu để xác định giá trị của từng
đơn vị thông tin cho cả đối tượng quặng và không quặng)
Bước 3
Xử lý ma trận thông tin ( Đánh giá và lựa chọn thông tin theo phương pháp khoảng cách- phân tích- tần suất)
Bước 4 Đối sánh nhận dạng, xác định các đối tượng đồng dạng với cụm đối tượng quặng
kết quả -Bảng phân loại cụm dị thường của đối tượng quặng
-Kết quả lựa chọn thông tin
-Danh sách các cụm đồng dạng ( cùng loại )
Trang 32Nhóm tác giả của phương pháp đã nghiên cứu hoàn thiện và mở rộng phạm
vi áp dụng đối với trường hợp chưa biết trước các đối tượng đối sánh Với trường hợp này từ 2 đối tượng mẫu đối nghịch, trên toàn bộ diện tích nghiên cứu, khoanh định được các đối tượng đồng dạng với đối tượng mẫu Các bước thực hiện phân tích với cả hai trường hợp biết trước đối tượng đối sánh và chưa biết đối tượng đối sánh cụ thể như sau:
Bước 1 Nội suy các số liệu khảo sát địa vật lý thực tế lên mạng lưới đều (ô
vuông hoặc chữ nhật) bằng các thuật toán nội suy hiện có
Bước 2 Thực hiện các nội dung như:
- Xây dựng các ma trận thông tin của các đối tượng mẫu cho cả hai thuật toán: thuật toán phân tích tần suất và thuật toán phân tích khoảng cách khái quát Nội dung này được thực hiện theo đúng phương pháp Khoảng cách-Tần suất-Nhận dạng hiện có
- Đánh giá, lựa chọn tổ hợp thông tin trên các đối tượng mẫu
Việc đánh giá lựa chọn tổ hợp thông tin được tiến hành trên cơ sở vận dụng kết hợp cả 2 phương pháp theo cách như sau:
+ Tiến hành phương pháp phân tích khoảng cách khái quát trên ma trận thông tin của 2 đối tượng mẫu (quặng và không quặng) xác định tập {i2}
+ Tiến hành phương pháp phân tích tần suất trên ma trận thông tin của đối tượng mẫu quặng Đến đây ta không sắp xếp {I i} theo thứ tự giảm dần của chính
1 2 1
h
i i h
j
j Q
(2.6)
Tổ hợp h tính chất đầu được lựa chọn thông qua các giá trị Qh như sau:
Trang 33Xây dựng đường cong Qh theo h (trục y là Qh, trục x là h); Giá trị h được xác định sao cho tại đó trị tuyệt đối đạo hàm bậc 2 của Qh theo h có giá trị lớn nhất
2
2
max) nghĩa là tại đó có sự phân chia (phân tách) rõ nhất giữa tập các
thông tin độ tin cậy cao và tập các thông tin độ tin cậy thấp Trên đường cong Qh
hoành độ h được xác định tại điểm có độ cong lớn nhất.[10]
Bước 3
Trường hợp biết trước đối tượng đối sánh
Nội dung này đã được giải quyết ở phương pháp Khoảng cách-Tần Nhận dạng đã trình bày ở trên
suất- Trường hợp chưa biết trước đối tượng đối sánh
Phân tích, tính toán chỉ số đồng dạng P*m tính toán chỉ số đồng dạng P*m cho tất cả các điểm trên các nút của của mạng lưới đều đã được nội suy, trên toàn bộ diện tích vùng nghiên cứu Nội dung này được thực hiện như sau:
- Dùng các “cửa sổ quét” để xác định ranh giới diện tích của các đối tượng đối sánh Các “cửa sổ quét” có thể là các hình tròn, hình vuông, hình chữ nhật,
hình elipxoid với các kích thước và góc quay khác nhau Các diện tích nằm trong cửa sổ quét được xem là các đối tượng đối sánh, cần tiến hành xử lý, phân tích đối sánh, xác định mức độ đồng dạng của chúng so với đối tượng mẫu thông qua chỉ số đồng dạng P*m Nội dung này được thực hiện giống như như trường hợp các đối tượng đối sánh đã biết của phương pháp Tần suất-Nhận dạng đã được trình bày Giá trị P*m của đối tượng đối sánh vừa tính được sẽ được gán cho điểm trung tâm của cửa sổ quét Điểm trung tâm này sẽ trùng với điểm nút của mạng lưới đều đã được nội suy
- Dịch chuyển cửa sổ quét khắp diện tích của vùng nghiên cứu, với bước dịch đều theo mạng lưới đã được nội suy Kết quả ta được một File số liệu các chỉ
số đồng dạng P*m(x,y) theo tọa độ trùng với tọa độ của mạng lưới đã được nội suy trên khắp diện tích vùng nghiên cứu
- Khoanh định và đánh giá mức độ đồng dạng của các diện tích đồng dạng với đối tượng mẫu Từ File số liệu này, với các mức giá trị ngưỡng cho trước ta sẽ
Trang 34có xác định được sự phân bố của các đối tượng đồng dạng cũng như mức độ đồng dạng của chúng so với đối tượng mẫu trên toàn diện tích nghiên cứu bằng việc xây dựng bản đồ đồng mức giá trị của P*m(x,y) [10]
Theo các công trình đã công bố về phương pháp Khoảng cách – Tần suất – Nhận dạng của nhóm tác giả, đây là một phương pháp nhận dạng hoàn chỉnh và có khả năng xử lý với các nguồn tài liệu đa dạng Các kết quả phân tích thử nghiệm phương pháp cũng đã bước đầu chỉ ra khả năng ứng dụng của phương pháp với tài liệu đo bay địa vật lý
Trang 35
CHƯƠNG 3: KẾT QUẢ PHÂN TÍCH THỰC NGHIỆM TRÊN TÀI LIỆU
THỰC TẾ VÙNG KHÁNH THƯỢNG
3.1 Thông tin về khu vực nghiên cứu
Hình 3.1.Vị trí khu vực nghiên cứu
\ Hình 3.2.Địa hình khu vực nghiên cứu
Trang 36Khu vực nghiên cứu là vùng núi thuộc xã Khánh Thượng, huyện Khánh Vĩnh, tỉnh Khánh Hòa
Tỉnh Khánh Hòa ở về phía khu vực duyên hải Nam Trung Bộ của Việt Nam, nằm sát dãy núi Trường Sơn, đa số diện tích Khánh Hòa là núi non, miền đồng bằng rất hẹp, chỉ khoảng 400 km², chiếm chưa đến 1/10 diện tích toàn tỉnh
Cấu tạo địa chất của Khánh Hòa chủ yếu là đá granit và Riônit, đaxit có nguồn gốc mắc-ma xâm nhập hoặc phún xuất kiểu mới Ngoài ra còn có các loại đá cát, đá trầm tích ở một số nơi Về địa hình kiến tạo, phần đất của tỉnh Khánh Hòa
đã được hình thành từ rất sớm, đặc biệt là vùng núi thuộc huyện Khánh Vĩnh Từ các tài liệu địa chất đã có ta thấy được vùng núi thuộc huyện Khánh Vĩnh có nhiều thành địa chất thuận lợi đối với việc tạo quặng và phân bố quặng Hơn nữa đây là vùng có hoạt động hoạt hóa magma kiến tạo mạnh mẽ, ở đại trung sinh có 2 chu kỳ tạo sản inđôxi và kimêri có ảnh hưởng một phần đến vùng nên tạo điều kiện cho việc hình thành và tích tụ khoáng sản
Học viên đã thu thập thông tin về các đặc điểm tự nhiên, địa chất và bản đồ trường của vùng để tiến hành nghiên cứu và phân tích thử nghiệm
a Vị trí địa lý
Huyện Khánh Vĩnh nằm trên tọa độ địa lý 120 45'52" đến 12030'14" vĩ độ Bắc và
108 004'23" đến 109 040'23" kinh độ Đông Khánh Vĩnh là huyện miền núi và bán sơn địa nằm ở cực Tây tỉnh Khánh Hòa, phía bắc giáp thị xã Ninh Hòa và tỉnh Đak Lak, phía tây là tỉnh Lâm Đồng, phía nam giáp huyện Khánh Sơn và tỉnh Ninh Thuận, phía đông giáp huyện Diên Khánh
Xã Khánh thượng nằm ở phía tây bắc của huyện với tọa độ: 12°19′47″B 108°45′56″Đ
Trang 37c Khái quát đặc điểm tự nhiên
Cấu tạo địa chất của Khánh Hòa chủ yếu là đá Granit và Riônit, Đaxit có nguồn gốc Mắc-ma xâm nhập hoặc phún xuất kiểu mới Ngoài ra còn có các loại
đá cát, đá trầm tích ở một số nơi Về địa hình kiến tạo, phần đất của tỉnh Khánh Hòa đã được hình thành từ rất sớm, là một bộ phận thuộc rìa phía Đông-Nam của địa khối cổ Kom Tom, được nổi lên khỏi mặt nước biển từ Đại cổ sinh, cách đây khoảng 570 triệu năm Ở đại trung sinh có 2 chu kỳ kiến tạo là Inđôxi và Kimêri có ảnh hưởng một phần đến Khánh Hòa
Khánh Vĩnh có địa hình chủ yếu là đồi núi và phân thành 2 khu vực chính Khu vực phía Đông, dọc theo lưu vực các phụ lưu của sông Cái chủ yếu là các đồi thấp, khu vực phía tây và phía Nam chủ yếu là các núi cao với nhiều đỉnh núi cao
từ 1500 m đến trên 2000 m, trong đó có Đỉnh Hòn Giao (2062 m) là đỉnh núi cao nhất tỉnh Khánh Hòa Do nằm ở thượng nguồn của sông Cái Nha Trang, huyện Khánh Vĩnh có mật độ sông suối cao hơn so với các huyện khác trong tỉnh, Mật độ sông suối bình quân là 0,65 km/km² Hầu hết sông suối đều xuất phát từ các dãy núi cao ở phía Nam, Tây và Bắc rồi tập trung về sông Thác Ngựa và sông Chò chảy về sông Cái Nha Trang
Tài nguyên khoáng sản của Khánh Vĩnh chủ yếu gồm thiếc, cao lanh và các loại gỗ quý hiếm Khánh Vĩnh có 87.198,99 ha đất rừng Độ che phủ thường xuyên chiếm 75% diện tích tự nhiên của huyện với tổng trữ lượng gỗ lên đến 10 triệu m3, trong đó khoảng 9 triệu m3 tập trung ở rừng rậm và rừng trung bình
3.2 Tài liệu thu thập, tính toán về khu vực nghiên cứu
3.2.1 Tài liệu thu thập về khu vực
Để tiến hành phân tích thử nghiệm phương pháp nhằm hiểu rõ nội dung, các bước
và cách thức thực hiện phân tích học viên thực hiện thu thập tài liệu về khu vực
nghiên cứu đã trình bày ở trên Tài liệu gồm các bản đồ trường xạ (Uran, Thori, Kali, kênh tổng) thuộc Đề án Bay đo - từ phổ gamma tỷ lệ 1/50.000 và đo vẽ trọng lực vùng Phan Rang - Nha Trang, do Quách Văn Thực cùng các tác giả thuộc Liên đoàn Vật lý Địa chất, thành lập năm 2003
Trang 39Hình 3.5.Bản đồ hàm lượng kali
Hình 3.6.Bản đồ hàm lượng kênh tổng
Cùng với các bản đồ trường thu thập được học viên còn sử dụng một số kết quả phân tích của đề án bay đo nhằm sử dụng như tài liệu để đối sánh với các kết quả thực hiện phân tích được Dưới đây là kết quả khoanh vùng triển vọng khoáng sản cho khu vực nghiên cứu của đề án bay đo cho khu vực nghiên cứu Trong đó,
có các phân vùng nhỏ triển vọng theo các cấp khác nhau Ở đây, vùng triển vọng số
6 có tiềm năng triển vọng loại B với các khoáng sản chính là khoáng sản vàng,
Trang 40kẽm Các vùng từ số 1 đến số 9 (Hình 3.5) cũng là các vùng triển vọng cùng loại với vùng số 6
Hình 3.7.Kết quả phân vùng triển vọng khoáng sản theo đề án bay đo cho khu vực
tỉ số này sẽ vượt ra khỏi các dải đó, do vậy thông qua các dấu hiệu này cũng có thể khoanh định và dự báo các đới đá biến đổi
Từ số liệu gốc thu thập được về trường xạ của khu vực Học viên thực hiện tính toán ra các tham số trung gian quan trọng nhằm sử dụng các tham số này kết hợp với các tài liệu gốc đã có để sử dụng làm tài liệu phân tích và xử lý
Các tham số trung gian được tính toán bao gồm:
108037’37’’