1. Trang chủ
  2. » Luận Văn - Báo Cáo

Luận văn Thạc sĩ Khoa học: Nghiên cứu áp dụng phương pháp Tần suất – Nhận dạng mới phục vụ dự báo khoáng sản theo tài liệu địa vật lý máy bay

74 11 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 74
Dung lượng 2,75 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Luận văn đã tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin; tìm hiểu về phương pháp phân tích tài liệu địa vật lý máy bay trong tìm kiếm, dự báo triển vọng khoáng sản; đánh giá, dự báo triển vọng khoáng sản cho vùng Nhị Hà trên cơ sở áp dụng bổ sung phương pháp Tần suất – Nhận dạng mới.

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-

Phạm Bảo Chi

NGHIÊN CỨU ÁP DỤNG PHƯƠNG PHÁP TẦN SUẤT – NHẬN DẠNG MỚI PHỤC VỤ DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2015

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-

Phạm Bảo Chi

NGHIÊN CỨU ÁP DỤNG PHƯƠNG PHÁP TẦN SUẤT – NHẬN DẠNG MỚI PHỤC VỤ DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY

Chuyên ngành: Vật lý địa cầu

Mã số: 60440111

LUẬN VĂN THẠC SĨ KHOA HỌC

Người hướng dẫn khoa học

PGS.TS.VÕ THANH QUỲNH

Hà Nội - 2015

Trang 3

LỜI CẢM ƠN

Để hoàn thành quyển luận văn này, trước tiên, với lòng kính trọng và biết ơn

sâu sắc, tôi xin gửi lời cảm ơn tới PGS.TS Võ Thanh Quỳnh - người thầy trực tiếp

hướng dẫn khoa học và chỉ bảo tôi trong suốt quá trình thực hiện đề tài

Tôi xin gửi lời cảm ơn tới ThS Nguyễn Viết Đạt người đã tận tình giúp đỡ

tôi trong suốt quá trình làm luận văn Tôi chân thành cảm ơn các thầy cô trong Bộ môn Vật lý Địa cầu – Trường Đại học Khoa học tự nhiên – Đại học Quốc gia Hà Nội đã trang bị kiến thức và có những đóng góp hết sức quý báu để tôi hoàn thành luận văn này Tôi cũng xin gửi lời cảm ơn đến Hiệu trưởng, các thầy cô trong khoa Toán – Lý – Tin, Trường Đại học Tây Bắc đã tạo điều kiện tốt nhất để tôi có thể hoàn thành tốt nhiệm vụ của mình

Cuối cùng cho phép tôi bày tỏ lòng biết ơn vô hạn tới gia đình và bạn bè, những người đã luôn quan tâm, động viên và là chỗ dựa tinh thần vững chắc của tôi trong những thời khắc khó khăn nhất

Do điều kiện thời gian và trình độ nên bản luận văn của tôi không tránh khỏi những thiếu sót, rất mong nhận được sự góp ý quý báu của thầy cô và các bạn Tôi xin chân thành cảm ơn!

Hà Nội, ngày 07 tháng 12 năm 2015

Học viên

Phạm Bảo Chi

Trang 4

MỤC LỤC

MỞ ĐẦU 1

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT NHẬN DẠNG 3

1.1 Lý thuyết xử lí tổ hợp số liệu 3

1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lí 3

1.1.2 Lựa chọn tổ hợp số liệu 4

1.2 Mẫu và các đặc trưng thống kê của số liệu địa vật lý 5

1.2.1 Số liệu đo và mẫu ngẫu nhiên 5

1.2.2 Hàm mật độ xác suất 6

1.2.3 Một số hàm phân phối lý thuyết 7

1.3 Các thuật toán nhận dạng 8

1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận dạng 8

1.3.2 Các thuật toán nhận dạng có mẫu chuẩn 10

1.3.3 Các thuật toán nhận dạng không có mẫu chuẩn 14

1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lí 15

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH NHẬN DẠNG MỚI TRONG TÌM KIẾM, DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT LÝ MÁY BAY 17

2.1 Các bước phân tích tài liệu địa vật lý máy bay trong tìm kiếm và dự báo triển vọng khoáng sản 17

2.2 Phương pháp đánh giá và phân loại cụm dị thường 18

2.3 Phương pháp Tần suất – Nhận dạng 20

2.3.1 Phương pháp phân tích tần suất 20

2.3.2 Phương pháp Tần suất – Nhận dạng 22

2.3.3 Hoàn thiện và mở rộng pham vi áp dụng phương pháp Tần suất – Nhận dạng 23

Trang 5

2.4 Phương pháp Khoảng cách – Tần suất – Nhận dạng 26

2.4.1 Xây dựng ma trận thông tin đối mẫu 27

2.4.2 Đánh giá lựa chọn tổ hợp thông tin 27

2.4.3 Phân tích đối sánh xác định các đối tượng đồng dạng 29

2.4.4 Hoàn thiện và mở rộng phạm vi áp dụng phương pháp Khoảng cách – Tần suất – Nhận dạng 29

CHƯƠNG 3 KẾT QUẢ PHÂN TÍCH THỰC NGHIỆM TRÊN TÀI LIỆU THỰC TẾ VÙNG NINH THUẬN 33

3.1 Phương pháp Tần suất – Nhận dạng và khả năng ứng dụng 33

3.2 Tài liệu thu thập, tính toán về khu vực nghiên cứu 34

3.2.1 Vị trí địa lí của khu vực nghiên cứu 34

3.2.2 Tài liệu Địa vật lý máy bay về khu vực nghiên cứu 35

3.3 Phân tích thử nghiệm 38

3.3.1 Phân tích thử nghiệm theo phương án 1 38

3.3.2 Thực hiện phân tích thử nghiệm phương pháp Tần suất – Nhận dạng mới 43

3.4 Kết quả và nhận xét 50

3.4.1 Nhận xét kết quả thực hiện theo phương án 1 50

3.4.2 Nhận xét kết quả thực hiện phân tích theo phương pháp Tần suất – Nhận dạng mới 51

KẾT LUẬN 53

TÀI LIỆU THAM KHẢO 55

Trang 6

DANH MỤC HÌNH

Hình 2.1 Sơ đồ các bước thực hiện chương trình 26

Hình 3.1 Sơ đồ vị trí khu vực nghiên cứu 34

Hình 3.2 Bản đồ hàm lượng Uran 35

Hình 3.3 Bản đồ hàm lượng Thori 36

Hình 3.4 Bản đồ hàm lượng Kali 36

Hình 3.5 Bản đồ hàm lượng kênh tổng 37

Hình 3.6 Kết quả phân vùng triển vọng khoáng sản theo đề án bay đo cho khu vực nghiên cứu 38

Hình 3.7 Sơ đồ diện tích triển vọng khoáng sản của khu vực theo kết quả của đề án bay đo 44

Hình 3.8 Sơ đồ vị trí các đối tượng mẫu 45

Hình 3.9 Sơ đồ đường đồng mức hệ số đồng dạng với vùng 08 theo kết quả phân tích Tần suất- Nhận dạng 48

Hình 3.10 Đường biên xác định được dựa theo sơ đồ đường đồng mức hệ số tỷ lệ 49

Hình 3.11 Kết quả khoanh định lại biên của các vùng triển vọng khoáng sản 50

Trang 7

DANH MỤC BẢNG

Bảng 3.1 Khoảng giá trị đặc trưng của đối tượng mẫu……… 37

Bảng 3.2 Ma trận thông tin của đối tượng mẫu ……… 37

Bảng 3.3 Giá trị tỷ trọng thông tin sắp xếp giảm dần……… 38

Bảng 3.4 Giá trị tỷ trọng cho m tính chất đầu……… 39

Bảng 3.5 Ma trận thông tin của 5 đối tượng đối sánh……… 39

Bảng 3.6 Kết quả phân tích chỉ số đồng dạng của 5 đối tượng đối sánh… …… 43

Bảng 3.7 Kết quả phân tích cho các đối tượng mẫu……….……48

Bảng 3.8 Bảng tóm tắt kết quả phân tích Tần suất–Nhận dạng mới cho vùng 08 49

Trang 8

1

MỞ ĐẦU

Công tác đo bay địa vật lý ở nước ta bắt đầu và đẩy mạnh khoảng những thập niên gần đây Những kết quả đạt được trong thời gian qua đã khẳng định được vai trò và hiệu quả to lớn của công tác địa vật lý máy bay trong việc tham gia giải quyết nhiệm vụ địa chất quan trọng, đặc biệt là trong việc tìm kiếm và dự báo triển vọng khoáng sản Tuy nhiên trong thực tế công tác địa vật lý máy bay vẫn còn tồn tại một

số hạn chế mà chủ yếu là ở nội dung xử lý – phân tích tài liệu cần được đầu tư nghiên cứu để không ngừng nâng cao hiệu quả Nguồn tài liệu của các phương pháp địa vật lý máy bay là rất phong phú, khối lượng các tài liệu địa vật lý máy bay ở nước ta hiện nay rất lớn Xử lí, phân tích tài liệu, khai thác triệt để thông tin đối với nguồn tài liệu hết sức phong phú này phục vụ công tác điều tra địa chất và tìm kiếm khoáng sản là nhiệm vụ hết sức quan trọng

Trong công tác xử lý – phân tích tài liệu địa vật lý máy bay phục vụ giải đoán địa chất, tìm kiếm và dựa báo triển vọng khoáng sản, người ta sử dụng một tổ hợp rất nhiều các phương pháp khác nhau trong đó nhóm các phương pháp thống kê - nhận dạng được áp dụng rộng rãi và có hiệu quả cao Tuy nhiên, khi tiến hành các phương pháp phân tích nhận dạng đối với các loại tài liệu địa vật lý ở nước ta vẫn còn gặp một số hạn chế nhất định cần phải được nghiên cứu khắc phục Do khối lượng tài liệu cũng như chủng loại các thông tin thu được trên các đối tượng địa chất rất lớn ngày càng nhiều, trong khi đó số lượng các tham số đầu vào cho các chương trình của phương pháp phân tích nhận dạng hiện có thường bị giới hạn Việc sử dụng các tổ hợp thông tin khác nhau để tiến hành phân tích nhận dạng nhiều khi cho những kết quả rất khác nhau Mặt khác, kể cả khi số lượng các tham

số đầu vào của các chương trình phân tích nhận dạng được mở rộng thì việc sử dụng đồng thời tất cả các loại thông tin có được để phân tích nhận dạng thì kết quả mang lại có độ tin cậy không cao hơn so với kết quả của việc chỉ sử dụng một tổ hợp thông tin nhất định có chất lượng cao Rõ ràng, việc sử dụng những thông tin thiếu độ tin cậy không những không mang lại hiệu quả mà còn làm nhòa đi thông tin quan trọng khác, gây nên những nhận biết sai lệch về đối tượng nghiên cứu

Trang 9

2

Để nâng cao độ tin cậy của các phương pháp phân tích nhận dạng đã có những công trình nghiên cứu theo hướng ứng dụng bài toán đánh giá lựa chọn thông tin để tìm ra tổ hợp những thông tin có chất lượng tốt trước khi tiến hành phân tích nhận dạng Bên cạnh đó các nhà địa vật lý Việt Nam cũng đã nghiên cứu xây dựng và đưa vào áp dụng có hiệu quả một số phương pháp phân tích mới trong đó có phương pháp phân tích Tần suất – Nhận dạng do nhóm tác giả PGS.TS.Võ Thanh

Quỳnh và nnk đề xuất xây dựng Đề tài luận văn “Nghiên cứu áp dụng phương

pháp Tần suất – Nhận dạng mới phục vụ dự báo khoáng sản theo tài liệu địa vật

lý máy bay” mà học viên lựa chọn nhằm tìm hiểu, áp dụng phương pháp phân tích

tổ hợp các tài liệu địa vật lý máy bay trong tìm kiếm và dự báo triển vọng khoáng sản góp phần đẩy nhanh và nâng cao chất lượng của công tác xử lí phân tích tài liệu địa vật lý máy bay

Luận văn được thực hiện với nhiệm vụ chính sau:

- Tìm hiểu về các thuật toán phân tích và đánh giá lựa chọn thông tin

- Tìm hiểu về phương pháp phân tích tài liệu địa vật lý máy bay trong tìm kiếm,

dự báo triển vọng khoáng sản

- Đánh giá, dự báo triển vọng khoáng sản cho vùng Nhị Hà trên cơ sở áp dụng bổ sung phương pháp Tần suất – Nhận dạng mới

Từ những nhiệm vụ trên, luận văn được viết với cấu trúc gồm:

- Mở đầu

- Chương 1: Cơ sở lý thuyết nhận dạng

- Chương 2: Một số phương pháp phân tích nhận dạng mới trong tìm kiếm, dự báo khoáng sản theo tài liệu địa vật lý máy bay

- Chương 3: Kết quả phân tích thực nghiệm trên tài liệu thực tế vùng Ninh Thuận

- Kết luận

Trang 10

3

CHƯƠNG 1 CƠ SỞ LÝ THUYẾT NHẬN DẠNG

Nhận dạng là phương pháp thực nghiệm nhằm xác định một mô hình cụ thể trong tập hợp các mô hình thích hợp, dựa trên cơ sở quan sát các tín hiệu vào ra Lý thuyết nhận dạng là một trong những phương pháp phục vụ cho mục tiêu của công tác thăm dò địa vật lý, chỉ cần dựa vào các số liệu khảo sát trường địa vật lý của đối tượng mà không cần tác động nghiên cứu trực tiếp đối tượng như các lĩnh vực khác

mà vẫn đưa ra được các thông tin của đối tượng để phục vụ cho các mục tiêu khác nhau Phương pháp sử dụng công cụ là toán học để giải quyết các bài toán phân loại đối tượng, và là một phương án được lựa chọn nhiều trong địa vật lý hiện nay

để nâng cao chất lượng xử lí

1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lí

Xử lí tổ hợp số liệu trong lý thuyết nhận dạng là một quá trình phức tạp phụ thuộc vào đối tượng nghiên cứu và các dạng số liệu khác nhau nên khi khảo sát, thu thập thông tin về đối tượng phải đáp ứng được các yêu cầu thực tế đặt ra như sau:

- Thông tin phải đảm bảo về số lượng và chất lượng để đạt được mục tiêu và xử lí với độ chính xác có thể chấp nhận được

- Thời gian thu thập thông tin phải phù hợp với tiến độ yêu cầu

- Khảo sát, thu thập thông tin phải đạt được hiệu quả kinh tế

Trang 11

4

Từ các yêu cầu này mà đôi khi các phương án khảo sát loại số liệu có độ tin cậy cao hơn không được lựa chọn mà thay vào đó người ta sử dụng một loại thông tin khác mà khi sử dụng tổ hợp các thông tin này cũng có khả năng đáp ứng được yêu cầu, mục tiêu đề ra

Mặt khác hiện nay các tổ hợp phương pháp địa vật lý đang ngày càng được áp dụng rộng rãi, các tổ hợp phương pháp này với các phép ghi đo tự động sẽ cung cấp một khối lượng dữ liệu rất lớn bao gồm nhiều chủng loại thông tin Mỗi loại thông tin chỉ mang những đặc trưng nhất định của đối tượng và để hoàn thành nhiệm vụ đặt ra trong nhiều trương hợp người ta buộc phải sử dụng tổ hợp các thông tin khác nhau

Bản thân mỗi số liệu khảo sát đều mang những sai số, chúng đi kèm với số liệu

và nhiều lúc gây ra những sai lầm khi xử lí Những sai số này do nhiều nguyên nhân khác nhau gây ra như: sai số đo ghi của máy, sai số do kĩ thuật và phương pháp đo ghi, sai số do ảnh hưởng từ đối tượng khác,… Trong số liệu địa vật lý những sai số mắc phải làm giảm độ tin cậy của thông tin được loại bỏ trong các bước xử lí số liệu nhưng rất khó để tách hoàn toàn chúng ra khỏi số liệu Đặc biệt là các nhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu Những sai số này làm giảm đáng kể độ tin cậy của thông tin, đặc biệt trong trường hợp loại thông tin đó được coi là loại tính chất quan trọng đặc trưng cho đối tượng đang được nghiên cứu Một nguyên nhân khác dẫn đến giảm độ tin cậy của một loại thông tin là tính đa trị của kết quả xử lí, gây ra nhiều khó khăn và sai lầm trong xử lí Để xác định đơn trị đối tượng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp

Từ các nguyên nhân trên, các phương pháp xử lí tổ hợp số liệu đã và đang được

áp dụng phổ biến trong nhiều lĩnh vực và mang lại hiệu quả cao

1.1.2 Lựa chọn tổ hợp số liệu

Trong bất kỳ bài toán nhận dạng nào thì số lượng và chất lượng các tính chất (loại thông tin) dùng để nhận dạng luôn được quan tâm hàng đầu Mỗi tổ hợp thông tin khác nhau thường cho những kết luận khác nhau về đối tượng Để đạt được kết

Trang 12

5

quả đáng tin cậy nhất thì quá trình xử lý số liệu cần lựa chọn được tổ hợp thông tin

có độ tin cậy cao và hợp lý

Chất lượng của thông tin tốt hay không phụ thuộc vào loại thông tin đó có đặc trưng cho đối tượng (khả năng phân biệt đối tượng với môi trường xung quanh) hay không Tính đặc trưng cho đối tượng của một loại số liệu địa vật lý do nhiều nguyên nhân quyết định Một tính chất là đặc trưng cho đối tượng khi độ chênh lệch giá trị của số liệu của tính chất đó giữa đội tượng nghiên cứu với môi trường xung quanh

đủ lớn Trong trường hợp đối tượng nằm quá sâu, kích thước quá nhỏ, hoặc do ảnh hưởng của các yếu tố khác (phong hóa, biến chất, chất lưu ) dẫn tới độ chênh lệch của giá trị không đủ để phân biệt đối tượng với môi trường xung quanh khi đó thông tin là không có ích cho xử lý số liệu Các sai số không tách được sẽ gây ra sai lệch về số liệu khi đó thông tin sẽ không còn mang tính đặc trưng cho đối tượng Một tổ hợp thông tin không đầy đủ sẽ không đáp ứng được yêu cầu, nhiệm vụ đặt ra cho quá trình xử lý Việc chọn số lượng các loại thông tin phải đảm bảo được tính đơn trị của kết quả và đưa ra được đầy đủ các yêu cầu nghiên cứu về đối tượng Việc sử dụng đồng thời nhiều loại thông tin trong đó có những thông tin có độ tin cậy thấp không những gây khó khăn cho quá trình xử lý, chất lượng xử lý không cao, do các thông tin thiếu tin cậy sẽ làm nhòe đi các thông tin quan trọng khác dẫn đến những nhận thức sai lệch về đối tượng

Việc lựa chọn được một tổ hợp thông tin có chất lượng cao là nội dung khó khăn và phụ thuộc nhiều vào hiểu biết, kinh nghiệm của người xử lý

1.2 Mẫu và các đặc trƣng thống kê của số liệu địa vật lý

1.2.1 Số liệu đo và mẫu ngẫu nhiên

Vì các thiết bị quan sát trường trong địa vật lý đều là các thiết bị số nên các kết quả quan sát trường địa vật lý nhiễu và sai số đo nên có thể là đại lượng này hay đại lượng khác mà người đo không dự đoán trước được Vì vậy để mô tả các giá trị (bằng số) các trường địa vật lý do được người ta sử dụng khái niệm đại lượng ngẫu nhiên

Trang 13

6

Các giá trị trường địa vật lý đo được các số cụ thể nên đại lượng ngẫu nhiên là

mô hình nền tảng để mô tả các số liệu địa vật lý

Đại lượng X được gọi là ngẫu nhiên nếu trong mỗi phép đo sẽ xuất hiện một trong những giá trị cụ thể x1, x2, x3,… của đại lượng này với các xác suất tương ứng p1,

P(x1 < X < x2) = 2

1

)(

x

x

dx x

x

dx x

Với F(x) là hàm phân bố của X; hàm mô tả xác suất để mô tả ngẫu nhiên X nhận các giá trị nhỏ hơn giá trị x1 nào đó

Đồ thị của hàm phân bố mật độ xác suất thực nghiệm được dựng lên từ số liệu

khảo sát thực tế được gọi là đường cong biến phân

Trang 14

7

Ngoài hàm phân bố F(x) và hàm mật độ f(x) người ta còn dùng các đặc trưng thống

kê để mô tả các đại lượng ngẫu nhiên bao gồm:

- Kỳ vọng toán M[x] = x = i

n

i

ix p

 1

(1.6)

- Mod (M0) là giá trị x mà tại đó hàm mật độ phân bố đạt max

- Median (Me) là giá trị của X có xác suất P(X) = 1/2

- Phương sai D[x] = M[x – [Mx]]2 = (x i – M[x])2 p i (1.7)

- Độ lệc trung bình bình phương    D (1.8)

1.2.3 Một số hàm phân phối lý thuyết

Để mô tả các đại lượng ngẫu nhiên, trong địa vật lý người ta sử dụng các hàm phân phối lý thuyết như hàm phân phối chuẩn (phân phối Gauxơ), phân phối chuẩn loga, phân phối Puasson…

Phần lớn các đại lượng ngẫu nhiên trong địa vật lý cũng như nhiều hiện tượng địa chất khác chúng tuân theo luật phân phối chuẩn

Đại lượng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của nó có dạng:

+ Kỳ vọng :

 

2 2

Đồ thị của hàm phân phối chuẩn đối xứng qua đường thẳng x = và giảm dần

xuống xung quanh kỳ vọng

Diện tích giới hạn bởi đường cong và trục hoành bằng 1, đó chính là xác suất để đại lượng ngẫu nhiên X nhận giá trị trong khoảng (  ; ) (1.3) Xác suất để đại luượng ngẫu nhiên X nhận giá trị trong khoảng từ x1 tới x2 chính là phần diện tích

Trang 15

8

được bao bởi đường cong, trục hoành và hai đường thẳng x = x 1 ; x = x 2 Xác suất

đó được tính theo công thức (1.4)

Nhiều giá trị trường địa vật lý như mật độ, tốc độ truyền sóng, phóng xạ… tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phân phối chuẩn người ta có thế xử lý số liệu để tìm ra các đặc trưng của đối tượng Ngoài luật phân phối chuẩn còn có các luật phân phối khác đang được áp dụng phổ biến trong phân tích thống kê các số liệu địa vật lý Ví dụ như luật phân phối chuẩn loga được dùng để mô tả các giá trị điện trở xuất, độ từ cảm của đất đá

1.3 Các thuật toán nhận dạng

Nhiệm vụ cơ bàn nhất của các công tác xử lý tổ hợp số liệu địa vật lý là phân loại các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện tích nhất định, ở đó các đặc trưng của trường địa vật lý giống với các đặc trưng của trường liên quan với loại (lớp) đối tượng địa chất nhất định Để giải quyết được nhiệm vụ trên tương tự nhiều lĩnh vực khoa học khác người ta sử dụng lý thuyết nhận dạng – một lĩnh vực toán học đi sâu vào giải quyết các bài toán phân loại đối tượng dựa vào mối quan hệ hữu cơ giữa các đối tượng cụ thể và các dấu hiệu đặc trưng cho đối tượng đó

Hiện nay, trong địa vật lý người ta sử dụng nhiều phương pháp nhận dạng hiện đại, được tự động hóa bằng các phần mềm mạnh Tuy nhiên có thể chia chúng thành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông tin tiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn (không có thông tin tiên nghiệm)

1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận dạng

Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thì công việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác định các đặc trưng thống kê các trường địa vật lý của chúng

Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan và các

số liệu địa chất khác đã xác định được bản chất địa chất của từng đối tượng gây ra

Trang 16

9

trường địa vật lý Tùy thuộc vào các mục đích nghiên cứu khác nhau mà các đối tượng chuẩn được lựa chọn khác nhau Ví dụ khi mục đích nghiên cứu là tìm kiếm khoáng sản thì đối tượng chuẩn có thể là một vùng quặng, một trường quặng, một

mỏ quặng hay một vỉa quặng Còn khi khảo sát địa vật lý phục vụ công tác đo vẽ bản đồ địa chất thì các đối tượng mẫu có thể là diện tích phát triển một loại đá nào

đó

Tùy theo bản chất, đối tượng chuẩn có hai loại là đối tượng chuẩn mang các thông tin đại diện và đối tượng chuẩn mang thông tin phủ nhận Đối tượng chuẩn đại diện mang các thông tin có khả năng phân loại một hay một lớp đối tượng Trong nhiều trường hợp có những đối tượng khác nhau nhưng mang các đặc điểm trường địa vật

lý tương đồng Khi đó người ta sử dụng đối tượng chuẩn mang thông tin phủ nhận

để loại bỏ những đối tượng không đúng ra khỏi tập kết quả nhận dạng

Cần lưu ý để công tác phân tích nhận dạng đạt kết quả tốt thì cần lựa chon các đối tượng chuẩn phải nằm xen kẽ với các phần diện tích khảo sát cần nhận dạng

Một đối tượng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụ thuộc vào các yếu tố sau:

- Đối tượng chuẩn phải có giá trị thông tin tin cậy theo mục tiêu tìm kiếm

- Đối tượng chuẩn phải phù hợp với diện tích nghiên cứu

- Mật độ lưới khảo sát các loại thông tin phải tương ứng với đối tượng chuẩn lựa chọn

Đối tượng chuẩn mang các dấu hiệu nhận biết, phân biệt nó với môi trường xung quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thu thập sẽ giúp quá trình xử lý số liệu cho kết quả tin cậy Để đánh giá chất lượng của dấu hiệu người ta sử dụng khái niệm lượng tin của dấu hiệu Lượng tin của dấu hiệu là khả

năng mà dấu hiệu đó có thể phân biệt được các đối tượng khác nhau với nhau Khả

năng này phụ thuộc vào việc các đối tượng của cùng một lớp có thường xuyên cho những giá trị cố định của dáu hiệu đó hay không và các giá trị đó có phân bố ra ngoài giới hạn của các đối tượng của lớp đó hay không,

Trang 17

10

Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọng như nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứa thông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ đi các thông tin hữu ích Khi đưa các dấu hiệu này vào sử dụng để nhận dạng không làm tăng

mà ngược lại lại làm giảm chất lượng nhận dạng đối tượng Chính vì vậy, trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đó chọn

ra các dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu có lượng tin thấp

Dựa vào các giá trị thường quan sát được trên các đối tượng chuẩn người ta tiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng Các đặc trưng này được sử dụng tùy thuộc vào thuật toán nhận dạng áp dụng Thường các đặc trưng thống kê bao gồm:

- Đường cong biến phân (hàm phân bố mật độ xác suất thực nghiệm)

- Kỳ vọng và phương sai của trường (tính thông qua đường cong biến phân)

Ngoài ra khi cần người ta tính cả hệ số tương quan giữa các dấu hiệu, phương chủ đạo của các dị thường…

1.3.2 Các thuật toán nhận dạng có mẫu chuẩn

Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác định bản chất địa chất của các đối tượng dựa vào việc só sánh tập hợp các dấu hiệu địa vật lý của các đối tượng nghiên cứu

Việc lựa chọn các thuật toán nhận dạng tùy thuộc vào các điều kiện sau:

- Số liệu xuất phát

- Tồn tại các thông tin tiên nghiêm về đối tượng

- Nhiệm vụ cụ thể của các công tác địa vật lý

Các thuật toán nhận dạng được xây dựng dựa vào các công cụ toán học khác nhau như: toán logic, các hàm hồi quy và lý thuyết định nghiệm thống kê… dưới đây là một số thuật toán điển hình

a Phương pháp nhận dạng sử dụng toán logic

Trang 18

Nếu xkn là giá trị trường của dấu hiệu thứ n của mẫu thứ k thì:

+ xkn = 0 khi mẫu k không chứa dấu hiệu thứ n

+ xkn = 1 khi mẫu k chứa mẫu hiệu thứ n

Bằng cách trên toàn bộ các mẫu được mã hóa

Tiếp theo, dựa vào các tổ hợp số “0” và “1” (từ thông tin) xác lập trên các mẫu chuẩn người ta xác định từ các thông tin chuẩn cho từng lớp đối tương Từ thông tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượng chuẩn của lớp đó và không gặp lần nào các đối tượng chuẩn thuộc lớp khác (giá trị p được chọn theo kinh nghiệm) Đối với một lớp người ta có thể chọn giá trị thông tin chuẩn các thông tin này được gọi là tổ hợp dấu hiệu phức tạp đặc trưng cho các đối tượng chuẩn của cùng một lớp thì tổ hợp dấu hiệu nào đặc trưng cho mẫu chuẩn lớn hơn, tổ hợp có đấu hiệu sẽ có lượng tin lớn hơn

Cuối cùng là nhận dạng các đối tượng nghiên cứu Ở bước này người ta tiến hành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức tạp của từng lớp gặp ở đối tượng nghiên cứu Nếu số lần gặp các tổ hợp dấu hiệu phức tạp của một lớp nào đó nhiều hơn số lần gặp các tổ chức phức tạp của lớp khác thì đói tượng nghiên cứu được xếp vào lớp đó Qúa trình này được tiến hành cho đến khi đối tượng cuối cùng được nhận dạng

b Phương pháp nhận dạng sử dụng phân tích hồi quy

Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên được sử dụng để xử lý giếng khoan và phân tích định lượng các tài liệu trọng lực Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối quan hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được bằng các phương pháp khác nhau

Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đá với bên kia là số liệu đo điện trở, điện trường tự nhiên, gamma… dọc thành giếng khoan

Trang 19

x2k của chính đối tượng đó

Phương trình hồi quy trên được xác định cho từng đối tượng chuẩn thứ k Ngoài phương pháp hồi quy người ta còn tiến hành xác định giá trị ngưỡng yk cho từng lớp đối tượng chuẩn Cuối cùng đưa các giá trị trường đo được trên đối tượng cần nghiên cứu vào các phương trình hồi quy tìm được trên đối tượng chuẩn người ta sẽ xác định được giá trị của tham số yk của đối tượng nghiên cứu

Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sung các số liệu của dấu hiệu mới bằng cách đưa thêm vào các phương trình của hàm hồi quy các số hạng mới Vì vậy thuật toán này rất phù hợp cho việc xử lý các số liệu của tổ hợp khảo sát gồm nhiều dáu hiệu khác nhau

Tuy nhiên thuật toán hồi quy cũng có nhược điểm ở chỗ với một tập hợp số liệu nhất định ứng với một giá trị sai số cho trước có thể xấp xỉ được nhiều hàm hồi quy Nhược điểm này thể hiện rõ nhất khi các dấu hiệu quan sát thường liên quan với nhau Lý do trên không cho phép đưa ra được các lý giải về ý nghĩa vật lý của các hệ số của hàm hồi quy tìm được Các lý giải vật lý chỉ có thể được đưa ra khi dạng của phương trình này được xác định cho một mô hình vật lý cụ thể, còn quá trình xấp xỉ hồi quy chỉ được tiến hành đơn thuần với mục đích xác định hệ số của phương trình hồi quy ứng với mô hình vật lý đó

c Phương pháp kiểm định giả thuyết thống kê

Thuật toán nhận dạng trên cơ sở mô hình thống kê đối tượng chuẩn trong phân tích

số liệu địa vật lý thường sử dụng các thông số như: tỉ số sự thật L(x) và tổng lượng thông tin J(1;2;x)

Trang 20

13

Giá trị các thông số đó được tính theo công thức:

J(1:2,x) = log[P1(x)/ P2(x)] (1.14) Trong đó:

P1(x), P2(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượng tương ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp không quặng) Khi sử dụng đối tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P2(x) được thay bằng 1

x: là vectơ giá trị các dấu hiệu được sử dụng, x1,x2…xk (ví dụ các hàm lượng qU, qTh, qK…)

Khi các dấu hiệu x1,x2…xk được xem là không phụ thuộc nhau thì xác suất của đại lượng n chiều của tổ hợp n dấu hiệu được tính:

P(x) = P(x1) P(x2)… P(xk) (1.15)

)() (

)

()(xP

)(xP

)

(xP

)(xP

)(xP

)

(xP

)

k 2 2

2 1 2

k 1 2

1 1 1

k x L x

L x L x

sử dụng các hàm phân giải bậc 1 (R1) hoặc bậc 2 (R2) đối với các tham số

x1,x2…xn Các hàm này được biểu diễn như sau:

1

(1.19)

Trong đó các hệ số: ai, bij, ci được xác định từ các ma trận thông tin các dấu hiệu của các đối tượng quặng và không quặng Thông qua các “diện tích đối tượng chuẩn” người ta xác định được các vectơ giá trị các dấu hiệu sử dụng x (trong trường hợp các dấu hiệu được xem là không phụ thuộc nhau) hoặc các hệ

Trang 21

14

số ai, bij, ci (trong trường hợp các dấu hiệu phụ thuộc nhau) Sau đó tính giá trị L(x), J(1:2,x) hoặc R1, R2, phổ các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên bản đồ Đối sánh các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết và khoanh định được các diện tích đồng dạng với đối tượng chuẩn Các dấu hiệu được lựa chọn thường là một tổ hợp nào đó trong số các tham số thu được

1.3.3 Các thuật toán nhận dạng không có mẫu chuẩn

a Thuật toán kiểm chứng thống kê

Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toàn độc lập nhau Ban đầu người ta sử dụng các bộ lọc để tách các dị thường ra khỏi phông nhiễu cho từng dấu hiệu trường Kết quả lọc cho phép nhận được các

số liệu trường chủ yếu gồm các dị thường Tiếp theo là phân loại các dị thường thành các lớp dị thường Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê giống nhau Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo sát thành các diện tích cơ sở, sau đó dựa vào kết quả phân cấp các giá trị trường ở mỗi cửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó Cuối cùng để phân lớp các dị thường người ta sử dụng chỉ tiêu 2để

so sánh và xếp loại các đường cong biến phân Các diện tích có ước lượng phân

bố mật độ xác suất giống nhau được xếp vào một lớp

Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiến hành xác định số hiệu của lớp tổng hợp

Với mục đích này, dựa vào các đường cong biến thiên dựng được cho từng dấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trị trung bình theo thứ tự tăng dần Sau đó dựa vào chỉ tiêu xác suất hậu nghiệm cực đại người ta quyết định xếp loại đối tượng khảo sát vào các lớp khác nhau Bằng cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích có hình

dạng bất kì, ở đó dị thường của các dấu hiệu khác nhau chồng lên nhau

b Thuật toán K trung bình

Trang 22

15

Nội dụng của thuật toán như sau: Giả sử tồn tại n đối tượng Nhiệm vụ đặt

ra là phân chia toàn bộ n đối tượng thành M lớp với M << n

Để giải quyết nhiệm vụ trên, lúc đầu người ta chọn ngẫu nhiên từ n đối tượng ra k đối tượng, k đối tượng được chọn này được xem như là các mẫu chuẩn xuất phát Tiếp theo là tiến hành chính xác hóa liên tiếp các mẫu chuẩn chọn được bằng cách so sánh các mẫu chuẩn với các đối tượng còn lại Sau mỗi lần chọn tập hợp các mẫu chuẩn Eν chọn được ở lần chọn thứ ν sẽ thay cho các mẫu chuẩn chọn được ở lần ν -1 (lần trước đó)

Nếu kí hiệu tập hợp mẫu chuẩn Ev chọn được ở lần thứ v là:

Sau quá trình hiệu chỉnh ở vòng 1, bằng phương pháp mô tả trên thuật toán

sẽ tiến hành hiệu chỉnh ở các lần tiếp theo, cho đến khi đối tượng cuối cùng được gọi ra

Sau khi tập hợp các mẫu chuẩn được chính xác hóa, thuật toán tiến hành phân loại toàn bộ số lượng n các đối tượng theo tập hợp các dấu hiệu thành M lớp dựa vào nguyên tắc khoảng cách tối thiểu

1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lí

Đối với thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ yếu dựa vào chỉ số tương đồng Chỉ số này xác định mức độ giống nhau hoặc khác nhau

Trang 23

P(Ak/Bj) Đối với các thuật toán loại này để quyết định nghiệm người ta đưa ra các giá trị ngưỡng của hệ số tương thích và xác suất hậu nghiệm Giá trị của chỉ số tương đồng sẽ được so sánh với giá trị ngưỡng này để quyết định đối tượng nghiên cứu giống hay không giống với mẫu

Chất lượng của kết quả xử lí được đánh giá dựa vào sai số nhận dạng các đối tượng kiểm chứng Các đối tượng kiểm chứng là các đối tượng mà bản chất địa chất của chúng đã được xác định rõ, song chúng không được chọn là mẫu chuẩn để nhận dạng mà được dùng làm các đối tượng để kiểm tra các kết quả nhận dạng

Sai số nhận dạng được tính bằng tỉ số các đối tượng kiểm chứng được nhận dạng đúng so với tổng các đối tượng kiểm chứng được đem ra nhận dạng

Đối với các thuật toán nhận dạng kiểm chứng thông kê người ta sử dụng xác suất nhận dạng sai lầm để đánh giá chất lượng xử lí Xác suất này được xác định dựa vào việc tính tích phân hàm phân bố mật độ xác suất của hệ số tương thích Các hàm này được xác định riêng cho các đối tượng kiểm chứng của từng lớp một

Trang 24

17

CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP PHÂN TÍCH NHẬN DẠNG MỚI TRONG TÌM KIẾM, DỰ BÁO KHOÁNG SẢN THEO TÀI LIỆU ĐỊA VẬT

LÝ MÁY BAY 2.1 Các bước phân tích tài liệu địa vật lý máy bay trong tìm kiếm và dự báo triển vọng khoáng sản

Phân vùng triển vọng khoáng sản từ tài liệu từ - phổ gamma hàng không là một nhiệm vụ khó khăn Công việc này được thực hiện trên cơ sở phân tích tổng hợp các tài liệu bay đo, các tài liệu kiểm tra mặt đất và các tài liệu địa chất, địa hoá thu

thập khác

Việc khoanh định các diện tích triển vọng khoáng sản trước hết là dựa vào các tài liệu bay đo trong đó tài liệu phổ gamma đóng vai trò chủ đạo, sơ đồ giải đoán địa chất được thành lập trước đó cũng là một cơ sở quan trọng khi dự báo mức độ triển

vọng khoáng sản của vùng

Các bước tóm tắt của quá trình thực hiện phân tích tài liệu, khai thác, sử dụng thông tin, khoanh định và dự báo các khu vực có triển vọng khoáng sản được tiến hành như sau:

Bước 1: Khoanh định các trường xạ địa hóa cục bộ, liên quan với các đới biến đổi có tiềm năng triển vọng khoáng hóa quặng [9]

* Áp dụng một số chương trình của “Khối Xử lý thống kê”, “Khối phát hiện và phân chia dị thường” và “Khối Xử lý tổ hợp” trong Bộ COSCAD để xác định các đặc trưng thống kê của các trường địa vật lý, phân chia các miền trường theo các tổ hợp dấu hiệu đặc trưng, khoanh định các trường xạ - địa hoá cục bộ như cách làm thông thường hiện nay dựa theo các dấu hiệu sau:

- Các đới trường địa vật lý dị thường

- Các đới tỉ số F dị thường

- Các đới hệ số tương quan dị thường

Trang 25

18

- Đặc điểm phân bố không gian của các dị thường địa phương

* Áp dụng bổ sung “Phương pháp đánh giá và phân loại cụm dị thường” vào phân tích tài liệu dị thường của phương pháp phổ gamma hàng không

Bước 2: Đối sánh các tiêu chuẩn địa vật lý với các tiền đề địa chất, khoanh định các đới có triển vọng, phân loại chúng [9]

Các tiêu chuẩn địa vật lý được đem đối sánh với các tiền đề địa chất, đó là các số liệu về địa chất, đặc biệt là các kết quả của công tác kiểm tra đánh giá mặt đất (thuộc Đề án bay đo) và của công tác tìm kiếm đánh giá trong đo vẽ địa chất

Để đánh giá và phân loại mức độ triển vọng khoáng sản của các đới theo tiêu chuẩn địa vật lý đưa vào sử dụng hai phương pháp nhận dạng mới được hoàn thiện

là phương pháp Tần suất – Nhận dạng và phương pháp Khoảng cách – Tần suất - Nhận dạng theo hai chương trình QTSM và QKCM

Để thực hiện bước 2 của quá trình trên, người ta sử dụng các phương pháp thống

kê – nhận dạng bao gồm: một số phương pháp truyền thống (bộ công cụ xử lý phổ thống kê CODCAD) và một số các phương pháp nhận dạng mới

Sau đây là nội dung tóm tắt của một số các phương pháp phân tích nhận dạng mới đang bắt đầu đưa vào áp dụng thử nghiệm trong công tác xử lí, phân tích tài liệu địa vật lý máy bay cho kết quả tốt

2.2 Phương pháp đánh giá và phân loại cụm dị thường

Trong công tác bay đo từ - phổ gamma ở Việt Nam số lượng các dị vật thường phổ gamma hàng không được phát hiện rất lớn Các dị thường phổ gamma thường tập trung thành cụm hoặc dải gồm nhiều dị thường đơn lẻ phân bố gần nhau trên một đối tượng địa chất nào đó và thường mang một đặc tính phóng xạ chung, liên quan đến một loại hình nhất định Do vậy, chỉ dựa trên bản đồ dị thường phổ gamma phân bố các dị thường đơn thì chưa thể khái quát về đặc điểm phóng xạ chung của toàn cụm Vậy cần lựa chọn các cụm dị thường tiêu biểu đại diện cho từng nhóm bản chất phóng xạ để nghiên cứu PGS.TS.Võ Thanh Quỳnh nghiên cứu và đề xuất

Trang 26

19

phương pháp phân tích bổ sung mới “Phương pháp đánh giá và phân loại cụm dị

thường phổ gamma hàng không” năm 2008 [7].Đây cũng có thể coi là một phương pháp nhận dạng nhưng ở mức độ thấp

Nội dung của phương pháp này là đưa ra một cách đánh giá và phân loại cụm dị thường phổ gamma hàng không trên cơ sở tập hợp số liệu các dị thường đơn của cụm, cụ thể như sau:

- Xem một cụm dị thường bao gồm tập hợp nhiều dị thường đơn với các tham số phóng xạ khác nhau như là một dị thường duy nhất với các tham số phóng xạ đặc trưng chung nào đó

- Các cụm dị thường được đánh giá và phân loại bản chất phóng xạ qua 8 tham số chỉ tiêu: ΔJ, T(1/2), ΔU/ΔK, ΔTh/ΔU, JU, JTh, JK, F tương tự đối với các dị thường đơn, đồng thời bổ sung ba tham số mới là hệ số tương quan hàm lượng các nguyên

tố RU-Th, RU-K, RK-Th

Các tham số phóng xạ đặc trưng của cụm được xác định thông qua đường cong biến phân (đường cong mật độ phân bố) từ tập hợp số liệu của các dị thường đơn Trên đường cong biến phân giá trị có tần suất lớn nhất được chọn làm giá trị đặc trưng chung của cụm

Từ bản chất chất toán học của hệ số tương quan nếu sử dụng chúng để phản ánh đặc điểm phân bố của các nguyên tố phóng xạ U, Th, K trong đất đá có thể thấy: khi hệ số tương quan hàm lượng các nguyên tố càng có giá trị nhỏ thì mức độ “dị thường” của các trường phóng xạ càng lớn và ngược lại Nếu trong 3 nguyên tố phóng xạ U, Th, K có một nguyên tố nào đó phân bố không bình thường thì 2 hệ số tương quan có nó sẽ có giá trị nhỏ Nếu có từ 2 nguyên tố trở lên phân bố không bình thường thì cả 3 hệ số tương quan sẽ có giá trị nhỏ Do vậy, các hệ số tương quan hàm lượng không chỉ là những tham số chỉ tiêu xác định bản chất phóng xạ,

mà còn nói lên mức độ “dị thường”, từ đó liên quan đến việc đánh giá mức độ triển vọng khoáng sản của cụm Các kết quả phân tích thử nghiệm trên tài liệu thực tế cho thấy đây là những tham số chỉ tiêu rất tốt trong việc tham gia đánh giá và phân

Trang 27

2.3.1 Phương pháp phân tích tần suất

Hiện nay, trong lớp các bài toán đánh giá - lựa chọn thông tin có rất nhiều phương pháp để xác định giá trị của loại thông tin thứ “i” trong tập hợp nhiều chủng loại thông tin nhận được của đối tượng nghiên cứu Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sự xuất hiện đồng thời các tính chất

do Griffiths và Vinni đưa ra có nội dung tóm tắt như sau:

Giả sử ta có đối tượng nghiên cứu với k loại dấu hiệu, mỗi dấu hiệu có n số liệu

đã biết Khi đó ta có ma trận thông tin các dấu hiệu của đối tượng mẫu như sau:

n

k k

dt j i

2 22

21

1 12 11

trong đó: k – số loại tính chất của ma trận thông tin

n – số lượng mẫu chứa các thông tin về các tính chất của đối tượng

Trang 28

h

hj hi i

k n

1

* 1

m i i m

Như vậy bản chất của phương pháp phân tích tần suất theo thuật toán Giffiths - Vinni là đưa ra được một cách đánh giá về chất lượng của từng chủng loại thông tin trong nhận thức đối tượng, trên cơ sở đó lựa chọn tập hợp các chủng loại thông tin

có giá trị cao phục vụ các mục đích nghiên cứu

Ở Việt Nam, phương pháp này đã được nghiên cứu áp dụng trong một số lĩnh vực, ví dụ trong địa chất thăm dò khi lựa chọn tổ hợp thông tin để đánh giá các mỏ quặng, v.v…, còn trong xử lý số liệu địa vật lý chưa thấy có công trình nào đề cập đến Nhằm góp phần nâng cao hơn nữa độ tin cậy của các kết quả phân tích nhận dạng, lúc đầu các nhà nghiên cứu đã áp dụng phương pháp này để lựa chọn tổ hợp thông tin đầu vào cho các chương trình phân tích nhận dạng mà không hề tham gia vào các thuật toán phân tích nhận dạng Tiếp sau đó, cũng từ nội dung phương pháp phân tích tần suất, các nhà nghiên cứu đã đề xuất một cách tiếp cận, trực tiếp tham

Trang 29

22

gia giải quyết bài toán nhận dạng và xây dựng thành một phương pháp mới:

“Phương pháp tần suất - nhận dạng” [6]

2.3.2 Phương pháp Tần suất – Nhận dạng

Phương pháp Tần suất – Nhận dạng là một phương pháp nhận dạng trong xử lí

số liệu địa vật lý do PGS.TS.Võ Thanh Quỳnh đề xuất trên cơ sở ứng dụng phương pháp phân tích tần suất trong tổ hợp số liệu thống kê cũng như xây dựng thuật toán phân tích, đối sánh, xác định đối tượng đồng dạng (kết quả đề tài QG06.16)

Các nội dung chính của phương pháp tần suất nhận dạng bao gồm:

- Xây dựng ma trận thông tin của đối tượng mẫu

- Đánh giá, lựa chọn tổ hợp thông tin

- Phân tích đối sánh, xác định các đối tượng đồng dạng

2.3.2.1 Xây dựng ma trận thông tin của đối tượng mẫu

Đây là nội dung rất quan trọng, là cơ sở cho công việc xác định được đối tượng,

có ảnh hưởng rất lớn đến kết quả phân tích Để đánh giá và lựa chọn tổ hợp thông tin theo thuật toán Griffiths-Vinni, trước hết cần có ma trận thông tin của đối tượng mẫu Ma trận này được xây dựng theo bước như sau:

- Xác định tính chất của các tham số dùng để xây dựng ma trận thông tin: Từ tập

hợp số liệu của các chủng loại thông tin của đối tượng mẫu xây dựng các đường cong biến phân (đường cong mật độ phân bố) Từ các đường cong biến phân xác định khoảng giá trị đặc trưng cho từng tham số Xác định tính chất của các tham số

là xác định các khoảng giá trị đặc trưng chung tương ứng của nó, làm cơ sở cho việc xây dựng các đơn vị thông tin ma trận

- Xác định giá trị của từng đơn vị thông tin cho các tính chất của ma trận:Sau khi

có được các khoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn

vị thông tin cho từng chủng loại thông tin của từng phần tử Đối với mỗi phần tử của mỗi chủng loại thông tin, nếu nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm ngoài sẽ nhận giá trị là 0 Bằng cách này sẽ chuyển được một ma trận thông tin với các số liệu địa chất, địa vật lý bất kì về ma trận thông tin chuẩn theo yêu cầu của thuật toán với các phân tử là các giá trị 1 hoặc 0

Trang 30

23

Vì vậy để xây dựng được ma trận thông tin đòi hỏi phải có tập hợp số liệu đa dạng và phong phú

2.3.2.2 Đánh giá, lựa chọn tổ hợp thông tin

Để tiến hành phân tích đối sánh, xác định các đối tượng đồng dạng, trước hết cần đánh giá lựa chọn tổ hợp thông tin có chất lượng cao từ tập hợp tất cả các chủng loại thông tin có được về đối tượng nghiên cứu Số lượng chủng loại thông tin m được lựa chọn tùy thuộc vào giá trị ngưỡng của Pm cho trước (ví dụ Pm ≥ 80%)

2.3.2.3 Phân tích đối sánh, xác định các đối tượng đồng dạng

Phân tích đối sánh, xác định đối tượng đồng dạng là nội dung chính của một thuật toán nhận dạng

Các đối tượng cần đối sánh với đối tượng mẫu để xem nó có đồng dạng với đối tượng mẫu hay không được thực hiện như sau:

- Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối với đối tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu

- Tiến hành đánh giá tỷ trọng thông tin cho tất cả các tính chất của đối tượng đối sánh bằng phương pháp phân tích tần suất như trên

- Tính tỷ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượng mẫu cho đối tượng đối sánh Có thể xem giá trị này tương tự hệ số đồng dạng, ta gọi

đã biết (ví dụ như các điểm quặng, mỏ quặng hay các đối tượng địa chất cần nghiên cứu tìm kiếm nào đó,….), các đối tượng đối sánh chưa biết Làm thế nào để phát hiện, khoanh định các diện tích đồng dạng với diện tích của đối tượng mẫu, cũng

Trang 31

Bước 1: Nội suy các số liệu khảo sát địa vật lý thực tế lên mạng lưới đều (ô vuông

hoặc chữ nhật) bằng các thuật toán nội suy hiện có

Bước 2: Thực hiện các nội dung: (Như nội dung phương pháp Tần suất – Nhận

dạng được đề xuất trước đó)

- Xây dựng ma trận thông tin của đối tượng mẫu

Bước 3: Đánh giá, lựa chọn tổ hợp thông tin trên đối tượng mẫu theo thuật toán

Griffiths – Vinni

a Trường hợp biết trước đối tượng đối sánh:

Tiến hành xử lí phân tích đối với đối tượng đối sánh tương tự như đối với đối tượng mẫu từ đó xác định chỉ số đồng dạng P*

m của đối tượng đối sánh như cách làm hiện có của phương pháp Tần suất – Nhận dạng

b Trường hợp chưa biết trước đối tượng đối sánh:

Phân tích, tính toán chỉ số đồng dạng P*m cho tất cả các điểm nút của mạng lưới đều đã được nội suy trên toàn bộ diện tích vùng nghiên cứu Nội dung này được thực hiện như sau:

- Dùng các “cửa sổ quét” để xác định ranh giới diện tích của các đối tượng đối sánh Các “cửa sổ quét” có thể là hình tròn, hình vuông, hình chữ nhật, hình elip với các kích thước và góc quay khác nhau Các diện tích nằm trong cửa sổ quét được xem là các đối tượng đối sánh, cần tiến hành xử lí, phân tích đối sánh, xác định mức độ đồng dạng của chúng so với đối tượng mẫu thông qua chỉ số đồng dạng P*m Nội dung này được thực hiện giống như trường hợp các đối tượng đối sánh đã biết của phương pháp Tần suất – Nhận dạng đã được trình bày Giá trị P*m của đối tượng đối sánh vừa tính được sẽ được gán cho điểm trung tâm của cửa sổ quét Điểm trung tâm này sẽ trùng với điểm nút của mạng lưới đều đã được nội suy

Trang 32

25

- Dịch chuyển cửa sổ quét khắp diện tích của vùng nghiên cứu với bước dịch chuyển đều theo mạng lưới đã được nội suy Kết quả ta được một File số liệu các chỉ số đồng dạng P*m(x,y) theo tọa độ trùng với tọa độ của mạng lưới đã được nội suy trên khắp diện tích vùng nghiên cứu

- Khoanh định và đánh giá mức độ đồng dạng của các diện tích đồng dạng với đối tượng mẫu Từ File số liệu này, với các mức giá trị ngưỡng cho trước ta sẽ có xác định được sự phân bố của các đối tượng đồng dạng cũng như mức độ đồng dạng của chúng so với đối tượng mẫu trên toàn diện tích nghiên cứu bằng việc xây dựng bản

đồ đồng mức giá trị của P*m(x,y).[3]

Đây là một phương pháp phân tích tổ hợp, cho phép xử lí đối với mọi dạng số liệu địa chất, địa vật lý bất kỳ với số lượng tham số đầu vào tuỳ ý và đã tiến hành phân tích thử nghiệm trên tài liệu thực tế cho kết quả tốt

Phương pháp Tần suất – Nhận dạng với các nội dung trình bày ở trên được tự động hóa bằng phần mềm QTS với các bước thực hiện như sơ đồ khối sau:

Trang 33

26

Hình 2.1 Sơ đồ các bước thực hiện chương trình

2.4 Phương pháp Khoảng cách – Tần suất – Nhận dạng

Đây cũng là một phương pháp nhận dạng mới nhưng khác với phương pháp tần suất - nhận dạng ở chỗ: phương pháp tần suất - nhận dạng chỉ dựa trên một loại đối tượng mẫu, đó là các đối tượng cần tìm (ví dụ đối tượng quặng) Trong khi

đó phương pháp khoảng cách - tần suất - nhận dạng xử lý đồng thời trên 2 loại đối tượng mẫu đối nghịch nhau (ví dụ quặng và không quặng), trên cơ sở vận dụng kết

Xác định các khoảng giá trị đặc trưng của đối tượng mẫu

Trường hợp 2

Có đối tượng đối sánh

Thực hiện khoanh vùng đối tượng đồng dạng trên toàn diện tích Xây dựng ma trận thông tin cho đối

tượng đối sánh

Tính chỉ số đồng dạng tại các điểm trên toàn diện tích theo mạng lưới đều Xác định đối tượng đồng dạng

Xuất kết quả

Nhập số liệu đầu vào

Xây dựng ma trận thông tin cho đối tượng mẫu

Đánh giá và lựa chọn thông tin

Trường hợp 1

Trang 34

27

hợp thuật toán khoảng cách khái quát của Paguônôv và thuật toán phân tích tần suất của Griffiths-Vinni Phương pháp này do nhóm tác giả Võ Thanh Quỳnh, Nguyễn Xuân Bình, Nguyễn Đức Vinh nghiên cứu và hoàn thiện năm 2012

2.4.1 Xây dựng ma trận thông tin đối mẫu

Các ma trận thông tin của đối tượng mẫu (ví dụ: quặng và không quặng) theo phương pháp phân tích khoảng cách khái quát có được trực tiếp từ số liệu địa vật lý trên các đối tượng mẫu đó (do các phần tử của ma trận của phương pháp này là các đại lượng số thực) Trong khi đó, ma trận thông tin của đối tượng mẫu trong phương pháp phân tích tần suất lại là các phần tử logic “có” hoặc “không” hoặc các giá trị “0” hoặc “1” Để có được ma trận thông tin của đối tượng mẫu ở dạng này

từ các số liệu địa vật lí, tác giả đưa ra cách xây dựng như sau:

Từ tập hợp số liệu của các chủng loại thông tin của đối tượng mẫu quặng trong phương pháp phân tích khoảng cách khái quát xây dựng các đường cong biến phân (đường cong mật độ phân bố) Từ các đường cong biến phân xác định khoảng giá trị đặc trưng cho từng tham số Sau khi có được các khoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn vị thông tin cho từng chủng loại thông tin, nếu

nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằm ngoài sẽ nhận giá trị

là 0 Bằng cách này sẽ chuyển được một ma trận thông tin với các số liệu địa chất, địa vật lý bất kì về ma trận thông tin chuẩn theo yêu cầu của thuật toán với các phần

từ là các giá trị 1 hoặc 0

2.4.2 Đánh giá lựa chọn tổ hợp thông tin

Việc đánh giá lựa chọn tổ hợp thông tin được tiến hành trên cơ sở vận dụng kết hợp cả 2 phương pháp theo cách như sau:

- Tiến hành phương pháp phân tích khoảng cách khái quát trên ma trận thông tin của 2 đối tượng mẫu (quặng và không quặng) để xác định tập {ρi*2}:

Ma trận thông tin đối tượng quặng:

Trang 35

28

q nk n

n

k k

j i

2 1

2 22

21

1 12

11

Ma trận thông tin đối tượng không quặng:

kq mk m

m

k k

j i

)(

2 1

2 22

21

1 12

i

ikq iq

ikq iq

i

2 2

Sắp xếp {ρi2} theo thứ tự giảm dần và gọi nó là {ρi*2}

- Tiến hành phương pháp phân tích tần suất trên ma trận thông tin của đối tượng mẫu quặng để xác định tập {Ii*}:

Từ ma trận thông tin của đối tượng mẫu:

n

k k

dt j i

2 1

2 22

21

1 12

11

Theo Griffiths – Vinni, tỉ trọng thông tin tương đối của tính chất thứ “i” được xác định theo công thức:

Trang 36

k n

Sắp xếp tập {Ii} theo thứ tự giảm dần và gọi tập mới là {Ii*}

Từ kết quả phân tích của 2 phương pháp ta có các tập {ρi2}, {ρi*2}, {Ii}, {Ii*} sẽ xác định được tập hợp các tính chất (các chủng loại thông tin) có độ tin cậy cao theo yêu cầu nghiên cứu thông qua tỉ trọng thông tin tương đối của các tính chất: Qh

% 100

1 2 1 2

h

i i h

j

j Q

Trong đó {Ji} được sắp xếp theo thứ tự giảm dần của {ρi2}

2.4.3 Phân tích đối sánh xác định các đối tượng đồng dạng

Các đối tượng cần đối sánh với đối tượng mẫu để xem nó có đồng dạng với đối tượng mẫu hay không được thực hiện theo cách như sau:

- Tiến hành đánh giá lượng tin Ii cho tất cả các tính chất của đối tượng đối sánh bằng phương pháp phân tích tần suất và xác định được tập {Ii} Ở đây ma trận thông tin của đối tượng đối sánh được xây dựng thông qua chính các khoảng giá trị đặc trưng ( các “cửa sổ quét” ) của đối tượng mẫu với cách làm như đã nêu

- Tính tỉ trọng thông tin tương đối của tính chất đầu đã được lựa chọn ở mục 2 theo công thức cho đối tượng đối sánh, ký hiệu là Q*

h và ta gọi đó là chỉ số đồng dạng Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi Q*

Trang 37

30

dạng của chúng khi chưa biết trước các đối tượng đối sánh Vậy việc hoàn thiện phương pháp đối với trường hợp chưa biết trước các đối tượng đối sánh đã góp phần đẩy nhanh và nâng cao chất lượng công tác xử lí phân tích tài liệu địa vật lí hàng không Cụ thể như sau:

Bước 1 Nội suy các số liệu khảo sát địa vật lý thực tế lên mạng lưới đều (ô vuông

hoặc chữ nhật) bằng các thuật toán nội suy hiện có

Nội dung này được thực hiện dễ dàng bằng các thuật toán nội suy trong Bộ chương

trình phân tích phổ-thống kê COSCAD

Bước 2 Thực hiện các nội dung như:

- Xây dựng các ma trận thông tin của các đối tượng mẫu cho cả hai thuật toán: thuật toán phân tích tần suất và thuật toán phân tích khoảng cách khái quát Nội dung này được thực hiện theo đúng phương pháp Khoảng cách-Tần suất-Nhận dạng hiện có

- Đánh giá, lựa chọn tổ hợp thông tin trên các đối tượng mẫu

Việc đánh giá lựa chọn tổ hợp thông tin được tiến hành trên cơ sở vận dụng kết hợp cả 2 phương pháp theo cách như sau:

+ Tiến hành phương pháp phân tích khoảng cách khái quát trên ma trận thông tin của 2 đối tượng mẫu (quặng và không quặng) xác định tập {

Qh Khi đó Qh được tính:

%100

1 2 1

h i i h

Ngày đăng: 26/04/2021, 00:51

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
1. Tăng Mười, (1995), Địa vật lý máy báy trong điều tra Địa vật lý và tìm kiếm khoáng sản, Thông tin KHKT Địa chất. Hà Nội Sách, tạp chí
Tiêu đề: Địa vật lý máy báy trong điều tra Địa vật lý và tìm kiếm khoáng sản
Tác giả: Tăng Mười
Năm: 1995
2. Tăng Mười, Võ Thanh Quỳnh (1998), Ứng dụng phương pháp phổ gamma hàng không trong tìm kiếm Uran và các khoáng sản có ích khác liên quan với phóng xạ, Báo cáo tại Hội nghị khoa học vật lý hạt nhân ứng dụng, Viện Khoa học Việt Nam, Hà Nội Sách, tạp chí
Tiêu đề: Ứng dụng phương pháp phổ gamma hàng không trong tìm kiếm Uran và các khoáng sản có ích khác liên quan với phóng xạ
Tác giả: Tăng Mười, Võ Thanh Quỳnh
Năm: 1998
3. Võ Thanh Quỳnh, Nguyễn Xuân Bình, Nguyễn Đức Vinh, (2011), “Nghiên cứu hoàn thiện phương pháp Tần suất-Nhận dạng trong xử lý và phân tích số liệu địa vật lý”, TC địa chất, A/326:50-56 Sách, tạp chí
Tiêu đề: ), “Nghiên cứu hoàn thiện phương pháp Tần suất-Nhận dạng trong xử lý và phân tích số liệu địa vật lý
Tác giả: Võ Thanh Quỳnh, Nguyễn Xuân Bình, Nguyễn Đức Vinh
Năm: 2011
4. Võ Thanh Quỳnh, Nguyễn Xuân Ngoan, Vũ Tuấn Hùng, (2002), Thành lập bộ chương trình xử lý tài liệu địa vật lý máy bay, Lưu trữ Cục Địa Chất và Khoáng Sản Việt Nam Sách, tạp chí
Tiêu đề: Thành lập bộ chương trình xử lý tài liệu địa vật lý máy bay
Tác giả: Võ Thanh Quỳnh, Nguyễn Xuân Ngoan, Vũ Tuấn Hùng
Năm: 2002
5. Võ Thanh Quỳnh (chủ biên), Nguyễn Xuân Sơn, Nguyễn Văn Phùng (1995), Báo cáo kết quả bay đo từ - phổ gamma tỉ lệ 1:25.000 vùng Tuy Hòa, Lưu trữ Cục Địa Chất và Khoáng Sản Việt Nam Sách, tạp chí
Tiêu đề: Báo cáo kết quả bay đo từ - phổ gamma tỉ lệ 1:25.000 vùng Tuy Hòa
Tác giả: Võ Thanh Quỳnh (chủ biên), Nguyễn Xuân Sơn, Nguyễn Văn Phùng
Năm: 1995
6. Võ Thanh Quỳnh, (2007), “Một cách tiếp cận mới giải quyết bài toán nhận dạng trong xử lý, phân tích tài liệu địa vật lý”, TC Địa chất, A/302:76-80, Hà Nội Sách, tạp chí
Tiêu đề: Một cách tiếp cận mới giải quyết bài toán nhận dạng trong xử lý, phân tích tài liệu địa vật lý”
Tác giả: Võ Thanh Quỳnh
Năm: 2007
7. Võ Thanh Quỳnh (2008), “Phương pháp đánh giá phân loại cụm dị thường trong xử lý phân - tích tài liệu phổ gamma hàng không”, TC Địa chất, A/304:70-75, Hà Nội Sách, tạp chí
Tiêu đề: “Phương pháp đánh giá phân loại cụm dị thường trong xử lý phân - tích tài liệu phổ gamma hàng không”
Tác giả: Võ Thanh Quỳnh
Năm: 2008
8. Võ Thanh Quỳnh, (2008), “Xây dựng một phương pháp nhận dạng mới trong xử lý tài liệu địa vật lý trên cơ sở vận dụng kết hợp các phương pháp phân tích khoảng cách khái quát và phân tích tần suất”, TC Địa chất, A/305: 61- 66. Hà Nội Sách, tạp chí
Tiêu đề: Xây dựng một phương pháp nhận dạng mới trong xử lý tài liệu địa vật lý trên cơ sở vận dụng kết hợp các phương pháp phân tích khoảng cách khái quát và phân tích tần suất”
Tác giả: Võ Thanh Quỳnh
Năm: 2008
10. Quách Văn Thực, (2003), Đề án bay đo từ - phổ gamma tỉ lệ 1/50.000 và đo vẽ trọng lựa tỉ lệ 1/100.000 vùng Phan Rang – Nha Trang, Liên đoàn Vật lý địa chất.Tài liệu tiếng anh Sách, tạp chí
Tiêu đề: Đề án bay đo từ - phổ gamma tỉ lệ 1/50.000 và đo vẽ trọng lựa tỉ lệ 1/100.000 vùng Phan Rang – Nha Trang
Tác giả: Quách Văn Thực
Năm: 2003
11. Green A.A (November 1987). Leveling airborne gamma-radiation data using between- channel correlation information, Geophysics, Vol.52, No11 Sách, tạp chí
Tiêu đề: Leveling airborne gamma-radiation data using between- channel correlation information
12. Nguyen Xuan Binh, Vo Thanh Quynh, (2015), “Prospect Prediction of Mineral Resources by Applying Two New Methods of Identification Whit Aero-geophysical Data”, VNU Journal of Science: Mathematics-Physics, Vol 31,No1, 129-135 Sách, tạp chí
Tiêu đề: Prospect Prediction of Mineral Resources by Applying Two New Methods of Identification Whit Aero-geophysical Data”
Tác giả: Nguyen Xuan Binh, Vo Thanh Quynh
Năm: 2015
13. Nguyen Viet Dat, Nguyen Xuan Binh, Vo Thanh Quynh, (2015), “Application of the correlation coefficient method in processing and interpreting the aero-gamma spectrum data”, VNU Journal of Science Sách, tạp chí
Tiêu đề: Application of the correlation coefficient method in processing and interpreting the aero-gamma spectrum data”
Tác giả: Nguyen Viet Dat, Nguyen Xuan Binh, Vo Thanh Quynh
Năm: 2015
9. Võ Thanh Quỳnh, (2012), “Nghiên cứu áp dụng các phương pháp nhận dạng hiện đại xử lí – phân tích tài liệu địa vật lý máy bay phục vụ tìm kiếm và dự Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w