Mục tièu và nội dung nghiên cứu: Để tài nhằm nghiên cứu các thuật toán nhận dạng và công nghệ tin học thích hợp cho việc phân tích, xử lý số liệu kim lượng và xác định các đặc trưng của
Trang 1ĐẠI HỌC QUOC GĨA HA NỢI TRƯỜNG ĐẠI HỌC KHOA HỌC Tự NHIÊN
Trang 21 BÁO CÁO TÓM TẮT
a Tên đề tài: Nghiền cứu áp dụng bài toán nhận dạng xúc định
các đặc trưng của trường địa hoá thứ sinh - phục vụ tìm kiếm
khoáng sản
M ã số: QT - 01 - 18
b Chủ trì đề tài: TS Đặng Mai
c Các cán bộ tham gia:
d Mục tièu và nội dung nghiên cứu:
Để tài nhằm nghiên cứu các thuật toán nhận dạng và công nghệ tin học thích hợp cho việc phân tích, xử lý số liệu kim lượng và xác định các đặc trưng của trường địa hoá thứ sinh
Để đạt mục đích đó, một tập mẫu kim lượng ở vùng Lào Cai, gồm hơn 5.900 kết quả phân tích định lượng gần đúng của các nguyên tô Ba, Ti,
Cr, Co, Ni, Mo, w , Sn, Bi, Cu, Pb, Zn, Nb, Li, Ce, La, Zr đã được lựa chọn
và xử lý theo các nội dung sau: 1) Nhận dạng các tổ hợp nguyên tố chi thị 2) Phân vùng trường địa hoá thứ sinh và 3) Nhận dạng phông và dị thường địa hoá
e Các kết quả đạt được:
1 Bằng việc áp dụng phân tích chùm (cluster analyse) theo các độ đo
và phương pháp ghép nhóm khác nhau đã xác định được rằng độ đo Pearson với thuật toán trọng tâm thích hợp cho việc phân chia các tổ hợp nguyên tô chỉ thị trong trường địa hoá thứ sinh
2 Tổ hợp nguyên tố chỉ thị trong trường địa hoá thứ sinh vùng nghiên cứu gồm:
• Pt>0 6 9 Baí)ilị3La()i9-,Ce0 9 4
• Ti0 69Co0 7X Cr0 72Ni0 X4
• Mo0 í7 Sn()X2
• Cuoyi Bi()91 Pb052 W 07l
3 Thuật toán K-means cluster được áp dụng đã chia tập mầu thành 4 nhóm khác nhau Mỗi nhóm bao gồm một số mẫu phân bổ trona không gian nhất định tạo thành các kiểu địa hoá riêng biệt Các hàm nhận dạng
Trang 3của chúng có dạng:
F,= -0.49Ba+ 1.68TĨ - 662.66Cr +765.22CO - 0.44NÌ +11.36MO + 24.31W - 2.66Sn -3.30BĨ - 1 1.08Cu -17.08Pb -21.93Zn -39.37Nb -16.91LÌ + 43.63Ce + 527.92La - 1.97Zr - 1150.74
F2 = -0.40Ba-1.23Ti - 666.6lCr +776.60CO + 2.05NÌ +1I.21MO+ 23.30W - 3.78Sn + 0.61BÌ - 1 1.13Cu -16.68PỒ -ỉ8.63Z n -25.02Nb-15.96Li - 23.46Ce + 530.47La + 0.44Zr -1124.59
F3 = -1.00Ba-0.17Ti - 683.34Cr + 790.41CO - 2.10NĨ + IO.2 IM0 + 23.37W -4.37Sn -2.53BÌ -15.40Cu -16.72PỒ -21.12Zn -22.32Nb-13.82Li - 26.10Ce + 527.09La + 0.29Zr -1126.01
F 4 = -0.96Ba -1.19TĨ - 679.7lC r + 789.69CO - 2 3 2 N1 + 11.84MO + 24.39W -3.09Sn -5.30BÌ -9.89Cu -16.49Pb -21.31Zn - 24.79NÒ -13.18LĨ - 24.92Ce + 525.88La + 0.91Zr -1132.71
Các hàm này cho xác suất nhận dạng đúng trên 90%
địa hoá thứ sinh được mô tả bằng các đa thức hai biến z = f (x, y) bậc 2 với
z là hàm lượng nguyên tố chỉ thị, X và y là hai toạ độ địa lý
Tính giá trị trend và phần dư cho tất cả các điểm lấy mẫu và nội suy lưới điểm bằng phương pháp Kriging, xác định được diện phân bỏ phông và
dị thường địa hoá làm cơ sở cho việc đánh giá triển vọng khoáng sán của vùng nghiên cứu
f Tình hình sử dụng kinh phí của để tài
Kinh phí hỗ trợ : 18.000.000 đ
Kinh phí được cấp: 17.280.000 đ
Trang 4KHOA QUẢN LÝ
(Ký và ghi rõ họ tên)
CHỦ TRÌ ĐỂ TÀI
(Ký và ghi rõ họ tên)
T S - <ỉyỵ? VúL-T) i^cÀ úư/y^ Tí
Cơ QUAN CHỦ TRÌ ĐỂ TÀI
OHÓ W!ÊU Tt?'JỞNtr
Trang 5a Title of the project: Study ofthe application of the diagnostic algorithm
for determination of the characteristics of secondary geochemìcaì /ieìcls in mineral expìoraỉion
Code: QT - 01 - 18
b Head of the project: Dr Đặng Mai
c Participants:
d Objectives and contents of the project:
The objectives of the project are to study appropriate diagnostic algorithms and informatic technologies for analysis and treatment of metallometric data and determination of the characteristics of geochemical íields
To obtain these aims, a set of metallometric samples in Lao Cai area including more than 5.900 results of qualitative determination of Ba, Ti, Cr,
Co, Ni, Mo, w , Sn, Bi, Cu, Pb, Zn, Nb, Li, Ce, La, Zr, has been selected and treated according to the next items: 1) Diagnosis of the assemblages of elements-indicators 2) Zoning of secondary geochemical fields 3) Diagnosis of geochemical background and anomalies
e Obtained results:
1 By the application of cluster analysis according to diíĩerent measurements and grouping methods it has been determined that the Pearson measurement with centroid algorithm is suitable for classitication
of the assemblages of elements-indicators in secondary geochemical lields
2 The assemblages of elements-indicators in the study area include:
Trang 6Their diagnostic equations have forms as foỉlow:
F|= -0.49Ba+ 1.68TĨ - 662.66Cr +765.22CO - 0.44NÌ +11.36MO +
secondary geochemical fields have been portrayed by bi-variant second
ordered polynomical íunctions z = f (x, y), where z is a content of elements-
i n d i c a t o r s , X a n d y a r e g e o g r a p h i c a l c o o r d i n a t e s
Based on the trends and surplus calculated for all the sampling points
and by interpolation of point set according to Kriging method, the contours
of geochemical background and anomalies, basis for evaluation of mineral
potential in the study area, have been deíìned
Trang 7MỤC LỤC
Mớ đầu 2
Chương 1 4
Nhận dạng các tổ hợp nguyên tô chi thị của trường địa hoá 4
1.1 Phân tích chùm 4
1.1.1 Cơ sở lý thuyết của phương pháp 4
1.1.2 Kết quả áp dụng phương pháp 5
1.2 Phân tích Thành phần chính 9
1.2.1 Cơ sở lý thuyết của phương pháp 9
1.2.2 Kết quả áp dụng phương pháp 11
Chương 2 14
Phân vùng tự động trường địa hoá thứ sinh 14
2.1 Cơ sở lý thuyết của phương ph áp 14
2.2 Kết quả áp dụng phương pháp 15
2.2.1 Phân vùng tự động 16
2.2.2 Hàm nhận dạng 16
Chương 3 22
Nhận dạng phòng và dị thường địa hoá 22
3.1 Cơ sở lý thuyết của phương ph á p 22
3.2 Kết quả áp dụng phương pháp 23
3.2.1 Hàm trend 23
3.2.2 Bản đồ trend và phần d ư 23
Kết luận 30
Tài liệu tham k h ả o 31
Trang 8Mở đầu
Bài toán nhận dạng đã được đề xuất ứng dụng vào Địa chất học từ những thập niên 70 của thế kỷ trước [8, 11], nhưng do tính phức tạp vé các thuật toán và những đòi hỏi cao về kỹ thuật máy tính nên mức độ áp dụng
còn hạn chế ơ Việt Nam, vấn đề này lại càng mới mẻ và còn ít được quan tâm
Đề tài này là một bước thử nghiệm nhằm áp dụng một sỏ phương pháp toán học nhận dạng và phần mềm thông kẽ hiện đại SPSS vào việc giai quyết một bài toán địa chất cụ thể: xác định các đặc trưng định lượng cùa trường địa hoá thứ sinh, phục vụ tìm kiếm khoáng sản
Với mục đích đó, tác giả đã lựa chọn và xử lý một tập mẫu kim lượng thuộc địa phận tỉnh Lào Cai cùng các bản đồ sô hoá của nó Tập mẫu này gồm hơn 5900 kết quả phân tích định lượng gần đúng với danh sách các nguyên tố gồm: Ba, Ti, Cr, Co, Ni, Mo, w , Sn, Bi, Cu, Pb, Zn, Nb, Li, Ce
La, Zr Khu vực nghiên cứu nằm trong phạm vi toạ độ địa lý:
22° 10’ đến 22°50’ vĩ độ bắc
103°30’ đến 104''00’ kinh độ đông
Các đặc trưng chính của trường địa hoá thứ sinh bao gồm tổ hợp cộng sinh nguyên tố chỉ thị, phông, dị thường địa hoá và một sỏ tham số khác Việc xác định các đặc trưng này là bài toán muôn thổ trong công tác tìm kiếm khoáng sản bằng phương pháp địa hoá Theo truyền thống, các đặc trưng đó được xác định bằng các thủ tục thống kê cổ điên và kinh nghiệm địa chất Các phương pháp này có ưu điểm là tương đổi đơn giản, có thế sứ dụng rộng rãi trong các đoàn Địa chất Tuy nhiên, để phân tích sâu sắc và khái quát cấu trúc số liệu trong những tập mẫu lớn, các phương pháp dó không thể thực hiện được Bài toán toán nhận dạng với các thuật toán thống
kê hiện đại có thể đáp ứng được yêu cầu đó
Trong để tài này, việc xác định các tổ hợp nguyên tố của trường thứ sinh sẽ được tiến hành theo phương pháp phân tích chùm (cluster analyze)
và phân tích nhân tố theo thành phần chính (factor analyze) còn phỏng va
dị thường địa hoá sẽ được nhận dạng theo phương pháp
■)
Trang 9phân tích trend Phân tích phân biệt (discriminal analyze) sẽ được áp dùng vào việc nhận dạng kiểu và vùng địa hoá.
Công trình được hoàn thành nhờ vào sự trợ giúp kinh phí của Đại học Quốc Gia Hà Nội và sự giúp đỡ của Phòng KHCN trường ĐHKHTN Tác giả xin chân thành cảm ơn
Trang 10Chương 1
NHẬN DẠNG CÁC T ổ HỢP NGUYÊN T ố CHỈ THỊ
CỦA TRƯỜNG ĐỊA HOÁ
Các tổ hợp nguyên tố chỉ thị quặng (THNTCT) của trường địa hoá thứ sinh có ý nghĩa quan trọng trong việc đánh giá kiểu quặng hoá và tính chất sinh khoáng của khu vực Mặt khác, đối với công tác tìm kiếm địa hoá
có thể dựa vào các tổ hợp đó để lựa chọn phương pháp và chi tiêu phân tích hợp lý Tổ hợp nguyên tố chỉ thị thường được xác định bằng cách chổng ghép các bản đổ dị thường địa hoá hoặc phân tích tương quan Mỗi phương pháp đều có những ưu thế và hạn chế nhất định Dưới đây sẽ áp dụng phân tích chùm và phân tích thành phần chính để giả bài toán này
1.1.1 Cơ sở lý thuyết c ủ a phương pháp
Phương pháp phân tích chùm sử dụng thuật toán ghép nhóm dựa vào
độ đo "khoảng cách" của các đối tượng [1, 2, 4] mà trong trường hợp này là các nguyên tố trong trường địa hoá thứ sinh
Các độ đo khoảng cách được sử dụng ở đây bao gồm:
Trang 111 Liên kết trung vị (median clustring)
2 Liên kết lân cận gần (nearest
10.0 theo các thuật toán nêu trên
Đendrogram lập theo khoảng cách
Ơcơlit gồm hai nhánh (hìnhl), trong đó
nhánh thứ nhất chỉ có titan, nhánh thứ hai
chứa tất cả các nguyên tố còn lại Đến lượt
mình, nhánh thứ hai lại được tách thành hai
nhánh con: bari và các nguyên tô' khác
V.V RÕ ràng rằng mô hình này không phản
ánh đúng đặc điểm địa hoá của khu vực nghiên cứu
Mô hình lập theo khoáng cách Khi-bình phương cũng có những nét
tương tự như mô hình trên (hình 2) Ỏ đây, xuất hiện tố hợp w - Sn - Mo -
Li - Bi tương đối rõ rệt, còn các nguyên tô khác nhir Pb, Zn Cu không
5
Trang 12nam trong một tô hợp nào Mô hình này cũng không hợp lý.
Trên hình 3 ta thấy có ba nhánh độc lập, đó là Ti Ba, Ce và các nguyên tố còn lại, Nhánh thứ tư này lại
phân ra các nhánh phụ bao gồm Co-Mo-
Bi-Sn-W-Zn-Nb, Cr-Cu-Pb và La Các tổ
hợp này không phù hợp với tính chất địa
hoá của các nguyên tố Như vậy, độ đo
nhóm các tổ hợp nguyên tố chỉ thị trong
trường địa hoá thứ sinh
nghiêm theo ba phương pháp khác nhau:
trọng tâm, trung vị và lân cận gần Trên
mô hình theo phương pháp trọng tâm của
độ đo này xuất hiện ba nhánh lớn Nhánh
thứ nhất bao gồm năm nguyên tô' Ce, La,
Ba, Pb, Li, Nhánh thứ hai bao gồm ba
nguyên tố Bi, Cu, w Các nguyên tố còn
lại (Nb, Zr, Mo, Sn, Cr, Ni, Ti, Zn, Co)
thuộc vào nhánh thứ ba (hình 4) Trong
khi đó, đendrogram theo phương pháp
trung vị chỉ gồm hai nhánh: Li là nhánh
thứ nhất, còn nhánh kia gồm 16 nguyên
tố (hình 5) Nhánh thứ hai này lại chia
thành ba nhánh con Nhánh con thứ nhất
gồm Ce, La, Ba, Pb Nhánh con thứ hai
gồm Ti, Zn, Co Cr, Ni, Nb, Zr, Sn, Mo
Các nguyên tố Bi, Cu, w thuộc nhánh
thứ ba Đendrogram lập theo phương
pháp làn cận gần cũng có những nét
tương tự Liti vẫn tách thành một nhánh
độc lập, nhưng tổ hợp nguyên tô trong
các nhánh phụ có nhiều thay đổi Tổ hợp
w
B i —
L i — Sn
Mo — Co
N ì Cu Zn
C r
Z r Nb Ce La Ba
T i
I
T i
Hình 2 Độ do Khi-bình phương -thuật toán trọng lãm
Co Mo
B i Sn
w
Zn
N i
Z r NbLi
C r Cu Pb LaCe
Hình 3 Độ đo Trebưsev thuật toán trọng tám
6
Trang 13thứ nhất bao gồm Ce, La, Ba, Pb, Ti, Zn, Co và tổ hợp thứ hai gồm Cr Ni
Nb, Zr, Sn, Mo, Bi, Cu, w Như vậy, các tổ hợp theo mô hình Cosin không thật rõ ràng và chưa phản ánh đúng thực tế
Chuyển sang các đendrogram lập theo độ đo Pearson Tương tự như các mô hình Cosin, trong thuật toán trung vị, cây phân loại gồm hai nhánh không cân đối Một nhánh là Li, còn nhánh kia hợp thành bới các nguyên tô
Ce, La, Ba, Pb, Bi, Cu, w, Cd, Ni, Co, Ti, Zn, Mo, Nb, Zr, Sn Các nguyên
tố trong nhóm thứ hai này được xếp vào bốn phụ nhóm Đó là Ce-La-Ba-Pb Bi-Cu-W, Cd-Ni-Co-Ti-Zn-Mo và Nb-Zr-Sn (hình 7) Nếu không xét trườna hợp đứng riêng của Li, cây phân loại này khá phù hợp với thực tế.
Hình 5 Độ đo Cosin thuật toán trung vị
Đendrogram theo thuật toán trọng tâm của độ đo Pearson được tách thành bốn nhánh rõ rệt (hình 8) Các thành viên trên nhánh thứ nhất là Ce
La, Ba, Pb Đó là một tổ hợp đặc trưng cho quặng nhiệt dịch chứa đất hiếm Nhánh thứ hai gồm Bi, Cu và w , tương ứng tổ hợp nhiệt dịch nhiệt đọ cao Nhánh thứ ba đặc trung cho các nguyên tố liên quan đến magma axit như
Nb, Zr, Sn, Mo Zn Và, cuối cùng, tổ hơp nguyên tố liên quan đến magma
Trang 14bazơ tạo nên nhánh thứ tư Các tổ hợp chi thị thế hiện trẽn đendrogram này
phan anh đung đặc điểm địa hoá các nguyên tô và đặc điếm kim sinh cua
khu vực nghiên cứu
Từ những điều trình bày trên đày, có thể rút ra hai nhận định trong
phần này như sau
• Trong vùng nghiên cứu tồn tại bốn tổ hợp nguyên tô chi thị
phân chia các tổ hợp nguyên tố chí thị trong trường địa hoá thứ sinh
1.2.1 Cơ sở lý thuyết của phương pháp
Phân tích thành phần chính là một trong những phương pháp rất có
hiệu lực đế lựa chọn tham số nhận dạng Ngoài ra, trong nghiên cứu địa hoá phương pháp này còn được ứng dụng đế phân chia các tổ hơp nguyên
X
Trang 15tố chỉ thị cuả trường địa hoá Ý nghĩa quan trọng của phương pháp này là ớ chô từ những tham số ít đặc tưng tạo ra được những tham số đặc trưng hưn
v à c ó t h ể rút b ớ t t h a m s ố n h ậ n d ạ n g m à l ư ợ n g t h ô n g tin m ấ t đ i k h ô n g đ á n g
kể
Gọi các nguyên tố trong trường địa hoá thứ sinh là các biến ngẫu
nhiên Xj, x 2, , xm Vấn để đặt ra là tìm phép biến đổi tuyến tính m vectơ
n g ẫ u n h i ê n đ ó t h à n h p v e c t ơ m ớ i (Z|, z 2, Z p ) s a o c h o m ồ i v e c l ơ n à y ( b i ế n
mới) chứa nhiều thông tin ban đầu nhất Các biến đó viết được dưới dạng
z, = a,]X| + a 12x2+ +oclmxm z2 = a 21x, + a 22x2+ + a2mxm
zp = a plx 1 + ocp2x2 + + apmxmCác biến Z|, z2, z p được gọi là các thành phần chính Trong thực tế,
p thường được chọn bé hơn m, nhưng lượng thông tin chứa trong đó vẫn đủ lớn Do vậy phương pháp thành phần chính cho phép rút bớt sỏ tham sô nhận dạng một cách đáng kế Điều đó làm nhẹ nhàng công tác tính toán, tránh được các nhiễu loạn ngẫu nhiẻn Ngoài ra, việc nhận dạng dựa tren thành phần chính lại dễ dàng và chính xác Trong nghiên cứu địa chất la thường lựa chọn hai thành phần chính và do vậy có thế đưa lên hệ trục loạ
độ vuông góc, thuận lợi cho việc bình luận kết quá
Để tìm thành phần chính, trước hết phải lập ước lượng ma trận covarian của các biến (trong trường hợp này là các nguyên tố) Ma trận này
Trang 16^ = - L ĩ ẳ ( x , 1 - x i ) ( x JI- x )) (8)
1 1 1 t = 1
Tiep theo, tính các vectơ riêng và giá trị riêng tương ứng của ma trận
II su II và thiết lập thành
phần chính theo nguyên tắc
sau
Toạ độ của các vectơ
riêng c h í n h là c á c h ệ s ố (Xjj
cần thiết để lập các tổ hợp
Zj trong (6) Gọi vectơ riêng
ứng với giá trị riêng lớn
nhất là vectơ riêng thứ nhất,
ứng với giá trị riêng lớn thứ
hai là v e c t ơ riêng thứ hai
v.v Khi đó, thành phần
chính thứ nhất, kí hiệu F|,
là tổ hợp Zj với các hệ số Gt
là toạ độ của vectơ riêng
thứ nhất Thành phần chính thứ hai là tổ hợp có các hệ số a là toạ độ của
vectơ riêng thứ hai V V
F, = a llx l + a l2x2 + .+ a lmxm F2 = a 2lX| + a 22x2 + .+ a 2mxm Fp = a plx, + a p2x2 + .+ a pmxm Trong đó, a n , a , 2 a lm là toạ độ của vectơ riêng thứ nhất a 21 a 22,- , a 2m ■ của vectơ riêng thứ hai V V Các số a,j còn được gọi là trọng số của biến j trên thành phần chính i 1.2.2 Kết quả áp dụng phương pháp Trường địa hoá nghiên cứu gồm 17 nguyên tô hoá học, như vậy ma trận covanan có 17 vec tơ riêng, nhưng chí 4 vec tơ đạt trị riêng > 1 Chúng là các thành phần chính chứa thông tin chủ yếu về trường địa hoá thứ sinh (hình 9) Ba -
-Pb
-B i
-Cu -
-w
-Nb -
-Z r -
-Sn -
Mo
-Zn -
-C r
-N i -
-T i -
Co
-L i
-Hình 8 Độ đo Pearson - thuật toán trọng tâm
10
Trang 17Bảng 1 đưa ra thành phần chính của trường địa hoá thứ sinh vùng nghiên cứu Đó là các véc tơ riêng có trị riêng lớn hơn 1 của ma trận tươngquan sau khi
tổng phương sai trong
tổng số 17 vec tơ riêng
biếu hiện của tổ hợp Ba - Pb - La - Ce
Thành phần chính thứ hai có giá trị riêng bằng 3.211 chiêm 18f r tổng phương sai Trên véc tơ này, toạ độ của Ti, Cr, Co và Ni đều mang dâu dương với trị tuyệt đôi lớn (từ 0,687 đến 0,836) Toạ đô cúa các biến khác
Nguyên Thành p lần chính tố
Trang 18có giá trị dưới < 1 % (ngoại trừ Zn) Như vậy, thành phần chính thứ 2 đặc trưng bằng tổ hợp nguyên tố Ti -C o - Ni - Cr.
Thành phần chính thứ 3 có giá trị riêng 2,79, chiếm 15,67% Các
Bảng 2 Giá tri riêng
So sánh với kết quả phân
tích chùm đã nêu ở trên, ta thấy có một sự phù hợp rất tốt, đặc biệt đôi với nhóm nguyên tô' Pb - Ba - La - Ce Một sô' sai lệch nhó thể hiện trong các nhóm Ti - C o - Ni - Cr, Mo -Sn - Nb và Cu - Bi - Pb Theo kết quả phân tích chùm trong nhóm thứ 2, còn có thêm Li, trong nhóm thứ 3, có thêm
Zr còn trong nhóm cuối cùng Pb được thay thế bởi w Sự kiện này phan ánh tính đa dạng và phức lạp trong mối quan hê địa hoá giữa các yếu tố cua trường thứ sinh Tuy vậy từ những kết qua tương đổng cùa hai phưưng pháp toán học đã áp dụng có thế khắng định vé sư hiện hữu 4 tố hợp nguyên tố chí thị trong trường địa hoá thứ sinh vùng Lào Cai Cụ thế là:
• Pb()fiy Baus3La() vlCell>)4
• Cu(,yI Bio.yi Pb<i52 W (l71
Các chì số đi kèm nguyên tố chính là trọng số cùa nguyên tố đó tròn thành phần chính tirơne ứng Cách biễu diễn này đã được một số tác giả sử
12
Trang 19dụng [9]; nó tăng tính định lượng cho công thức cúa các tổ hợp.
Trang 20Chương 2
PHÂN VÙNG Tự ĐỘNG TRƯỜNG ĐỊA HOÁ THÚ SINH
Phân vùng một trường địa hoá thứ sinh là sự phân chia trường đó thành những bộ phận đồng nhất về mặt địa hoá Những bộ phận ấy có thể tiêu biếu cho một kiểu quặng, một tập hợp đá gốc, hoặc một điều kiện cánh quan nhất định Để giả quyết bài toán này, đã áp dụng thuật toán phân tích chùm theo quan trắc và phân tích phân biệt Trước khi trình bày các kết qua nghiên cứu, ta sẽ trình bày tóm tất cơ sở lý thuyết của các phương này
2.1 C ơ SỞ LÝ THUYẾT CỦA PHUƠNG PHÁP
Mặc dầu lý thuyết toán học về phân loại đã được giải quyết bới nhiều nhà nghiên cứu [5,6,7], nhưng với các đối tượng địa chất cũng như nhicu đôi tượng tự nhiên khác, chưa có (và sẽ không bao giờ có) một thuật toán cụ thể nào có thể được coi là tốt nhất Điều đó liên quan đến tính phức tạp cúa đối tượng Ngoài ra, những đòi hỏi chặt chẽ của lý thuyết toán học đối với
số liệu phân tích thường không thể thực hiện đầy đủ trong thực tế Do tâl cá những điều ấy, cần thiết phải tiến hành thử nghiệm theo nhiều thuật toán khác nhau
Thuật toán phân tích chùm đã trình bày trên đây về cơ bán vẫn được
áp dụng trong phần này để phân vùng địa hoá nhưng có một sỏ thay đối nhỏ Thứ nhất, trong khi xác định các tổ hợp cộng sinh nguyên tố đỏi tượng
p h â n c h i a là c á c b i ế n ( n g u y ê n t ô ) , c ò n g i ờ đ â y là c á c q u a n trác ( m ẩ u k i m
lượng) Thứ hai do số lượng quan trắc rất nhiểu (gần 6000) nén khóng thê
s ử d ụ n g t h u ậ t t o á n h ợ p n h ấ t l i ê n t i ế p v à đ ư a ra c á c đ e n d r o g r a m dạng c à n h
cây như trên Thay vào đó sẽ là thuật toán K - nieaiìs cỉustev' ‘
Dưới đây trình bày khái quát về phân tích phán biệt
Phân tích này nhằm tìm ra các hàm nhận dạng mẫu một cách tốt nhất cho một số nhóm đối tượng nhất định Hàm này và được biễu diễn dưới
Hiện chưa có tài liệu nào dịch thuật ngữ này ra tiếng Việt, nén tác gia vẫn đẽ nguyên
từ tiếng Anh
Trang 21dạng một tổ hợp tuyến tính của các nguyên tố:
F = a,x,+ a2x2 + + amx2m+a<)trong đó:
• A là vec tơ (a,, a2, .am)
• D là véc tơ hiệu số trung binh trong hai nhóm
• s là ma trận mà mỗi phân tử của nó là
s.; =
ni + n2 I k - U-)(UJ - ui)+ Z ( v« - V,)(VJ - 1=1 1=1 vj) trong đó:
Trang 22nhau.: số liệu thường và số liệu logarit hoá.
Trang 23h a m t h ê h i ệ n q u a x á c s u ấ t n h ậ n d ạ n g đ ú n g v à s ự p h â n b ô t r ọ n g t â m c ủ a c á c
nhóm mà các hàm này đặt lên.
Cac ham phân biệt theo sô liệu thường (không logarit hoá) có dạng:
0.014La+ 6.300 Li + 7.214 Mo + 0.998Nb + 0.023NÍ -O.OỎOPb + 35.563Sn + 0.006TĨ + 0.290VV + 0.402Zn - 42.087
-0.057Cu 0.017La + 6.437LÍ + 8.162 Mo - 0.320Nb + 0.053NĨ 0.00 lPb + 29.825Sn + 0.008TÍ + 0.052W + 0.392Zn - 42.439
Với các hàm này, 83.02% trường hợp của nhóm 1; 69.34f/f nhóm 2; 96.80% nhóm 3 và 85.83% nhóm 4 và xét chung là 84.2% được nhận dang đúng (bảng 3)
84.2c/c trường liựp nhận dụng CỈÍUIỊỊ
Trên Territorial M ap r i , trọng tâm của các nhóm nàm rát gần nhau
n Một sô tác giả dịch từ này là bán đồ lanh thố [3], nhưng vì sơ bị nhám lan với khá 1
niệm lãnh thổ trong địa lý, chúng tôi vẫn để nguyên từ tiêng Anh.
ŨI Ị ịQò