Những sai số này do nhiều nguyênnhân khác nhau như: sai số đo ghi của máy, sai số do kỹ thuật và phương pháp đoghi, sai số do ảnh hưởng của các đối tượng khác… Trong số liệu địa vật lý n
Trang 1MỤC LỤC
LỜI MỞ ĐẦU 1
CHƯƠNG 1: LÝ THUYẾT NHẬN DẠNG 3
1.1 Lý thuyết xử lý tổ hợp số liệu 3
1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lý 3
1.1.2 Lựa chọn tổ hợp số liệu 4
1.2 Mẫu và các đặc trưng thống kê của số liệu địa vật lý 6
1.2.1 Số liệu đo và mẫu ngẫu nhiên 6
1.2.2 Hàm mật độ xác suất 6
1.2.3 Một số hàm phân phối lý thuyết 7
1.3 Các thuật toán nhận dạng 9
1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận dạng 9
1.3.2 Các thuật toán nhận dạng có mẫu chuẩn 11
1.3.3 Các thuật toán nhận dạng không có mẫu chuẩn 14
1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lý 15
CHƯƠNG 2: ỨNG DỤNG PHƯƠNG PHÁP TẦN SUẤT – NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ 17
2.1 Phương pháp phân tích tần suất 17
2.2 Phương pháp Tần suất - Nhận dạng 19
2.2.1 Phương pháp xây dựng ma trận thông tin đối tượng mẫu 19
2.2.2 Phương pháp đánh giá lựa chọn tổ hợp thông tin 19
2.2.3 Phương pháp phân tích đối sánh xác định các đối tượng đồng dạng 20
2.3 Xây dựng phần mềm ứng dụng phương pháp Tần suất – Nhận dạng 21
CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU PHÂN TÍCH DỮ LIỆU VÙNG ĐÔNG TUY HOÀ 24
3.1 Đặc điểm địa chất và địa vật lý vùng Đông Tuy Hoà 24
3.1.1 Đặc điểm địa lý, tự nhiên 24
3.1.2 Đặc điểm địa chất và địa vật lý 25
3.2 Ứng dụng chương trình phân tích tần suất trong số liệu thực tế 28
3.2.1 Xử lý số liệu cho trường hợp biết trước đối tượng đối sánh 28
3.2.2 Xử lý số liệu không dùng đối tượng đối sánh 31
TÀI LIỆU THAM KHẢO 35
PHỤ LỤC 1: CHƯƠNG TRÌNH PHÂN TÍCH TẦN XUẤT – NHẬN DẠNG 36
PHỤ LỤC 2: CÁC BẢN VẼ 45
Trang 2LỜI MỞ ĐẦU
Hiện nay, trong công tác điều tra nghiên cứu địa chất và tìm kiếm khoángsản thì số lượng thông tin trên mỗi một đối tượng thu thập ngày càng lớn Mỗi mộttài liệu chứa đựng một loại thông tin về đối tượng và nếu chỉ sử dụng một loại tàiliệu riêng biệt thì rất khó có thể giải quyết thoả đáng nhiệm vụ đặt ra Do đó phântích đồng thời nhiều loại thông tin về đối tượng (tổ hợp số liệu) là một xu hướng tấtyếu, được phát triển mạnh và được áp dụng rộng rãi ở nước ta và trên thế giới
Có nhiều phương pháp khác nhau đang được sử dụng trong xử lý phân tích
tổ hợp số liệu địa vật lý, trong đó nhóm các phương pháp thống kê – nhận dạngđược ứng dụng rộng rãi và có hiệu quả hơn cả Tuy nhiên khi tiến hành phân tích xử
lý tổ hợp số liệu địa vật lý vẫn còn những hạn chế đó là: số lượng chủng loại thôngtin rất lớn trong khi số lượng các tham số đầu vào của các chương trình phân tíchnhận dạng thường bị giới hạn Việc sử dụng các tổ hợp thông tin khác nhau để tiếnhành phân tích nhận dạng nhiều khi cho những kế quả rất khác biệt Trong trườnghợp số lượng các tham số đầu vào được mở rộng nhưng do việc sử dụng các thôngtin kém tin cậy sẽ dẫn tới các kết quả kém hơn so với sử dụng một tổ hợp thông tin
ít hơn nhưng có chất lượng cao Việc sử dụng những thông tin kém tin cậy khôngnhững không có hiệu quả mà còn làm nhoà đi những thông tin quan trọng khác dẫntới những nhận thức sai lệch về đối tượng Với số lượng các chủng loại thông tinngày càng tăng hiện nay, việc lựa chọn được một tổ hợp thông tin có chất lượng cao
là một nhiệm vụ quan trọng và rất khó khăn Đây chính là nội dung của các bài toán
đánh giá lựa chọn thông tin Từ yêu cầu thực tế trên khoá luận với đề tài “Nghiên
cứu áp dụng phương pháp Tần suất – Nhận dạng trong giải đoán địa chất số liệu địa vật lý hàng không” đưa ra một hướng đánh giá lựa chọn các thông tin góp
phần nâng cao chất lượng xử lý số liệu địa vật lý
Khoá luận được thực hiện với các mục tiêu nhiệm vụ chính sau:
- Nghiên cứu lựa chọn một thuật toán đánh giá lựa chọn thông tin để lựachọn các tổ hợp thông tin có chất lượng nhằm nâng cao độ tin cậy của kếtquả nhận dạng
- Trên cơ sở thuật toán lựa chọn thông tin đã nghiên cứu đề xuất một giảipháp phân tích đối sánh từ đó xây dựng thành một phương pháp phântích, nhận dạng
Trang 3- Tiến hành phân tích thử nghiệm trên một tài liệu thực tế nhằm làm rõ ýnghĩa thực tiễn và khả năng áp dụng thực tế của kết quả nghiên cứu.
Từ cơ sở những mục tiêu thực hiện, khoá luận được viết với cấu trúc nhưsau:
- Mở đầu
- Chương 1: Lý thuyết nhận dạng
- Chương 2: Ứng dụng phương pháp Tần suất – Nhận dạng trong xử lý số
liệu địa vật lý
- Chương 3: Áp dụng kết quả nghiên cứu phân tích số liệu hàng không
vùng Đông Tuy Hoà
- Kết luận
Khoá luận có sử dụng tài liệu từ - phổ gamma hàng không, các tài liệu kiểmtra mặt đất khu vực Đông Tuy Hoà của Đoàn Địa vậy lý máy bay, Đoàn Địa vật lýmặt đất, Liên đoàn Vậy lý – Địa chất, Các kết quả của các đề tài nghiên cứu doPGS.TS Võ Thanh Quỳnh làm chủ biên
Trong quá trình thực hiện khoá luận này, em đã nhận được sự quan tâm giúp
đỡ tận tình của các thầy giáo, cô giáo trong Khoa Địa chất, Trường Đại học Khoahọc Tự nhiên; sự giúp đỡ tạo điều kiện của ban lãnh đạo và các cán bộ kỹ thuậtĐoàn Địa vậy lý máy bay, Đoàn Địa vật lý mặt đất, Liên đoàn Vậy lý – Địa chấttrong việc tìm hiểu và thu thập tài liệu, đặc biệt là sự hướng đẫn, giúp đỡ tận tìnhcủa thầy giáo hướng dẫn PGS.TS Võ Thanh Quỳnh Em xin bày tỏ lòng biết ơnchân thành tới những sự giúp đỡ nhiệt tình đó!
Do những hạn chế về mặt thời gian và kinh nghiệm còn ít nên khoá luậnkhông thể tránh khỏi những thiếu sót, rất mong nhận được sự bổ xung, góp ý từ thầy
cô và các bạn
Sinh viên thực hiện
Nguyễn Viết Đạt
Trang 4CHƯƠNG 1: LÝ THUYẾT NHẬN DẠNG
Khác với các lĩnh vực nghiên cứu trực tiếp đối tượng địa chất, địa vật lýnghiên cứu gián tiếp các đối tượng đó dựa vào các đặc điểm trường vật lý củachúng Từ các số liệu khảo sát trường địa vật lý, mục tiêu cuối cùng của công tácthăm dò địa vật lý là đưa ra được các thông tin của đối tượng để phục vụ cho cácmục tiêu khác nhau Để thực hiện nhiệm vụ này có nhiều phương pháp, trong đó lýthuyết nhận dạng – lĩnh vực toán học giải quyết các bài toán phân loại đối tượng làmột phương án được lựa chọn nhiều hiện nay trong địa vật lý
1.1 Lý thuyết xử lý tổ hợp số liệu
Mỗi loại số liệu cụ thể thường chỉ phản ánh một số đặc trưng nào đó của đốitượng vì vậy khi sử dụng số liệu đó để đưa ra kết luận về đối tượng sẽ cho kết quảkém tin cậy do nhiều nguyên nhân khác nhau chưa kể tới các sai số mắc phải khithu thập và chỉnh lý số liệu Để nâng cao chất lượng xử lý thông tin và đáp ứngđược các yêu cầu thực tế, hiện nay, người ta áp dụng phổ biến là các phương pháp
xử lý tổ hợp dữ liệu Xử lý tổ hợp dữ liệu về cơ bản là dựa trên nhiều loại thông tin
khác nhau để giải quyết được các nhiệm vụ đặt ra phù hợp với điều kiện kinh tế và
kỹ thuật cho phép Không chỉ trong địa vật lý mà nhiều lĩnh vực khác cũng sử dụng
xử lý tổ hợp số liệu để nâng cao chất lượng của kết quả xử lý
1.1.1 Các yêu cầu khi sử dụng tổ hợp số liệu trong xử lý.
Khảo sát, thu thập thông tin về đối tượng phải đáp ứng được các yêu cầuthực tế đặt ra như sau:
- Thông tin phải đảm bảo về số lượng và chất lượng để đạt được mục tiêu và
xử lý với độ chính xác chấp nhận được
- Thời gian thu thập thông tin phải phù hợp với tiến độ yêu cầu
- Khảo sát, thu thập thông tin phải đạt được hiệu quả kinh tế
Từ các yêu cầu này mà đôi khi các phương án khảo sát loại số liệu có độ tincậy cao hơn không được lựa chọn mà thay vào đó người ta sử dụng một số loạithông tin khác mà khi sử dụng tổ hợp các thông tin này cũng có khả năng đáp ứngđược yêu cầu, mục tiêu đề ra Ví dụ như thay vì dùng số liệu địa chấn có giá thànhkhảo sát cao thì có thể sử dụng tổ hợp số liệu khảo sát trọng lực và số liệu điện trởsuất để tìm kiếm các hang động karst
Mặt khác hiện nay các tổ hợp phương pháp địa vật lý đang ngày càng được
áp dụng rộng rãi do những đặc trưng về kỹ thuật như tổ hợp địa vật lý biển, tổ hợp
Trang 5địa vật lý hàng không… Các tổ hợp phương pháp này với các phép ghi đo tự động
sẽ cung cấp một khối lượng dữ liệu rất lớn bao gồm nhiều chủng loại thông tin
Ngoài dữ liệu khảo sát trực tiếp, hiện nay, với số lượng thông tin lưu trữngày càng tăng thì việc sử dụng kết hợp các dữ liệu có sẵn này với các thông tinkhảo sát là một nhu cầu để nâng cao độ tin cậy cho kết quả xử lý
Mỗi loại thông tin chỉ mang những đặc trưng nhất định của đối tượng và đểhoàn thành được nhiệm vụ đặt ra trong nhiều trường hợp người ta buộc phải xửdụng tổ hợp các thông tin khác nhau
Bản thân mỗi số liệu khảo sát đều mang những sai số, chúng đi kèm với sốliệu và nhiều lúc gây ra những sai lầm khi xử lý Những sai số này do nhiều nguyênnhân khác nhau như: sai số đo ghi của máy, sai số do kỹ thuật và phương pháp đoghi, sai số do ảnh hưởng của các đối tượng khác… Trong số liệu địa vật lý nhữngsai số mắc phải làm giảm độ tin cậy của thông tin được loại bỏ trong các bước xử lý
số liệu nhưng rất khó để tách hoàn toàn được chúng ra khỏi số liệu Đặc biệt là cácnhiễu do nguồn gốc địa chất, chúng làm sai lệch mạnh các tín hiệu có ích và đôi khikhông loại bỏ được do không đủ thông tin Những sai số này làm giảm đáng kể độtin cậy của thông tin, đặc biệt trong trường hợp loại thông tin đó được coi là loạitính chất quan trọng đặc trưng cho đối tượng đang cần nghiên cứu Một nguyênnhân khác dẫn tới giảm độ tin cậy của một loại thông tin là tính đa trị của kết quả
xử lý Điều này gây nhiều khó khăn và sai lầm trong xử lý Để xác định đơn trị đốitượng cần sử dụng kết hợp nhiều loại thông tin khác nhau một cách phù hợp
Từ các nguyên nhân trên các phương pháp xử lý tổ hợp số liệu đã và đangđược áp dụng phổ biến trong nhiều lĩnh vực và mang lại kết quả cao
1.1.2 Lựa chọn tổ hợp số liệu
Trong bất kỳ bài toán nhận dạng nào thì số lượng và chất lượng các tính chất(loại thông tin) dùng để nhận dạng luôn được quan tâm hàng đầu Mỗi tổ hợp thôngtin khác nhau thường cho những kết luận khác nhau về đối tượng Để đạt được kếtquả đáng tin cậy nhất thì quá trình xử lý số liệu cần lựa chọn được tổ hợp thông tin
có độ tin cậy cao và hợp lý
Chất lượng của thông tin tốt hay không phụ thuộc vào loại thông tin đó cóđặc trưng cho đối tượng (khả năng phân biệt đối tượng với môi trường xung quanh)hay không Tính đặc trưng cho đối tượng của một loại số liệu địa vật lý do nhiềunguyên nhân quyết định Một tính chất là đặc trưng cho đối tượng khi độ chênh lệchgiá trị của số liệu của tính chất đó giữa đối tượng nghiên cứu với môi trường xung
Trang 6quanh đủ lớn Trong trường hợp đối tượng nằm quá sâu, kích thước quá nhỏ, hoặc
do ảnh hưởng của các yếu tố khác (phong hóa, biến chất, chất lưu…) dẫn tới độchênh lệch của giá trị không đủ để phân biệt đối tượng với môi trường xung quanhkhi đó thông tin là không có ích cho xử lý số liệu Các sai số không tách được sẽgây ra sai lệch về số liệu khi đó thông tin không còn mang tính đặc trưng cho đốitượng
Một tổ hợp thông tin không đầy đủ sẽ không đáp ứng được yêu cầu, nhiệm
vụ đặt ra cho quá trình xử lý Việc chọn số lượng các loại thông tin phải đảm bảođược tính đơn trị của kết quả và đưa ra được đầy đủ các yêu cầu nghiên cứu về đốitượng
Việc sử dụng đồng thời nhiều loại thông tin trong đó có những thông tin có
độ tin cậy thấp không những gây khó khăn cho quá trình xử lý, chất lượng xử lýkhông cao, do các thông tin thiếu tin cậy sẽ làm nhoè đi các thông tin quan trọngkhác dẫn đến những nhận thức sai lệch về đối tượng
Việc lựa chọn được một tổ hợp thông tin có chất lượng cao là nội dung khókhăn và phụ thuộc nhiều vào hiểu biết, kinh nghiệm của người xử lý
Trang 71.2 Mẫu và các đặc trưng thống kê của số liệu địa vật lý
1.2.1 Số liệu đo và mẫu ngẫu nhiên
Vì các thiết bị quan sát trường trong địa vật lý đều là các thiết bị số nên cáckết quả quan sát trường là những con số Ở một điểm quan sát bất kỳ, kết quả quansát trường địa vật lý vì chứa nhiễu và sai số đo nên có thể là đại lượng này hay đạilượng khác mà người đo không dự đoán trước được Vì vậy để mô tả các giá trị(bằng số) các trường địa vật lý đo được người ta sử dụng khái niệm đại lượng ngẫunhiên
Các giá trị trường địa vật lý đo được là các số cụ thể nên đại lượng ngẫunhiên là mô hình nền tảng để mô tả các số liệu địa vật lý
Đại lượng X được gọi là ngẫu nhiên nếu trong mỗi phép đo sẽ xuất hiện mộttrong những giá trị cụ thể x1, x2, x3,… của đại lượng này với xác suất tương ứng p1,
p2, p3,…
Tất cả các giá trị có thể của X sẽ tạo thành nhóm đủ, vì bao giờ trong kết quảcủa một phép đo cũng sẽ xuất hiện một giá trị xi nào đó (biểu hiện nào đó của X);nghĩa là bao giờ cũng tồn tại đẳng thức:
x
x
dx x f x
X x
( 1
x
dx x f x
Trang 8với F(x) là hàm phân bố của X; hàm mô tả xác suất để đại lượng ngẫu nhiên
X nhận các giá trị nhỏ hơn giá trị xi nào đó
Đồ thị của hàm phân bố mật độ xác suất thực nghiệm được dựng lên từ số
liệu khảo sát thực tế được gọi là đường cong biến phân.
Ngoài hàm phân bố F(x) và hàm mật độ f(x) người ta còn dùng các đặc trưngthống kê để mô tả các đại lượng ngẫu nhiên bao gồm:
x M
- Mod (M0) là giá trị x mà tại đó hàm mật độ phân bố đạt max
- Median (Me) là giá trị là giá trị của X có xác suất P(X) =
2 1
- Phương sai: D x Mx Mx 2 ( x i M x) 2p i (1.7)
1.2.3 Một số hàm phân phối lý thuyết
Để mô tả các đại lượng ngẫu nhiên, trong địa vật lý người ta sử dụng cáchàm phân phối lý thuyết như hàm phân phối chuẩn (phân phối Gauxơ), phân phốichuẩn loga, phân phối Puasson…
Phần lớn các đại lượng ngẫu nhiên trong địa vật lý cũng như nhiều hiệntượng địa chất khác chúng tuân theo luật phân phối chuẩn
Đại lượng ngẫu nhiên X tuân theo luật phân phối chuẩn nếu hàm mật độ của
nó có dạng:
2 2
2 ) (
2
1)
Diện tích giới hạn bởi đường cong và trục hoành bằng 1, đó chính là xác suất
để đại lượng ngẫu nhiên X nhận giá trị trong khoảng ( ; ) (1.3) Xác suất đểđại lượng ngẫu nhiên X nhận giá trị trong khoảng từ x1 tới x2 chính là phần diện tíchđược bao bởi đường cong, trục hoành và hai đường thẳng x x1; x x2 Xác suất
đó được tính theo công thức (1.4)
Trang 9Nhiều giá trị trường địa vật lý như mật độ, tốc độ truyền sóng, phóng xạ…tuân theo luật phân phối chuẩn và dựa trên các thuật toán thống kê theo luật phânphối chuẩn người ta có thể xử lý số liệu để tìm ra các đặc trưng của đối tượng.
Ngoài luật phân phối chuẩn còn có các luật phân phối khác đang được ápdụng phổ biến trong phân tích thống kê các số liệu địa vật lý Ví dụ như luật phânphối chuẩn loga được dùng để mô tả các giá trị điện trở xuất, độ từ cảm của đất đá
Trang 101.3 Các thuật toán nhận dạng
Nhiệm vụ cơ bản nhất của công tác xử lý tổ hợp số liệu địa vật lý là phân loạiđược các điểm quan sát thành các diện tích nhất định hay các nhóm, lớp diện tíchnhất định, ở đó các đặc trưng của trường địa vật lý giống với các đặc trưng củatrường liên quan với loại (lớp) đối tượng địa chất nhất định Để giải quyết đượcnhiệm vụ trên tương tự nhiều lĩnh vực khoa học khác người ta sử dụng lý thuyếtnhận dạng - một lĩnh vực toán học đi sấu vào giải quết các bài toán phân loại đốitượng dựa vào mối quan hệ hữu cơ giữa các đối tượng cụ thể và các dấu hiệu đặctrưng cho đối tượng đó
Hiện nay, trong địa vật lý ngưồi ta sử dụng rất nhiều phương pháp nhận dạnghiện đại, được tự động hoá bằng các phần mềm mạnh Tuy nhiên có thể chia chúngthành 2 nhóm: nhóm có phương pháp nhận dạng theo đối tượng chuẩn (có thông tintiên nghiệm) và nhóm có phương pháp nhận dạng không có đối tượng chuẩn (không
có thông tin tiên nghiệm)
1.3.1 Mẫu chuẩn các đặc điểm đặc trưng và sử dụng mẫu chuẩn trong nhận dạng
Để xử lý tổ hợp các số liệu bằng phương pháp nhận dạng có mẫu chuẩn thìcông việc quan trọng mang tính quyết định là lựa chọn các mẫu chuẩn và xác địnhcác đặc trưng thống kê các trường địa vật lý của chúng
Các mẫu hay đối tượng chuẩn là phần diện tích ở đó bằng các số liệu khoan
và các số liệu địa chất khác đã xác định được bản chất địa chất của từng đối tượnggây ra trường địa vật lý Tuỳ thuộc vào các mục đích nghiên cứu khác nhau mà cácđối tượng chuẩn được lựa chọn khác nhau Ví dụ khi mục đích nghiên cứu là tìmkiếm khoáng sản thì đối tượng chuẩn có thể là một vùng quặng, một trường quặng,một mỏ quặng hay một vỉa quặng Còn khi khảo sát địa vật lý phục vụ công tác đo
vẽ bản đồ địa chất thì các đối tượng mẫu có thể là diện tích phát triển một loại đánào đó
Tuỳ theo bản chất, đối tượng chuẩn có hai loại là đối tượng chuẩn mang cácthông tin đại diện và đối tượng chuẩn mang thông tin phủ nhận Đối tượng chuẩnđại diện mang các thông tin có khả năng phân loại một hay một lớp đối tượng.Trong nhiều trường hợp có những đối tượng khác nhau nhưng mang các đặc điểmtrường địa vật lý tương đồng Khi đó người ta sử dụng đối tượng chuẩn mang thôngtin phủ nhận để loại bỏ những đối tượng không đúng ra khỏi tập kết quả nhận dạng
Trang 11Cần lưu ý để công tác phân tích nhận dạng đạt hiệu quả tốt thì cần lựa chọncác đối tượng chuẩn sao cho các diện tích tồn tại các đối tượng chuẩn phải nằm xen
kẽ với các phần diện tích khảo sát cần nhận dạng
Một đối tượng chuẩn nào đó có phạm vi ứng dụng là giới hạn và nó phụthuộc vào các yếu tố sau:
- Đối tượng chuẩn phải có giá trị thông tin tin cậy theo mục tiêu tìm kiếm
- Đối tượng chuẩn phải phù hợp với diện tích nghiên cứu
- Mật độ lưới khảo sát các loại thông tin phải tương ứng với đối tượng chuẩnlựa chọn
Đối tượng chuẩn mang các dấu hiệu nhận biết, phân biệt nó với môi trườngxung quanh, các dấu hiệu có khả năng phân biệt cao trong các loại thông tin thuthập sẽ gúp quá trình xử lý số liệu cho kết quả tin cậy Để đánh giá chất lượng của
dấu hiệu người ta sử dụng khái niệm lượng tin của dấu hiệu Lượng tin của dấu
hiệu là khả năng mà dấu hiệu đó có thể phân biệt được các đối tượng khác nhau với nhau Khả năng này phụ thuộc vào việc các đối tượng của cùng một lớp có
thường xuyên cho những giá trị cố định của dấu hiệu đó hay không và các giá trị đó
có phân bố rộng ra ngoài giới hạn của các đối tượng của lớp đó hay không
Trong quá trình nhận dạng không phải mọi dấu hiệu trường đều quan trọngnhư nhau, thậm chí có những dấu hiệu trường địa vật lý hoàn toàn không chứathông tin về đối tượng khảo sát và có thể là những dấu hiệu nhiễu làm mờ nhạt đicác thông tin hữu ích Khi đưa các dấu hiệu này vào sử dụng để nhận dạng khônglàm tăng mà ngược lại lại làm giảm chất lượng nhận dạng đối tượng Chính vì vậy,trong quá trình xử lý cần tiến hành đánh giá lượng tin của từng dấu hiệu để từ đóchọn ra những dấu hiệu có lượng tin cao đưa vào xử lý và loại bỏ những dấu hiệu cólượng tin thấp
Dựa vào các giá trị trường quan sát được trên các đối tượng chuẩn người tatiến hành xác định các đặc trưng thống kê của trường cho từng loại đối tượng Cácđặc trưng này được sử dụng tuỳ thuộc vào thuật toán nhận dạng áp dụng Thườngcác đặc trưng thống kê bao gồm:
- Đường cong biến phân (hàm phân bố mật độ xác xuất thực nghiệm)
- Kỳ vọng và phương sai của trường (tính thông qua đường cong biến phân).Ngoài ra khi cần người ta tính cả hệ số tương quan giữa các dấu hiệu,phương chủ đạo của các dị thường…
Trang 121.3.2 Các thuật toán nhận dạng có mẫu chuẩn
Các thuật toán nhận dạng có mẫu chuẩn là các thuật toán tiến hành xác địnhbản chất địa chất của các đối tượng dựa vào việc so sánh tập hợp các dấu hiệu địavật lý đặc trưng cho đối tượng chuẩn với tập hợp các dấu hiệu địa vật lý của đốitượng nghiên cứu
Việc lựa chọn thuật toán nhận dạng tuỳ thuộc vào các điều kiện sau:
- Số liệu xuất phát
- Tồn tại thông tin tiên nghiệm về đối tượng
- Nhiệm vụ cụ thể của công tác địa vật lý
Các thuật toán nhận dạng được xây dựng dựa vào các công cụ toán học khácnhau như: toán logic, các hàm hồi quy và lý thuyết định nghiệm thống kê… dướiđây là một số thuật toán điển hình
a Phương pháp nhận dạng sử dụng toán logic
Trong các thuật toán logic, để nhận dạng đối tượng hoặc là người ta tínhlượng tin tổng, hoặc là xác định khoảng cách tổng
Từ đối tượng chuẩn tìm được các dấu hiệu đặc trưng và, người ta tiến hành
mã hoá các dấu hiệu trường bằng mã nhị phân gồm tập số “0” và “1”.
Nếu xkn là giá trị trường của dấu hiệu thứ n của mẫu thứ k thì:
- xkn = 0 khi mẫu k không chứa dấu hiệu thứ n.
- xkn =1 khi mẫu k chứa dấu hiệu thứ n.
Bằng cách trên toàn bộ các mẫu được mã hoá
Tiếp theo, dựa vào các tổ hợp số “0” và “1” (từ thông tin) xác lập trên cácmẫu chuẩn người ta xác định các từ thông tin chuẩn cho từng lớp đối tượng Từthông tin chuẩn cho một lớp (đối tượng) là từ thông tin gặp p lần ở các đối tượngchuẩn của lớp đó và không gặp lần nào các đối tượng chuẩn thuộc lớp khác (giá trị
p được chọn theo kinh nghiệm) Đối với một lớp người ta có thể chọn khoảng giá trịthông tin chuẩn Các thông tin này được gọi là tổ hợp dấu hiệu phức hợp Trong các
tổ hợp dấu hiệu phức hợp đặc trưng cho các đối tượng chuẩn của cùng một lớp thì
tổ hợp dấu hiệu nào đặc trưng cho số lượng mẫu chuẩn lớn hơn, tổ hợp dấu hiệu đó
sẽ có lượng tin lớn hơn
Cuối cùng là nhận dạng các đối tượng nghiên cứu Ở bước này người ta tiếnhành kiểm tra xem bao nhiêu tổ hợp dấu hiệu phức hợp của từng lớp gặp ở đốitượng nghiên cứu Nếu số lần gặp các tổ hợp dấu hiệu phức hợp của một lớp nào đónhiều hơn số lần gặp các tổ hợp phức hợp của lớp khác thì đối tượng nghiên cứu
Trang 13được xếp vào lớp đó Quá trình này được tiến hành cho tới khi đối tượng cuối cùngđược nhận dạng.
b Phương pháp nhận dạng sử dụng phân tích hồi quy
Trong xử lý số liệu địa vật lý, thuật toán hồi quy đầu tiên được sử dụng để sử
lý các số liệu đo địa vật lý giếng khoan và phân tích định lượng các tài liệu trọnglực Thực chất của thuật toán này là xây dựng các hàm hồi quy xác định mối quan
hệ giữa các tham số địa chất cần tìm với các số liệu địa vật lý quan sát được bằngcác phương pháp khác nhau Ví dụ mối quan hệ giữa một bên là độ rỗng của đất đávới bên kia là các số liệu đo điện trở, điện trường tự nhiên, gama… dọc thành giếngkhoan
Thường quá trình xấp xỉ các hàm hồi quy giới hạn bởi các đa thức bậc 1, bậc
2 hoặc đặc biệt có thể xấp xỉ với đa thức bậc lớn hơn Ví dụ: nếu chỉ có hai dấu hiệu
1 và 2 thì hàm hồi quy được xấp xỉ bằng đa thức bậc 2 có đạng:
x1k và x2k của chính đối tượng đó
Phương trình hồi quy trên được xác định cho từng đối tượng chuẩn thứ k.Ngoài phương pháp hồi quy người ta còn tiến hành xác định giá trị ngưỡng yk chotừng lớp đối tượng chuẩn Cuối cùng đưa các giá trị trường đo được trên các đốitượng cần nghiên cứu vào các phương trình hồi quy tìm được trên đối tượng chuẩn
ta sẽ xác định được giá trị của tham số yk của đối tượng nghiên cứu
Thuật toán phân tích hồi quy có ưu điểm là dễ dàng đưa vào xử lý bổ sungcác số liệu của dấu hiệu mới bằng cách đưa thêm vào phương trình của hàm hồi quycác số hạng mới vì vậy thuật toán này rất phù hợp cho việc xử lý các số liệu của tổhợp khảo sát gồm nhiều dấu hiệu khác nhau
Tuy nhiên thuật toán hồi quy cũng có nhược điểm ở chỗ với một tập hợp sốliệu nhất định ứng với một giá trị sai số cho trước có thể xấp xỉ được nhiều hàm hồiquy Nhược điểm này thể hiện rõ nhất khi các đấu hiệu quan sát trường liên quanvới nhau Lý do trên không cho phép đưa ra được các lý giải về ý nghĩa vật lý củacác hệ số của hàm hồi quy tìm được Các lý giải vật lý chỉ có thể được đưa ra khidạng của phương trình này được xác định cho một mô hình vật lý cụ thể, còn quátrình xấp xỉ hồi quy chỉ được tiến hành đơn thuần với mục đích xác định hệ số củaphương trình hồi quy ứng với mô hình vật lý đó
Trang 14c Phương pháp kiểm định giả thuyết thống kê
Thuật toán nhận dạng trên cở sở mô hình thống kê đối tượng chuẩn trongphân tích số liệu địa vật lý thường sử dụng các thông số như: tỷ số sự thật L(x) vàtổng lượng thông tin J(1:2,x)
Giá trị các thông số đó được tính theo công thức:
)(
)(
2
1
x P
x P x
) ( log ,
x p x
Trong đó:
P1(x), P2(x) là các xác suất bắt gặp giá trị dấu hiệu x cùng với các đối tượngtương ứng của lớp 1 và lớp 2 (ví dụ lớp quặng và lớp không quặng) Khi sử dụngđối tượng chuẩn cho lớp 1 (lớp quặng) thì trong các biểu thức P2(x) được thay bằng1
x là vecto giá trị các dấu hiệu được sử dụng, x1, x2,…, xk (ví dụ các hàmlượng qu, qth, qk,…)
Khi các dấu hiệu x1, x2,…, xk được xem là không phụ thuộc nhau thì xác xuấtcủa đại lượng n chiều của tổ hợp n dấu hiệu được tính:
) ( )
( ).
( ).
( )
(x P x1 P x2 P x3 P x k
)()
()
()()
()
(
)()
()
()
2 2 2 1 2
1 2 1 1 1
k k
x P x P x P
x P x P x P x
) , 2 : 1 (
) , 2 : 1 ( ) , 2 : 1 ( ) , 2
n i
i
i x a R
i
k j
j i
b R
Trang 15trường hợp các dấu hiệu phụ thuộc nhau) Sau đó tính giá trị L(x), J(1:2,x) hoặc R1,
R2, phổ các giá trị này lên khắp diện tích khảo sát và biểu diễn chúng lên bản đồ.Đối sánh các giá trị này với các giá trị của đối tượng chuẩn có thể nhận biết vàkhoanh định được các diện tích đồng dạng với đối tượng chuẩn Các dấu hiệu đượclựa chọn thường là một tổ hợp nào đó trong số các tham số thu được
1.3.3 Các thuật toán nhận dạng không có mẫu chuẩn
a, Thuật toán kiểm chứng thống kê
Thuật toán này tiến hành phân loại trường khi các dấu hiệu trường hoàn toànđộc lập nhau Ban đầu người ta sử dụng bộ lọc để tách các dị thường ra khỏi phôngnhiễu cho từng dấu hiệu trường Kết quả lọc cho phép nhận được các số liệu trườngchủ yếu gồm các dị thường Tiếp theo phân loại các dị thường thành các lớp dịthường Mỗi lớp dị thường gồm các dị thường có các đặc trưng thống kê giốngnhau Để phân loại các dị thường đầu tiên người ta phân chia khu vực khảo sátthành các diện tích cơ sở, sau đó dựa vào kết quả phân chia cá giá trị trường ở mỗicửa sổ người ta dựng các đường cong biến phân đặc trưng cho cửa sổ đó Cuối cùng
để phân lớp các dị thường người ta sử dụng các chỉ tiêu χ2 để so sánh và xếp loạicác đường cong biến phân Các diện tích có ước lượng phân bố mật độ xác suấtgiống nhau được xếp vào một lớp
Giai đoạn cuối cùng của quá trình nhận dạng là giai đoạn thuật toán tiếnhành xác định số hiệu của lớp tổng hợp
Với mục đích này, dựa vào các đường cong biến phân đựng được cho từngdấu hiệu người ta xác định giá trị trung bình và phương sai rồi sắp xếp các giá trịtrung bình theo thứ tự tăng dần Sau đó người ta dựa vào chỉ tiêu xác suất hậunghiệm cực đại người ta quyết định xếp loại đối tượng khảo sát và các lớp khácnhau Bằng cách trên, toàn bộ khu vực khảo sát được phân thành một số diện tích cóhình dạng bất kỳ, ở đó dị thường của các dấu hiệu khác nhau đè lên nhau
b, Thuật toán K trung bình
Nội dung thuật toán như sau: Giả sử tồn tại n đối tượng, nhiệm vụ đặt ra làphân chia toàn bộ n đối tượng thành M lớp với M << n
Để giải quyết nhiệm vụ trên, lúc đầu người ta chọn hú hoạ từ n đối tượng ra
k đối tượng, k đối tượng được chọn này xem như các mẫu chuẩn xuất phát Tiếptheo là tiến hành chính xác hoá liên tiếp các mẫu chuẩn chọn được bằng cách sosánh các mẫu chuẩn với các đối tượng còn lại Sau mỗi lần chọn tập hợp các mẫu
Trang 16chuẩn Ev chọn được ở lần chọn thứ v sẽ thay cho các mẫu chuẩn ở lần chọn thứ v-1(lần trước đó).
Nếu ký hiệu tập hợp mẫu chuẩn (Ev) chọn được ở lần chọn thứ v là:
Sau quá trình hiệu chỉnh ở vòng 1, bằng phương pháp mô tả trên thuật toán
sẽ tiến hành hiệu chỉnh ở các lần tiếp theo, cho tới khi đối tượng cuối cùng được gọira
Sau khi tập hợp các mẫu chuẩn được chính xác hoá, thuật toán tiến hànhphân loại toàn bộ số lượng n các đối tượng theo tập hợp các dấu hiệu thành M lớpdựa vào nguyên tắc khoảng cách tối thiểu
1.3.4 Quyết định sự tồn tại của đối tượng và đánh giá chất lượng xử lý
Đối với thuật toán nhận dạng có mẫu chuẩn việc quyết định nghiệm chủ yếudựa vào chỉ số tương đồng Chỉ số này xác định mức độ giống nhau hoặc khác nhaugiữa đối tượng nghiên cứu với đối tượng chẩn theo lượng thông tin tổng hợp củatoàn bộ các dấu hiệu (trường địa vật lý quan sát)
Phụ thuộc vào từng loại thuật toán nhận dạng người ta chọn những đại lượngkhác nhau để đánh giá chỉ số tương đồng Đối với các thuật toán nhận dạng kiểmchứng thống kê thì chỉ số tương đồng chính là hệ số tương thích λ hay xác suất hậunghiệm P(Ak/Bj) Đối với các thuật toán loại này để quyết định nghiệm người ta đưa
ra các giá trị ngưỡng của hệ số tương thích và xác suất hậu nghiệm Giá trị của chỉ
số tương đồng sẽ được so sánh với giá trị ngưỡng này để quyết định đối tượngnghiên cứu giống hay không giống với mẫu
Chất lượng của kết quả xử lý được đánh giá dựa vào sai số nhận dạng các đốitượng kiểm chứng Các đối tượng kiểm chứng là các đối tượng mà bản chất địa chấtcủa chúng đã được xác định rõ, song chúng không được chọn là mẫu chuẩn để nhậndạng mà được dùng làm các đối tượng để kiểm tra các kết quả nhận dạng
Trang 17Sai số nhận dạng được tính bằng tỷ số các đối tượng kiểm chứng được nhậnđạng dúng so với tổng các đối tượng kiểm chứng được đem ra nhận dạng.
Đối với các thuật toán nhận dạng kiểm chứng thống kê người ta sử dụng xácsuất nhận dạng sai lầm để đánh giá chất lượng xử lý Xác suất này được xác địnhdựa vào việc tính tích phân hàm phân bố mật độ xác suất của hệ số tương thích λ.Các hàm này được xác định riêng cho các đối tượng kiểm chứng của từng lớp một
Trang 18CHƯƠNG 2: ỨNG DỤNG PHƯƠNG PHÁP TẦN SUẤT – NHẬN DẠNG TRONG XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ
2.1 Phương pháp phân tích tần suất
Phương pháp phân tích tần suất với việc sử dụng tần suất trung bình của sựxuất hiện đồng thời các dấu hiệu do Griffths -Vinni đưa ra tiến hành trên một loạiđối tượng mẫu có nội dung tóm tắt như sau:
Giả sử ta có đối tượng nghiên cứu với k loại dấu hiệu, mỗi dấu hiệu có n sốliệu đã biết Khi đó ta có ma trận thông tin các dấu hiệu của đối tượng mẫu như sau:
n
k k
d t j i
k là số các tính chất của ma trận thông tin
n là số lượng mẫu của mỗi loại thông tin
Mỗi phần tử ij của ma trận được biểu diễn bằng các khái niệm logic: “yes”hoặc “no” hoặc bằng các số 1 hoặc 0
Theo Griffths-Vinni, lượng thông tin tương đối của dấu hiệu thứ “i” đượcxác định theo công thức:
2
1 1
n h hj hi
% 100
1
* 1
m i i m
I I
Trang 19Tỷ trọng thông tin Pm là giá trị biểu hiện chất lượng của m tính chất lựa chọntrong k tính chất ban đầu Theo như thuật toán này khi ta lựa chọn trước một giá trị
tỷ trọng thông tin thì tương ứng ta có thể tính toán được m thông tin tương ứng.Như vậy thuật toán cho phép đánh giá chất lượng của từng loại thông tin và lựachọn tập hợp chủng loại thông tin có giá trị cao phục vụ các mục đích nghiên cứu
Trang 202.2 Phương pháp Tần suất - Nhận dạng
Lý thuyết của phương pháp phân tích tần suất ở trên là một cơ sở để lựa chọncác tính chất tốt một cách định lượng Như đã trình bày trong chương 1, tổ hợp sốliệu địa vật lý là tập hợp của các tính chất có chất lượng khác nhau Và khi ứngdụng phương pháp phân tích tần suất trong việc tìm một tổ hợp tính chất tốt phục vụ
mục tiêu nhận dạng đối tượng là hiệu quả và có tính định lượng Phương pháp Tần
suất – Nhận dạng là một phương pháp nhận dạng trong xử lý số liệu địa vật lý do PGS TS Võ Thanh Quỳnh đề xuất trên cơ sở ứng dụng phương pháp phân tích tần suất trong tổ hợp số liệu thống kê cũng như xây dựng thuật toán phân tích, đối sánh, xác định đối tượng đồng dạng (kết quả đề tài QG06.16).
Các nội dung của phương pháp tần suất nhận dạng gồm có 3 nội dung chínhsau:
- Xây dựng ma trận thông tin của đối tượng mẫu
- Đánh giá, lựa chọn tổ hợp thông tin
- Phân tích, đối sánh, xác định các đối tượng đồng dạng
2.2.1 Phương pháp xây dựng ma trận thông tin đối tượng mẫu
Đây là một nội dung rất quan trọng ảnh hưởng tới kết quả phân tích của thuậttoán Griffths –Vinni, trước hết cần có ma trận thông tin của đối tượng mẫu Ma trậnthông tin của đối tượng mẫu trong phương pháp phân tích tần suất được xây dựngnhư sau:
Từ tập hợp số liệu của các chủng loại thông tin của đối tượng mẫu xây dựngcác đường cong biến phân (đường cong mật độ phân bố) Từ các đường cong biếnphân xác định khoảng giá trị đặc trưng cho từng tham số Sau khi có được cáckhoảng giá trị đặc trưng, dùng nó làm “cửa sổ quét” để tạo ra các đơn vị thông tincho từng chủng loại thông tin của từng phần tử Đối với mỗi phần tử của mỗi chủngloại thông tin, nếu nó nằm trong khoảng giá trị đặc trưng sẽ nhận giá trị là 1, nằmngoài sẽ nhận giá trị là 0 Bằng cách này sẽ chuyển được một ma trận thông tin vớicác số liệu địa chất, địa vật lý bất kì về ma trận thông tin chuẩn theo yêu cầu củathuật toán với các phân tử là các giá trị 1 hoặc 0
2.2.2 Phương pháp đánh giá lựa chọn tổ hợp thông tin
Để tiến hành phân tích đối sánh, xác định các đối tượng đồng dạng, trước hếtcần đánh giá lựa chọn tổ hợp thông tin có chất lượng cao từ tập hợp tất cả các chủngloại thông tin có được về đối tượng nghiên cứu
Trang 21Nội dung này được thực hiện theo đúng phương pháp phân tích tần suất như
đã trình bày ở mục 2.1 Số lượng chủng loại thông tin m được lựa chọn tùy thuộcvào giá trị ngưỡng của Pm cho trước (ví dụ Pm 75%)
2.2.3 Phương pháp phân tích đối sánh xác định các đối tượng đồng dạng
Phân tích đối sánh, xác định đối tượng đồng dạng là nội dung chính của mộtthuật toán nhận dạng
Các đối tượng cần đối sánh với đối tượng mẫu để xem nó có đồng dạng vớiđối tượng mẫu hay không được thực hiện như sau:
- Xây dựng ma trận thông tin cho đối tượng đối sánh tương tự như đối vớiđối tượng mẫu thông qua các khoảng giá trị đặc trưng của chính đối tượng mẫu
- Tiến hành đánh giá tỷ trọng thông tin cho tất cả các tính chất của đối tượngđối sánh bằng phương pháp phân tích tần suất như trên
- Tính tỷ trọng thông tin của tổ hợp thông tin đã được lựa chọn của đối tượngmẫu cho đối tượng đối sánh Có thể xem giá trị này tương tự hệ số đồng dạng, ta gọi
nó là chỉ số đồng dạng, kí hiệu P*
m.Đối tượng đối sánh được xem là đồng dạng với đối tượng mẫu khi P*
m có giátrị đạt mức quy định nào đó Ví dụ P*
m 65%
Trang 222.3 Xây dựng phần mềm ứng dụng phương pháp Tần suất – Nhận dạng
Theo nội dung phương pháp phân tích tần suất nhận dạng được trình bày ởtrên tôi đã thành lập một phần mềm tự động xử lý số liệu tương ứng trên máy tính(phụ lục 1) Về nguyên tắc chương trình này có thể xử lý mọi tổ hợp số liệu phứctạp tương ứng như số liệu địa chất, địa vật lý, địa hoá…Các nội dung thực hiện tínhtoán của chương trình được trình bày trên sơ đồ khối như sau:
Hình 2.1: Sơ đồ khối chương trình xử lý số liệu
Từ số liệu đầu vào bao gồm: số liệu của đối tượng mẫu và số liệu của vùngnghiên cứu hoặc của các đối tượng cần đối sánh Chương trình sẽ tính toán với 2 nộidung chính là thực hiện tính toán trên đối tượng mẫu và từ các kết quả phân tích đốitượng mẫu tiến hành đối sánh hoặc phân vùng tuỳ thuộc vào dạng dữ liệu đầu vàocủa những đối tượng cần xác định
Phân tích, tính toán trên đối tượng mẫu:
Với thông tin đầu vào của đối tượng mẫu bao gồm toạ độ điểm và các chủngloại thông tin của đối tượng chương trình tiến hành xây dựng ma trận thông tin chođối tượng mẫu theo thuật toán trình bày trong mục 2.2.1
Trang 23Từ ma trận thông tin thành lập được tiến hành lựa chọn tổ hợp thông tin mớitrong tổ hợp thông tin ban đầu với các loại thông tin được lựa chọn có chất lượngcao Thuật toán lựa chọn tổ hợp thông tin được trình bày trong mục 2.2.2
Hình 2.2 : Dao diện chương trình xử lý số liệu
Tuỳ thộc vào mục tiêu xử lý số liệu chương trình có thể thực hiện với haitrường hợp khác nhau:
Trường hợp 1 – Đã biết đối tượng đối sánh:
Ở trường hợp này, các đối tượng là xác định, dữ liệu đầu vào là số liệu của tổhợp đối tượng cần đối sánh với đối tượng mẫu Đối với mỗi đối tượng chương trìnhtính toán với tổ hợp thông tin đã lựa chọn ở đối tượng mẫu (tổ hợp các thông tin cóchất lượng, đặc trưng cho đối tượng mẫu) các bước tiến hành cụ thể như sau:
- Bước 1: Xây dựng ma trận thông tin của đối tượng đối sánh với khoảng giátrị đặc trưng cho các tham số là khoảng giá trị đặc trưng của tham số đó tínhđược ở đối tượng mẫu
- Bước 2: Tính toán giá trị chỉ số đồng dạng P*m từ đó cho biết đối tượng đốisánh có đồng dạng với đối tượng mẫu hay không
Kết quả sau khi tính toán với trường hợp này bao gồm:
- Các khoảng giá trị đặc trưng cho từng tính chất của đối tượng mẫu
- Kết quả đánh giá và lựa chọn các chủng loại thông tin của đối tượng mẫu
- Danh sách các đối tượng đồng dạng với đối tượng mẫu và chỉ số đồng dạngtương ứng
Trường hợp 2 – Chưa biết đối tượng đối sánh
Từ số liệu của đối tượng mẫu và số liệu của toàn bộ diện tích cần nghiêncứu, yêu cầu trong trường hợp này là tiến hành khoanh vùng được các vùng đốitượng đồng dạng với đối tượng mẫu Trong trường hợp này số liệu mẫu được xử lý
Trang 24hoàn toàn tương tự như trường hợp 1 Việc xử lý số liệu đối với vùng nghiên cứuđược tiến hành như sau:
- Bước 1: Thành lập các diểm trên mạng lưới đều phủ kín toàn bộ diện tích
- Bước 2: Từ mỗi điểm trên mạng lưới thành lập được, lấy nó làm tâm dựngmột hình vuông cạnh a với a được lựa chọn sao cho phù hợp
- Bước 3: Coi mỗi hình vuông dựng được là một “đối tượng” đối sánh với sốliệu là toàn bộ các điểm số liệu của vùng nằm trong hình vông này Tiếnhành phân tích trên các “đối tượng” đối sánh như ở trường hợp 1 và nhậnđược giá trị P*
m của các “đối tượng” này
- Bước 4: Gán giá trị P*
m tìm được về điểm trung tâm của hình vuông (cácđiểm được thành lập ở bước 1)
Kết quả sau khi tính toán với trường hợp này bao gồm:
- Kết quả đánh giá và lựa chọn thông tin của đối tượng mẫu
- File dữ liệu P*
m trên mạng lưới đều
Từ file dữ liệu đầu ra (P*
m) ta có thể vẽ các bản đồ đồng mức bằng một sốphần mềm hỗ trợ thành lập bản đồ như MAPINFOR, Suffer for Win…
Dựa theo bản đồ này ta có thể xác định các đối tượng đồng dạng với đốitượng mẫu đã dùng đối sánh
Chương trình này được viết với ngôn ngữ lập trình C, mặc dù có những điểmyếu trong trình bày dao diện nhưng các hỗ trợ toán học cao giúp cho các bước tính
và số lượng phép tính được tối ưu khi lập trình
Trang 25CHƯƠNG 3: ÁP DỤNG KẾT QUẢ NGHIÊN CỨU PHÂN TÍCH DỮ LIỆU VÙNG ĐÔNG TUY HOÀ
3.1 Đặc điểm địa chất và địa vật lý vùng Đông Tuy Hoà
3.1.1 Đặc điểm địa lý, tự nhiên
Vị trí địa lý, địa hình
Khu vực nghiên cứu thuộc Trung Trung bộ gồm phần lớn thuộc địa phận tỉnhPhú Yên, được giới hạn từ 12o53’ – 13o21’ vĩ độ bắc và 108o53’ – 109o28’ kinh độđông với tổng diện tích gần 3500km2
bao gồm các huyện: Sơn Hoà, Tuy
Hoà, Sông Hinh (tỉnh Phú Yên),
Địa hình của khu vực chủ yếu là
đồng bằng và một phần nhỏ phía tây là
đồi núi thấp Phần lớn khu vực ven
biển Tuy Hoà đều khá phẳng và nông
với các bãi, doi cát trừ đoạn đèo Cả có
nhiều ngành đá, vũng vịnh nhỏ, nước
sâu Vùng cửa sông Đà Rằng thường bị
cát bồi không thuận lợi cho lưu thông
dòng chảy Phía trong bờ biển có các
đồng bằng hẹp phân bố không liên tục
dọc sông Ba
Khí hậu, Thuỷ văn
Khu vực nghiên cứu đặc trưng bởi điều kiện nhiệt phong phú Ở đây có đặctrưng của vùng khí hậu nhiệt đới ẩm gió mùa và chịu ảnh hưởng của đại dương Có
2 mùa rõ rệt: mùa mưa từ tháng 9 đến tháng 12 và mùa nắng từ tháng 1 đến tháng 8.nhiệt độ trung bình hàng năm khoảng 27oC, lượng mưa trung bình hàng năm đạt1600mm – 1700mm
Mạng lưới sông suối của khu vực tương đối dày nhưng do đặc điểm địa hìnhnên các sông thường ngắn và dốc các sông lớn thường bắt nguồn từ dãy trường sơn(sông Ba, sông Đà Nông, sông Krông H’Năng, sông Hinh…) Lớn nhất trong vùng
là sông Đà Rằng (sông Ba) đổ ra biển đông ở thị xã Tuy Hoà Chế độ thuỷ văn ởđây cũng hoàn toàn phụ thuộc theo mùa Vào mùa mưa lượng dòng chảy chiếm hơn80% tổng lượng dòng chảy năm Hơn nữa, do đặc trưng địa hình dốc nên vào mùa
Hình 3.1: Vị trí khu vực nghiên cứu
Trang 26mưa khả năng tập trung dòng chảy nhanh dẫn tới hiện tượng lũ ống, lũ quét thấtthường trong những năm gần đây các tai biến lũ và xói lở bờ sông gây thiệt hạinhiều về người và tài sản trong khu vực.
Dân cư, kinh tế, xã hội
Hầu hết dân số trong khu vực là người Kinh, có một phần nhỏ là người dântộc Êđê, Gia Lai, Chăm, Ba Na, Hrê, Hoa, Mnông sống tập trung ở vùng cao phíatây Dân cư tập trung chủ yếu ở các thành phố, thị xã, thị trấn ven biển, dọc theoquốc lộ 1A và các vùng ven sông
Kinh tế của khu vực đanh phát triển mạnh nhưng không đều chủ yếu tại cácthành phố và thị xã, người dân số chủ yếu bằng nông nghiệp, ngư nghiệp và tiểu thủcông nghiệp Do cấu tạo đường bờ của khu vực tạo ra nhiều vũng, vịnh, bãi triều,cửa sông ven biển nên hoạt động nuôi trồng thuỷ sản của vùng rất được chú trọngphất triển, hình thức chủ yếu là nuôi tôm bãi triều và lồng hình thành nên các vùngchuyên canh như khu vực xã Hoà Tân, vùng Cửa Bé – Vĩnh Trường, ven biểnhuyện Vạn Ninh
Khu vực nghiên cứu rất giàu có và đa dạng về tài nguyên khoáng sản nhưvàng, volfram, ilmenit, zircon, cát thuỷ tinh, nước khoáng, vật liệu xây dựng…trong
đó các loại khoáng sản có giá trị công nghiệp lớn như nước khoáng, ilmenit, zircon,diatomit (Phú Yên), cát thuỷ tinh, vật liệu xây dựng Hoạt động khai thác khoángsản phổ biến nhất trong khu vực là khai thác vật liệu xây dựng bao gồm đá xâydựng, sét để sản xuất gạch ngói, đặc biệt là khai thác vàng sa khoáng (300 nghìntấn) ở vùng Đá Bàn – Xuân Sơn
Giao thông vận tải
Ở khu vực phía tây quan trọng nhất là quốc lộ 14 Từ Buôn Mê Thuột điPleiku rồi qua Củng Sơn về Tuy Hoà, quốc lộ Trên 50 từ Chư Sê đến Tuy Hoà Ởphía đông có mạng lưới giao thông đường bộ tương đối phát triển bao gồm tuyếnđường sắt bắc nam và quốc lộ 1A Đây là mạng lưới giao thông chính trong vùng Ởcác bán đảo ven biển và vùng núi hệ thống giao thông kém phát triển
3.1.2 Đặc điểm địa chất và địa vật lý
Đặc điểm địa chất
Khu vực nằm sát rìa phía Nam – Đông Nam của đới Kon Tum và là một khốinâng bền vững trong suốt Paleozoi Tuy nhiên từ Paleozoi muộn đến đệ tứ, vùng bịcác hoạt động của quá trình hoạt hóa magma kiến tạo xảy ra mạnh mẽ đã phá vỡmóng kết tinh Phần lớn diện tích của vùng lộ ra các đá magma xâm nhập của các
Trang 27phức hệ khác nhau Một số diện tích bị phủ bởi các thành tạo trầm tích phun trào cótuổi Carbon – Permi, Triat trung, Kreta, Kainozoi Phần còn lại là các đá của móngkết tinh còn sót lại.
Các thể magma xâm nhập trong vùng nghiên cứu có biểu hiện vô cùngphong phú và đa dạng do các hoạt động hoạt hoá magma kiến tạo vô cùng mạnh mẽ
Đặc điểm kiến tạo
Vùng nghiên cứu chiếm phần rìa Nam – Đông Nam đới nâng Kon Tum Đớinâng này được giới hạn bởi các đứt gẫy sâu Hưng Nhượng – Tà Vi ở phía Bắc, TuyHoà – Oranh ở phía Nam Vùng bay bị phân cắt bởi 4 hệ thống đứt gẫy Đông Bắc –Tây Nam, Tây Bắc – Đông Nam, á kinh tuyến và á vĩ tuyến trong đó 2 hệ thống đầuphổ biến hơn Khu vực chia làm 2 phần: phần Tây Bắc đứt gẫy Tuy Hoà – Oranhphổ biến hệ thống đứt gẫy Tây Bắc; phần đông Nam đứt gẫy Tuy Hoà – Oranh phổbiến cả 2 hệ thống đứt gẫy Đông bắc và Tây Bắc