Có rất nhiều phương pháp, thuật toán để giải quyết vấn đề lọc nhiễu, tuy nhiên lọc số liệu dựa trên giả thuyết về tính ngẫu nhiên của dữ liệu quan sát tức là dựa trên các giả thuyết
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-Nguyễn Khắc Điền
LỌC NHIỄU CÁC BĂNG ĐI ̣A CHẤNBẰNG
PHƯƠNG PHÁP THỐNG KÊ
Chuyên ngành: Vật lý Đi ̣a cầu
Mã số: 60 44 15
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS Nguyễn Đức Vinh
Hà Nội - 2011
Trang 2MỤC LỤC
Mở đầu 1
Chương 1 : MỘT SỐ KHÁI NIỆM THỐNG KÊ SỬ DỤNG TRONG XỬ LÝ
SỐ LIỆU ĐỊA VẬT LÝ 3
1.1 Đại lượng ngẫu nhiên, hàm ngẫu nhiên 3
1.2 Hàm tự tương quan và tương quan tương hỗ 4
1.3 Cơ sở của phương pháp lọc số liệu địa vật lý dựa trên lý thuyết sác xuất thống kê 8
Chương 2 MỘT SỐ PHƯƠNG PHÁPLỌC NHIỄU BĂNG ĐỊA CHẤN 12
2.1 Phương pháp tương quan tín hiệu giữa các tuyến 12
2.2 Phương pháp sác xuất ngược 14
2.3 Các bước xử lí theo phương pháp tương quan tín hiệu giữa các tuyến 15
2.4 Làm trơn hướng cộng 17
2.5 Phương pháp giải quyết vấn đề trong luận văn 19
Chương 3 MỘT SỐ THỬ NGHIỆM TRÊN SỐ LIỆU MÔ HÌNH 21
3.1 Mô hình 21
3.2 Thử nghiệm phương pháp tương quan tín hiệu giữa các tuyến 22
3.3 Thử nghiệm phương pháp sác xuất ngược 32
Kết luận
Tài liệu tham khảo
Trang 32
MỞ ĐẦU
Thăm dò đi ̣a chấ n là mô ̣t trong những phương pháp chủ đa ̣o trong thăm dò địa vật lý Đây là phương pháp cho đô ̣ tin câ ̣y cao , rất hiê ̣u quả trong viê ̣c xác định cấu trúc địa chất có dạng phân lớp Tuy nhiên, do ảnh hưởng của nhiều nguyên nhân khác nhau, băng đi ̣a chấn thu được luôn bi ̣ ảnh hưởng của các loại nhiễu Vì vậy xử lý số liệu là mảng công việc rất quan trọng trong thực nghiệm nói chung và trong thực nghiệm vật lý nói riêng Số liệu quan sát thông thường không chỉ chứa tín hiệu cần quan tâm mà còn chứa nhiều thành phần khác ví dụ như nhiễu ngẫu nhiên Điều này làm phức tạp rất nhiều khả năng nhận biết tín hiệu cần quan tâm Chính vì vậy, một trong những khâu quan trọng của xử lý số liệu là tách tín hiệu trên phông nhiễu hay còn gọi là lọc nhiễu
Có rất nhiều phương pháp, thuật toán để giải quyết vấn đề lọc nhiễu, tuy nhiên lọc số liệu dựa trên giả thuyết về tính ngẫu nhiên của dữ liệu quan sát tức là dựa trên các giả thuyết thống kê được quan tâm nhiều hơn cả Trong số rất nhiều các phương pháp lọc trên cơ sở thống kê thì phương pháp được gọi
là tương quan tín hiệu giữa các tuyến được coi là khá đơn giản và cho hiệu quả khá tốt trong trường hợp tín hiệu có ích được ghi nhận trên nhiều tuyến quan sát ví dụ các dị thường trọng lực, từ với các vật thể hai chiều nằm ngang Các băng địa chấn cũng là đối tượng thích hợp của phương pháp tương quan tín hiệu giữa các tuyến (mạch địa chấn) vì các trục đồng pha (biểu đò thời khoảng) nằm trên các mạnh ghi
Trang 4
3
Được sự động viên của thầy giáo hướng dẫn, chúng tôi đã mạnh dạn tìm hiểu phương pháp và tiến hành thử nghiêm khả năng cũng như hiệu quả của phương pháp Do thời gian và trình độ còn hạn chế nên việc tìm hiểu một vấn
đề mới là rất khó khăn Tuy nhiên, kết quả bước đầu cho thấy khả năng lọc nhiễu của phương pháp là khá tốt, với các cố gắng tiếp theo để hoàn chỉnh phương pháp có thể đó sẽ là một công cụ mạnh trong việc lọc số liệu
Thực hiện khóa luận này, nhiệm vụ chính của sinh viên là tìm hiểu về cơ
sở lý thuyết của phương pháp, xây dựng chương trình, lựa chọn mô hình để thử nghiệm thuật toán
Luận văn được chia làm 3 chương:
Chương 1: MỘT SỐ KHÁI NIỆM THỐNG KÊ SỬ DỤNG TRONG XỬ LÝ
SỐ LIỆU ĐỊA VẬT LÝ
Chương 2: MỘT SỐ PHƯƠNG PHÁP LỌC NHIỄU BĂNG ĐỊA CHẤN
Chương 3: MỘT SỐ THỬ NGHIỆM TRÊN SỐ LIỆU MÔ HÌNH
Trang 54
CHƯƠNG 1
MỘT SỐ KHÁI NIỆM THỐNG KÊ
SỬ DỤNG TRONG XỬ LÝ SỐ LIỆU ĐỊA VẬT LÝ
1.1 Đại lượng ngẫu nhiên, hàm ngẫu nhiên
Đại lượng ngẫu nhiên
Khái niệm này so với khái niệm biến cố ngẫu nhiên nó là biểu hiện biến cố được ghi nhận dưới dạng số Đại lượng ngẫu nhiên là đại lượng thu được trong kết quả thực nghiệm, trong địa vật lý đó là giá trị quan sát các trường địa vật lý
Quá trình ngẫu nhiên
Quá trình ngẫu nhiên hay hàm ngẫu nhiên (ví dụ ký hiệu là F(x) hoặc F(t) )
là hàm mà các giá trị của nó có được trong quá trình thực nghiệm Quá trình ngẫu nhiên được gọi là quá trình ergodic nếu giá trị trung bình trong khoảng quan sát đủ lớn tương đương giá trị trung bình trong suốt khoảng quan sát Nói một cách khác, quá trình ngẫu nhiên được gọi là ergodic nếu các đặc
trưng thống kê của nó có thể suy ra được từ một chuỗi các mẫu đủ dài của nó
Quá trình ngẫu nhiên dừng là quá trình ngẫu nhiên mà các đặc trưng của nó không thay đổi theo thời gian [1] Lý thuyết thống kê phát triển các tính toán trên cơ sở giả thiết dữ liệu có tính dừng và tính ergodic Hàm ngẫu nhiên có thể liên tục hoặc rời rạc, với việc sử dụng máy tính các đại lượng liên tục được chuyển sang rời rạc Hiểu một cách đơn giản, hàm ngẫu nhiên là tập hợp của các giá trị ngẫu nhiên Hàm ngẫu nhiên trong địa vật lý là các quan sát trường địa vật lý hoặc theo thời gian hoặc theo khoảng cách, độ sâu
Phương sai, độ lệch chuẩn
Phương sai thường được ký hiệu là s2 được định nghĩa bởi công thức [4 ]:
Trang 6Mô hình số liệu địa vật lý
Trong địa vật lý, việc quan sát ghi nhận giá trị một trường địa vật lý tại điểm (hay thời điểm) x sẽ thu được một tổng bao gồm dị thường a(x) hay
a(x) và phần làm cho dị thường kia bị méo đi gọi là nhiễu n(x) hay n(x)
về mặt toán học, số liệu đo có thể viết:
(1.4) Cũng cần phải chú ý rằng khái niệm dị thường (hay tín hiệu) trong quan sát các trường địa vật lý chỉ là tương đối Trong từng trường hợp cụ thể quan niệm này thay đổi Các chuyên gia [4] coi phần trường chênh lệch so với phần trường bình thường thì là dị thường Trường bình thường phải hiểu trong hai trường hợp khác nhau: Trường nhân tạo và trường tự nhiên Loại nhân tạo, ví dụ như trong thăm dò điện, trường bình thường là trường gây ra bởi nguồn phát xác định trong môi trường đồng nhất Với loại trường nguồn gốc tự nhiên thông thường được tính bằng các biểu thức giải tích Nhìn chung, phần trường có ích, cần phát hiện, nghiên cứu được coi là dị thường (tín hiệu), phần còn lại làm méo mó phần kia gọi là nhiễu Ví dụ trong thăm dò từ, trọng lực có lúc ta quan tâm phần khu vực, có lúc ta khai thác phần địa phương
1.2 Hàm tự tương quan và tương quan tương hỗ
Trang 87
Hình 1.1 Ví dụ hàm fi và hàm tự tương quan R(m) tương ứng
Trong ví dụ trên, fi là giá trị trường địa vật lý tại điểm đo thứ i (trên tuyến, trên mạch địa chấn ), i=1 n, n- số điểm đo trên tuyến (kênh), m- bước xê dịch, m=0, , 2, 3, M (M<<n) Hàm R(m) là hàm chẵn R(m)=R(-m), vì thế khi tính chỉ cần tính với m 0 Giả sử f =0, ta có hàm R(m) cho các trường hợp m=0, 1, 2 tương ứng như sau:
Hàm tương quan tương hỗ
Trang 9(1.11)
Ví dụ, trong trường hợp m=0 ta có:
(1.12) Trong trường hợp m= 1 và -1 sẽ có:
(1.13) Với mô hình số liệu địa vật lý như (1.4) ta có hàm tương quan tương hỗ (1.11) như sau [4]:
(1.14)
Ta thấy rằng, trừ tổng đầu tiên, các tổng khác bằng không, tất nhiên, đây là trường hợp tín hiệu và nhiễu giữa hai tập số liệu là độc lập và không tương quan Như vậy, hàm tương quan tương hỗ cho phép đánh giá mối liên kết giữa tín hiệu nằm ở hai tập số liệu (hai tuyến hoặc hai kênh)
Trang 109
Hình 1.2 Ví dụ số liệu và các hàm B(m) tương ứng
Hình 1.2 là một số mảng số liệu quan sát trường địa vật lý trên một số khu vực khác nhau (a,b,c) [4] Theo dõi ví dụ trên hình 1.2 ta thấy hàm tương quan tương hỗ đánh giá rất tốt đường phương của dị thường, trường hợp có một dị thường và hướng không đổi hàm B(m) có một cực đại ( hình 1.2 a) Trường hợp dị thường đổi phương hoặc nhiều dị thường có phương khác nhau hàm B(m) có nhiều cực đại (hình 1.2 b) Trên hình 1.2c ta còn thấy khả năng đánh giá sự xe dịch đường phương của di thường (có thể do đứt gãy)
Ta thấy hàm tương quan tương hỗ giữa hai tuyến giữa (hình 1.2c) có cực đại lệch hẳn về phía bên phải trục m
1.3 Cơ sở của phương pháp lọc số liệu địa vật lý dựa trên lý thuyết sác xuất thống kê
Trang 11- Giả thuyết về sự vắng mặt tín hiệu, nghĩa là khi trường quan sát fi = ni
Giả thuyết này ký hiệu là H0
Sở dĩ có điều này vì các nhà nghiên cứu chia không gian khảo sát thành hai phần gọi là S1 và S2 Phần không gian S1 bao gồm tập hợp các điểm có mặt
dị thường, phần này tương ứng H1 Tương tự, S2 bao gồm các điểm không chưa dị thường và tương ứng H0
Giả sử sác xuất tiên nghiệm (trước khi thu thập số liệu) có tín hiệu và không có tín hiệu lần lượt là P1, P2 Trong trường hợp như vậy thì sác xuất hậu nghiệm tồn tại tín hiệu (sau khi thu thập số liệu) tính theo công thức [4]:
= P(F/H1) / P(F/H0) (1.17)
Trang 1211
Trên cơ sở (1.17), biểu thức (1.16 ) sẽ là [4]:
P(F/H1)= / ( +1) (1.18)
Theo định nghĩa sác xuất, với m quan sát và giả thiết nhiễu không liên kết
và có phân bố chuẩn n(0, 2
) ta có [4]:
P(F/H0) = P(f1/H0) P(f2/H0) P(fm/H0) =
(1.19) P(F/H1) = P(f1/H1) P(f2/H2) P(fm/H2) =
Trang 1312
Kết luận chương 1:
Lý thuyết thống kê là hệ thống công cụ mạnh, được áp dụng rất hiệu quả trong nhiều lĩnh vực, ví dụ trong xử lý phân tích số liệu kinh tế, tài chính Trong lĩnh vực xử lý só liệu địa chất - địa vật lý, cùng với sự phát triển của
hệ thống tính toán, hệ thống công cụ này hiện nay cũng được sử dụng nhiều
và cũng cho các kết quả khả quan [4] Điểm chính trong việc áp dụng lý thuyết này là quan niệm về mô hình toán của số liệu quan sát, ý nghĩa của các hàm tương quan và cơ sở chấp nhận nghiệm thống kê
Trang 1413
CHƯƠNG 2
MỘT SỐ PHƯƠNG PHÁP LỌC NHIỄU BĂNG ĐỊA CHẤN
2.1 Phương pháp tương quan tín hiệu giữa các tuyến
Trong công tác địa vật lý thăm dò người ta thường tiến hành khảo sát theo từng đường trên diện tích khu vực cần khảo sát Các đường đó trong chuyên môn gọi là các tuyến Các tuyến này thường song song hoặc gần song song với nhau Bằng các thông tin tiên nghiệm về vùng khảo sát người ta thường
bố trí sao cho các tuyến cắt qua đối tượng địa chất cần khảo sát Có một số tuyến có thể vuông góc hoặc gần vuông góc với các tuyến song song kia làm nhiệm vụ kiểm tra hoặc liên kết Trong trường hợp địa hình phức tạp, khi không hình thành được mạng lưới tuyến rõ ràng ta vẫn có thể nội suy để đưa
về mạng lưới ô vuông hoặc chữ nhật Với các băng địa chấn thì coi như mỗi mạch (kênh ghi) là một tuyến Về mặt thống kê, thông tin từ đối tượng địa chất cần khảo sát có mặt trên nhiều tuyến theo một đường cong hoặc thẳng đó là một thuận lợi lớn vì nhiễu ngẫu nhiên không hề xuất hiện như vậy Phương pháp tương quan tín hiệu giữa các tuyến chính là tận dụng thuận lợi vừa nói trên, người ta cộng đồng pha tín hiệu có ích để nó được tăng lên trong khi nhiễu ngẫu nhiên không được cộng đồng pha sẽ bị giảm đi
Nếu đưa chỉ số j để xác nhận sự xê dịch của tín hiệu dọc theo tuyến quan sát và chỉ số p để xác nhận sự xê dịch giữa tuyến nọ và tuyến kia thì công thức (1.18) trong trường hợp bài toán hai chiều có thể nhận dạng sau:
Trang 1514
Trong biểu thức trên, thành phần đầu tiên là tỉ số năng lượng tín hiệu trên nhiễu trong cửa sổ Nm điểm tham gia cộng Thành phần thứ hai chính là tích chập giữa số liệu quan sát và tín hiệu có ích cần tách Tuy nhiên, giả sử chúng ta chưa biết hình dạng tín hiệu ra sao Bây giờ, ta thử tách thành phần thứ hai này và gọi nó là :
tỉ số tín hiệu trên nhiễu sẽ được tăng N lần Tất nhiên, điều đó chỉ đạt được khi tổng được thực hiện theo hướng tương quan nghĩa là theo đúng đường phương của tín hiệu
Để đánh giá đường phương của tín hiệu (hướng cộng) thì ta có thể tính hàm tương quan tương hỗ giữa các tuyến kề nhau Độ xê dịch này sẽ được xác định theo hoành độ giá trị cực đại dương của hàm tương quan tương hỗ Cực trị này cho ta biết sự tương quan cực đại của tín hiệu theo hướng ta tính
Trang 1615
Với tín hiệu có hình dạng thay đổi đáng kể trong khuôn khổ diện tích quan sát thì việc tính tổng (2.3) nên tiến hành với giá trị N không quá (3, 5, 7)[ 4 ] với bước nhảy là một tuyến Cách làm này cho phép ta nghiên cứu kỹ các đặc điểm thay đổi của tín hiệu về dạng theo diện
Trường hợp tín hiệu có các hướng khác nhau thì hàm tương quan tương
hỗ có các giá trị cực đại ở nhiều bước xê dịch khác nhau, khi đó việc cộng sẽ phải tiến hành theo từng hướng một và chúng ta có thể phân chia tín hiệu theo các hướng khác nhau
Việc tính tổng (2.3) là đơn giản nhưng qui trình thực hiện thuật toán phương pháp tương quan tín hiệu giữa các tuyến lại khá phức tạp Trong khuôn khổ luận văn này, công sức chủ yếu được tập trung vào các công việc đó, điều này được trình bày trong các mục 2.3, 2.4, 2.5 dưới đây
2.2 Phương pháp sác xuất ngược
Trong thực tế, ở mức độ nào đó chúng ta có thể có được thông tin về tín hiệu cần nhận biết Ví dụ, có thể dựa vào thực nghiệm ở gần khu vực quan sát hoặc dựa vào hình dạng xung thu được trên băng địa chấn Như vậy, giả sử ta biết hình dạng, biên độ tương đối và chiều dài tín hiệu, điều chưa biết là vị trí của nó Trong trường hợp này ta có thể tính hệ số hợp lý và sau đó tính được sác xuất có mặt dị thường Để tính ta sử dụng công thức (1.21), còn sác xuất P(F/H1) ta tính theo công thức (1.18) Xem xét công thức (1.21) để tính ta thấy thành phần thứ nhất là ½ tỉ số năng lượng tín hiệu/nhiễu và nó không thay đổi với mọi vị trí j trên tuyến quan sát Thành phần thứ hai của biểu thức tính chính là bộ lọc theo tiêu chuẩn cực đại tín hiệu/nhiễu, hàm trọng số ở đây chính là si/σ2 NHư vậy, với thuật toán này, sau khi xác định
Pj(F/H1) cho các điểm j trên tuyến, giả thuyết H1 được chấp nhận trong các trường hợp Pj(F/H1)>0.5
Trang 1716
Dạng và chiều dài tín hiệu có thể chọn căn cứ vào quan niệm lý thuyết về tín hiệu (dị thường), ví dụ trong thăm dò từ, trọng lực ta có thể giải bài toán thuận cho vật thể dự đoán Nếu việc ấy khó khả thi chúng ta có thể lấy tín hiệu trực tiếp trên số liệu quan sát, cũng có thể lấy từ điều kiện tương tự ở khu vực bên cạnh
Trong thăm dò địa vật lý, phương pháp xác định P(F/H1) nhằm phát hiện tín hiệu có ích trên phông nhiễu được gọi là phương pháp sác xuất ngược Việc tính biểu thức (1.21) có vẻ phức tạp hơn (2.3), tuy nhiên vì không phải tính thêm hàm tương quan tương hỗ và xác định hướng cộng đã làm cho công việc trở thành khá đơn giản Một số kết quả thử nghiệm sẽ được trình bày trong chương 3
2.3 Các bước xử lí theo phương pháp tương quan tín hiệu giữa các
tuyến
Như trên đã trình bày, việc xử lí tài liệu theo phương pháp tương quan tín hiệu giữa các tuyến là khá phức tạp, cần phải qua các bước sau:
a Loại trừ phông khu vực
b Tính hàm tương quan tương hỗ chuẩn hoá B ( l ) cho số liệu các đôi ch
tuyến lân cận Giá trị l cực đại để tính hàm tương quan tương hỗ cần phải
đáp ứng độ xê dịch cực đại có thể của tín hiệu từ tuyến nọ sang tuyến kia vì trong địa vật lý thăm dò thường sử dụng lưới ô vuông hoặc chữ nhật, nên giá
trị l thường lấy trong khoảng -15 < l < 15
c Để đánh giá độ xê dịch l theo cực trị của hàm tương quan tương hỗ và e
đánh giá phương sai ta dùng công thức:
l l
B nB
Trang 1817
Trong đó: n - là tổng số điểm theo tuyến
m - là chiều dài tín hiệu (tính theo số điểm đo )
Trong trường hợp cực trị hình răng cưa (cực trị răng cưa xảy ra đối với hàm tương quan tương hỗ khi các tín hiệu có ích chồng chất và gần nhau về đường phương), khi đó đánh giá giá trị l là khó khăn, vì vậy ta phải tính hàm e
tương quan tươ ng hỗ cho các số liệu cách một, hai tuyến
Cực trị hình răng cưa của nó về sự giao thoa của các tín hiệu gần đường phương với nhau Vì thế việc tính hàm tương quan tương hỗ có thể sẽ phải tiến hành với bước xê dịch hợp lý để tách từng tín hiệu [ 4]
d Chọn hướng cộng và đáy cộng
Như trên đã đề cập, hướng cộng ta sẽ lấy theo kết quả tính hàm tương quan tương hỗ Việc tính hàm tương quan tương hỗ chuẩn hoá cho phép đánh giá gần đúng tỷ số tín hiệu trên nhiễu theo công thức:
2 2
s
= 1 ( )( )
e ch e ch
l l
B B
Theo các chuyên gia [4 ], khi
2 2
s
> 1 và B ( ch l ) > 0.5 thì ta chọn N = e
3, trong trường hợp tín hiệu hẹp ta lấy N = 5
Khi B ch (l ) = 0.3 e 0.4 , N = 5 7 , số tuyến lớn hơn 9 thì bản thân tín hiệu đã có thể bị bóp méo
e Tìm tổng dạng (2.3) theo từng hướng cộng
Thí dụ : l = 2 x e hướng cộng được lấy bằng 2 và đáy cộng là N = 3 Tổng thu được sẽ gán cho tuyến giữa (trong trường hợp này ta cần chú ý rằng
sẽ có một phần thông tin bị mất, có thể là ở đầu tuyến hoặc cuối tuyến) Để đưa tỷ lệ cộng về tỷ lệ ban đầu cần phải chia kết quả cho N
Trang 1918
2.4 Làm trơn hướng cộng
Việc làm trơn hàm tương quan tương hỗ trước khi xác định hướng cộng chắc chắn sẽ không đảm bảo hết các yếu tố ngẫu nhiên ảnh hưởng đến hướng cộng thu được Trong khi đó việc quan sát Địa Vật lý theo nhiều tuyến và sự thay đổi không phức tạp hướng chuyển dịch của tín hiệu từ tuyến
nọ đến tuyến kia mở cho chúng ta một khả năng nâng cao hiệu quả công tác
xử lý, đó là việc làm trơn hướng cộng trước khi thực hiện việc cộng tín hiệu Trước hết chúng ta xem xét mối quan hệ giữa sự dịch chuyển của tín hiệu với sự thay đổi hướng cộng từ tuyến nọ sang tuyến kia Trong thực tế thăm dò Địa Vật lý, việc quan sát thường tiến hành theo mạng lưới chữ nhật
khoảng cách giữa các tuyến không đổi và bằng y khoảng cách giữa các
điểm đo theo tuyến cũng không đổi và bằng x
Thuật ngữ "hướng cộng" có liên quan đến việc xử lý tài liệu thăm dò địa chấn phương pháp thu chỉnh hướng Giả sử rằng: Ta thu được N mạch địa chấn Để xử lý chúng theo phương pháp này, ta tiến hành cộng tín hiệu theo các hướng AA, BB, CC, khác nhau Mặt khác, ta quy ước gọi hướng cắt ngang vông góc các mạch địa chấn (AA) là hướng 0, còn hướng khác là 1, 2, hay -1, -2, , các hướng này phụ thuộc vào vị trí tương đối của nó so với hướng AA