Khái niệm về công tác phân loại ảnh viễn thám Phân loại trong xử lý tư liệu viễn thám là gán các khoảng cấp độ xám nhất định thuộc một nhóm đối tượng nào đó có các tính chất tương đối đ
Trang 1Công nghệ viễn thám
Chương VI
kỹ thuật phân loại trong viễn thám
-
1 Khái niệm về công tác phân loại ảnh viễn thám
Phân loại trong xử lý tư liệu viễn thám là gán các khoảng cấp độ xám nhất định thuộc một nhóm đối tượng nào đó có các tính chất tương đối đồng nhất nhằm phân biệt các nhóm đó với nhau trong khuôn khổ ảnh cho trước Quá trình phân loại có thể được thực hiện theo phương pháp giải đoán bằng mắt hoặc nhờ sự trợ giúp của máy tính
Với phưong pháp giải đoán trực tiếp bằng mắt với sự tham gia của tri thức con người thì mức độ đầy đủ, độ chính xác của kết quả phụ thuộc rất nhiều vào khả năng của người giải đoán, hiệu quả kinh tế thấp và tốn kém nhiều về các chi phí điều tra ngoại nghiệp
Còn kỹ thuật phân loại nhờ sự trợ giúp của máy tính ngày càng được áp dụng trong thực tế với hai phương pháp cơ bản là phân loại có kiểm định và phân loại không kiểm định
Phương pháp phân loại có kiểm định là một hình thức kết hợp giữa giải
đoán nhờ sự trợ giúp của máy tính với kết quả điều tra thực địa Phương pháp này được ứng dụng phổ biến trên thế giới Độ chính xác của nó phụ thuộc vào diện tích, mật độ phân bố và độ chính xác của các mẫu chọn trên khu vực nghiên cứu
Phương pháp phân loại không kiểm định là một phương pháp chỉ sử dụng thuần túy thông tin ảnh, quá trình xử lý hoàn toàn ở trong phòng Đây là một phương pháp cho hiệu quả kinh tế cao nhưng độ tin cậy của thành quả thấp
Cơ sở để thực hiện bài toán phân loại ảnh viễn thám là đặc trưng phổ và
đặc trưng về cấu trúc của ảnh Và thực tế người ta thường thực hiện bài toán phân loại dựa trên đặc trưng phổ của ảnh đa phổ
2 Các trường hợp có thể xảy ra khi phân loại theo phổ
Như chúng ta đã biết các đặc trưng trên ảnh thuộc các đối tượng cùng loại trên mặt đất sẽ có phổ tương tự nên cần phải đưa về một điểm trong không gian phổ Tuy nhiên trong thực tế điều này sẽ không thể xảy ra và ta chỉ
có thể thu được sự phân bố các nhóm cùng tính chất theo phương thức xác
Trang 2suất thống kê nào đó Có thể xẩy ra ba trường hợp như ở hình 6.1a, hình 6.1b
và hình 6.1c
Hình 6.1a Trường hợp lý
tưởng
Hình 6.1b Trường hợp đặc thù
a Trường hợp lý tưởng
Các nhóm đồng tính chất khác nhau có thể được giữ trọn vẹn trong không gian phụ nhỏ nhất (trong một band riêng rẽ)
b Trường hợp đặc thù
Các nhóm đồng chất khác nhau có thể không được phân chia nguyên vẹn trong bất kỳ không gian phụ nào nhưng có thể thực hiện (phân chia được) trong không gian đa chiều
c Trường hợp tổng quát
Hoặc là trong không gian phụ
hoặc là trong không gian đa chiều
luôn tồn tại sự chồng phủ giữa hai
nhóm đồng chất khác nhau Vì tâm
các nhóm đồng tính chất có thể được
xác định và đường bao của các nhóm
có thể khó xác định với dạng đường
gạch chéo đã từng xuất hiện Nó sẽ
cho chúng ta các băng thực hiện phân
loại trên máy tính nhờ việc sử dụng
hàm suy đoán nào đó Hình 6.1c Trường hợp tổng quát
3 Quá trình phân loại
Quá trình phân loại ảnh viễn thám theo phổ có thể thực hiện theo các bước sau:
x2
x1
A
B
A
B
x2
x1
x2
x1
A
B
Trang 3Công nghệ viễn thám
a Định nghĩa các lớp
Các lớp phân loại cần được định nghĩa rõ ràng về mặt chỉ tiêu Các chỉ tiêu này cần được lựa chọn phụ thuộc vào đặc thù của tư liệu ảnh (hình 6.2)
b Lựa chọn các đặc tính
Các thuộc tính phổ hoặc cấu trúc cho phép tách biệt các lớp với nhau cần được tập hợp
c Chọn vùng mẫu
Các tệp mẫu được lựa chọn dựa trên kết quả của bước 1 và bước 2 Các
số liệu lấy được trên cơ sở tệp mẫu có ý nghĩa quyết định trong việc thành lập các chỉ tiêu phân loại hiện đang được sử dụng có thể có nhiều như: Phân loại hình hộp, phân loại theo khoảng cách ngắn nhất, phân loại theo xác suất cực
đại Ta có thể áp dụng nhiều phương pháp phân loại khác nhau trong khuôn khổ tệp mẫu và so sánh kết quả đạt được nhằm chọn ra phương pháp tối ưu nhất cho kết quả chính xác nhất
Từ vùng phân tích sẽ đưa ra các chỉ tiêu thống kê như sau:
- Giá trị trung bình
- Các cực trị: Xmin, Xmax
- Tính độ lệch chuẩn
- Lập ma trận phương sai - hiệp phương sai
d Tiến hành phân loại
Dựa vào các phương pháp đã lựa chọn và các chỉ tiêu đã thiết lập, các
A
A
B
B C
C
Giá trị của Pixel Phân loại
Chọn vùng mẫu
Hình 6.2 Định nghĩa lớp
Tư liệu gốc
Trang 4Pixel sẽ được phân loại tuần tự vào các lớp đã chọn
e Kiểm tra kết quả
Kiểm tra nhằm đánh giá độ chính xác và độ tin cậy Nếu kết quả kiểm tra không thỏa mãn thì ta cần phải thay đổi hoặc điều chỉnh các chỉ tiêu phân loại một cách phù hợp nhằm đạt kết quả tốt hơn
Đ.6.2 Lý thuyết BAYES
Lý thuyết Bayes là một trong những cơ sở lý thuyết cơ bản để xây dựng bài toán phân loại ảnh viễn thám Dưới đây sẽ trình bày một số vấn
đề cơ bản của lý thuyết này
Giả sử chúng ta đo một vài đặc trưng của cảnh quan (độ xám của các Pixel) và có thể chỉ ra Pixel nào thuộc về hai lớp Đây là mảng một chiều đối với việc phân loại hai lớp trong vùng đặc trưng của ảnh, nếu số lượng Pixel có khả năng đại diện cho từng lớp (hình 6.3a và hình 6.3b)
P(x/i)
Lớp 1
Lớp 2
Đặc trưng X
Hình 6.3a Cân bằng xác suất tiền nghiệm
Hình 6.3b Không cân bằng xác suất tiền nghiệm
P(x/i) P(i)
Lớp 1
Lớp 2
Đặc trưng X
P(1) = P(2) P(1) < P(2) P(1) > P(2)
Trang 5Công nghệ viễn thám
Chúng ta có thể tính toán Histogram xuất hiện quan hệ đặc trưng cho từng lớp và coi như xấp xỉ với hàm mật độ xác suất của các mẫu vô hạn mật
độ xác suất có điều kiện
P(x/1); P(x/2) này có diện tích đơn vị và mô tả xác suất của Pixel có giá trị đặc trưng X; chỉ ra các Pixel này sẽ thuộc về lớp 1 hoặc lớp 2 riêng biệt
Mỗi hàm mật độ xác suất có thể được tỷ lệ hóa nhờ xác suất tiên nghiệm
P(i) - có nghĩa là lớp i này xuất hiện ở vùng quan tâm của ảnh Tỷ lệ hàm xác suất P(x/i), P(i) này tương ứng với Pixel có giá trị xác suất X và ở lớp
i Trong viễn thám xác suất tiên nghiệm có thể được ước định từ các thông tin
về cảnh quan như quan sát vùng nghiên cứu, các bản đồ hiện trạng hoặc các số liệu lịch sử
Để tiến hành phân loại các Pixel, chúng ta cần biết xác suất về sau tức
là Pixel thuộc về lớp nào đã chọn có giá trị đặc trưng X
Xác suất P(i/x) có thể tính theo quy tắc Bayes
( ) ( ) ( ) ( )
x P
i P i x P x i
(6.1)
( ) ∑ ( ) ( )
=
= 2
1
/
i
i P i x P x
Quy tắc suy đoán được tạo thành theo xác suất về sau (6.1)
Pixel có giá trị X thuộc về lớp 1 nếu P(1/x) > P(2/x); tương tự:
Pixel thuộc về lớp 2 nếu P(2/x) > P(1/x)
Nếu P(x) giống cả hai lớp trong phương trình (6.1) sẽ không được xét
đến trong khi so sánh và ta có thể viết công thức:
Pixel thuộc về lớp 1 nếu P(x/1) P(1) > P(x/2) P(2)
Pixel thuộc về lớp 2 nếu P(x/2) P(2) > P(x/1) P(1)
Có trường hợp hai xác suất về sau bằng nhau, nghĩa là:
( ) (x P x)
hoặc P x( / 1) ( )P 1 = P x( / 2) ( )P 1
Việc phân loại không thể làm được từ các lớp xác suất
Điểm dừng của quá trình phải được sử dụng, như khi sử dụng sự phân
Trang 6loại các điểm lân cận Pixel phân loại trước đây hoặc chọn ngẫu nhiên hoặc thuộc lớp 1 hoặc lớp 2 Nó có thể được chỉ ra rằng công thức suy đoán Bayes giảm tối thiểu giá trị xác suất trung bình của sai số trong toàn bộ tập hợp dữ liệu đã phân loại nếu tất cả hàm xác suất mật độ phân loại là bình thường
Thực tế, độ tin cậy xác suất tiên nghiệm khó đạt được kết quả, vì thế nó
được thừa nhận như nhau Sự phân loại chính xác hơn có thể có nếu nó được
ước định chính xác từ dữ liệu bên ngoài
Công thức Bayes có thể được viết lại từ đầu như sau:
Pixel thuộc về lớp 1 nếu D1(x) > D2(x) Pixel thuộc về lớp 2 nếu D1(x) > D2(x) Di(x) được gọi là hàm biệt thức và:
( ) ( ) ( )
Trên hình 6.5 điểm giao nhau xD của hai hàm là điểm suy đoán ranh giới hoặc chia lớp
Về phía phải của ranh giới được ưu đãi cho lớp 2 và về phía trái của ranh giới được ưu đãi cho lớp 1 Đặt D1 bằng xác suất về sau, kết quả phân loại Bayes là tốt nhất, nhưng nó không chỉ chọn có cùng kết quả Hàm biệt
Hình 6.4 Dạng đơn giản nhất
D(x)
D2=P(x/2) P(2)
D1=P(x/1) P(1)
Đặc trưng X
Hình 6.5 Đặc tính chung
D(x)
D2(x)
D1(x)
Đặc trưng X
XD
Trang 7Công nghệ viễn thám
thức khác có thể nhận được, nếu lưu ý rằng việc suy đoán biên là như nhau nên sử dụng hàm đơn điệu của D Ví dụ:
D x i( ) =a P x i P i[ ( ) ( )/ ]+b (6.5) hoặc
( ) [ ( ) ( ) ]
Đây là hai hàm biệt thức hợp lý Nếu sự phân bố xác suất chuẩn, trong thực tế ta sử dụng:
i
⎣
⎢
⎢
⎤
⎦
⎥
⎥
1
2 2 πσ
μ
Hàm biệt thức tốt nhất cho lớp I là:
( ) [ ( ) ( ) ] [ ] ( ) ( ) ( ) ( )
i
1
2
2
2
Đây là dạng tính toán hiệu quả bởi vì số hạng cuối chỉ phụ thuộc vào x
và là hàm bậc đơn giản
Ranh giới giữa hai lớp được tính theo công thức:
( ) ( )
D x1 =D x2
Và giải cho x, điều này tương đương với:
( ) ( )
[ ] [ ( ) ( ) ]
ln P x/ 1 P 1 = ln P x/ 2 P 2 (6.9) ( ) ( ) ( ) ( )
P x/ 1 P 1 = P x/ 2 P 2 (6.10) Tổng số xác suất của sai số phân loại là phần đè lên nhau của hàm xác suất hậu nghiệm Tổng số sai số xác xuất bằng tổng của các xác suất mà phân loại không đúng của các lớp được phân ra Dễ dàng nhận thấy rằng việc loại
bỏ các phần chia về phía trái hay phía phải sẽ bao gồm cả vùng rộng hoặc của một lớp riêng biệt, do đó sẽ tăng tổng số sai số
Đ.6.3 Một số phương pháp phân loại đa phổ
1.Phân loại theo xác suất cực đại (Maximum Likehood lassifier)
Phân loại theo xác suất cực đại được sử dụng nhiều trong xử lý ảnh viễn thám, đây là phương pháp phân loại có kiểm định, mỗi Pixel được tính xác xuất thuộc vào một lớp nào đó và nó được gán vào lớp mà xác suất thuộc vào lớp đó là lớn nhất
Trang 8Biến số x là điểm tương ứng với giá trị đặc trưng của Pixel trên ảnh đen trắng một chiều, trở thành véc tơ x trong K thành phần tương ứng
Hình 6.6 thể hiện tập hợp độ xám các Pixel trên tập hợp ảnh đa phổ Hàm xác suất P(x/i) trở thành hàm đa biến và các lớp được chia ra bởi các
đường cong trong không gian hai chiều Các bề mặt trong mảng 3 chiều và các siêu bề mặt trong mảng k chiều xem như là kết quả của sự phân bố chuẩn Trong mảng một chiều, phân bố chuẩn theo phương trình (6.7) và yêu chỉ có 2 tham số, giá trị trung bình lớp μ, phương sai δ2 chỉ rõ hàm số đủ
Tương tự, chỉ có các thông số của sự phê chuẩn hai chiều M và ma trận phương sai - hiệp phương sai ∑ chỉ ra các thông số sự phân bố chuẩn mảng hai chiều, giá trị μ1 và μ2 là các giá trị trung bình của lớp giá trị phương sai δ11 và
δ22 là số hạng đường chéo của ma trận Thành phần chính của ma trận phương sai - hiệp phương sai còn có các phần tử là δ12 và δ21
( )
( )
σ12 1 μ1 2 μ2
1
1
i
i
N
ư
∑
=
(6.11)
X1(l) và x2(l) là hai giá trị đặc trưng mẫu l
Véc tơ trung bình:
M =⎡
⎣
⎢ ⎤
⎦
⎥
μ μ
1 2
Ma trận phương sai - hiệp phương sai:
=⎡
⎣
⎦
⎥
12 12
21 22
P(x/i) P(i)
Lớp 2 Lớp 1
PE(2/1)
Hình 6.6 Xác suất sai số P E cho phân loại theo xác suất cực đại
Trang 9Công nghệ viễn thám
Hệ số tương quan: ρ = δ12/(δ1δ2)1/2
=⎡
⎣
⎦
⎥
⎣
⎦
⎥
11 12
21 22
12 12
21 22
(6.12)
Nếu σ12i = σ21i thì ma trận phương sai - hiệp phương sai là đối xứng Tính chất này cũng đúng cho số chiều lớn hơn Cần chú ý rằng vì nguyên tố
đường chéo là khác nhau của những sự phân bố theo những chiều khác nhau
σ11i = σ1i2 nó sẽ luôn dương và chỉ không dương nếu nguyên tố nằm ngoài đường chéo
ý nghĩa của số hạng nằm ngoài đường chéo của ma trận phương sai - hiệp phương sai được đánh giá theo sự xác định hệ số tương quan giữa hai chiều như:
σ σ
11 22
1 2
i
i
=
Trong dạng chuẩn hóa này ƒ12i chỉ có giá trị giữa dấu trừ và dấu cộng Hình dáng của sự phân bố hai chiều bình thường cho các giá trị khác nhau của
ρ12i được chỉ ra ở hình 6.6
Chú ý rằng, giá trị của ƒ12i gần với dấu cộng hoặc dấu trừ bao gồm sự phụ thuộc tuyến tính chắc chắn trong dữ liệu hai chiều Vì vậy nếu ρ12i ≈ 0 thì
sự phụ thuộc giữa hai chiều là rất ít
Dạng tổng quát đa biến cho sự phân bố chuẩn K chiều thường được mô tả:
( )
P x i
i
T
⎡
⎣⎢
⎤
⎦⎥
ư
1 2
1 2
1
Trong đó: x : Là véc tơ ảnh
Mi : Véc tơ trung bình của lớp i
∑I : Ma trận phương sai - hiệp phương sai
∑I-1
: Ma trận nghịch đảo
|∑i| : Định thức của ma trận phương sai - hiệp phương sai
k : Số kênh phổ Hàm biệt thức tốt nhất Bayes k chiều:
D x i = ⎡P i ưk ư i ư X ư M i T i X ư M i
⎣⎢
⎤
⎦⎥
ư
1 2
1 2
1
Trang 10Hàm số biệt thức Bayes tốt nhất trong mảng k chiều được biểu diễn theo biểu thức (6.15) là phương trình của phương pháp phân loại theo xác suất cực
đại Bốn số hạng trong phương trình này tương tự như trong phương trình (6.8) Phương trình (6.15) là cơ sở toán học của phương pháp phân loại theo xác suất cực đại, dạng của nó phụ thuộc vào mối quan hệ giữa các trị trung bình và các ma trận phương sai - hiệp phương sai của các lớp khác nhau
2.Phân loại theo khoảng cách ngắn nhất (K-Nearest neghbour Classifier)
Phân loại theo khoảng cách ngắn nhất được sử dụng để phân loại các
đối tượng trong không gian phổ đa chiều Khoảng cách giữa các Pixel được sử dụng như thước đo đánh giá sự thuộc về một lớp nào đó của Pixel đang khảo sát
Với thuật toán này, mỗi giá trị Pixel ẩn số của véc tơ đặc trưng X sẽ
được phân về lớp có giá trị véc tơ trung bình Mi gần với X Thêm vào đó, sự xuất hiện trực quan rõ ràng, tính toán đơn giản của sự tiếp cận này, nếu chúng
ta giả sử rằng ma trận phương sai - hiệp phương sai của tất cả các lớp là bằng nhau
Và xác suất tiên nghiệm bằng nhau:
Hàm biệt thức (6.17) sẽ là:
D x i( ) = ưA 1(X ưM i)T ư (X ư M i)
1
ở đây hằng số A là:
A= ln[ ]P0 ư kln( )ư ln[ ]0
1 2
Và ta có thể bỏ đi sự so sánh của Di cho các lớp khác nhau và đại lượng dmi được tính tính:
dM i = ư1(X ưM i)T ư (X ư M i)
1
Khoảng cách này là khoảng cách Mahalanobis
Khai triển của dạng phương trình này dẫn đến phương trình bậc hai của X Dạng bậc hai này là dạng độc lập của i và vì vậy nó có thể được liên hợp với A
Trang 11Công nghệ viễn thám
Nếu các ma trận phương sai - hiệp phương sai được nén về dạng đường chéo, nghĩa là các đặc trưng không tương đương, khi đó:
Σi = ⎡
⎣
⎦
⎥
σ σ 0 2
0 2
0
Và:
T
i
Đại lượng (X - Mi)T.(X - Mi) là vô hướng của tổng các số hạng bình phương:
d22i = XưM i T XưM i = X1ưX1i 2+ X2ưX2i 2+ X K ưM ki 2 (6.23)
Đây là công thức bình phương khoảng cách ơcơlit giữa véc tơ X
và Mi
Công thức (6.23) biểu diễn hàm biệt thức của phương pháp phân loại theo nguyên lý khoảng cách tối thiểu
Di(x) sẽ lớn nhất đối với lớp i khi khoảng cách d2i là nhỏ nhất trong lớp này, nghĩa là lớp này có giá trị trung bình gần nhất Một cách sử dụng khác của khoảng cách này là khoảng cách “City Block” khoảng cách này được xác
định:
d1i = X1ư M1i + X2 ư M2i + + X K ư M ki (6.24)
⏐X1-μ1⏐
x2
d1 = ⏐X1-μ1⏐+⏐X2-μ2⏐
d2 = [(X1-μ1)2 +(X2-μ2)2]1/2
M
⏐X2-μ2⏐
d2 X
x1
Hình 6.7 Khoảng cách “City Block” (d 1 ) Khoảng cách "ơcơlít" trong mảng 2 chiều
Trang 12Để mô tả sự khác nhau về suy đoán các đường biên bằng hai phương thức: Khoảng cách tối thiểu và khoảng cách “City Block” với việc đo khoảng cách d1 và d2 theo tập hợp của 3 phân bố chuẩn trong mảng 2 chiều như hình 6.7
Hàm mật độ xác suất có giá trị trung bình khác nhau và khác nhau các giá trị ngoài đường chéo của ma trận phương sai - hiệp phương sai nhưng xác suất tiên nghiệm lại bằng nhau Ranh giới suy đoán từ các thuật toán khác nhau được nêu ra ở hình (6.8)
Từ đó ta có một số nhận xét sau :
1- Phương pháp phân loại theo xác suất cực đại và khoảng cách ngắn nhất suy đoán ranh giới là hoàn toàn khác nhau Chúng có thể được nhận ra nếu các điều kiện đầu (6.23) hoàn toàn thỏa mãn
2- Thuật toán khoảng cách ngắn nhất có những ranh giới suy đoán khác nhau với hai hàm khoảng cách d1 và d2
Khi sử dụng khoảng cách d1, các đường ranh giới có dạng tuyến tính từng phần và xấp xỉ với ranh giới tuyến tính khi sử dụng khoảng cách d2
3- Vùng tách rời được chia ra cho 2 lớp Trong trường hợp khoảng cách ngắn nhất chỉ ra rằng xác suất cho lớp 2 là lớn hơn trong vùng, nó chỉ ra
sự cần thiết đối với ranh giới, loại bỏ đi sự phân loại không hợp lý của nguyên tắc chung, nghĩa là các véc tơ đặc trưng của các Pixel khác xa với bất kỳ véc tơ trung bình của lớp xác định
Tóm lại, phương pháp khoảng cách ngắn nhất đưa đến thuật toán đơn giản có thể được lập trình hóa có kết quả, đặc biệt khi sử dụng khoảng cách d1
Hình 6.8 Ranh giới cho 3 lớp, tập hợp hai chiều
b/ Thuật toán xác suất cực đại a/ Thuật toán khoảng cách tối thiểu
d1
Lớp 3 Lớp 1
Lớp 2
x2
x1
d2
Lớp 2
Lớp 3 Lớp 1
Lớp 2