Hiện nay, trong kĩ thuật viễn thám có nhiều phương pháp phân loại ảnh, mỗi phương pháp đều có những ưu điểm và hạn chế nhất định. Tùy vào việc lựa chọn và sử dụng phương pháp phân loại mà kết quả phân loại là khác nhau. Do đó, việc nghiên cứuvà đánh giá kết quả phân loại của từng phương pháp là cần thiết nhằm lựa chọn phương pháp thích hợp cho từng dữ liệu ảnh nhất định. Mục tiêu của bài tiểu luận này là so sánh kết quả phân loại trên cùng dữ liệu mẫu để đánh giá các thuật toán phân loại của haiphương pháp sau: phương pháp phân loại gần đúng nhất (Maximum Likelihood Classifier – MLC) và khoảng cách ngắn nhất (Milimum Distance).
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA
SO SÁNH MỘT SỐ PHƯƠNG PHÁP PHÂN LOẠI ẢNH TRONG VIỄN THÁM
Môn: Xử lý ảnh số trong Viễn thám
Tp.HCM, ngày 5 tháng 06 năm 2013
Học viên thực hiện Huỳnh Thị Mai Đình
Mã số học viên 12103003
Trang 21 Đặt vấn đề 1
2 Dữ liệu và phương pháp thực hiện 2
2.1 Dữ liệu 2
2.2 Phương pháp và quy trình thực hiện 2
3 Khái quát về các phương pháp phân loại ảnh trong viễn thám 3
4 Nội dung thực hiện 3
4.1 Xác định các đối tượng phân loại 3
4.2 Giải đoán ảnh bằng mắt 4
4.3 Xử lý ảnh 4
4.4 Xây dựng bộ dữ liệu mẫu huấn luyện 6
4.5 Ước tính thống kê vùng mẫu 7
4.6 Phân loại ảnh 9
4.7 Đánh giá kết quả phân loại 11
5 Kết quả và thảo luận 13
Trang 31 Đặt vấn đề
Công nghệ viễn thám được sử dụng để cung cấp dữ liệu không gian cho nhiều ứng dụng trong thực tế và thường có thể được thực hiện với chi phí thấp hơn so với nhiều phương pháp truyền thống khác Ưu điểm nổi bật của công nghệ này thể hiện ở khả năng chiết tách thông tin của các đối tượng trên bề mặt đất theo diện rộng qua thời gian, thậm chí tại những nơi con người không thể tiếp cận được [3] Khả năng này được thực hiện thông qua việc giải đoán và phân loại ảnh viễn thám mà đặc biệt là ảnh được cung cấp từ các vệ tinh Ảnh sau khi được phân loại được ứng dụng trong nhiều lĩnh vực đặc biệt là trong lĩnh vực môi trường
Hiện nay, trong kĩ thuật viễn thám có nhiều phương pháp phân loại ảnh, mỗi phương pháp đều có những ưu điểm và hạn chế nhất định Tùy vào việc lựa chọn và sử dụng phương pháp phân loại mà kết quả phân loại là khác nhau Do đó, việc nghiên cứu
và đánh giá kết quả phân loại của từng phương pháp là cần thiết nhằm lựa chọn phương pháp thích hợp cho từng dữ liệu ảnh nhất định Mục tiêu của bài tiểu luận này là so sánh kết quả phân loại trên cùng dữ liệu mẫu để đánh giá các thuật toán phân loại của hai phương pháp sau: phương pháp phân loại gần đúng nhất (Maximum Likelihood Classifier – MLC) và khoảng cách ngắn nhất (Milimum Distance)
Trang 42 Dữ liệu và phương pháp thực hiện
2.1 Dữ liệu
Dữ liệu ảnh được sử dụng cho tiểu luận là ảnh Landsat TM 7 Ảnh đã được hiệu chỉnh hình học với hệ tọa độ WGS 84, vùng 48
Khu vực ảnh giải đoán ( tổ hợp màu 5,4,2)
2.2 Phương pháp và quy trình thực hiện
Phương pháp phân loại có giám định được thực hiện trong tiểu luận này Như đã trình bày trong phần mở đầu, đề tài chỉ thực hiện so sánh hai phương pháp: phương pháp phân loại gần đúng nhất (Maximum Likelihood Classifier – MLC) và khoảng cách ngắn nhất (Milimum Distance)
Về phương pháp chọn mẫu: Dữ liệu mẫu huấn luyện và mẫu kiểm tra sẽ được chọn theo phương pháp ngẫu nhiên Bên cạnh các phương pháp tăng cường chất lượng
ảnh,đề tài sử dụng công cụ Google Earth với ảnh vệ tinh có độ phân giải cao hơn ảnh
Landsat (30m) nhằm hỗ trợ cho việc giải đoán và chọn mẫu hiệu quả
Trang 5Quy trình giải đoán và phân loại ảnh như sau:
3 Khái quát về các phương pháp phân loại ảnh trong viễn thám
Kỹ thuật phân loại có giám định dùng thuật toán phân loại gần đúng nhất (MLC) là phương pháp được sử dụng khá phổ biến MLC được xây dựng trên cơ sở hàm mật độ xác xuất tuân theo luật phân bố chuẩn Theo đó, mỗi pixel sẽ được tính xác suất thuộc một loại nào đó và nó được chỉ định gán vào tên loại mà xác suất thuộc vào loại đó là lớn nhất
Phân loại khoảng cách ngắn nhất sử dụng khoảng cách không gian phổ từ pixel được xét đến vector đặc trưng của trung bình từng loại như chỉ số đánh giá xác định sự thuộc về một loại nào đó Các khoảng cách không gian phổ hay được sử dụng trong phương pháp này là khoảng cách Euclid; khoảng cách Euclid chuẩn hóa; khoảng cách Mahalanobis
4 Nội dung thực hiện
4.1 Xác định các đối tượng phân loại
Mục đích phân loại ảnh là thành lập bản đồ sử dụng đất, các loại cần được xác định trên bản đồ bao gồm:
Trang 6TT Loại đất
1 Đất trồng lúa giai đoạn 1
2 Đất trồng lúa giai đoạn 2
3 Đất trồng cây ăn quả
4 Đất nuôi trồng thủy sản
5 Đất rừng ngập mặn
6 Đất đô thị
7 Đất sông ngòi, kênh, rạch suối
4.2 Giải đoán ảnh bằng mắt
Giải đoán ảnh bằng mắt giúp cho việc nhận định thông tin về sự phân bố của các đối tượng trên ảnh một cách tổng quát trước khi đi vào phân tích và phân loại ảnh bằng các phương pháp được thực hiện tự động bằng máy tính Dựa vào sự hiển thị màu hay độ sáng, hình dạng, kích thước, cấu trúc… của từng đối tượng trên ảnh là các khóa giải đoán khi thực hiện giải đoán bằng mắt Trong đó, việc tổ hợp màu đóng vai trò quan trọng
Sự hiển thị màu của từng đối tượng trên ảnh là kết quả của sự phản xạ của bước sóng điện từ đối với bề mặt đất Tùy theo từng bước sóng với từng lớp phủ khác nhau trên
bề mặt đất mà kết quả hiển thị là khác nhau Nói cách khác, mỗi đối tượng trên bề mặt đất đều có đặc trưng về phổ riêng, mà ta có thể dựa vào đặc tính này để xác định các kênh phổ thích hợp tham gia tổ hợp màu nhằm phục vụ cho quá trình giải đoán bằng mắt hiệu quả
4.3 Xử lý ảnh
Có rất nhiều kỹ thuật để xử lý ảnh trước khi phân loại nhằm nâng cao chất lượng kết quả phân loại ảnh Trong đó, kỹ thuật phân tích thành phần chính (PCA) thường được thực hiện Đây là kỹ thuật được sử dụng để làm giảm số kênh phổ mà vẫn giữ lượng thông tin không bị thay đổi đáng kể Kỹ thuật phân tích thành phần chính áp dụng trong viễn thám trên cơ sở thực tế là ảnh chụp ở các kênh phổ gần nhau có sự tương quan phổ rất cao, vì vậy mà thông tin của chúng có phần trùng lắp rất lớn (ảnh đa phổ chứa nhiễu
Trang 7cũng như dư thừa thông tin) Nhờ vào ưu điểm này mà ta thường sử dụng kết quả ảnh sau khi thực hiện phân tích thành phần chính để tiến hành chọn mẫu và phân loại ảnh
Ma trận tương quan giữa các kênh phổ
Kênh 1 Kênh 2 Kênh 3 Kênh 4 Kênh 5 Kênh 7 Kênh 1 1 0.942403 0.900939 -0.32807 0.163119 0.357983 Kênh 2 0.942403 1 0.942913 -0.27066 0.226043 0.403178 Kênh 3 0.900939 0.942913 1 -0.30114 0.288703 0.483381 Kênh 4 -0.32807 -0.27066 -0.30114 1 0.677257 0.487048 Kênh 5 0.163119 0.226043 0.288703 0.677257 1 0.947248 Kênh 7 0.357983 0.403178 0.483381 0.487048 0.947248 1
Ma trận tương quan sau khi phân tích PCA
Kênh 1 Kênh 2 Kênh 3 Kênh 4 Kênh 5 Kênh 7
Ta thấy rằng, giá trị xung quanh đường chéo chính đều bằng 0, chứng tỏ không còn
sự tương quan giữa các kênh sau khi phân tích PCA
Nếu ảnh gốc có k kênh, thì sau khi biến đổi cũng sẽ nhận được k kênh, nhưng 3 thành phần đầu tiên chiếm hết 90% lượng thông tin chứa trong ảnh gốc, từ kênh thứ 3 trở
đi, nội dung thông tin bị giảm dần Ta có thể sử dụng 3 kênh đầu này để tổ hợp màu phục
vụ cho việc giải đoán ảnh bằng mắt Tuy nhiên, nhược điểm của PCA là khó chỉ định kênh nào vào màu nào cho phù hợp với giải đoán, vì ảnh PCA là một hàm bước sóng
Trang 8của ảnh gốc Do đó, cần tìm mối tương quan giữa ảnh gốc và ảnh PCA để chỉ định màu ứng với từng bước sóng một cách phù hợp
Ma trận tương quan giữa ảnh gốc và ảnh PCA
Kenh 1 Kenh 2 Kenh 3 Kenh 4 Kenh 5 Kenh 7 PCA1 0.006 0.015 0.036 0.564 0.763 0.314 PCA2 -0.356 -0.241 -0.469 0.637 -0.321 -0.293 PCA3 -0.514 -0.353 -0.45 -0.513 0.358 0.129 PCA4 -0.649 0.059 0.651 0.022 0.11 -0.372 PCA5 -0.307 -0.136 0.233 0.108 -0.417 0.805 PCA6 -0.304 0.891 -0.313 -0.025 -0.028 0.115
Vì ảnh PCA là một hàm bước sóng của ảnh gốc, nên ta cần chuyển đổi các giá trị pixel từ số thực về số nguyên bằng kĩ thuật histogram Sau đó, dùng các ảnh đã chuyển đổi này để tạo ảnh tổ hợp màu
Ảnh tổ hợp màu 3 kênh ảnh PCA
4.4 Xây dựng bộ dữ liệu mẫu huấn luyện
Khác với kỹ thuật phân loại phi giám định, trong kỹ thuật phân loại có giám định, cần chọn các vùng mẫu cho mỗi loại theo yêu cầu đã xác định Số lượng pixel tối thiểu yêu cầu phải thu thập cho mỗi mẫu là k + 1 đến 10k pixel (k: số kênh phổ của ảnh vệ tinh dùng để phân loại)
Trang 94.5 Ước tính thống kê vùng mẫu
Các mẫu sau khi được xây dựng được tính toán thống kê các tham số như giá trị trung bình mẫu, ma trận phương sai, hiệp phương sai…của hàm phân bố chuẩn Đặc biệt với phương pháp phân loại khoảng cách gần đúng nhất, việc kiểm tra xem sự phân bố của
dữ liệu huấn luyện ứng với từng vùng mẫu có phù hợp với luật phân bố chuẩn hay không
là rất quan trọng để cho ra kết quả hiệu quả khi thực hiện phương pháp này
Tham số thống kê tương ứng với từng vùng mẫu
Đối với lớp phủ là Đất trồng lúa giai đoạn 1
Min Max Mean Stdev Band 1 57 68 61.60274 2.520691 Band 2 25 31 28.12329 1.641013 Band 3 18 24 20.42466 1.580417 Band 4 88 128 112.0548 8.017152 Band 5 64 94 78.47945 6.446596 Band 7 20 31 25.20548 2.788662
Đối với lớp phủ là Đất trồng lúa giai đoạn 2
Min Max Mean Stdev Band 1 69 89 78.78261 4.620509 Band 2 28 48 39.04348 5.217152 Band 3 27 67 51.26087 10.43559 Band 4 34 91 64.85507 14.5716 Band 5 50 157 118.2029 28.26533 Band 7 27 73 55.56522 12.00059
Đối với lớp phủ là Đất trồng cây ăn quả
Min Max Mean Stdev Band 1 55 66 60.18868 2.922437 Band 2 22 29 25.32076 2.190658 Band 3 17 26 21.30189 2.635446 Band 4 63 86 75.45283 5.614425 Band 5 33 70 47.4717 9.471828 Band 7 9 26 15.37736 4.211826
Trang 10Đối với lớp phủ là Đất nuôi trồng thủy sản
Min Max Mean Stdev Band 1 66 77 69.69014 2.201243 Band 2 29 38 31.8169 1.799284 Band 3 29 44 34.49296 2.857938 Band 4 35 47 39.69014 2.718148 Band 5 26 59 44.69014 7.023616 Band 7 9 27 19.19718 3.717218
Đối với lớp phủ là Đất rừng ngập mặn
Min Max Mean Stdev Band 1 69 89 78.78261 4.620509 Band 2 28 48 39.04348 5.217152 Band 3 27 67 51.26087 10.43559 Band 4 34 91 64.85507 14.5716 Band 5 50 157 118.2029 28.26533 Band 7 27 73 55.56522 12.00059
Đối với lớp phủ là Đất đô thị
Min Max Mean Stdev Band 1 62 123 79.35714 11.42841 Band 2 26 63 38.57143 7.238931 Band 3 24 75 44.5 10.19622 Band 4 42 75 55.89286 9.608404 Band 5 50 125 84.89286 15.20317 Band 7 20 83 46.60714 12.90518
Trang 11Đối với lớp phủ là Đất sông ngòi, kênh, rạch suối
Min Max Mean Stdev Band 1 58 93 70.72131 6.143102 Band 2 26 45 33.65574 4.082014 Band 3 21 55 35.4918 7.603997 Band 4 14 66 29.4918 12.22514 Band 5 5 41 15.73771 9.049681 Band 7 1 15 6.622951 3.131368
Đối với lớp phủ là Mây
Min Max Mean Stdev Band 1 49 255 97.48276 59.70108 Band 2 17 171 45.5 36.28651 Band 3 12 207 48.51724 46.52494 Band 4 10 198 66.18966 52.45297 Band 5 4 255 70.91379 74.69171 Band 7 1 158 37.91379 44.45549
4.6 Phân loại ảnh
Hai phương pháp phân loại được sử dụng để phân loại ảnh là phương pháp phân loại gần đúng nhất và phương pháp khoảng cách gần đúng nhất Như đã trình bày ở phần
[3.], mỗi phương pháp đều dựa trên thuật toán khác nhau, do đó, ứng với từng phương
pháp, kết quả ảnh phần loại nhận được là khác nhau Để so sánh độ chính xác của hai phương pháp này, cần đưa vào tính toán với cùng chung một bộ dữ liệu mẫu và dữ liệu kiểm tra
Trang 12Kết quả ảnh sau khi phân loại của hai phương pháp này như sau:
Ảnh phân loại bằng phương pháp phân loại gần đúng nhất
Trang 13Ảnh phân loại bằng phương pháp khoảng cách ngắn nhất
4.7 Đánh giá kết quả phân loại
Đánh giá kết quả phân loại là việc so sánh sự phù hợp giữa những loại thực vật trên mặt đất và những loại giải đoán bằng các phương pháp phân loại Trong tiểu luận này, hai phương pháp được sử dụng là khoảng cách gần đúng nhất và khoảng cách ngắn nhất Dữ liệu kiểm tra hai phương pháp này cũng phải cùng một bộ dữ liệu
Kết quả thống kê trên ma trận sai số ta được các chỉ tiêu đánh giá của hai phương pháp như sau:
Trang 14Phương pháp phân loại theo khoảng cách ngắn nhất
Mây
Đất trồng lúa giai đoạn 1
Đất trồng lúa giai đoạn 2
Đất trồng cây
ăn quả
Đất nuôi trồng thủy sản
Đất rừng ngập mặn
Đất đô thị
Đất sông ngòi, kênh, rạch suối Mây
Độ chính xác
Độ chính xác
Độ chính xác
toàn cục 70.707%
Hệ số Kappa 0.6645
Phương pháp phân loại gần đúng nhất
Mây
Đất trồng lúa giai đoạn 1
Đất trồng lúa giai đoạn 2
Đất trồng cây
ăn quả
Đất nuôi trồng thủy sản
Đất rừng ngập mặn
Đất đô thị
Đất sông ngòi, kênh, rạch suối Mây
Độ chính xác
Độ chính xác
Độ chính xác
toàn cục 62.62%
Hệ số Kappa 0.5727
Trang 155 Kết quả và thảo luận
Với cùng một bộ dữ liệu huấn luyện và cùng bộ dữ liệu kiểm tra,từ kết quả phân loại ta nhận thấy kết quả so sánh từ hai phương pháp phân loại như sau:
Phương pháp phân loại gần
đúng nhất
Phương pháp phân loại theo khoảng cách ngắn nhất
Độ chính xác toàn cục
70.707% 62.62%
Hệ số Kappa
0.6645 0.5727
Độ chính xác toàn cục và hệ số Kappa của phương pháp phân loại gần đúng nhất đều cao hơn phương pháp phân loại theo khoảng cách ngắn nhất Kết quả so sánh cho thấy, thuật toán của phương pháp phân loại gần đúng nhất ưu điểm hơn phương pháp phân loại theo khoảng cách ngắn nhất Tuy nhiên, kết quả phân loại dựa vào phương pháp phân loại gần đúng nhất chỉ hiệu quả đối với dữ liệu mẫu theo phân bố chuẩn, do đó, khi
sử dụng phương pháp này, cần cẩn thận khi chọn và thống kê các tham số vùng mẫu trước khi thực hiện phân loại
Trang 16Tài liệu tham khảo
1 Lê Văn Trung, 2010, Viễn Thám, Nhà xuất bản Đại học quốc gia Tp Hồ Chí Minh
2 Lê Văn Trung, 2006, Thực hành Viễn Thám, Nhà xuất bản Đại học quốc gia Tp
Hồ Chí Minh
3 F S Al-Ahmadi và A S Hames, 2007, Comparison of Four Classification Methods to Extract Land Use and Land Cover from Raw Satellite Images for Some Remote Arid Areas, Kingdom of Saudi Arabia, King Abdulaziz University