Phương pháp tự động rút trích thông tin về nhiệt độ bề mặt trái đất, chỉ số thực vật dựa vào dữ liệu raster.. − Tìm hiểu ứng dụng ảnh Viễn thám vào phân tích dữ liệu không gian nhằm rút
Trang 1LỜI CAM ĐOAN
Tôi xin cam đoan đề tài này là do chính tôi thực hiện, các số liệu thu thập và kết quả phân tích trong đề tài là trung thực, đề tài không trùng với bất kỳ đề tài nghiên cứu khoa học nào Ngoài ra, trong luận văn còn sử dụng một số nhận xét, đánh giá cũng như
số liệu của các tác giả, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồn gốc
TP Hồ Chí Minh, Tháng 01 năm 2016
Học Viên
Đặng Nguyễn Thiện Kha
Trang 2LỜI CẢM ƠN
Trong đợt làm luận văn tốt nghiệp vừa qua, em đã nhận được sự hướng dẫn, giúp
đỡ và động viên tận tình từ nhiều phía Tất cả những điều đó đã trở thành một động lực rất lớn giúp em có thể hoàn thành tốt mọi công việc được giao Với tất cả sự cảm kích
và trân trọng, em xin được gửi lời cảm ơn đến tất cả mọi người
Trước tiên, em xin bày tỏ lòng biết ơn chân thành đến cô Dương Thị Thúy Nga, người đã tận tình hướng dẫn, tạo mọi điều kiện thuận lợi để em hoàn thành tốt luận văn này
Em cũng xin cảm ơn các thầy cô của trường Đại học Công nghệ Thông Tin ĐHQG
TP HCM, xin cảm ơn quý thầy cô đã tận tình dạy bảo, giúp đỡ em trong suốt thời gian học tại trường Tất cả các kiến thức mà em được truyền đạt sẽ là hành trang quý giá trên con đường học tập, làm việc và nghiên cứu sau này
TP Hồ Chí Minh Tháng 01 năm 2016
Học Viên
Đặng Nguyễn Thiện Kha
Trang 3MỤC LỤC
LỜI CAM ĐOAN 1
LỜI CẢM ƠN 2
MỤC LỤC 3
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT 5
DANH MỤC CÁC BẢNG 5
DANH MỤC CÁC HÌNH VẼ 7
MỞ ĐẦU 1
1 LÝ DO CHỌN ĐỀ ĐÀI 1
2 MỤC TIÊU VÀ NHIỆM VỤ NGHIÊN CỨU 2
3 ĐỐI TƯỢNG NGHIÊN CỨU 2
4 PHẠM VI NGHIÊN CỨU 2
5 TÍNH MỚI CỦA ĐỀ TÀI 3
6 Ý NGHĨA THỰC TIỄN 4
7 PHƯƠNG PHÁP NGHIÊN CỨU 4
CHƯƠNG 1 TỔNG QUAN 5
1.1 TÌNH HÌNH NGHIÊN CỨU NGOÀI NƯỚC 5
1.2 TÌNH HÌNH NGHIÊN CỨU TRONG NƯỚC 6
1.3 ĐÁNH GIÁ KẾT QUẢ CÁC CÔNG TRÌNH NGHIÊN CỨU ĐÃ CÔNG BỐ NHỮNG TỒN TẠI CẦN GIẢI QUYẾT 7
CHƯƠNG 2 CƠ SỞ LÝ THUYẾT SỬ DỤNG DỮ LIỆU ẢNH VIỄN THÁM TRONG TÍNH TOÁN, XỬ LÝ NHIỆT ĐỘ BỀ MẶT VÀ CHỈ SỐ THỰC VẬT CỦA LỚP PHỦ THỰC VẬT 9
2.1 TỔNG QUAN VỀ CSDL KHÔNG GIAN 9
2.1.1 GIỚI THIỆU VỀ CSDL KHÔNG GIAN 9
2.1.2 CẤU TRÚC DỮ LIỆU THÔNG TIN ĐỊA LÝ (GIS) 9
2.2 CÔNG NGHỆ VIỄN THÁM 10
2.2.1 GIỚI THIỆU 10
2.2.2 VỆ TINH LANDSAT 8 11
2.2.3 ẢNH VIỄN THÁM 12
2.3 QUAN HỆ GIỮA ẢNH VIỄN THÁM VÀ CƠ SỞ DỮ LIỆU KHÔNG GIAN 14
2.3.1 DỮ LIỆU DẠNG VECTOR 14
2.3.2 DỮ LIỆU DẠNG RASTER 15
3.4.2.1 Ô LƯỚI (CELLS) 15
3.4.2.2 KHU VỰC VÀ VÙNG 17
3.4.2.3 DỮ LIỆU RỜI RẠC 18
2.3.3 PHÉP GIAO 19
2.3.4 TÍNH GIAO NHAU 22
3.4.5.1 RASTER VÀ POINTS 22
3.4.5.2 RASTER VÀ LINES 23
Trang 43.4.5.3 RASTER VÀ POLYGONS 23
2.4 PHƯƠNG PHÁP TÍNH NHIỆT ĐỘ BỀ MẶT TỪ DỮ LIỆU RASTER 24
2.4.1 CHUYỂN ĐỔI GIÁ TRỊ SỐ (DN) SANG GIÁ TRỊ BỨC XẠ PHỔ (L) 25
2.4.2 CHUYỂN ĐỔI GIÁ TRỊ BỨC XẠ PHỔ SANG NHIỆT ĐỘ 25
2.5 PHƯƠNG PHÁP TÍNH CHỈ SỐ THỰC VẬT BỀ MẶT TỪ DỮ LIỆU RASTER 26
CHƯƠNG 3 PHƯƠNG PHÁP TỰ ĐỘNG XỬ LÝ ẢNH VIỄN THÁM VÀ XÂY DỰNG CƠ SỞ DỮ LIỆU KHÔNG GIAN 27
3.1 MỘT SỐ PHƯƠNG PHÁP XỬ LÝ CẢI THIỆN THỜI GIAN LƯU TRỮ DỮ LIỆU 27 3.1.1 GIẢI PHÁP LỰA CHỌN CÁCH VIẾT TRUY VẤN DỮ LIỆU 27
3.1.2 GIẢI PHÁP CÀI ĐẶT CHỈ MỤC 29
3.1.2.1 CHỈ MỤC TỪNG PHẦN (PARTIAL INDEX) 29
3.1.2.2 CHỈ MỤC HỢP NHẤT (COMPOUND INDEX) 32
3.1.2.3 CHỈ MỤC HÀM (FUNCTIONAL INDEX) 32
3.1.3 GIẢI PHÁP NÉN DỮ LIỆU ẢNH VIỄN THÁM DẠNG RASTER 34
3.1.4 GIẢI PHÁP TỐI ƯU HÓA CÁC KIỂU VIẾT CÂU TRUY VẤN 40
3.1.4.1 TRUY VẤN LỒNG TRONG MỆNH ĐỀ SELECT 40
3.1.4.2 TRUY VẤN LỒNG TRONG MỆNH ĐỀ FROM VÀ PHƯƠNG PHÁP CTES 46 3.2 PHƯƠNG PHÁP XỬ LÝ DỮ LIỆU ẢNH VIỄN THÁM 50
3.3 PHƯƠNG PHÁP TỰ ĐỘNG RÚT TRÍCH THÔNG TIN VỀ NHIỆT ĐỘ BỀ MẶT TRÁI ĐẤT, CHỈ SỐ THỰC VẬT DỰA VÀO DỮ LIỆU RASTER 55
CHƯƠNG 4 TRIỂN KHAI ỨNG DỤNG 57
4.1 KHẢO SÁT 57
4.2 KIẾN TRÚC TRIỂN KHAI 58
4.3 KIẾN TRÚC LOGIC 59
4.3.1 KIẾN TRÚC LOGIC TRÊN ỨNG DỤNG XỬ LÝ ẢNH VIỄN THÁM 59
4.3.2 KIẾN TRÚC LOGIC TRÊN WEBGIS 61
4.4 SƠ ĐỒ USE CASE HỆ THỐNG 63
4.5 THIẾT KẾ DỮ LIỆU 65
4.6 MÔ HÌNH ER 66
4.7 LƯỢC ĐỒ CƠ SỞ DỮ LIỆU 67
4.8 ĐẶC TẢ CƠ SỞ DỮ LIỆU 67
4.9 GIAO DIỆN ỨNG DỤNG 70
4.9.1 SƠ ĐỒ LIÊN KẾT MÀN HÌNH 70
4.9.2 CHI TIẾT MÀN HÌNH 71
4.9.2.1 MÀN HÌNH ỨNG DỤNG XỬ LÝ ẢNH VIỄN THÁM 71
4.9.2.2 MÀN HÌNH HỆ THỐNG WEBGIS 73
4.10 ĐỐI CHIẾU KẾT QUẢ NHIỆT ĐỘ ĐẠT ĐƯỢC VỚI NHIỆT ĐỘ ĐO ĐẠC THỰC TẾ 90 4.11 HIỆN TƯỢNG ĐẢO NHIỆT TẠI TP HỒ CHÍ MINH 93
KẾT LUẬN 100
1 CÁC CÔNG VIỆC ĐÃ TIẾN HÀNH 100
1.1 VỀ MẶT NGHIÊN CỨU LÝ THUYẾT 100
Trang 52 KẾT QUẢ ĐẠT ĐƯỢC VÀ HẠN CHẾ 101
2.1 KẾT QUẢ ĐẠT ĐƯỢC 101
2.2 HẠN CHẾ 102
3 HƯỚNG PHÁT TRIỂN 102
TÀI LIỆU THAM KHẢO 103
PHỤ LỤC 105
1 KHẢO SÁT VÀ TIỀN XỬ LÝ ẢNH VỆ TINH LANDSAT 105
1.1 THU THẬP ẢNH VỆ TINH LANDSAT 105
1.2 TIỀN XỬ LÝ 105
2 SHAPEFILE 106
2.1 NHỮNG TẬP TIN CHÍNH CỦA SHAPEFILE: 106
2.2 NHỮNG TẬP TIN PHỤ THÊM CỦA SHAPEFILE 106
3 ARCMAP 106
3.1 GIỚI THIỆU 107
3.2 KỸ THUẬT GỘP KÊNH ẢNH VIỄN THÁM 108
3.3 GHÉP ẢNH VIỄN THÁM 112
4 GEOSERVER 116
4.1 GIỚI THIỆU 116
4.2 CÁC ĐẶC TRƯNG 117
5 TẬP TIN METADATA (MTL.TXT) 118
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT GIS Geographic information system NDVI Normalized Difference Vegetation Index CSDL Cơ sở dữ liệu ESRI Environmental Systems Research Institute MHH Mô hình hóa DANH MỤC CÁC BẢNG Bảng 2.1 So sánh các kênh của ảnh Landsat-7 và Landsat-8 12
Bảng 3.1 Chương trình cài đặt thực thi truy vấn 27
Bảng 3.2 Kết quả thời gian truy vấn của 2 phương án ở bảng 3.1 28
Bảng 3.3 Đoạn chương trình cài đặt chỉ mục không gian 30
Bảng 3.4 So sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục không gian 31
Bảng 3.5 Đoạn chương trình cài đặt chỉ mục hàm 33
Trang 6Bảng 3.6 So sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục hàm 33
Bảng 3.7 Truy vấn lấy ra tất cả giá trị Raster 36
Bảng 3.8 Bảng so sánh thời gian truy vấn, bộ nhớ lưu trữ và thời gian thêm ảnh của 3 ảnh vệ tinh với các kích thước khác nhau 38
Bảng 3.9 Cài đặt chương trình truy vấn 41
Bảng 3.10 Kết quả so sánh thời gian truy vấn giữa sử dụng truy vấn lồng và không sử dụng truy vấn lồng 42
Bảng 3.11 Truy vấn của phương án 1 43
Bảng 3.12 Kết quả thực thi Explaincủa Phương án 1 43
Bảng 3.13 Đoạn chương trình cài đặt 44
Bảng 3.14 Kết quả Explain 44
Bảng 3.15 Kết quả sử dụng truy vấn lồng và Case when kết hợp Inner-Joins 46
Bảng 3.16 Truy vấn lần lượt của hai phương án 47
Bảng 3.17 So sánh thời gian truy vấn giữa truy vấn lồng và phương pháp CTE 48
Bảng 3.18 So sánh kết quả truy vấn hai phương án rút trích giá trị nhiệt độ và chỉ số thực vật của TP Hồ Chí Minh 54
Bảng 4.1 Danh sách các tác nhân hệ thống và diễn giải 63
Bảng 4.2 Danh sách các UseCase hệ thống và diễn giải 64
Bảng 4.3 Bảng anh_vt 67
Bảng 4.4 Bảng chitiet_nhietdo 67
Bảng 4.5 Bảng phuong_xa 68
Bảng 4.6 Bảng quan_huyen 68
Bảng 4.7 Bảng tinh_thanhpho 69
Bảng 4.8 Bảng vung_mien 69
Bảng 4.9 Use case thêm dữ liệu ảnh Viễn thám vào CSDL 71
Bảng 4.10 Use case đăng nhập 73
Bảng 4.11 Use case quản lý các lớp bản đồ 74
Bảng 4.12 Use case in bản đồ 78
Bảng 4.13 Use case vẽ biểu đồ 79
Bảng 4.14 Use case tìm kiếm nhiệt độ, chỉ số thực vật của từng phường (xã) 82
Bảng 4.15 Use case xem thông tin nhiệt độ, chỉ số thực vật 83
Bảng 4.16 Use case in dữ liệu 84
Bảng 4.17 Use case xem dự báo nhiệt độ 85
Bảng 4.18 Use case Thêm dữ liệu mô hình hóa vào CSDL 87
Bảng 4.19 Use case cảnh báo nhiệt độ cực đoan 88
Bảng 4.20 Thời gian chụp ảnh Viễn Thám 90
Bảng 4.21 So sánh nhiệt độ bề mặt được rút trích từ các ảnh Viễn thám Bảng 4.20 và nhiệt độ không khí trung bình của toàn khu vực TP Hồ Chí Minh 90
Bảng 4.22 So sánh nhiệt độ bề mặt trung bình của một số quận (huyện) với nhiệt độ không khí trung bình của toàn khu vực TP Hồ Chí Minh 91 Bảng 4.23 Khảo sát hiện tượng đảo nhiệt của TP Hồ Chí Minh tháng 1 và tháng 10
Trang 7DANH MỤC CÁC HÌNH VẼ
Hình 1.1 Phương pháp nghiên cứu biến đổi nhiệt độ đô thị 7
Hình 2.1 Đối tượng Vectors (trái) và Raster (phải) 10
Hình 2.2 Minh họa dữ liệu Vector 10
Hình 2.3 Minh họa dữ liệu Raster 10
Hình 2.4 Dữ liệu TIN 10
Hình 2.5 Dữ liệu Annotation 10
Hình 2.6 Vệ tinh Landsat 8 tại Vandenberg Air Force Base Bang California 11
Hình 2.7 Minh họa tập tin shapefile 14
Hình 2.8 Dữ liệu Raster được lưu ở dạng ô lưới (cells) 15
Hình 2.9 Giá trị các ô lưới của Raster 16
Hình 2.10 Một ô lưới của Raster 16
Hình 2.11 Độ phân giải của Raster 17
Hình 2.12 Raster trên hệ trục tọa độ Oxy 17
Hình 2.13 Giới hạn của một Raster 17
Hình 2.14 Raster được chia thành nhiều vùng và khu vực 17
Hình 2.15 So sánh điểm trong dữ liệu Vector (trái) và dữ liệu Raster (phải) 18
Hình 2.16 So sánh đường giữa dữ liệu Vector (trái) và Raster (phải) 19
Hình 2.17 So sánh vùng trong Vector (trái) và Raster (phải) 19
Hình 2.18 Vector giao với Vector cho ra kết quả Vector 20
Hình 2.19 Xác định các lát chứa Vector và Raster 20
Hình 2.20 Vector giao với Raster cho ra kết quả Raster 21
Hình 2.21 Vector giao vởi Raster cho ra kết quả Vector 21
Hình 2.22 Raster giao với Raster 22
Hình 2.23 Tính giao nhau giữa Raster với điểm 22
Hình 2.24 Raster giao với Đường 23
Hình 2.25 Raster giao với Polygon 24
Hình 2.26 Polygon chứa giá trị nhiệt của các ô lưới Raster 24
Hình 2.27 Ví dụ minh họa chỉ số thực vật (NDVI) thể hiện thực trạng thực vật 26
Hình 3.1 So sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục không gian 31
Hình 3.2 So sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục hàm 34
Hình 3.3 Ánh xạ giữa ảnh vệ tinh và Raster 35
Hình 3.4 Ảnh kích thước 3x4 36
Hình 3.5 Ảnh sau khi nén với kích thước 2x3 36
Hình 3.6 Kết quả truy vấn bảng 3.7 37
Hình 3.7 Thời gian truy vấn với các kích thước ảnh khác nhau 39
Hình 3.8 So sánh thời gian truy vấn lồng và không sử dụng truy vấn lồng 42
Hình 3.9 Kết quả Graphical Explain của truy vấn lồng 45
Trang 8Hình 3.10 Kết quả Graphical Explain của giải pháp thay thế truy vấn lồng 45
Hình 3.11 Biểu đồ so sánh giữa thời gian truy vấn 46
Hình 3.12 Hàm ST_Distance 48
Hình 3.13 Hàm ST_Dwithin 48
Hình 3.14 So sánh thời gian truy vấn của truy vấn lồng và giải pháp ETCs 49
Hình 3.15 Dữ liệu Raster sau khi áp dụng phương pháp nén 50
Hình 3.16 Bản đồ chỉ số thực vật có dãy màu theo từng phường xã 51
Hình 3.17 Bản đồ chỉ số thực vật có dãy màu theo từng điểm ảnh 51
Hình 3.18 Biểu đồ so sánh thời gian truy vấn hai phương án rút trích giá trị nhiệt độ và chỉ số thực vật của TP Hồ Chí Minh 54
Hình 3.19 Phương pháp tự động rút trích thông tin về nhiệt độ bề mặt trái đất, chỉ số thực vật dựa vào dữ liệu raster 55
Hình 4.1 Quy trình phát triển ứng dụng 57
Hình 4.2 Kiến trúc triển khai hệ thống 58
Hình 4.3 Kiến trúc logic trên ứng dụng xử lý ảnh Viễn thám 59
Hình 4.4 Sơ đồ kiến trúc Logic ứng dụng WebGIS 61
Hình 4.5 Sơ đồ UseCase hệ thống 63
Hình 4.6 Quy trình rút trích giá trị nhiệt độ và chỉ số thực vật 65
Hình 4.7 Mô hình ER 66
Hình 4.8 Lược đồ CSDL trên PostgreSQL 67
Hình 4.9 Sơ đồ giao diện của ứng dụng xử lý ảnh Viễn thám 70
Hình 4.10 Sơ đồ màn hình giao diện toàn hệ thống WebGIS 71
Hình 4.11 Màn hình kết nối CSDL 73
Hình 4.12 Màn hình rút trích nhiệt độ và chỉ số thực vật 73
Hình 4.13 Màn hình đăng nhập 74
Hình 4.14 Màn hình quản lý các lớp bản đồ 75
Hình 4 15 Màn hình bản đồ địa chính 76
Hình 4.16 Màn hình bản đồ nhiệt độ 77
Hình 4.17 Màn hình bản đồ chỉ số thực vật 78
Hình 4.18 Màn hình chức năng in bản đồ 79
Hình 4.19 Màn hình chức năng lập biểu đồ 80
Hình 4.20 Màn hình biểu đồ của từng quận (huyện) 81
Hình 4.21 Màn hình biểu đồ tròn của từng quận (huyện) 81
Hình 4.22 Biểu đồ cột của một quận (huyện) qua các năm 82
Hình 4.23 Màn hình chức năng tìm kiếm nhiệt độ, chỉ số thực vật của từng phường (xã) 83
Hình 4.24 Màn hình xem thông tin chi tiết nhiệt độ và chỉ số thực vật 84
Hình 4.25 Màn hình xem thông tin chi tiết và in dữ liệu 85
Hình 4.26 Màn hình chức năng dự báo nhiệt độ 86
Hình 4.27 Biểu đồ dự báo nhiệt độ các quận (huyện) 86
Hình 4.28 Biểu đồ dự báo nhiệt độ của một quận (huyện) theo thời gian 87
Trang 9Hình 4.30 Màn hình kết quả dự báo nhiệt độ của một quận (huyện) 88Hình 4.31 Màn hình cảnh báo nhiệt độ 89Hình 4.32 Biểu đồ xu thế nhiệt độ trung bình TP Hồ Chí Minh các tháng mùa nắng 91Hình 4.33 Biểu đồ xu thế nhiệt độ trung bình TP Hồ Chí Minh các tháng mùa mưa 91Hình 4.34 Biểu đồ xu thế nhiệt độ Quận 1 và huyện Cần Giờ các tháng mùa nắng 92Hình 4.35 Biểu đồ xu thế nhiệt độ Quận 1 và huyện Cần Giờ các tháng mùa mưa 92Hình 4.36 Hiện tượng đảo nhiệt đô thị 93Hình 4.37 Khảo sát hiện tượng đảo nhiệt của TP Hồ Chí Minh 94Hình 4.38 Biểu đồ thể hiện đảo nhiệt đô thị TP Hồ Chí Minh tháng 1 năm 2015 95Hình 4.39 Biểu đồ thể hiện đảo nhiệt đô thị TP Hồ Chí Minh tháng 10 năm 2015 96Hình 4.40 Biểu đồ chỉ số thực vật một số khu vực tháng 1 và tháng 10 năm 2015 96Hình 4.41 Bản đồ lớp phủ thực vật TP Hồ Chí Minh tháng 1 năm 2015 97Hình 4.42 Bản đồ nhiệt độ TP Hồ Chí Minh tháng 1 năm 2015 98
Trang 10
MỞ ĐẦU
1 Lý do chọn đề đài
Việt Nam được đánh giá là một trong những nước sẽ bị ảnh hưởng nghiêm trọng nhất của biến đổi khí hậu và TP Hồ Chí Minh là một trong mười thành phố trên thế giới được
dự báo sẽ bị ảnh hưởng nặng nề bởi biến đổi khí hậu
Do chịu tác động từ sự nóng lên toàn cầu, cộng với xu hướng tăng nhiệt độ, kết hợp với quá trình đô thị hóa, bê tông hóa, không thảm xanh, không có nơi hút nhiệt độ,… nhiệt độ tại TP Hồ Chí Minh có thể tăng lên nhanh chóng, ảnh hưởng đến sinh hoạt, sức khỏe của nhiều người Trong vòng 50 năm trở lại đây, nhiệt độ trung bình của thành phố đang có chiều hướng tăng dần Nhiệt độ trung bình thấp nhất cũng tăng, trong khi tình hình biến động mưa, áp thấp nhiệt đới cũng rất phức tạp
Biến đổi khí hậu sẽ ảnh hưởng rất bất lợi đến TP Hồ Chí Minh trong thời gian tới Lượng mưa dự báo sẽ giảm trong mùa khô và tăng trong mùa mưa Nhiệt độ trung bình
dự báo sẽ tăng là 1 độ C vào năm 2050, và 2,6 độ C vào năm 2100 Mực nước biển dự kiến sẽ tăng 30 cm cho đến năm 2050 và tiếp tục tăng trong khoảng 65 – 100 cm vào năm 2100 so với mực nước biển trung bình trong giai đoạn 1980 - 1999 Như vậy, TP
Hồ Chí Minh sẽ chịu ảnh hưởng hỗn hợp các yếu tố: tăng nhiệt độ dẫn đến nhiệt độ cao hơn trong thành phố; suy giảm chất lượng không khí và nguồn nước; mực nước biển dâng lên dẫn đến nguy cơ ngập lụt và nhiễm mặn tăng lên, kết hợp với triều cường sẽ tạo ra các đỉnh lũ cao hơn; tăng lượng mưa trong mùa mưa sẽ tạo ngập úng nhiều hơn và
hệ quả thay đổi dòng chảy của hệ thống sông ngòi dẫn đến sự gia tăng các sự cố vỡ đê bao, gia tăng tần suất ngập lụt Một ảnh hưởng kép nữa nếu công tác quản lý bảo vệ môi trường sống không được quan tâm đầy đủ
Để ứng phó với tình trạng biến đổi khí hậu ngày càng gia tăng và phức tạp khó lường, rất cần sự phối hợp các giải pháp từ nhiều ban ngành và của toàn xã hội Từ các ứng dụng khoa học kỹ thuật đến thái độ của người dân trong đời sống hàng ngày với môi
Trang 11trường xung quanh Có vậy mới mong giảm thiểu và góp phần giải quyết từng bước thực trạng vốn rất khó khăn này
2 Mục tiêu và nhiệm vụ nghiên cứu
Mục tiêu nghiên cứu: nghiên cứu phương pháp tự động tính toán, xử lý nhiệt độ bề mặt trái đất, chỉ số thực vật tại TP Hồ Chí Minh, từ đó xây dựng công cụ tự động xử lý
dữ liệu ảnh Viễn Thám và ứng dụng WebGIS phân tích thông tin về nhiệt độ, chỉ số thực vật để thấy rõ hiện tượng đảo nhiệt tại TP Hồ Chí Minh
Để đạt được mục tiêu trên đề tài cần thực hiện những nhiệm vụ sau:
− Tìm hiểu lý thuyết cơ bản về CSDL không gian
− Nghiên cứu một số hệ thống vệ tinh dự báo thời tiết của Mỹ
− Thu thập và khảo sát ảnh vệ tinh dự báo thời tiết (ảnh vệ tinh Landsat)
− Nghiên cứu các mối quan hệ giữa ảnh Viễn thám và CSDL không gian
− Tìm hiểu ứng dụng ảnh Viễn thám vào phân tích dữ liệu không gian nhằm rút trích nhiệt độ và chỉ số thực vật khu vực TP Hồ Chí Minh
− Tiền xử lý ảnh Viễn thám
− Xây dựng phương pháp tự động rút trích thông tin nhiệt độ bề mặt trái đất từ ảnh Viễn thám
− Nghiên cứu và thử nghiệm các giải pháp xử lý cải thiện thời gian lưu trữ, truy vấn
dữ liệu trên ảnh Viễn thám
− Nghiên cứu công nghệ và xây dựng ứng dụng WebGIS phân tích dữ liệu không gian
về hiện tượng đảo nhiệt tại TP Hồ Chí Minh
3 Đối tượng nghiên cứu
Đối tượng nghiên cứu là ảnh Viễn thám chụp tại khu vực TP Hồ Chí Minh
4 Phạm vi nghiên cứu
Phạm vi xử lý ở TP Hồ Chí Minh
Trang 12Phạm vi ứng dụng: tự động tính toán, xử lý nhiệt độ bề mặt trái đất, chỉ số thực vật
từ ảnh Viễn thám để thấy rõ hiện tượng đảo nhiệt
5 Tính mới của đề tài
Tự động hóa lưu trữ dữ liệu ảnh Viễn thám và tính toán thông tin nhiệt độ bề mặt đô thị
Hầu hết các nhà khoa học khi nghiên cứu vấn đề nhiệt độ đô thị từ dữ liệu ảnh Viễn thám đều sử dụng phần mềm như Idrisi, Envi,… để xử lý thủ công, tính toán các vấn đề như nhiệt độ bề mặt đô thị và các yếu tố ảnh hưởng đến sự thay đổi nhiệt độ như lớp phủ thực vật, bề mặt bê tông hóa, sông, kênh rạch,… Kết quả của phương pháp này là những tấm ảnh thể hiện thông tin liên quan đến nhiệt độ đô thị tại một thời điểm Để biết thông tin nhiệt độ của cả một khoảng thời gian dài thì cần phải xử lý thủ công rất nhiều tấm ảnh Nhưng điều quan trọng nhất là thông tin nhiệt độ đó được lưu trữ rời rạc trên từng tấm ảnh Khi cần phân tích thông tin cần thiết về các vấn đề liên quan đến nhiệt độ đô thị tại các khu vực khác nhau theo thời gian và không gian thì rất khó khăn, các chuyên gia phải đánh giá bằng mắt thường trên hàng loạt tấm ảnh này
Trên thế giới đã có một số nghiên cứu về việc xây dựng CSDL ảnh Viễn thám phục
vụ các mục đích nghiên cứu khác nhau nhưng ở Việt Nam thì hầu như chưa có một nghiên cứu nào về vấn đề này
Tính liên ngành
Đây là một đề tài liên ngành Công nghệ Thông tin và Môi trường, rất cần thiết phục
vụ cho công tác bảo vệ môi trường và phát triển bền vững
Ý nghĩa khoa học
Đề tài xây dựng phương pháp tự động xử lý ảnh Viễn thám để lưu trữ và tính toán, phân tích thông tin nhiệt độ bề mặt trái đất vào cơ sở khoa học, công nghệ xử lý ảnh Viễn thám Phương pháp này sẽ là cơ sở khoa học cho các nghiên cứu tiếp theo nhằm giải quyết hiệu quả các vấn đề môi trường không chỉ ở TP Hồ Chí Minh mà còn ở các
Trang 136 Ý nghĩa thực tiễn
Hệ thống xử lý dữ liệu ảnh Viễn thám, phân tích thông tin nhiệt độ đô thị tại TP Hồ Chí Minh là một giải pháp rất hiệu quả và đem lại lợi ích to lớn cho nền kinh tế, xã hội
và bảo vệ sức khỏe con người Việc ứng dụng Công nghệ thông tin để giải quyết các bài toán môi trường đã và đang góp phần to lớn vào việc xây dựng giải pháp tổng thể để ứng phó với những ảnh hưởng của biến đổi khí hậu Ứng dụng kết quả nghiên cứu sẽ phục
vụ tốt cho công tác quản lý môi trường nói chung và công tác quản lý môi trường tại TP
Hồ Chí Minh nói riêng
7 Phương pháp nghiên cứu
Trang 14CHƯƠNG 1 TỔNG QUAN
1.1 Tình hình nghiên cứu ngoài nước
Công nghệ GIS - Viễn thám được nghiên cứu và phát triển từ vài thập kỷ nay trên thế giới Những thành tựu từ những nghiên cứu của các công nghệ này đã góp phần to lớn vào công tác quản lý môi trường trên toàn thế giới Vấn đề ứng dụng GIS - Viễn thám vào việc giám sát các hiện tượng tự nhiên trên bề mặt trái đất như sạt lở bờ sông, ngập lụt, cháy rừng,… đã được nghiên cứu nhiều Vấn đề tính toán và đánh giá sự thay đổi nhiệt độ bề mặt trái đất cũng đang được quan tâm, nhất là trong bối cảnh biến đổi khí hậu đang ảnh hưởng rất lớn đến sự nóng dần của trái đất
- Trong luận văn Thạc sĩ của D J Twigt tại Đại học Kỹ thuật Delft (2006) “3D temperature modeling for the South China Sea using remote sensing data”, tác giả tập trung nghiên cứu 2 vấn đề: nhiệt độ và độ mặn trên mặt biển dạng 3 chiều ở quy mô lớn; phát triển mô hình thể hiện diễn biến của các quá trình này Mô hình Delft3D sẽ được ứng dụng để tính toán nhiệt độ, độ mặn mặt biển, sử dụng dữ liệu đo đạc và xử lý ảnh Viễn thám
- Một nghiên cứu khác là “Analysis of Alberta temperature observations and estimates by global climate models” (2000) của Phân viện Khoa học và Công nghệ - Phòng Khoa học Môi trường Alberta đã kiểm tra sự thay đổi nhiệt độ đô thị của tỉnh Alberta theo không gian và thời gian dựa vào việc so sánh dữ liệu đo đạc với kết quả của
mô hình khí hậu toàn cầu, chủ yếu là xem xét đến xu hướng thay đổi nhiệt độ của vùng
- “Database System for Archiving and Managing Remote Sensing Images” (2009) của nhóm tác giả Jianting Shi, Yinan Chen, Chunyuan Liu là một nghiên cứu về việc xây dựng và quản lý CSDL ảnh Viễn thám Hệ thống sử dụng Oracle để lưu trữ dữ liệu GIS
và ảnh Viễn thám, ArcGIS Server để tạo các dịch vụ Web, ArcSDE để quản lý dữ liệu không gian
Trang 15Ngoài ra, còn khá nhiều nghiên cứu khác về vấn đề nhiệt độ bề mặt nước biển, bề mặt đô thị nhưng rất ít nghiên cứu vừa tính toán nhiệt độ vừa xây dựng CSDL phục vụ công tác phân tích, đánh giá và giám sát các vấn đề môi trường
1.2 Tình hình nghiên cứu trong nước
Ở Việt Nam hiện có một vài nhóm nghiên cứu về vấn đề nhiệt độ đô thị như:
“Ứng dụng ảnh Modis theo dõi sự thay đổi nhiệt độ bề mặt đất và tình hình khô hạn vùng đồng bằng sông Cửu Long” của nhóm tác giả Huỳnh Thị Thu Hương, Trương Chí Quang và Trần Thanh Dân – trường Đại học Cần Thơ (2012) Nghiên cứu này sử dụng dòng ảnh vệ tinh MOD11A2 (độ phân giải 1 km, chu kỳ thời gian 8 ngày) từ năm
2000 đến năm 2010 để tính toán và đánh giá nhiệt độ bề mặt đất và chỉ số khô hạn vùng đồng bằng sông Cửu Long kết hợp phỏng vấn hộ nông dân trong vùng nghiên cứu Kết quả đã xây dựng hoàn chỉnh qui trình tính toán nhiệt độ bề mặt đất và chỉ số khô hạn thực vật TVDI cho vùng đồng bằng sông Cửu Long từ ảnh MODIS
Luận án TS Kỹ thuật của TS Trần Thị Vân “Nghiên cứu biến đổi nhiệt độ đô thị dưới tác động của quá trình đô thị hóa bằng phương pháp Viễn thám và GIS, trường hợp khu vực thành phố Hồ Chí Minh” (2011) – Viện Môi trường và Tài nguyên – ĐHQG
TP Hồ Chí Minh đã nghiên cứu biến đổi nhiệt độ bề mặt đô thị trên cơ sở ứng dụng Viễn thám và GIS, qua đó phân tích và thiết lập mối tương quan giữa sự thay đổi nhiệt độ và quá trình đô thị hóa cho khu vực TP Hồ Chí Minh¬ Trong nghiên cứu này, tác giả sử dụng 2 loại ảnh: Aster và Landsat Đối với toàn TP Hồ Chí Minh, tác giả sử dụng ảnh trong 4 năm: 1989, 1998, 2002, 2006 Đối với 19 quận trong nội thành, tác giả sử dụng thêm ảnh của 6 năm: 1993, 1994, 1999, 2001, 2003, 2004 Tất cả ảnh Viễn thám đều chụp trong mùa khô để nghiên cứu về sự thay đổi nhiệt độ đô thị TP Hồ Chí Minh
Trang 16Hình 1.1 Phương pháp nghiên cứu biến đổi nhiệt độ đô thị [2]
Luận án tập trung vào việc xử lý ảnh Viễn thám để xác định nhiệt độ trung bình tại các khu vực như: khu công nghiệp, khu vực đô thị hóa, nội thành, vùng nông thôn, đất nông nghiệp, rừng, mặt nước trong các năm và có sự so sánh sự khác biệt về nhiệt
độ giữa các khu vực này và những yếu tố ảnh hưởng đến nó như lớp phủ thực vật, bề mặt không thoát nước
1.3 Đánh giá kết quả các công trình nghiên cứu đã công bố những tồn tại cần giải quyết
Những vấn đề nghiên cứu nhiệt độ bề mặt đất, mặt biển hay các chỉ số khô hạn,… trên thế giới và Việt Nam chủ yếu tập trung vào việc xử lý ảnh Viễn thám và đánh giá ảnh hưởng của các yếu tố chính có liên quan đến sự thay đổi nhiệt độ Sau đó, tác giả xác định nhiệt độ trung bình tại từng khu vực và so sánh qua các thời kỳ Do phải xác định nhiệt độ trung bình từng khu vực bằng phương pháp thủ công và phải do chuyên gia xử lý ảnh Viễn thám thực hiện nên chúng ta không thấy được chi tiết thông tin nhiệt
độ tại những khu vực mà chúng ta quan tâm Và cũng do không có được nguồn dữ liệu
Trang 17chi tiết nhiệt độ cả vùng nghiên cứu theo thời gian và không gian nên những công việc phân tích thông tin sau này sẽ gặp rất nhiều khó khăn
Do vậy, luận văn nghiên cứu phương pháp tự động xử lý ảnh Viễn thám và xây dựng CSDL, phân tích dữ liệu không gian về hiện tượng đảo nhiệt tại TP Hồ Chí Minh nhằm hỗ trợ các nhà quản lý trong công tác giám sát môi trường cũng như cung cấp đến người dân thông tin về tình hình thay đổi nhiệt độ tại khu vực mình đang sống một cách trực quan để có biện pháp thích ứng, đảm bảo đời sống sức khỏe tốt
Trang 18CHƯƠNG 2 CƠ SỞ LÝ THUYẾT SỬ DỤNG DỮ LIỆU ẢNH VIỄN THÁM TRONG TÍNH TOÁN, XỬ LÝ NHIỆT ĐỘ BỀ MẶT VÀ CHỈ SỐ THỰC VẬT CỦA LỚP PHỦ THỰC VẬT
2.1 Tổng quan về CSDL không gian
2.1.1 Giới thiệu về CSDL không gian
CSDL không gian là một loại CSDL quan hệ cung cấp các kiểu dữ liệu không gian
và các ngôn ngữ truy vấn dữ liệu không gian CSDL không gian hỗ trợ các kiểu dữ liệu không gian trong việc thực thi chính nó, cung cấp các kiểu đánh chỉ mục để thực thi truy vấn nhanh nhất từ bảng dữ liệu lớn
Mô hình CSDL không gian hỗ trợ các kiểu dữ liệu không gian như điểm (Point), đường thẳng (Line), đa giác (Polygon) CSDL dữ liệu không gian cung cấp mô hình cơ bản cho cấu trúc của hình học trong không gian như: kinh độ, vĩ độ…, cũng như kiểm tra mối quan hệ giữa các hình học trong không gian như: kiểm tra tính giao nhau, tính diện tích, chu vi hoặc tính khoảng cách giữa các đối tượng hình học trong không gian
Dữ liệu không gian là vô cùng lớn do đó việc đánh chỉ mục cho dữ liệu là vô cùng quan trọng nhằm tối ưu hóa truy vấn dữ liệu, giảm bớt thời gian truy vấn, giảm bộ nhớ lưu trữ…
2.1.2 Cấu trúc dữ liệu thông tin địa lý (GIS)
Các đối tượng hiển thị trên bản đồ được gọi là các đối tượng đồ họa hay được gọi tắt là các đối tượng Các đối tượng có thể là tự nhiên hoặc do con người tạo ra Có hai loại đối tượng đồ họa chính là: Vector (điểm, đường, đa giác), Raster (hình ảnh, các bức ảnh trên không được chỉnh sửa hình học (Digital Orthophotography) Hình 2.1 thể hiện hai loại đối tượng Vector và Raster
Trang 19Hình 2.1 Đối tượng Vectors (trái) và Raster (phải) [3]
Các loại dữ liệu GIS gồm: Ảnh (Images), Vector (Hình 2.2), Raster (Hình 2.3), thuộc tính (Attributes), Triangulated Irregular Network (TIN – Hình 2.4), chú thích trên
dữ liệu hình ảnh (Annotation – Hình 2.5) Trong phạm vi giới hạn đề tài sẽ phân tích 2 loại dữ liệu GIS gồm: dữ liệu Vector và dữ liệu Raster
Hình 2.2 Minh họa dữ liệu Vector [4]
Hình 2.3 Minh họa dữ liệu Raster [4]
Hình 2.4 Dữ liệu TIN [3]
Hình 2.5 Dữ liệu Annotation
2.2 Công nghệ Viễn thám
2.2.1 Giới thiệu
Viễn thám là một khoa học công nghệ giúp thu thập thông tin về các đối tượng trên
bề mặt trái đất mà không cần tiếp xúc trực tiếp với bề mặt ấy
Nguyên lý cơ bản của Viễn thám đó là đặc trưng phản xạ của các đối tượng tự nhiên tương ứng với từng giải phổ khác nhau Kết quả của việc giải đoán các lớp phụ thuộc rất
Trang 20nhiều vào sự hiểu biết về mối tương quan giữa đặc trưng phản xạ phổ với bản chất, trạng thái của các đối tượng tự nhiên Những thông tin về đặc trưng phản xạ phổ của các đối tượng tự nhiên sẽ cho phép các nhà chuyên môn chọn các kết quả tối ưu, chứa nhiều thông tin nhất về đối tượng nghiên cứu, đồng thời đây cũng là cơ sở để phân tích các tính chất của đối tượng, tiến tới phận loại chúng
2.2.2 Vệ tinh Landsat 8
Một trong các vệ tinh Landsat đó là Landsat 8 được phóng thành công lên quỹ đạo từ tháng 2/2013 với nhiệm vụ theo dõi rừng và các hệ sinh thái khác trên Trái đất Ảnh được thu nhận, lưu trữ và cung cấp miễn phí cho các nhà khoa học hoặc các tổ chức
có quan tâm Theo Tom Loveland, nhà khoa học thuộc dự án Landsat 8, trên thực tế, nhiệm vụ của trung tâm là chuẩn bị tất cả số ảnh này sẵn sàng cho người sử dụng trong vòng 48 giờ sau khi chụp Tuy nhiên, phần lớn số ảnh này đều được xử lý sẵn sàng trong vòng 24 giờ
Hình 2.6 Vệ tinh Landsat 8 tại Vandenberg Air Force Base Bang California
Tiền thân của Landsat 8 là vệ tinh Landsat 7 vẫn đang hoạt động trên quỹ đạo cùng lúc với vệ tinh mới này và gửi về khoảng 250 ảnh mỗi ngày Như vậy, một trong những ưu thế rõ ràng nhất của Landsat 8 là khả năng chụp và gửi về mỗi ngày nhiều ảnh hơn hẳn thế hệ vệ tinh trước Tuy nhiên, hai kênh phổ mới mới là ưu thế vượt trội của Landsat 8, trong đó một kênh phổ cho phép vệ tinh thu thập được thông tin ở các tầng
Trang 21nước sâu hơn trong đại dương, sông, hồ; trong khi đó kênh phổ mới còn lại có thể phát hiện mây (Cirrus) và chỉnh sửa các hiệu ứng khí quyển
Thêm vào đó, băng phổ hồng ngoại của Landsat 8 được chia thành hai, cho phép xác định nhiệt độ bề mặt chính xác hơn Loveland cho biết, tất cả những ưu thế của Landsat 8 sẽ tạo ra sự khác biệt đáng kể trong lập bản đồ và xác định biến động trên bề mặt Trái đất
Landsat 8 được lập trình bay vòng quanh Trái đất mất 99 phút, bao phủ toàn bộ
bề mặt Trái đất trong 16 ngày Với khoảng 400 ảnh được chuyển về mỗi ngày, vệ tinh Landsat 8 sẽ cung cấp cái nhìn chính xác hơn về sự biến đổi của Trái đất trong vòng 10 năm nhiệm vụ của mình
Bảng 2.1 So sánh các kênh của ảnh Landsat-7 và Landsat-8 [5]
Kênh Bước sóng
(µm)
Độ phân giải (m)
Kênh Bước sóng
(µm)
Độ phân giải (m)
Trang 22bộ cảm này được thiết kế để cải thiện hiệu suất và độ tin cậy cao hơn so với các bộ cảm Landsat thế hệ trước Landsat 8 thu nhận ảnh với tổng số 11 kênh phổ, bao gồm chín kênh sóng ngắn và hai kênh nhiệt sóng dài xem chi tiết ở (Bảng 2.1) Bộ cảm OLI cung cấp hai kênh phổ mới, Kênh 1 dùng để quan trắc biến động chất lượng nước vùng ven
bờ và Kênh 9 dùng để phát hiện các mật độ dày, mỏng của đám mây ti (có ý nghĩa đối với khí tượng học), trong khi đó bộ cảm TIRS sẽ thu thập dữ liệu ở hai kênh hồng ngoại nhiệt sóng dài (kênh 10 và 11) dùng để đo tốc độ bốc hơi nước, nhiệt độ bề mặt [5]
Các thông số kỹ thuật của sản phẩm ảnh vệ tinh Landsat 8 như sau [5]:
− Loại sản phẩm: đã được xử lý ở mức 1T nghĩa là đã cải chính biến dạng do chênh cao địa hình (mức trực ảnh Orthophoto)
− Định dạng: GeoTIFF
− Kích thước Pixel: 15m/30m/100m tương ứng ảnh Đen trắng Pan/Đa phổ/Nhiệt
− Phép chiếu bản đồ: UTM
− Hệ tọa độ: WGS 84
− Định hướng: theo Bắc của bản đồ
− Phương pháp lấy mẫu: hàm bậc 3
− Độ chính xác: với bộ cảm OLI đạt sai số 12m theo tiêu chuẩn CE, có độ tin cậy 90%, với bộ cảm TIRS đạt sai số 41m theo tiêu chuẩn CE, có độ tin cậy 90%
− Dữ liệu ảnh: có giá trị 16 bit pixel, khi tải về ở dạng file nén có định dạng là tar.gz, kích thước tập tin nếu ở dạng nén khoảng 1GB, còn ở dạng không nén khoảng 2GB
Trong khí tượng, ảnh Viễn thám của vệ tinh Landsat được dùng để dự báo thời tiết,
dự báo thiên tai liên quan đến biến đổi nhiệt độ bề mặt đất, mây Trong bản đồ, vệ tinh Landsat là công cụ đắc lực phục vụ cho ngành bản đồ, thành lập các loại bản đồ địa hình
và bản đồ chuyên đề ở nhiều tỉ lệ khác nhau Trong lĩnh vực Nông – Lâm nghiệp, vệ tinh Landsat được ứng dụng theo dõi mức độ biến đổi thảm phủ thực vật, độ che phủ rừng… Trong địa chất được ứng dụng theo dõi tốc độ sa mạc hoá, tốc độ xâm thực bờ biển, phân
Trang 23Trong đề tài luận văn này, ảnh Viễn thám được sử dụng làm dữ liệu đầu vào để tính toán, phân tích thông tin nhiệt độ bề mặt, lớp phủ thực vật Những tấm ảnh Viễn thám này được cung cấp bởi NASA, nó đã được nhiều nhà khoa học, cơ quan, tổ chức trên toàn thế giới sử dụng rộng rãi và kiểm nghiệm do đó ta có thể đảm bảo chất lượng dữ liệu đầu vào
2.3 Quan hệ giữa ảnh Viễn thám và cơ sở dữ liệu không gian
2.3.1 Dữ liệu dạng Vector
ESRI shapefile hay còn gọi là shapefile là một định dạng dữ liệu Vector cho phần mềm hệ thống thông tin địa lý Shapefile là tập hợp các tập tin “.shp”, “.shx”, “.dbf” Tập tin được quan tâm nhất trong shapefile là những tập tin có đuôi “.shp” nhưng shapefile vẫn cần những tập tin hỗ trợ khác
Hình 2.7 Minh họa tập tin shapefile
Shapefile miêu tả những kiểu dữ liệu hình học nguyên thủy như điểm, đường, vùng (gấp khúc hoặc đa giác) Những kiểu hình học này mô tả cho các đối tượng như: suối nước, sông, hồ… và đều có các thuộc tính mô tả như tên hay mức độ ô nhiễm… Nhưng có một số thuộc tính mà kiểu hình học này không thể hiện được Vì vậy, có một bảng chứa thuộc tính cho kiểu hình học nguyên thủy trong Shapefile Những kiểu hình
Trang 24học (điểm, đường, đa giác) cùng với thuộc tính dữ liệu tạo nên rất nhiều thể hiện về dữ liệu địa lý Điều này làm tăng khả năng và độ chính xác tính toán
Shapefile được tổ chức thành các tập tin riêng rẽ, tối thiểu cần phải có 3 tập tin với phần mở rộng là “shp”, “shx”, và “dbf” để lưu vào dữ liệu chính (core data) tạo shapefile Có 8 tập tin phụ thêm chứa dữ liệu chỉ mục tăng khả năng tìm kiếm
Một shapefile là định dạng lưu trữ dữ liệu Vector được số hóa cho việc lưu trữ vị trí địa lý và thông tin thuộc tính đi kèm
2.3.2 Dữ liệu dạng Raster
2.3.2.1 Ô lưới (cells)
Hình 2.8 Dữ liệu Raster được lưu ở dạng ô lưới (cells)
Dữ liệu Raster tạo thành một ma trận các ô lưới (hay điểm ảnh), trong đó mỗi ô chứa một giá trị Hay nói cách khác, các giá trị tại các ô lưới đại diện cho giá trị quang phổ của một đối tượng nào đó Đối tượng này có thể là đất, cây cối, đường phố…Giá trị quang phổ phụ thuộc vào độ phản xạ ánh sáng và màu sắc của đối tượng được chụp Hay nói cách khác, mỗi đối tượng có một giá trị phản xạ khác nhau
Trang 25Hình 2.9 Giá trị các ô lưới của Raster [12] Hình 2.10 Một ô lưới của Raster [12]
Dữ liệu Raster được lưu trữ theo danh sách các ô theo thứ tự từ trái qua phải và
từ trên xuống dưới Theo Hình 2.9, dữ liệu Raster sẽ lưu trữ các giá trị 80, 74, 62, 45, 45
và cứ như vậy cho đến khi hết
Mỗi ô lưới trong Raster có chiều cao và chiều rộng bằng nhau và bằng một phần diện tích của Raster
Ví dụ: Chúng ta có một dữ liệu dạng Raster diện tích là 100 km2, nếu Raster này có 100
ô lưới thì mỗi ô lưới sẽ có chiều dài và chiều rộng có kích thước là 1 km
Một ô lưới có thể có nhiều độ phân giải khác nhau Khi giảm kích thước ô lưới, chất lượng hình ảnh tốt hơn, nhưng số lượng ô lưới sẽ tăng lên Số lượng ô lưới lớn hơn
sẽ yêu cầu thời gian xử lý lâu hơn và tốn bộ nhớ lưu trữ hơn Ngược lại, nếu tăng kích thước ô lưới quá lớn, thông tin có thể bị mất hoặc có thể bị che khuất
Ví dụ: Trong Hình 2.11, Raster đại diện cho một vùng đường ray xe lửa, nếu kích thước
ô lưới lớn hơn chiều rộng của vùng đường ray đó thì có thể đường ray đó sẽ không tồn tại
Trang 26Hình 2.11 Độ phân giải của Raster [12]
Hình 2.12 Raster trên hệ trục tọa độ Oxy [12]
Mỗi ô lưới được xác định bởi chỉ số dòng và chỉ số cột Hay nói cách khác, mỗi
ô lưới được nằm trong một hệ trục tọa độ Trong đó có trục x là chỉ số cột, trục y là chỉ
số dòng và trục x cắt trục y tại O có tọa độ là (0, 0)
Hình 2.13 Giới hạn của một Raster [12]
Hình 2.14 Raster được chia thành nhiều
− Khu vực (regions):
Trang 27Một nhóm các ô lưới có giá trị giống nhau và liền kề nhau được gọi là một khu vực Một vùng có thể có nhiều khu vực Trong ví dụ Hình 2.14, vùng 2 gồm có hai khu vực,
vùng 4 có ba khu vực
2.3.2.3 Dữ liệu rời rạc
− Điểm (Points)
Trong dữ liệu Vector, mỗi điểm được xác định bởi tọa độ x và y Tuy nhiên trong
dữ liệu Raster, điểm là một ô lưới, là đơn vị nhỏ nhất của một Raster Theo định nghĩa, điểm không có diện tích, nhưng nếu chuyển sang ô lưới, điểm sẽ có diện tích bằng tích của chiều dài và chiều rộng của ô lưới (Hình 2.15)
Hình 2.15 So sánh điểm trong dữ liệu Vector (trái) và dữ liệu Raster (phải) [12]
sẽ được lựa chọn ngẫu nhiên (Hình 2.16)
Giống như điểm trong dữ liệu Vector, chiều rộng của đường sẽ thành chiều rộng của
ô lưới Ví dụ, nếu đường ray xe lửa có chiều rộng là 1m thì khi chuyển sang Raster, mỗi
ô lưới sẽ có chiều rộng là 1m
Trang 28Hình 2.16 So sánh đường giữa dữ liệu Vector (trái) và Raster (phải) [12]
− Vùng (Polygons)
Trong dữ liệu Vector, một vùng được biểu diễn bởi các cặp tọa độ có điểm đầu và điểm cuối trùng nhau Trong khi đó, đối tượng vùng trong dữ liệu Raster gồm một nhóm các ô lưới có giá trị giống nhau Các đối tượng biểu diễn vùng là các tòa nhà, hồ, đất, rừng… Độ chính xác phụ thuộc vào quy mô và kích thước của ô lưới Raster có độ phân giải càng cao (kích thước ô lưới nhỏ) thì độ chính xác càng cao
Hình 2.17 So sánh vùng trong Vector (trái) và Raster (phải) [12]
2.3.3 Phép giao
Phép giao (Intersection) là phần chung giữa hình A và hình B Nếu hình A và hình
B không có bất kỳ điểm chung thì trả về đối tượng hình rỗng
Như vậy, dù là dữ liệu Raster hay Vector thì chúng vẫn có thể chuyển đổi qua lại với nhau thông qua các hàm mà PostGIS hỗ trợ Đây cũng là cơ sở cho việc chúng ta thực hiện các phép giao trên hai nguồn dữ liệu khác nhau là Raster và Vector để rút trích những phần chung Sau đây để làm rõ chúng ta thực hiện một số kịch bản truy vấn:
− Vector giao với Vector và kết quả là dữ liệu Vector
− Vector giao với Raster và kết quả là dữ liệu Raster
Trang 29− Raster giao với Raster và kết quả là dữ liệu Raster
Ví dụ 2.3.3.1: Vector giao với Vector và kết quả là dữ liệu Vector
Hình 2.18 Vector giao với Vector cho ra kết quả Vector [6]
Trong Hình 2.18, Vector có hình tròn (hình màu hồng) giao với 2 Vector khác (Vector màu xanh da trời và màu xanh lá) Kết quả trả về là một nửa hình tròn chứa hai giá trị là Vector a và giá trị một loại Vector khác là 1
Ví dụ 2.3.3.2: Vector giao với Raster và kết quả là dữ liệu Raster
Ý tưởng: Đầu tiên chúng ta sử dụng hàm ST_Intersects để rút trích những lát (Titles) có
vùng chứa cả Vector và Raster Việc làm này sẽ làm giảm số lượng ô lưới truy vấn vì số lượng ô lưới nằm trong vùng chứa Vector và Raster thường nhỏ hơn so với toàn bộ ô lưới của toàn bộ Raster Theo Hình 2.19, cho thấy kết quả trả về gồm 2 lát là r12 và r13
Hình 2.19 Xác định các lát chứa Vector và Raster [6]
Sau đó, chúng ta sẽ chỉ thực hiện phép giao (ST_Intersection) với những ô lưới
thuộc r12, r13 với Vector Theo Hình 2.20, kết quả trả về là một Raster có giá trị là 1
Ngoài ra, thuộc tính của Vector (geometry) được bảo toàn trong bảng kết quả (Intersection)
Trang 30Hình 2.20 Vector giao với Raster cho ra kết quả Raster [6]
Ví dụ 2.3.3.3: Vector giao với Raster cho ra kết quả Vector
Ý tưởng: Trong trường hợp này, giá trị trả về là một Vector, nên việc đầu tiên là đưa dữ
liệu Raster về dạng Vector bằng hàm ST_DumpAsPolygon Sau đó sử dụng hàm
ST_Intersection (Vector, Vector) để giao bộ dữ liệu Vector đó với bộ dữ liệu Vector từ
giả thiết Theo Hình 2.21, kết quả trả về là các cặp geometry-pixel mang giá trị là 1
Hình 2.21 Vector giao vởi Raster cho ra kết quả Vector [6]
Ví dụ 2.3.3.4: Raster giao với Raster và kết quả trả về là Raster
Ý tưởng: Trong trường hợp này, kết quả trả về là một Raster đa kênh (MutiBands) thể hiện ở Hình 2.22 Vùng giới hạn (extent) tương ứng với vùng giới hạn giao nhau của hai Raster Lưu ý, vùng nodata (không chứa giá trị) nằm trong bất kỳ Raster nào thì cũng sẽ tồn tại trên Raster kia Hay nói cách khác, bất kỳ kênh nào có ô lưới “nodata” trong vùng giao nhau thì ô lưới “nodata” đó sẽ tồn tại trong kết quả Raster đầu ra
Trang 31Hình 2.22 Raster giao với Raster [6]
2.3.4 Tính giao nhau
Tính giao nhau (Intersect) là kiểm tra xem các vùng đó có giao nhau hay không
Nếu có trả về giá trá trị True, ngược lại là False Trong PostGIS, hàm hỗ trợ kiểm tra tính giao nhau của hai hình là hàm ST_Intersect Tuy nhiên, chúng ta cần lưu ý nếu Vector giao với vùng nodata trên Raster thì hàm ST_Intersect sẽ trả về giá trị False Nếu chỉ một phần Vector giao với vùng nodata, phần còn lại giao với vùng khác của Raster thì kết quả trả về ST_Intersect (Vector, Raster) sẽ bằng True
2.3.4.1 Raster và Points
Câu truy vấn:
SELECT id, ST_Value (rast, geom) elevation
FROM lidar, srtm
WHERE ST_Intersects (geom, rast)
Hình 2.23 Tính giao nhau giữa Raster với điểm [7]
Trong truy vấn trên, thực ra hàm ST_Intersect không cần nhất thiết phải sử dụng
Vì một điểm trong Vector được biểu diễn bằng một ô lưới trong Raster Do đó nếu hàm
Trang 32ST_Value dùng để lấy giá trị ô lưới nghĩa là Vector và ô lưới đó đã giao nhau Do đó,
không cần bắt buộc phải sử dụng hàm ST_Intersect
2.3.4.2 Raster và Lines
Một trong các ví dụ liên quan đến Raster và Lines là rút trích các giá trị của một đoạn đường trong một mạng lưới đường bộ (Hình 2.24)
Câu truy vấn:
SELECT id, (ST_Intersection (geom, rast)).geom road,
(ST_Intersection (geom, rast)).val elevation
FROM roadNetwork, srtm
WHERE ST_Intersects (geom, rast)
Hình 2.24 Raster giao với Đường [7]
SELECT id, (gv).geom buffer, (gv) val temp
FROM (SELECT id, ST_Intersection (geom, rast) gv
FROM buffers, temperature WHERE ST_Intersects (geom, rast))
Trang 33Hình 2.25 Raster giao với Polygon [7]
Truy vấn 2: Rút trích giá trị nhiệt độ trung bình của các polygons (Hình 2.26) và sắp
xếp thứ tự theo chỉ số của các polygons
Hình 2.26 Polygon chứa giá trị nhiệt của các ô lưới Raster [7]
2.4 Phương pháp tính nhiệt độ bề mặt từ dữ liệu Raster
Viễn thám hồng ngoại nhiệt, gọi tắt là Viễn thám nhiệt liên quan đến các sóng điện
từ với bước sóng giữa 3, 5 µm - 20 µm Hầu hết các ứng dụng Viễn thám nhiệt thường
sử dụng dãy sóng từ 8 µm đến 13 µm Nhiệt độ bề mặt được tính từ kênh nhiệt TIRS 1 của ảnh Landsat 8 với bước sóng từ 10.6 – 11.19 µm, độ phân giải 100 m
Phương pháp nghiên cứu dựa trên phép tính chuyển đổi nhiệt độ từ giá trị xám độ trên kênh nhiệt 10 của ảnh vệ tinh Landsat TIRS Quá trình thực hiện bắt đầu từ việc
Trang 34chuyển đổi giá trị số (Digital Number - DN) sang giá trị bức xạ phổ (L), sau đó chuyển đổi tiếp giá trị bức xạ này sang giá trị nhiệt độ
2.4.1 Chuyển đổi giá trị số (DN) sang giá trị bức xạ phổ (L )
Dữ liệu Landsat 8 được thu nhận dưới dạng ảnh số Do đó cần phải chuyển đổi giá trị của dữ liệu ảnh số này sang giá trị bức xạ phổ là giá trị phản ánh năng lượng phát
ra từ mỗi vật thể được thu nhận trên kênh nhiệt Việc chuyển đổi này được thực hiện theo biểu thức sau [5]:
L = ML* QCAL + AL
Ghi chú: các thông số được lấy từ tập tinh METADATA (phụ lục 5)
▪ QCAL: giá trị số của điểm ảnh
▪ M L : hệ số nhân của bức xạ theo kênh
▪ A L: hệ số cộng của bức xạ theo kênh
▪ L : Giá trị bức xạ phổ (W / (m2.sr.µm))
2.4.2 Chuyển đổi giá trị bức xạ phổ sang nhiệt độ
Ảnh kênh TRIS 1 của Landsat TIRS có thể được chuyển đổi từ giá trị bức xạ phổ sang biến vật lý hữu ích hơn Đây là nhiệt độ hiệu quả trên vệ tinh (nhiệt độ vật thể đen) của hệ thống được nhìn từ trái đất – khí quyển dưới giả thiết sự phát xạ bằng 1 Công thức chuyển đổi tính theo công thức Planck [5]:
Trang 352.5 Phương pháp tính chỉ số thực vật bề mặt từ dữ liệu Raster
Chỉ số NDVI (Normalized Difference Vegetation Index) được xác định dựa trên
sự phản xạ khác nhau của thực vật thể hiện giữa kênh phổ thấy được và kênh phổ cận hồng ngoại Dùng để biểu thị mức độ tập trung của thực vật trên mặt đất
Chỉ số thực vật được tính theo công thức sau [11]:
Hình 2.27 Ví dụ minh họa chỉ số thực vật (NDVI) thể hiện thực trạng thực vật [11]
Ghi chú:
▪ NIR (Near Infrared): Giá trị số của một điểm ảnh của kênh NIR
▪ IR (Infrared): Giá trị số của một điểm ảnh của kênh RED
▪ Landsat-8, hai kênh này có độ phân giải là 30m x 30m NDVI có giá trị trong
khoảng từ -1 đến 1
▪ Chỉ số NDVI càng lớn thì chất lượng cấy xanh càng tốt Ngược lại, chỉ số NDVI
càng nhỏ, chất lượng cấy xanh càng giảm
NDVI =(𝑵𝑰𝑹−𝑰𝑹)
(𝑵𝑰𝑹+𝑰𝑹)
Trang 36CHƯƠNG 3 PHƯƠNG PHÁP TỰ ĐỘNG XỬ LÝ ẢNH VIỄN THÁM VÀ XÂY DỰNG CƠ SỞ DỮ LIỆU KHÔNG GIAN
3.1 Một số phương pháp xử lý cải thiện thời gian lưu trữ dữ liệu
3.1.1 Giải pháp lựa chọn cách viết truy vấn dữ liệu
Bộ tối ưu truy vấn trong các hệ quản trị CSDL quan hệ luôn lựa chọn và đưa ra kế hoạch thực thi tốt nhất cho các truy vấn Tuy nhiên, kế hoạch thực thi của truy vấn có thể bị ảnh hưởng bởi cách viết truy vấn của người lập trình, nghĩa là với cách viết truy vấn khác nhau có thể có những kế hoạch thực thi truy vấn khác nhau Do vậy, cần phải lưu ý khi viết một truy vấn dữ liệu sao cho tốt là điều rất cần thiết, nhằm để đạt được hiệu quả cao về thời gian truy xuất dữ liệu
Phương án xử lý: có 2 phương án xử lý như sau:
- Phương án 1: Duyệt toàn bộ các quận trong bảng dữ liệu, tính khoảng cách và sau
đó sắp xếp khoảng cách từ quận Tân Bình đến các quận còn lại Cuối cùng lấy ra
năm quận đầu tiên thỏa điều kiện gần nhất với quận truy vấn
- Phương án 2: Loại bỏ các quận không nằm trong khoảng cách 100 mét với quận Tân Bình, sau đó duyệt các quận còn lại và lấy ra năm quận gần với quận Tân
Bình nhất
Ghi chú: Bảng quan_huyen (ten, geom) được mô tả như sau: Thuộc tính
“ten_quanhuyen” chứa thông tin tên của các quận; Thuộc tính “geom” chứa thông tin hình dạng hình học (polygons) các quận Đoạn chương trình viết cho phương án 1 và phương án 2 được thể hiện ở bảng 3.1
Bảng 3.1 Chương trình cài đặt thực thi truy vấn
Trang 37Phương án Câu truy vấn
Bảng 3.2 Kết quả thời gian truy vấn của 2 phương án ở bảng 3.1
phương án 2, thời gian truy vấn dữ liệu đạt hiệu quả cao hơn (từ 310 ms giảm xuống còn 135 ms)
Trang 383.1.2 Giải pháp cài đặt chỉ mục
Chỉ mục không gian (Spatial index) giúp cải thiện thời gian thực hiện các yêu cầu truy vấn dữ liệu Mục này sẽ trình bày một số kỹ thuật chỉ mục trong truy vấn để tăng tốc độ xử lý truy xuất dữ liệu Các loại chỉ mục bao gồm: chỉ mục từng phần (Partial Index), Chỉ mục hợp nhất (Compound Index), Chỉ mục hàm (Functional Index)
3.1.2.1 Chỉ mục từng phần (Partial Index)
Chỉ mục từng phần cho phép cài đặt chỉ mục trên thuộc tính có điều kiện tìm kiếm
cụ thể Ví dụ chúng ta có thể chỉ cài đặt chỉ mục cho thuộc tính “loại” trong bảng dữ liệu phuong_xa (id, ten, loai) với điều kiện tìm kiếm là “loai” = “Thị trấn”
- Chỉ mục từng phần chỉ cài đặt trên những thuộc tính thỏa điều kiện trong mệnh
đề WHERE Do vậy, tránh trường hợp cài đặt chỉ mục lên những dòng dư thừa
- Chỉ mục từng phần đôi khi lại là một “trợ lý đắc lực” cho người thiết kế chỉ mục trên dữ liệu Ví dụ, trong dữ liệu có đến 90% các dòng là như nhau và chỉ có 10% các dòng là khác nhau Người thiết kế chỉ mục có thể chỉ cài đặt chỉ mục trên 10% dòng dữ liệu khác nhau đó và không cần cài đặt chỉ mục trên 90% dòng dữ liệu giống nhau còn lại
Khuyết điểm:
- Điều kiện trong mệnh đề WHERE (cú pháp cài đặt chỉ mục từng phần) phải tương thích với câu truy vấn Điều này có nghĩa là cài đặt chỉ mục trên thuộc tính nào thì thuộc tính đó phải được sử dụng (phải nằm trong mệnh đề SELECT) thì chỉ mục từng phần mới mang lại hiệu quả
- Đối với điều kiện trong mệnh đề WHERE là một tham số, thì người cài đặt chỉ mục sẽ không thấy được hiệu năng mang lại và có nên cài đặt chỉ mục hay không
Trang 39“SELECT FROM sometable WHERE status = $1” Vì người cài đặt chỉ mục
không thể đoán trước được tham số truyền vào Do đó, người cài đặt chỉ mục không thể xác định được xem có nên cài đặt chỉ mục hay không
Thực nghiệm:
Mục đích: Để làm rõ sự cải thiện hiệu suất khi cài đặt chỉ mục không gian, thực nghiệm
sẽ tiến hành “Yêu cầu truy vấn 3.2” bằng hai giải pháp: cài đặt chỉ mục không gian và không cài đặt chỉ mục không gian Cụ thể như sau:
Yêu cầu truy vấn 3.2: Tìm tất cả các quận trên địa bàn TP Hồ Chí Minh có các dòng sông, kênh rạch đi ngang qua
Để giải quyết “yêu cầu truy vấn 3.2”, ta sử dụng 2 bảng được mô tả như sau:
- Bảng dữ liệu quan_huyen (ten, geom): Thuộc tính “ten” chứa thông tin tên của các quận; Thuộc tính “geom” chứa thông tin dạng hình học (polygons) các quận
- Bảng dữ liệu smallrivers (gid, name, geom): Thuộc tính “gid” chứa thông tin mã của các con sông; Thuộc tính “name” chứa thông tin tên các dòng sông, kênh rạch của Việt Nam; Thuộc tính “geom” chứa thông tin kiểu dáng hình học (Lines) của tất cả các dòng sông, kênh rạch của Việt Nam
Bảng 3.3 Đoạn chương trình cài đặt chỉ mục không gian
CREATE INDEX vnm_adm3_geom_gist
ON quan_huyen USING gist (geom)
WITH (FILLFACTOR=90);
CREATE INDEX smallrivers_geom_gist
ON smallrivers
USING gist(geom);
EXPLAIN ANALYZE VERBOSE SELECT c.ten, b.name
FROM quan_huyen AS c INNER JOIN
smallrivers As b
1 Cài đặt chỉ mục (Spatial Indexes)
2 Thực thi truy vấn
Trang 40ON ST_Intersects(c.geom, b.geom);
Ghi chú: Quy trình thực hiện đoạn chương trình cài đặt của Bảng 3.3 như sau: Ở đoạn
chương trình 1 cài đặt chỉ mục không gian lên thuộc tính “geom” (chứa dạng hình học) cho cả 2 bảng quan_huyen và smallrivers; Ở đoạn chương trình 2, ta sử dụng câu
lệnh Explain Analyze Verbose để xem hiệu suất truy vấn Kết quả so sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục không gian được thể hình ở bảng 3.4 và hình 3.1
Bảng 3.4 So sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục không gian
Hình 3.1 So sánh thời gian truy vấn trước và sau khi cài đặt chỉ mục không gian
Kết luận: Dựa vào bảng 3.4 và hình 3.1, chúng ta có thể thấy được hiệu năng được tăng lên rõ rệt sau khi cài đặt chỉ mục không gian (từ 1064ms giảm xuống còn 388ms) Như
vậy, việc cài đặt chỉ mục không gian là rất quan trọng khi thiết kế một CSDL không gian