Thêm vào đó, với số lượng điểm lớn, để cải thiện và tăng khả năng sử dụng của dữ liệu ĐMĐ LiDAR cho các bài toán ứng dụng khác nhau như: thành lập mô hình số địa hình Digital Terrain Mod
Trang 1VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-
NGUYỄN THỊ HỮU PHƯƠNG
NGHIÊN CỨU PHƯƠNG PHÁP PHÂN LOẠI DỮ LIỆU ĐÁM
MÂY ĐIỂM LIDAR VÀ ỨNG DỤNG
LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
HÀ NỘI – 2022
Trang 2VÀ CÔNG NGHỆ VIỆT NAM
HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ
-
Nguyễn Thị Hữu Phương
NGHIÊN CỨU PHƯƠNG PHÁP PHÂN LOẠI DỮ LIỆU ĐÁM
MÂY ĐIỂM LIDAR VÀ ỨNG DỤNG
Chuyên ngành: Hệ thống thông tin
Mã số: 9 48 01 04
LUẬN ÁN TIẾN SĨ NGÀNH MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1 PGS.TS Đặng Văn Đức
2 PGS.TS Nguyễn Trường Xuân
Hà Nội – Năm 2022
Trang 3LỜI CẢM ƠN
Trong quá trình thực hiện đề tài “Nghiên cứu phương pháp phân loại dữ
liệu đám mây điểm LiDAR và ứng dụng”, NCS đã nhận được rất nhiều sự giúp
đỡ, tạo điều kiện của Học viện Khoa học và Công nghệ, Viện Công nghệ thông tin, Viện hàn lâm Khoa học và Công nghệ Việt Nam NCS xin bày tỏ lòng cảm ơn chân thành về sự giúp đỡ đó
NCS xin bày tỏ lòng biết ơn sâu sắc tới PGS.TS Đặng Văn Đức và PGS.TS Nguyễn Trường Xuân – những người thầy trực tiếp hướng dẫn và chỉ bảo cho NCS hoàn thành luận án này Hai thầy đã dành cho NCS nhiều thời gian, tâm sức, đóng góp nhiều ý kiến, nhận xét quý báu, chỉnh sửa cho NCS những chi tiết nhỏ trong luận án, giúp luận án của NCS được hoàn thiện hơn về mặt nội dung và hình thức
NCS xin chân thành cảm ơn bạn bè, đồng nghiệp đang công tác tại Bộ môn Công nghệ phần mềm, Khoa Công nghệ thông tin, Trường Đại học Mỏ - Địa chất
đã tạo điều kiện và giúp đỡ NCS trong suốt quá trình thực hiện và hoàn thành luận
án này
Sự cảm ơn sâu sắc NCS xin dành tới gia đình đã luôn chia sẻ, động viên, cảm thông trong những chuỗi ngày dài học tập và nghiên cứu, NCS luôn nhận được sự yêu thương từ gia đình để có thể đạt được kết quả như ngày hôm nay
TÁC GIẢ LUẬN ÁN
NCS Nguyễn Thị Hữu Phương
Trang 4MỤC LỤC
LỜI CẢM ƠN 1
MỤC LỤC……… 2
DANH MỤC CÁC TỪ VIẾT TẮT 4
DANH MỤC HÌNH VẼ 6
DANH MỤC BẢNG BIỂU 8
MỞ ĐẦU……….9
CHƯƠNG 1 TỔNG QUAN VỀ PHÂN LOẠI DỮ LIỆU ĐÁM MÂY ĐIỂM LIDAR……… 15
1.1Kiến trúc hệ thống LiDAR 15
1.1.1 Khái niệm công nghệ LiDAR 15
1.1.2 Hoạt động của hệ thống LiDAR 17
1.2Dữ liệu LiDAR 19
1.2.1 Thu nhận dữ liệu ĐMĐ theo công nghệ LiDAR 19
1.2.3 Đặc trưng của dữ liệu ĐMĐ LiDAR 20
1.2.3 Định dạng dữ liệu LiDAR 21
1.3 Bài toán phân loại dữ liệu ĐMĐ LiDAR 22
1.3.1 Bài toán phân loại dữ liệu Lỗi! Thẻ đánh dấu không được xác định 1.3.2 Các bài toán phân loại ĐMĐ LiDARLỗi! Thẻ đánh dấu không được xác định. 1.4 Các công trình nghiên cứu liên quan 28
1.4.1 Trong nước 28
1.4.2 Ngoài nước 29
1.5Phương pháp đề xuất 35
1.6Kết luận chương 37
CHƯƠNG 2 PHÁT TRIỂN THUẬT TOÁN NÂNG CAO CHẤT LƯỢNG PHÂN LOẠI ĐMĐ LIDAR 38
2.1 Cải tiến thuật toán EM 38
2.1.1 Mô tả thuật toán EM 38
2.1.2 Ý tưởng cải tiến thuật toán EM 42
2.1.3 Thực hiện cải tiến 44
2.1.4 Thử nghiệm và đánh giá thuật toán EM - D 52
Trang 52.2 Cải tiến thuật toán MCC 60
2.2.1 Mô tả thuật toán MCC 60
2.2.2 Ý tưởng cài tiến thuật toán MCC 65
2.2.3 Thực hiện cải tiến 68
2.2.4 Thử nghiệm và đánh giá thuật toán MCC - D 76
2.3 Kết luận chương 80
CHƯƠNG 3 ĐỀ XUẤT SỬ DỤNG HIỆU QUẢ ĐÁM MÂY ĐIỂM LIDAR SAU PHÂN LOẠI ………81
3.1 Lớp phủ khu vực đô thị và khả năng sử dụng của dữ liệu LiDAR trong phân loại lớp phủ bề mặt khu vực đô thị 81
3.2 Đề xuất phương pháp xử lý dữ liệu LiDAR trong phân loại lớp phủ bề mặt khu vực đô thị ……….84
3.2.1 Phân loại lớp phủ bề mặt khu vực đô thị 84
3.2.2Phương pháp đề xuất 87
3.2.3Thử nghiệm ……… 88
3.2.4 Tạo bộ dữ liệu đầu vào cho DSS trong quy hoạch đất đai 94
3.3 Kết luận chương 102
KẾT LUẬN ………104
DANH MỤC CÁC CÔNG TRÌNH KHOA HỌC CỦA TÁC GIẢ 106
TÀI LIỆU THAM KHẢO 108
Trang 6DANH MỤC CÁC TỪ VIẾT TẮT
3D 3 Dimensions 4D 4 Dimensions ASPRS American Society for Photogrammetry and Remote Sensing BCAL Boise Center Aerospace Laboratory LiDAR
CHM Canopy Height Model CNN Convolutional Neural Network CORS Continous Operating Reference Station DEM Digital Elevation Model
ĐMĐ ĐMĐ DSM Digital Surface Model DSS Decision Support System DTM Digital Terrain Model
EM Expectation Maximization GMM Gaussian Mixture Model GNSS Global Navigation Sattelite System IDW Inverse Distance Weighting
INS Inertial Navigation System k-NN k Nearest Neighbor
Laser Light amplification by stimulated emission of radiation LiDAR Light Detection And Ranging
MCC Multiscale Curvature Classification MLS Mobile Laser Scanning
NN Nereast Neighbor NVC Nạve Bayes Classification OBC Object-Based Classification PCA Principal Component Analysis pPCA Probabilistic Principle Component Analysis RBF Radial Basis Function
Trang 7RCF Random Conditional Field RGB Red – Green - Blue
SVM Support Vector Machine TIN Triangulated Irregular Network TLS Terrestrial Laser Scanning TNHH MTV Trách nhiệm hữu hạn một thành viên ToF Time of Flight
TPS Thin Plate Spline UAV Unmanned Aerial Vehicle WSVM Wavelet Support Vector Machine
PS Point Spacing
PD Point Density ISPRS International Society for Photogrammetry and Remote Sensing
Trang 8DANH MỤC HÌNH VẼ
Hình 1.1 Thành phần của hệ thống LiDAR 16
Hình 1.2 Cách hoạt động của các thành phần trong hệ thống LiDAR 17
Hình 1.4 Cường độ và năng lượng thu nhận từ các tia phản xạ 18
Hình 1.5 Nguyên lý quét của LiDAR 18
Hình 1.6 ĐMĐ sau khi được thu nhận và xử lý 19
Hình 1.7 Nguyên lý thu thập dữ liệu của hệ thống LiDAR 19
Hình 1.8 ĐMĐ khi chưa được xử lý 20
Hình 1.9 Quá trình phân loại dữ liệu tổng quátLỗi! Thẻ đánh dấu không được xác định. Hình 1.10 Tiến trình xử lý dữ liệu điểm LiDAR 23
Hình 1.11 Các bước thực hiện lọc điểm ground 25
Hình 1.12 Kết quả tạo DEM và nội suy đường bình độ từ dữ liệu điểm LiDAR (Bộ TNMT) 26
Hình 1.13 Quy trình phân loại dữ liệu LiDAR tổng quát 27
Hình 1.14 Các bước thực hiện phương pháp đề xuất 36
Hình 2.1 Tiến trình của thuật toán EM 40
Hình 2.2 Quy trình thực hiện cải tiến thuật toán EM (EM-D) 43
Hình 2.3 Tạo độ x, y, z của ĐMĐ 53
Hình 2.4 Hình ảnh hiển thị ĐMĐ 3D 53
Hình 2.5 Độ cao và giá trị cường độ phản xạ của điểm 54
Hình 2.6 Điểm được hiển thị theo độ cao và chia thành các ĐMĐ nhỏ hơn 55
Hình 2.7 Sự tương quan trong bộ dữ liệu 55
Hình 2.8 Phân tích thành phần chính dựa trên pPCA 56
Hình 2.9 Ma trận thành phần chính của mô hình 56
Hình 2.10 Bảng tổng hợp giá trị riêng được khởi tạo và tính toán lại 57
Hình 2.11 Tổng hợp tổng phương sai của các thành phần trong bộ dữ liệu 57
Hình 2.12 Ma trận thành phần sau khi được tính toán và tổng hợp 57
Hình 2.13 Tham số của mô hình được cập nhật với bộ dữ liệu 1 58
Hình 2.14 Tham số cập nhật cho bộ dữ liệu 2 59
Hình 2.15 Sự phân bố của dữ liệu theo hai thành phần chính 59
Hình 2.16 Sự phân bố của dữ liệu với hai thành phần trong bộ dữ liệu 2 60
Trang 9Hình 2.17 Sơ đồ thuật toán MCC 63
Hình 2.18 Quy trình thực hiện phân loại ĐMĐ với MCC - D 66
Hình 2.19 Một TPS đi qua các điểm kiểm soát 67
Hình 2.20 Bộ dữ liệu thử nghiệm với MCC-D tại Uông Bí, Quảng Ninh 77
Hình 2.21 Một phần đồ thị Voronoi được tạo 77
Hình 2.22 Mật độ của các điểm dữ liệu 78
Hình 2.23 Giá trị PD của bộ dữ liệu 78
Hình 2.24 Kết quả phân loại với MCC-D 79
Hình 3.1 Quy trình phân loại lớp phủ bề mặt sử dụng ảnh viễn thám 86
Hình 3.2 Phương pháp phân loại lớp phủ bề mặt và thành lập mô hình ứng dụng 87
Hình 3.3 Tọa độ và mô hình 3D ĐMĐ năm 2018 90
Hình 3.4 Kết quả phân loại với EM – D 91
Hình 3.5 DEM với độ phân giải là 1m 92
Hình 3.6 DSM với độ phân giải 1m 93
Hình 3.7 Các thành phần của DSS trong quy hoạch đất 95
Hình 3.8 Tạo bộ dữ liệu đầu vào cho DSS trong quy hoạch đất đai sử dụng dữ liệu LiDAR 98
Hình 3.9 ĐMĐ sau khi loại bỏ nhiễu 99
Hình 3.10 Sự phân bố của điểm sau phân loại 100
Hình 3.11 Mô hình DEM 101
Hình 3.12 Mô hình DSM 101
Hình 3.13 Mô hình 3D 101
Hình 3.14 Mô hình mô phỏng khu vực đo vẽ 102
Trang 10DANH MỤC BẢNG BIỂU
Bảng 2.1 Số lượng điểm trong tập dữ liệu huấn luyện và kiểm tra 53
Bảng 2.2 Số lượng điểm trong tập dữ liệu huấn luyện và kiểm tra của bộ dữ liệu 53
Bảng 2.3 Sự tương quan và tần suất hai thành phần chính 59
Bảng 2.4 So sánh kết quả phân loại của thuật toán EM - D và thuật toán EM [45] 60 Bảng 2.5 Bộ dữ liệu huấn luyện và kiểm tra được lựa chọn tại Uông Bí 77
Bảng 2.6 So sánh kết quả phân loại giữa MCC - D và MCC phiên bản 2.2 (2020) 79 Bảng 2.7 Số điểm trong tập dữ liệu huấn luyện và kiểm tra của mỗi lớp 80
Bảng 2.8 Ma trận nhầm lẫn và giá trị OA 80
Bảng 3.1 Giá trị thuộc tính của bộ dữ liệu LiDAR được sử dụng 89
Bảng 3.2 Số lượng các điểm trong tập dữ liệu huấn luyện và kiểm tra 90
Bảng 3.3 Số lượng điểm của các lớp sau phân loại 91
Bảng 3.4 So sánh kết quả phân loại của EM – D với MCC và EM 91
Bảng 3.5 Số lượng điểm thuộc các lớp sau phân loại 99
Bảng 3.6 Bảng so sánh độ chính xác của kết quả phân loại 100
Trang 11MỞ ĐẦU
1 Tính cấp thiết của đề tài nghiên cứu
Công nghệ LiDAR (Light Detection and Ranging) là công nghệ tiên tiến trong lĩnh vực Trắc địa – bản đồ LiDAR là công nghệ viễn thám chủ động không phụ thuộc vào thời tiết trong quá trình thu thập dữ liệu không gian Trái đất LiDAR
có khả năng thu thập thông tin về đối tượng bằng cách phát tia laser tới mục tiêu và thu nhận tia phản xạ Sự khác biệt về thời gian đi và về của tia laser cùng với thông tin từ tia phản xạ ta có thể thu được các thông tin về đối tượng và tạo ra mô hình số
3 chiều của nó LiDAR là một trong số ít loại cảm biến có thể tạo ảnh nhiều lớp một cách đáng tin cậy LIDAR cung cấp thông tin chính xác về các đối tượng được khảo sát bằng cách đo tuần tự với độ chính xác cao Với những ưu điểm vượt trội của mình trong lĩnh vực nghiên cứu khí quyển và bề mặt Trái đất, LiDAR ngày càng được sử dụng rộng rãi [1]
Từ những năm đầu của thập niên 60 của thế kỷ 20, sự ra đời của bộ khuếch đại ánh sáng bằng phát xạ kích thích – Laser đã mở rất nhiều ứng dụng mới, trong
đó phải kể đến kĩ thuật khảo sát từ xa sử dụng nguồn kích thích bằng tia laser gọi là LiDAR Công nghệ LiDAR là sự phát triển và ứng dụng các thiết bị laser, định vị
vệ tinh và đo quán tính để thu thập dữ liệu địa lý trên bề mặt Trái đất [2] Bản chất của công nghệ LiDAR là kỹ thuật đo dài laser, định vị không gian GPS/INS và sự nhận biết cường độ phản xạ ánh sáng [2] Sóng laser được phản hồi từ bề mặt Trái đất hay từ các đối tượng trên bề mặt như cây cối, đường hoặc nhà , với mỗi xung
sẽ đo được thời gian đi và về của tín hiệu, từ đó ta tính được khoảng cách từ nguồn phát laser tới đối tượng Các đối tượng trên bề mặt Trái đất khác nhau có khả năng phản xạ tia quét laser với cường độ khác nhau Ở mỗi thời điểm phát xung laser, hệ thống định vị vệ tinh GNSS và INS sẽ xác định vị trí không gian của điểm phát, góc định hướng trong không gian của tia quét sẽ được xác định từ máy phát laser Một tia laser phát đi, sẽ có một hay nhiều tín hiệu phản hồi Với các trị đo tổng hợp đó tính được vị trí (tọa độ không gian) của các điểm trên bề mặt Trái đất Số lượng tia phản xạ từ bề mặt Trái đất phụ thuộc vào tính không gian của các đối tượng trên đó
Với số lượng tia phản xạ từ hàng trăm đến trăm ngàn được thu nhận trong một giây, LiDAR thực hiện quét bề mặt Trái đất với mật độ điểm dày đặc, kết quả cho ra dữ liệu đám mây điểm (ĐMĐ) được tham chiếu địa lý biểu thị chi tiết bề mặt vùng
Trang 12quét ĐMĐ là tập hợp các điểm dữ liệu tương tự thế giới thực theo ba chiều Mỗi điểm được xác định bởi vị trí và màu sắc của chính nó, các điểm trong ĐMĐ được đặc trưng bởi tọa độ (x, y) và độ cao (z) Các điểm sau đó có thể được hiển thị dưới dạng pixel để tạo mô hình 3D có độ chính xác cao của đối tượng Các ĐMĐ có khả năng mô tả các vật thể có kích thước chỉ vài milimet hoặc các vật thể lớn như cây cối, tòa nhà và thậm chí toàn bộ thành phố [3] Các ĐMĐ thô được quét từ các đối tượng vật lý như bên ngoài tòa nhà, nhà máy, địa hình, … Sau khi thu thập dữ liệu thô, ĐMĐ phải được chuyển đổi thành các tệp máy tính có thể đọc được Dữ liệu ĐMĐ là rất lớn Tùy theo mục đích sử dụng cụ thể, số lượng điểm và lớp điểm được
sử dụng là khác nhau Ngoài dữ liệu ĐMĐ, LiDAR còn tạo ra ảnh cường độ xám dựa trên cường độ phản xạ khác nhau của các đối tượng trên Trái đất [4]
Tuy nhiên, ĐMĐ thô không phải là sản phẩm cuối cùng Để truy xuất thông tin từ ĐMĐ, các bước xử lý được áp dụng như phân loại (Classification), lọc (Filtering) và mô hình hóa (Modelling) Hệ thống LIDAR với khả năng quét thu được hàng trăm hoặc thậm chí hàng nghìn điểm chỉ với một xung laser duy nhất
Điều này khiến cho các ĐMĐ thô với mật độ điểm cực lớn và có nhiễu do độ nhạy cao của máy dò xuống mức đơn photon, các ĐMĐ hiển thị rất nhiều “điểm trong không khí” Để sử dụng ĐMĐ LiDAR trong các bài toán ứng dụng cụ thể, cần thiết phải xử lý trước để giảm nhiễu Thêm vào đó, với số lượng điểm lớn, để cải thiện và tăng khả năng sử dụng của dữ liệu ĐMĐ LiDAR cho các bài toán ứng dụng khác nhau như: thành lập mô hình số địa hình (Digital Terrain Model – DTM), mô hình
số độ cao (Digital Elevation Model – DEM), mô hình số bề mặt (Digital Surface Model – DSM), tính toán sinh khối rừng, mô hình 3D mô phỏng, khảo sát địa hình khu vực ven biển, phân loại lớp phủ bề mặt … ta phải tiến hành phân loại điểm trong ĐMĐ đó Thực hiện bài toán phân loại dữ liệu ĐMĐ LiDAR giúp sử dụng được tối đa các thông tin có ích từ dữ liệu ĐMĐ, cho ta kết quả nhất quán và độ chính xác cao hơn so với dữ liệu ĐMĐ LiDAR thô ban đầu
Tại Việt Nam, công nghệ LiDAR được áp dụng từ những năm 2006 trong lĩnh vực Trắc địa – Bản đồ Tuy nhiên, những ứng dụng của LiDAR chủ yếu trong thành lập DEM/DTM/DSM mà chưa có nhiều những bài toán ứng dụng trong các bài toán như quản lý đất đai, khảo sát địa hình khu vực ven biển, khảo cổ, địa chất,
… Hạn chế này là do bài toán phân loại ĐMĐ LiDAR vẫn chưa được quan tâm tại
Trang 13Việt Nam, khi tại các đơn vị sản xuất vẫn đang sử dụng phương pháp phân loại bán
tự động sử dụng các phần mềm phân loại thương mại được bán kèm cùng với thiết
bị và con người (đối chiếu kết quả phân loại với bản đồ hiện trang khu vực đo vẽ, ảnh cường độ xám và hiệu chỉnh kết quả) Thời gian phân loại thường tốn nhiều thời gian do quá trình hiệu chỉnh và đối chiếu, kết quả phân loại không chính xác do sai số sai lầm, …
Hiện nay, trên thế giới các thuật toán phân loại dữ liệu LiDAR ngày càng được cải tiến Phân loại dữ liệu ĐMĐ LiDAR tự động được thực hiện bằng các thuật toán phân loại điểm, trên cơ sở kết hợp với ảnh cường độ xám, kết quả thu được từ công tác thực địa và dữ liệu ảnh số được chụp (trong trường hợp hệ thống LiDAR có máy chụp ảnh kỹ thuật số) [4] Các thuật toán được các nhà khoa học ngoài nước công bố trên các Tạp chí, Hội thảo chỉ ra rằng với mỗi khu vực, bộ dữ liệu khác nhau sẽ có thuật toán phân loại phù hợp cho ra kết quả phân loại tốt nhất
Trước khi thực hiện việc phân loại dữ liệu tự động cần đặc biệt lưu ý tới các đặc trưng cơ bản về địa hình, địa mạo, công trình xây dựng, thủy văn, thực phủ, khu dân cư… (Kích thước tối đa, tối thiểu các công trình; chiều cao tối đa, tối thiểu của cây;
vùng lỗi do mặt nước; các điểm bị lỗi; các điểm trên không…) [1] Sau khi kết thúc công đoạn này ta cần phân loại và gán nhãn cho các điểm trong ĐMĐ như: Lớp chứa điểm ground, Lớp chứa điểm thực phủ, Lớp chứa điểm trên mái nhà, tường nhà và các công trình xây dựng, Lớp chứa các điểm trên không, Lớp chứa các điểm
bị lỗi, Lớp chứa các điểm trên mặt nước … Từ đó sử dụng dữ liệu ĐMĐ cho các bài toán rộng hơn như tính toán sinh khối, thành lập mô hình 3D hay tạo bộ dữ liệu cho hệ hỗ trợ ra quyết định Để phát huy hiệu quả công nghệ LiDAR phục vụ cho các ứng dụng khác nhau, sử dụng những thành tựu đã được công bố về thuật toán phân loại ĐMĐ LiDAR, NCS nhận thấy việc nghiên cứu về công nghệ, về thuật toán sử dụng và về khả năng phát triển các thuật toán phân loại ĐMĐ tự động mới phù hợp với điều kiện địa hình của Việt Nam phù hợp với yêu cầu thực tế
Do đó, nghiên cứu phương pháp phân loại tự động dữ liệu LiDAR của luận
án là cần thiết, mang tính khoa học và khả năng thực tiễn cao tại Việt Nam
2 Mục tiêu nghiên cứu
Mục tiêu của luận án là nghiên cứu đề xuất phương pháp, thuật toán phân loại ĐMĐ LiDAR có độ chính xác cao Kết quả sau phân loại dữ liệu LiDAR sẽ
Trang 14được sử dụng thử nghiệm cho bài toán nghiên cứu đánh giá sự thay đổi của lớp phủ
bề mặt khu vực đô thị và tạo bộ dữ liệu đầu vào cho DSS trong quản lý đất đai
3 Đối tượng và phạm vi nghiên cứu
Để hoàn thành mục tiêu nghiên cứu của luận án, đối tượng nghiên cứu của luận án tập trung vào bài toán phân loại dữ liệu ĐMĐ LiDAR
Đối tượng nghiên cứu của luận án là công nghệ LiDAR, bài toán phân loại điểm và khả năng sử dụng của thuật toán EM và MCC để nâng cao hiệu quả của kết quả phân loại ĐMĐ LiDAR phục vụ cho bài phân loại bề mặt lớp phủ của khu vực
đô thị từ đó tạo mô hình mô phỏng lớp phủ bề mặt và tạo bộ dữ liệu cho DSS trong quản lý đất đai
Phạm vi nghiên cứu của luận án tập trung chủ yếu vào bài toán phân loại dữ liệu ĐMĐ LiDAR mà trọng tâm là phát triển thuật toán phân loại dữ liệu ĐMĐ LiDAR tự động và ứng dụng trên bộ dữ liệu được thu thập tại Việt Nam
4 Nội dung nghiên cứu
Để thực hiện được mục tiêu đặt ra của luận án, luận án sẽ thực hiện các nội dung nghiên cứu sau:
- Công nghệ LiDAR và cơ sở toán học của dữ liệu ĐMĐ LiDAR
- Bài toán phân loại dữ liệu ĐMĐ LiDAR
- Thuật toán và phương pháp phân loại ĐMĐ LiDAR
- Lựa chọn thuật toán và đề xuất phương pháp phân loại ĐMĐ LiDAR
- Nghiên cứu về lớp phủ bề mặt khu vực đô thị
- Sử dụng dữ liệu LiDAR sau phân loại phân loại lớp phủ bề mặt khu vực
đô thị và tạo bộ dữ liệu đầu vào cho DSS trong quy hoạch đất đai
5 Phương pháp nghiên cứu
- Phương pháp nghiên cứu phân tích, tổng hợp: Thu thập và nghiên cứu các các bài báo, luận án tiến sĩ, sách, tài liệu đã được công bố có liên quan đến công nghệ LiDAR, bài toán phân loại ĐMĐ LiDAR Thông qua đó có thể chọn lọc các nội dung, vấn đề nghiên cứu, tiến hành đề xuất và cải tiến thuật toán/phương pháp
và đưa ra hướng giải quyết bài toán
- Phương pháp thực nghiệm: Để đánh giá độ chính xác thuật toán/phương pháp cải tiến và để xuất, thực hiện cài đặt, chạy thử nghiệm trên nhiều bộ dữ liệu và
Trang 15so sánh với kết quả nghiên cứu lý thuyết Thông qua đó chứng minh được độ chính xác của kết quả nghiên cứu
- Phương pháp viễn thám: Sử dụng các kỹ thuật xử lý dữ liệu viễn thám để thành lập mô hình DEM/DSM/DTM, mô hình mô phỏng, … phục vụ cho các thực nghiệm của nghiên cứu
6 Ý nghĩa khoa học và thực tiễn của luận án
-Ý nghĩa khoa học: Luận án nghiên cứu về cơ sở toán học của dữ liệu ĐMĐ LiDAR, bài toán phân loại ĐMĐ LiDAR, các thuật toán phân loại dữ liệu ĐMĐ đã được công bố Từ những nghiên cứu lý thuyết này, NCS đã cải tiến được phương pháp phân loại ĐMĐ LiDAR sử dụng thuật toán EM và MCC
- Ý nghĩa thực tiễn: Kết quả của luận án góp phần nâng cao độ chính xác trong bài toán phân loại dữ liệu ĐMĐ LiDAR Áp dụng công nghệ LiDAR tại Việt Nam không còn chỉ dừng lại ở ứng dụng và sử dụng những phương pháp, phần mềm phân loại đã có sẵn Luận án đã mở rộng khả năng sử dụng của dữ liệu ĐMĐ của công nghệ LiDAR trong các lĩnh vực nghiên cứu, giám sát các đối tượng địa lý
7 Câu hỏi nghiên cứu
Câu hỏi 1: Bài toán phân loại tự động ĐMĐ LiDAR tại Việt Nam có những
hạn chế nào? Tại sao lại cần phát triển thuật toán phân loại tự động ĐMĐ LiDAR phù hợp với yêu cầu sử dụng tại Việt Nam?
Câu hỏi 2: Có thể phân loại tự động đám mây điểm LiDAR bằng thuật toán
EM và MCC được không? Các hạn chế của thuật toán EM và MCC là gì và cách khắc phục chúng như thế nào?
Câu hỏi 3: Dữ liệu LiDAR sau phân loại có thể sử dụng trong bài toán phân
loại lớp phủ bề mặt khu vực đô thị và tạo bộ dữ liệu đầu vào cho DSS quy hoạch đất đai không?
8 Điểm mới của luận án
- Đề xuất và xây dựng được phương pháp phân loại ĐMĐ LiDAR trên cơ sở
sử dụng thuật toán EM và MCC
- Đề xuất quy trình sử dụng dữ liệu LiDAR sau phân loại cho bài toán phân loại lớp phủ bề mặt khu vực đô thị và tạo bộ dữ liệu đầu vào cho DSS trong quản lý đất đai từ kết quả sau phân loại ĐMĐ LiDAR
9 Bố cục của luận án
Trang 16Ngoài phần Mở đầu và phần Kết luận, nội dung chính của luận án được trình bày trong 3 chương như sau:
Chương 1: “Tổng quan về phân loại dữ liệu ĐMĐ LiDAR” giới thiệu tóm tắt
về công nghệ LiDAR, giới thiệu bài toán và tổng quan các công trình nghiên cứu trong và ngoài nước về phân loại dữ liệu ĐMĐ LiDAR
Chương 2:”Phát triển một số thuật toán nâng cao chất lượng phân loại ĐMĐ
LiDAR” trình bày về giải pháp và đề xuất cải tiến các thuật toán EM và MMC trong
việc phân loại ĐMĐ LiDAR Đồng thời đánh giá hiệu quả các thuật toán đề xuất thông qua thực nghiệm
Chương 3: “Đề xuất sử dụng hiệu quả ĐMĐ LiDAR sau phân loại” trình bày
ứng dụng dữ liệu LiDAR sau phân loại trong việc phân loại lớp phủ bề mặt khu vực
đô thị từ đó xây dựng mô hình mô phòng lớp phủ bề mặt và xây dựng cơ sở dữ liệu cho DSS trong quản lý đất đai
Trang 17CHƯƠNG 1 CHƯƠNG 1 TỔNG QUAN VỀ PHÂN LOẠI DỮ LIỆU ĐÁM MÂY
ĐIỂM LIDAR
Một số khái niệm cơ bản về công nghệ LiDAR và phương pháp phân loại ĐMĐ LiDAR sẽ được trình bày trong chương 1 Các kiến thức này làm cơ sở cho bài toán phân loại ĐMĐ LiDAR và lựa chọn cách giải bài toán liên quan đến dữ liệu ĐMĐ LiDAR sẽ được trình bày trong các chương tiếp theo
1.1 Kiến trúc hệ thống LiDAR
1.1.1 Khái niệm công nghệ LiDAR
LiDAR là phương pháp viễn thám thực hiện đo khoảng cách đến Trái đất bằng xung tia laser, là một cảm biến quang chủ động Thiết bị LiDAR phát tia laser
về phía mục tiêu trên mặt đất, sau đó đo các tia phản xạ Tổ hợp các xung laser này
và dữ liệu khác lưu trữ trên hệ thống LiDAR chứa các thông tin 3D chính xác về hình dạng Trái đất và các đặc trưng các đối tượng trên đó [2] LiDAR đôi khi còn được gọi là ToF (Time of Flight) là phương pháp phát hiện các đối tượng và ánh xạ khoảng cách của chúng [5]
Các máy tín hiệu phản xạ sẽ ghi lại chính xác từ lúc tia laser rời khỏi máy phát cho đến khi phản hồi trở lại để có thể tính toán khoảng cách giữa điểm phát và mục tiêu Thông tin này được kết hợp với thông tin vị trí sẽ được tính toán thành các tọa độ 3D thực tế của mục tiêu phản hồi trong không gian đối tượng LiDAR cho phép xác định tọa độ (x, y) và độ cao (z) của một điểm có độ chính xác cao [1]
Hệ thống LiDAR có 3 thành phần chính là: Hệ thống khuyếch đại ánh sáng Laser (Light amplification by stimulated emission of radiation), hệ thống vệ tinh định vị toàn cầu GNSS/GPS (Global Navigation Sattelite System/Global Postioning System) và hệ thống đạo hàng/dẫn đường quán tính INS (Inertial Navigation System) Tổ hợp các thiết bị này trong mối quan hệ hữu cơ, tác động chi phối lẫn nhau, tạo nên hệ thống LiDAR [1], [3]
Trang 18Hình 1.1 Thành phần của hệ thống LiDAR Các hệ thống LiDAR truyền ánh sáng laser từ các hệ thống di động khác nhau (ô tô, máy bay, máy bay không người lái) qua không khí và thảm thực vật (laser trên không) và thậm chí cả nước (laser độ sâu) Cơ chế quét được thiết kế để tạo ra một luồng xung laser nhất quán Các xung laser được phản xạ khỏi gương (quay hoặc quét) [6]
Hệ thống GNSS cung cấp thông tin địa lý chính xác liên quan đến vị trí của cảm biến (vĩ độ, kinh độ, chiều cao) và IMU xác định tại vị trí này hướng chính xác của cảm biến (Pitch, Roll, Yaw) Dữ liệu được ghi lại bởi 2 thiết bị này sau đó được
sử dụng để tạo dữ liệu thành các điểm tĩnh: cơ sở của ĐMĐ ánh xạ 3D [5] GPS cung cấp thông tin địa lý chính xác liên quan đến vị trí của cảm biến và đơn vị đo lường quán tính ghi lại hướng chính xác của cảm biến tại vị trí đó [6] Cùng với GPS, IMU ghi lại vị trí X, Y, Z chính xác của máy quét IMU chứa một cảm biến gia tốc kế, con quay hồi chuyển và cảm biến từ kế để đo vận tốc, định hướng và lực hấp dẫn [4]
Sau khi khảo sát, dữ liệu được tải xuống và xử lý bằng phần mềm xử lý dữ liệu ĐMĐ LIDAR Đầu ra bao gồm kinh độ được đăng ký theo địa lý (X), vĩ độ (Y)
và độ cao (Z) cho mọi điểm dữ liệu Với dữ liệu điểm độ cao có thể tạo bản đồ địa hình chi tiết của vùng nghiên cứu [3]
Trang 191.1.2 Hoạt động của hệ thống LiDAR
Một cảm biến LiDAR gắn trên máy bay, oto, … Bộ phát sẽ tạo ra chuỗi xung laser, sau đó gửi đến bề mặt/mục tiêu để đo thời gian đi và về của xung Nguyên lý làm việc của LiDAR như sau:
- Phát xung laser xuống bề mặt trái đất
- Thu nhận tia laser phản xạ trở lại nguồn xung LiDAR bằng các cảm biến
- Đo thời gian đi của laser
- Tính toán thực tế để đo khoảng cách một photon ánh sáng trở lại đã đi tới
và từ một vật thể được tính bằng công thức (1) [3]:
D = (S * T)/2 (1.1) Trong đó, D (Distance) là khoảng cách từ bộ phát đến đối tượng, S (Speed of light) là tốc độ của tia laser, T là thời gian của xung laser đi từ bộ phát đến đối tượng và phản hồi đến sensor trên thiết bị mang bộ phát laser Sau đó có thể xác định được các đối tượng như nhà, đường hay thực vật Những dữ liệu độ cao này được sử dụng để tạo ra mô hình DEM/DSM/DTM của bề mặt [7]
Hình 1.2 Cách hoạt động của các thành phần trong hệ thống LiDAR Xung của laser được phát hướng xuống mặt đất trên một độ cao nào đó được phản hồi từ mặt đất hay từ các bề mặt đối tượng như cây, đường hoặc nhà , với mỗi xung sẽ đo được thời gian đi và về của tín hiệu, tính được khoảng cách từ nguồn phát laser tới đối tượng Với các trị đo tổng hợp sẽ tính toán được vị trí của các điểm trên bề mặt trái đất [8], [1] Trong thời điểm phát và nhận tia laser, dữ liệu
về định hướng không gian của tia quét được xác định và ghi lại nhờ hệ thống INS/IMU Sử dụng dữ liệu tọa độ không gian của ĐMĐ từ phản hồi cuối cùng (Last
Trang 20Echo) làm cơ sở để tạo mô hình số độ cao của bề mặt thực, với mô hình DSM sử dụng phản hồi đầu tiên và cuối cùng (First Pulse - FP và Last Pulse - LP) [2], [9]
Hình 1.3 Cường độ và năng lượng thu nhận từ các tia phản xạ Toạ độ không gian X, Y, Z của điểm địa vật hay địa hình sẽ được xác định dựa vào độ dài (D) và góc phương vị tương ứng (ψ), trong hệ thống toạ độ lựa chọn GPS (thường là hệ tọa độ WGS 84) [3], [9] Tại Việt Nam, hệ tọa độ được sử dụng
là Hệ quy chiếu và Hệ tọa độ quốc gia VN-2000, múi chiếu 30, kinh tuyến trục thực hiện theo quy định tại Thông tư số 973/2001/TT-TCĐC ngày 20 tháng 6 năm 2001 của Tổng cục Địa chính hướng dẫn áp dụng hệ quy chiếu và hệ tọa độ quốc gia VN-
2000
Hình 1.4 Nguyên lý quét của LiDAR
Trang 21Hình 1.5 ĐMĐ sau khi được thu nhận và xử lý
1.2 Dữ liệu LiDAR
1.2.1 Thu nhận dữ liệu ĐMĐ theo công nghệ LiDAR
Sản phẩm thu được của LiDAR là một tập hợp các điểm có mật độ dày đặc với độ cao điểm được thu nhận một cách chính xác Tập hợp điểm này thường được gọi là ĐMĐ LiDAR, có thể được sử dụng để tạo ra các mô hình 3D của bề mặt Trái đất và đặc trưng của bề mặt[3] Các ĐMĐ có nguồn gốc từ dữ liệu thô được quét từ các đối tượng vật lý như bên ngoài tòa nhà, nhà máy, địa hình, … Sau khi thu thập
dữ liệu thô, ĐMĐ phải được chuyển đổi thành các tệp máy tính có thể đọc được
Hình 1.6 Nguyên lý thu thập dữ liệu của hệ thống LiDAR
Bộ thu phát LiDAR di chuyển nhờ vào một cụm gương quét được gắn bên dưới bộ thu phát Gương gập 450 phản chiếu các xung laser lên một gương chuyển động, điều hướng các xung laser đến trái đất [10] Xung laser phản hồi đầu tiên là tia phản xạ đáng kể nhất và sẽ được liên kết với tính năng cao nhất trong cảnh quan
Trang 22như ngọn cây hoặc đỉnh của tòa nhà Những tia phản xạ ở giữa được sử dụng cho cấu trúc thảm thực vật, và phản xạ cuối cùng cho các mô hình địa hình thật của Trái đất [8] Dữ liệu được yêu cầu xử lý thời gian trả về cho mỗi xung quay trở lại cảm biến và tính khoảng cách thay đổi từ cảm biến, hoặc thay đổi trên bề mặt che phủ đất [1]
Độ cao của tia phản xạ sẽ khác nhau, tùy thuộc vào hình dạng và kích thước của các vật thể, xung laser LIDAR được phản xạ từ trên bề mặt Những điểm này có thể được phân thành nhiều lớp khác nhau: cây cao, ground, cỏ, đường giao thông, tòa nhà, v.v
Hình 1.7 ĐMĐ khi chưa được xử lý
1.2.3 Đặc trưng của dữ liệu ĐMĐ LiDAR
Công nghệ LiDAR có thể thu thập thông tin về hình dạng Trái đất và đặc trưng của nó thông qua các ĐMĐ Mỗi điểm trong ĐMĐ chứa đựng lượng thông tin lớn được sử dụng để tạo mô hình 3D về bề mặt Trái đất cũng như các đối tượng trên
bề mặt, khi có thông tin về màu sắc, ĐMĐ sẽ trở thành 4D
Các thuộc tính thành phần mà một ĐMĐ chứa có thể cung cấp thông tin bổ sung có giá trị để bổ sung độ cao và có thể cho phép người dùng tạo ra các sản phẩm raster riêng như mô hình chiều cao tán cây hoặc lưới cường độ [7]
Các đặc trưng của ĐMĐ LiDAR [6]:
- Các xung laser phản xạ từ các vật thể trên và trên bề mặt, bao gồm các tòa nhà, cây cối và các thảm thực vật khác Nhiều xung phản xạ cho phép dữ liệu LiDAR được sử dụng để tách địa hình trống khỏi các đặc điểm bề mặt Với
Trang 23mỗi đối tượng, xung chạm vào một lượng ánh sáng nhất định sẽ được phản
xạ trở lại và được cảm biến phát hiện và ghi lại [11]
- Tọa độ (X, Y, Z) chỉ ra vị trí cũng như độ cao của điểm, điểm riêng lẻ có thể
có các thuộc tính bổ sung
- Thứ tự phản hồi: mỗi điểm trong ĐMĐ sẽ có một thứ tự tia phản hồi tương ứng
- Số điểm trên m2: số điểm trung bình trên m2
- Mật độ điểm: số lượng phép đo trên một khu vực mà bề mặt Trái đất được lấy mẫu
- Số điểm: Tổng số điểm trong ĐMĐ Tùy vào từng bài toán cụ thể, các đặc trưng của ĐMĐ sẽ được sử dụng phù hợp
1.2.3 Định dạng dữ liệu LiDAR
Với kích thước khổng lồ của các tập dữ liệu LiDAR, một định dạng nhị phân
có tên LAS đã được áp dụng để quản lý và chuẩn hóa cách thức tổ chức và phổ biến
dữ liệu Các tệp LAS chứa nhiều thông tin hơn, có thể được đọc hiệu quả hơn [12]
LAS là một định dạng công nghiệp được tạo ra và duy trì bởi Hiệp hội Chụp ảnh và Viễn thám Hoa Kỳ (ASPRS) LAS là một định dạng tệp tiêu chuẩn được công bố để trao đổi dữ liệu LiDAR [1], [6]
Mỗi tệp LAS chứa siêu dữ liệu của LiDAR trong một khối tiêu đề theo sau là các bản ghi riêng cho từng xung laser được ghi lại Phần tiêu đề của mỗi tệp LAS chứa thông tin thuộc tính trên bản khảo sát chính: phạm vi dữ liệu, ngày bay, thời gian bay, số lượng bản ghi điểm, số điểm trả về, bất kỳ bù dữ liệu được áp dụng và bất kỳ hệ số tỷ lệ được áp dụng nào Các thuộc tính điểm gốc sau được duy trì cho từng xung laser của tệp LAS: thông tin vị trí x, y, z, tem thời gian GPS, cường độ,
số trả về, thứ tự tia trả về, giá trị phân loại điểm, góc quét, giá trị RGB bổ sung, hướng quét, cạnh của đường bay, dữ liệu người dùng, ID điểm và thông tin dạng sóng [13], [15]
Tuy bộ dữ liệu LiDAR là cực lớn và chứa đựng những thông tin có ích, nhưng nếu không lựa chọn được phương pháp xử lý và cách sử dụng phù hợp thì bộ
dữ liệu này có giá trị là không Để dữ liệ ĐMĐ LiDAR sử dụng trong các bài toán
Trang 24ứng dụng khác nhau, NCS lựa chọn phương pháp xử lý là phân loại để gán nhãn cho điểm trong ĐMĐ LiDAR
1.3 Bài toán phân loại dữ liệu ĐMĐ LiDAR
Công nghệ LiDAR đang ngày càng phát triển, bộ dữ liệu thu được từ LiDAR rất có giá trị đặc biệt là dữ liệu độ cao thu được từ bề mặt Trái đất Hai bài toán rất điển hình của LiDAR đó chính là tạo DTM/DSM và phân loại điểm Việc phân loại thủ công dữ liệu LiDAR có thể tốn thời gian và dễ xảy ra lỗi Do đó, các nhà nghiên cứu đã đề xuất một số phương pháp để giải quyết vấn đề tạo DTM và phân loại điểm
Bài toán phân loại dữ liệu LiDAR là bài toán được sử dụng cho nhiều bài toán ứng dụng LiDAR như thành lập mô hình DEM, DSM, phân loại điểm ground
và non-ground, … Số lượng điểm thu nhận được từ quá trình quét của LiDAR là rất lớn, bao gồm các điểm phản xạ từ các đối tượng khác nhau trên bề mặt trái đất như mặt đất, tòa nhà, thực vật, mặt nước, … Cần thực hiện phân loại những điểm này
để áp dụng vào các bài toán khác nhau [14] Bài toán phân loại thường được thực hiện đó chính là phân loại ĐMĐ thành điểm non-ground và điểm ground
Trong đó, theo [1] điểm ground là những điểm thu nhận được từ bề mặt trái đất, thể hiện cho địa hình của bề mặt trái đất, bao gồm các điểm nằm trên bề mặt địa hình đã được loại bỏ các đối tượng lớp phủ bề mặt như: nhà, các công trình kiến trúc, thực phủ Điểm non-ground là những điểm bên trên bề mặt trái đất, thu được
từ những đối tượng trên bề mặt như cây cối, nhà, đường dây điện, … Những điểm non-ground thể hiện cho phân bố bề mặt, bao gồm các điểm nằm trên bề mặt các đối tượng che phủ mặt đất khi nhìn từ trên xuống
Phân loại điểm LiDAR thành lớp ground và non-ground chủ yếu dựa trên sự thay đổi độ cao của các điểm, có thể giả định rằng các điểm có độ cao thấp hơn là các điểm trên mặt đất trong khi điểm có độ cao cao hơn là các điểm không nằm trên mặt đất (non-ground) [15] Các điểm non-ground được thu nhận từ các đối tượng phía trên bề mặt, chẳng hạn như cây cối, tòa nhà, cầu và cây bụi Để phù hợp xác định các điểm ground, điều quan trọng là phải hiểu các đặc trưng vật lý của các điểm ground phân biệt chúng với các điểm non-ground
Trên thực tế, bài toán phân loại điểm LiDAR không dễ thực hiện, do số lượng điểm rất lớn, sự phân bố của các điểm trong ĐMĐ thường không đồng đều,
Trang 25khiến cho quá trình phân loại thủ công thường khó thực hiện và độ chính xác cũng không cao Chính vì thế, có thể sử dụng các thuật toán phân loại (classification) thực hiện phân chia điểm về các lớp được gán nhãn
Mỗi điểm LiDAR có thể có một phân loại được gán cho nó xác định loại đối tượng đã phản xạ xung laser Các lớp khác nhau được định nghĩa bằng cách sử dụng
mã số nguyên trong các tệp LAS
Phân loại điểm LiDAR có nghĩa là xác định loại bề mặt Trái đất hay đối tượng phản xạ tia laser [17] Với công nghệ LIDAR quá trình phân loại chỉ dựa vào
vị trí hình học của tia phản xạ so với các lân cận và loại tia phản xạ đầu tiên/cuối cùng (nếu có nhiều lần trả về cho một xung, có thể chỉ phản xạ cuối cùng là điểm ground) Mọi điểm LiDAR đều có thể có một lớp được gán cho nó để xác định loại vật thể đã phản xạ xung laser Điểm LiDAR có thể được phân loại thành một số loại bao gồm đất trống hoặc ground, đỉnh của tán cây và mặt nước Các lớp khác nhau được xác định bằng cách sử dụng mã số nguyên trong tệp LAS [16]
Mỗi xung phản xạ của LiDAR đều là những mẫu cần thiết cho nghiên cứu đối tượng, thậm chí nhiều khu vực cần phải có mật độ điểm cao Phép nội suy được
sử dụng để tạo mô hình số liên tục hay bản đồ từ những điểm còn lại [3], [10]
Bài toán phân loại dữ liệu LiDAR thường được thực hiện qua các bước sau [1]:
Hình 1.8 Tiến trình xử lý dữ liệu điểm LiDAR
Trang 26Sơ đồ 1- 9 thể hiện các bước chính để xử lý dữ liệu điểm LiDAR Sau khi thu thập tọa độ (x, y, z) của các điểm LiDAR, sắp xếp điểm có thể cải thiện hiệu quả của việc hiển thị và xử lý dữ liệu Ngoài xử lý hình học của điểm LiDAR, thông tin cường độ LiDAR cũng có thể hữu ích
1.3.1 Tiền xử lý dữ liệu ĐMĐ LiDAR
ĐMĐ là tập hợp điểm rất lớn với nhiều giá trị điểm nhiễu Những yếu tố nhiễu này ảnh hưởng rất lớn đến việc áp dụng các thuật toán xử lý và độ chính xác của các thuật toán sử dụng dữ liệu ĐMĐ Do đó, cần phải có các phương pháp tiền
xử lý và đơn giản hóa ĐMĐ thích hợp để xử lỷ hiệu quả ĐMĐ Mục đích của tiền
xử lý dữ liệu là cung cấp ĐMĐ với ít điểm nhiễu hơn, kích thước dữ liệu nhỏ hơn
và tăng hiệu quả sử dụng của ĐMĐ trong các ứng dụng tiếp theo được đảm bảo [18] Nhiễu của dữ liệu LiDAR bao gồm additive noise và multiplicative noise [21]
Các phương pháp để xử lý nhiễu có thể được chia thành hai loại: xử lý miền tần số
và xử lý không gian [19] Sự phân bố nhiễu trong dữ liệu LiDAR rất phức tạp và chỉ
sử dụng các bộ lọc kỹ thuật số truyền thống làm mượt các tín hiệu chỉ bằng cách chọn một tần số cắt làm không hiệu quả [20], [21]
Các xu hướng loại bỏ nhiễu chính được sử dụng trong quá trình tiền xử lý dữ liệu ĐMĐ LiDAR [22]:
- Loại bỏ biên
- Lọc bề mặt cục bộ, lọc bên biên
- Trung bình non-local, phương pháp dựa trên từ điển
- Khử nhiễu trong ảnh
1.3.2 Phân loại điểm ground
Quá trình phân loại điểm ground được thực hiện để loại bỏ những điểm ground ra khỏi ĐMĐ LiDAR Thuật toán phân loại điểm ground thường dựa trên hai tiêu chí:
non Điểm ground có độ cao thấp hơn so với những đối tượng nonnon ground
- Độ cao và độ dốc ít thay đổi rõ rệt Phân loại điểm ground có thể được thực hiện qua sơ đồ trong hình 1.11
Trang 27Hình 1.9 Các bước thực hiện lọc điểm ground
1.3.3 Phân loại điểm non-ground
Các điểm non-ground sau khi được tách ra khỏi ĐMĐ cĩ thể phân loại vào các lớp chuyên biệt hơn như nhà cao tầng, đường, thực vật, mặt nước, … Do các điểm non-ground cĩ thể thuộc về nhiều lớp khác nhau, tính chất mỗi lớp cĩ thể được thể hiện thơng qua độ cao, tính chất hình học, cường độ phản xạ, … nên quá trình phân loại thường phức tạp hơn so với quá trình phân loại điểm ground Cĩ rất nhiều phương pháp được đề xuất để phân loại điểm non-ground bao gồm phương pháp phân loại khơng giám sát, phương pháp Nạve Bayes Classification (NVC), cây quyết định, SVM, … Thêm vào đĩ, dữ liệu cường độ xám và ảnh đa phổ cĩ thể được kết hợp với dữ liệu ĐMĐ cho quá trình phân loại
1.3.4 Nội suy khơng gian
Nếu muốn mơ hình hĩa các bề mặt để phân tích, việc bố trí đo trên tồn bộ
bề mặt là khơng khả thi Do đĩ, các phép đo trường được thực hiện tại một số điểm được bố trí dọc theo bề mặt và các giá trị trung gian được suy ra bởi một quá trình gọi là phép nội suy [23] Tất cả các phương pháp nội suy đều dựa trên về luật địa lý đầu tiên của Tobler, trong đĩ tuyên bố rằng “Các đối tượng đều cĩ sự liên kết, tuy
Trang 28nhiên những đối tượng gần nhau có mối quan hệ chặt chẽ hơn” [23] Phép nội suy được sử dụng khi quá trình phân loại hoàn tất
Nội suy không gian được định nghĩa là dự đoán các giá trị của biến chính như độ cao, tọa độ, … tại vị trí điểm trong cùng một vùng của vị trí được lấy mẫu
Do ĐMĐ LiDAR không được phân phối đều, phép nội suy được sử dụng để tạo ra các điểm chưa biết bằng cách sử dụng vị trí và độ lớn của những điểm đã biết [24]
Với dữ liệu điểm LiDAR, phép nội suy được sử dụng để tạo DTM từ điểm ground,
và DSM từ điểm cao nhất trong lưới
Hình 1.10 Kết quả tạo DEM và nội suy đường bình độ từ dữ liệu điểm LiDAR (Bộ
TNMT) Hiện nay, bài toán nội suy đã được các nhà khoa học xây dựng như: trọng số khoảng cách nghịch đảo (Inverse distance weighting – IDW), NN (Nereast Neighbor), và biến thể trên spline
Có thể thấy, các phương pháp xử lý và khai phá dữ liệu LiDAR rất đa dạng
và có tính ứng dụng cao Trong phạm vi nghiên cứu của luận án, NCS lựa chọn tập trung vào bài toán phân loại ĐMĐ LiDAR Trong quy trình xử lý dữ liệu LiDAR,
có thể nhận thấy, bài toán lọc điểm và phân loại là quan trọng khi từ những điểm được phân loại loại đối tượng và bản chất của nó trên bề mặt sẽ được nghiên cứu dễ dàng hơn [25] Đồng thời, ĐMĐ LiDAR sau khi được phân loại sẽ được sử dụng
Trang 29vào các ứng dụng cụ thể của các lĩnh vực như: Trắc địa – Bản đồ, Địa chất học, Khảo cổ học, … Kết quả điểm LiDAR có thể được phân chia thành các lớp chi tiết hơn như lớp ground, lớp nhà, đường, thực vật, mặt nước, … Những thông tin sau phân loại có thể được sử dụng vào nhiều bài toán ứng dụng khác nhau và phục vụ cho nhiều mục đích khác nhau
Cụ thể bài toán lọc điểm và phân loại được tác giả Pinlang Dong và cộng sự thực hiện theo quy trình trong hình 1.13
Hình 1.11 Quy trình phân loại dữ liệu LiDAR tổng quát Quy trình được thực hiện qua các bước:
- Chuẩn bị dữ liệu huấn luyện và rút trích đặc trưng: Đây là công đoạn tìm Input cho việc học để tìm ra mô hình phân loại Với dữ liệu ĐMĐ LiDAR được thu nhận, cần tiến hành chọn ra những dữ liệu đặc trưng, loại bỏ nhiễu, ước lượng số chiều của ĐMĐ
- Phân loại: Đây là bước xác định mô hình phân loại để có thể phân loại với tập dữ liệu LiDAR mới
- Kiểm tra và đánh giá mô hình phân loại: Đánh giá độ chính xác của mô hình phân loại sau khi phân loại ĐMĐ LiDAR
- Ứng dụng dữ liệu LiDAR sau phân loại vào bài toán cụ thể: xây dựng mô hình, tạo bộ dữ liệu, mô hình hóa bề mặt, …
Trang 301.4 Các công trình nghiên cứu liên quan
Từ khi ra đời từ thập niên 70, 80 của thế kỷ trước công nghệ LiDAR ngày càng được áp dụng một cách rộng rãi trong nhiều lĩnh vực của xã hội Những lĩnh vực áp dụng công nghệ LiDAR như: khảo sát địa hình và thành lập bản đồ; lâm nghiệp chủ yếu sử dụng LiDAR để đánh giá và thống kê sản lượng gỗ, tương quan của các yếu tố như tán, độ dày tán, …; lập bản đồ ngập úng; các ứng dụng cho đới duyên hải như quản lý và dự báo xói mòn bờ biển, quan trắc và dự báo ngập lụt ven biển; địa hình đáy biển; lập bản đồ giao thông; mạng điện thoại di động; …
Các kết quả nghiên cứu về bài toán phân loại ĐMĐ LiDAR được các tác giả trong nước và ngoài nước công bố trong các bài báo dưới đây:
1.4.1 Trong nước
Tại Việt Nam, từ khi Công ty Đo đạc ảnh Địa hình, Trung tâm Viễn thám thuê Công ty AAMHATCH của Úc bay thử nghiệm năm 2006 tại Đồng Nai và thành phố Cần Thơ đến nay, LiDAR đang ngày càng được áp dụng rộng rãi Các công trình nghiên cứu khoa học, nghiên cứu tích hợp công nghệ, áp dụng dữ liệu LiDAR trong sản xuất, … đều chỉ ra những ưu điểm của LiDAR trong nghiên cứu các đối tượng trên bề mặt địa hình Trong những năm gần đây, cùng với sự phát triển và phổ biến của công nghệ thông tin tại Việt Nam, các công nghệ tiên tiến trên thế giới đã được các Bộ, Ban, Ngành áp dụng trong quá trình sản xuất Với ngành Khoa học Trái đất, ứng dụng công nghệ LiDAR trong sản xuất tại các Công ty, Xí nghiệp đang trong quá trình thử nghiệm Tại Công ty TNHH MTV Tài nguyên và Môi trường Việt Nam, dữ liệu LiDAR được xử lý với phần mềm Global Mapper hay với ENVI LiDAR để tạo DEM hay DSM và nội suy đường bình độ từ dữ liệu này
Với những đề tài, bài báo trong nước đã được công bố về ứng dụng công nghệ và dữ liệu LiDAR trong lĩnh vực khoáng sản của tác giả Vũ Quốc Lập (Công
ty Đo đạc và Khoáng sản) cho thấy dữ liệu LiDAR đáp ứng được yêu cầu đo vẽ hiện trạng các hệ thống hầm lò Trong khi đó nghiên cứu [26] đã chỉ ra rằng công nghệ LiDAR với bộ dữ liệu thu nhận được cho kết quả thành lập DEM/DSM là khả quan Việc áp dụng LiDAR tại vùng bãi bồi ven biển hoàn toàn có thể cho phép xây dựng cơ sở dữ liệu nền địa hình có độ chính xác tương đương bản đồ tỷ lệ 1:5000
và nhỏ hơn Trong khi đó, nghiên cứu [27], [28] đã đưa ra phương pháp kết hợp dữ
Trang 31liệu LiDAR với UAV để thu thập được dữ liệu tích hợp có giá trị và có thể sử dụng trong công tác khảo sát, thiết kế và kiểm định công trình Ngoài ra, dữ liệu LiDAR còn được sử dụng để cập nhật lớp cơ sở dữ liệu giao thông thành phố Hồ Chí Minh nhằm khai thác, phát huy tối đa hiệu quả của nguồn dữ liệu LiDAR hiện có [29]
Kết quả đạt được là ĐMĐ được xử lý để giúp quá trình cập nhật lớp cơ sở dữ liệu giao thông được nhanh chóng và chính xác
Những nghiên cứu của các tác giả trên đây đều sử dụng các thuật toán phân loại sẵn có trong các phầm mềm thương mại Dữ liệu đầu vào của quá trình phân loại là dữ liệu bay quét LiDAR Điểm sau phân loại được chia thành điểm ground
và điểm non-ground, hai lớp điểm này được sử dụng để thành lập DEM (với điểm Ground) và DTM (với điểm Non-Ground), và sử dụng chủ yếu hai mô hình này trong nghiên cứu bề mặt địa hình Trong khi đó, các phần mềm thương mại đi kèm với thiết bị LiDAR rất đắt, chỉ thực hiện được với kiểu dữ liệu đầu vào định sẵn và thuật toán phân loại bán tự động Với khối lượng dữ liệu điểm thu về trong mỗi lần bay quét LiDAR là vô cùng lớn, việc chỉ phân loại thành hai lớp Ground và Non – Ground chưa sử dụng được hết ưu điểm của dữ liệu LiDAR, kết quả đầu ra mới chỉ dừng lại ở tạo DEM/DTM đang là trở ngại lớn để có thể áp dụng rộng rãi hơn nữa LiDAR vào ngành Khoa học trái đất tại Việt Nam
1.4.2 Ngoài nước
Trên thế giới, LiDAR được áp dụng từ khá sớm, những năm 90 của thế kỷ
XX, NASA đã áp dụng công nghệ LiDAR trong nghiên cứu địa hình Đến nay, các nghiên cứu đã được công bố về việc áp dụng công nghệ LiDAR, những cải tiến về công nghệ, thuật toán xử lý dữ liệu được các nhà khoa học liên tục công bố Các hướng nghiên cứu và áp dụng của các tác giả là tương đối rộng, trong đó có các hướng sau:
A Áp dụng thuật toán K-means trong phân loại
Trong các nghiên cứu sử dụng thuật toán K-means để thực hiện phân loại ĐMĐ LiDAR, tác giả Zhang và cộng sự [30] hay trong [31] đã áp dụng Kmeans trong việc phân loại ĐMĐ theo mật độ điểm, đề xuất sử dụng các số liệu dựa trên giá trị riêng và K-means thực hiện phân loại Các tác giả đã sử dụng tham số mật độ của ĐMĐ như là điều kiện để lựa chọn số lượng cụm để tiến hành phân loại và là điều kiện để hội tụ Phương pháp phân tích thành phần chính được sử dụng để thu
Trang 32được các giá trị riêng và các số liệu dẫn xuất, trong khi K-means được áp dụng để phân điểm thành hai lớp: edge và non-edge Để đánh giá phương pháp đề xuất, bốn khu vực thử nghiệm với các mức độ phức tạp khác nhau đã được chọn Từ các phân tích định tính và định lượng, nó có thể kết luận rằng quy trình phân loại được đề xuất đã cho kết quả khả quan, dẫn đến độ hoàn chỉnh và độ chính xác trên 92% đối với loại non-edge và từ 61% đến 98% đối với lớp edge
Việc kết hợp K-means với ANN (Mạng nơ ron nhân tạo) trong [32] hay sử dụng K-means dựa trên phân đoạn ĐMĐ trong tài liệu [33] cho thấy thuật toán K-means có ưu điểm trong phân loại ĐMĐ LiDAR
B Phương pháp phân loại dựa trên đặc trưng của điểm
Điểm LiDAR với đặc trưng độ cao, cường độ phản xạ, hình thái điểm đã được các tác giả sử dụng trong các nghiên cứu phân loại ĐMĐ LiDAR Các đặc trưng của điểm được coi như là đầu vào rất quan trọng giúp tăng độ chính xác của kết quả phân loại Trong nghiên cứu [34] dựa trên sự thay đổi về độ lệch của mật độ dữ liệu LiDAR từ các tín hiệu phản hồi Với khu vực thử nghiệm ở phía nam của Đức và trung tâm thành phố Stuttgart, các tác giả đã đề xuất cách tiếp cận thống kê để phân loại điểm ground dựa trên mối quan hệ mật độ trong ĐMĐ LiDAR Kết quả phân loại được sử dụng để tạo ra DTM, DSM và CHM (Canopy Height Model) Trong khi đó, nghiên cứu [35] sử dụng thuật toán phát hiện điểm để phát hiện và phân loại các đối tượng đô thị và cây cối từ dữ liệu 3D MLS (Mobile Laser Scanning) và TLS (Terrestrial Laser Scanning) Phương pháp bao gồm cả việc phân đoạn tự động để loại bỏ đi những phần không liên quan đến quá trình phân đoạn dọc đối tượng
Thuật toán được kiểm tra với hai ĐMĐ được thu nhận bằng hai bộ cảm khác nhau
Với khu vực thử nghiệm các tác giả nhận thấy rằng với thuật toán phát hiện các điểm dị thường cho kết quả chính xác khoảng 95% với hai lớp được phân loại là cây cối và công trình nhân tạo như hồ nước
Nghiên cứu [36] thực hiện quá trình phân loại ĐMĐ bằng việc phân chia ĐMĐ 3D thành các đoạn (segment) độc lập, dựa trên các đặc trưng của đối tượng, cuối cùng các điểm sẽ được tự động phân loại theo các đặc trưng này Kết quả chỉ ra rằng sự tương thích của kết quả phân loại khi sử dụng OBC (Object-Based Classification) và nhận dạng của con người, các thông tin không gian như đặc trưng của điểm được cung cấp bởi ĐMĐ có thể cung cấp là đa dạng, phong phú và mạnh
Trang 33mẽ như là cơ sở của phân loại Với nghiên cứu [37], điểm LiDAR đơn lẻ được phân tích theo các tính năng của chúng chẳng hạn như chiều cao, thứ tự trả về, v.v sau đó
tự động được gán cho lớp mà chúng thuộc về
C Phương pháp phân loại truyền thống và sử dụng phép nội suy
Quá trình lọc điểm là chìa khóa cho hầu hết mọi ứng dụng với ĐMĐ LiDAR
Với các thuật toán lọc điểm, cài đặt tham số và tăng ngưỡng hội tụ giúp tăng độ chính xác của quá trình lọc điểm Dựa trên ý tưởng đó, nghên cứu [41], [44] và [45]
đã sử dụng EM phân loại ĐMĐ LiDAR Các đặc trưng của dữ liệu LiDAR đã được
sử dụng như: độ cao, sự thay đổi độ cao, cường độ tia phản xạ laser và ảnh cường
độ Với độ chính xác 94% được thu nhận cho khu vực rộng 8 dặm vuông Dựa trên tham số và mô hình được lựa chọn, thuật toán EM phù hợp với khu vực phân loại
Kết quả thu được đã chỉ ra rằng thuật toán đề xuất có hiệu quả với các bộ dữ liệu thử nghiệm khi cho sai số trên lớp điểm non-ground là 4.48% Trong đó, với nghiên cứu [45] các tác giả đã chứng minh sai số của thuật toán đề xuất là 16.78% thấp hơn
so với thuật toán PTD truyền thống và giảm được lỗi hệ thống xuống còn 31.95%
Trong khi đó, nghiên cứu [43] đã sử dụng GMM trong bài toán phân loại ĐMĐ LIDAR Mô hình GMM được xác định trong lớp huấn luyện của phân loại không giám sát và định nghĩa một tập các lớp trung gian Kết quả thử nghiệm cho thấy hệ thống đề xuất hoạt động tốt trên hai bộ dữ liệu với độ chính xác trong khoảng 0.8 – 0.89
Nghiên cứu [42] đã đề xuất một thuật toán phân loại ĐMĐ dựa trên mối quan
hệ ngữ nghĩa nhiều mức để thành lập mô hình 3D của khu vực khảo sát Với bộ dữ liệu có mật độ điểm cao, chứa nhiều nhiễu thì việc lựa chọn một thuật toán phù hợp
là hoàn toàn cần thiết Đầu vào của thuật toán là ĐMĐ qua các phép biến đổi dựa trên ràng buộc về sự đồng nhất của điểm và sự ràng buộc của các điểm lân cận, các điểm được phân thành các lớp với độ chính xác là 93.55% Tuy nhiên, thuật toán được đề xuất vẫn gặp hạn chế trong việc chưa xử lý được triệt để nhiễu trong bộ dữ liệu đầu vào
Thuật toán CRF (Conditional Random Field) được đề xuất trong [46] đã đưa
ra cách tiếp cận sử dụng thông tin theo ngữ cảnh như một dữ liệu đầu vào của bài toán phân loại Bài toán phân loại được thể hiện bằng cách sử dụng mô hình GMM, tham số của mô hình được lựa chọn qua tối ưu hóa phép lặp với thuật toán cực đại
Trang 34hóa kỳ vọng Thuật toán CRF sẽ được sử dụng để phân tích thông tin ngữ cảnh của
dữ liệu Qua thử nghiệm, nhóm tác giả đã chỉ ra rằng độ chính xác của phân loại phụ thuộc vào bài toán phân loại với GMM-EM
Thêm vào đó, nghiên cứu [47] chỉ ra việc kết hợp RF và SVM trên bộ dữ liệu thu nhận được tại khu vực đô thị và rừng có kết quả thu được là chính xác (độ chính xác tổng thể trên 80% đối với tập dữ liệu đô thị và hơn 93% đối với tập dữ liệu rừng), trong phạm vi kết quả tốt nhất được tìm thấy trong tài liệu, bất kể phương pháp phân loại
Các tác giả trong nghiên cứu [48], [49] đều dựa trên thuật toán MCC phân loại
dữ liệu LiDAR MCC sử dụng phép nội suy TPS để loại bỏ những điểm không thuộc nhóm ground để từ đó có thể thành lập được DEM của khu vực khảo sát TPS
là phép lặp cho phép đánh giá trạng thái giữa các điểm, tuân thủ các dữ liệu đầu vào
và kiểm soát khoảng cách các điểm mẫu ảnh hưởng đến bề mặt ước lượng Trong khi đó phương pháp mới MCC-RGB [49] thực hiện cập nhật phân loại sử dụng bộ phân loại dựa trên SVM để phân biệt thảm thực vật và các điểm trên bề mặt bắt nguồn từ màu điểm Các tác giả đã thảo luận về các ứng dụng đối với dữ liệu đa diện và dữ liệu quang ảnh tại hai địa điểm có lớp phủ thực vật khác biệt: một núi lửa dưới đáy núi lửa tại Hồ Horseshoe, Núi Mammoth, CA và một vết sẹo đứt gãy trước dãy dọc theo phần McGee Creek của Hilton Creek Fault phía bắc Bishop, CA Điều này cho thấy rằng các kỹ thuật học máy đơn giản có thể tăng cường khả năng phân loại ĐMĐ cho các ứng dụng khó khăn trong địa mạo như chụp ảnh vi địa hình đất hoặc phân loại các điểm trên các sườn núi thực vật Với nghiên cứu [50] đã có nghiên cứu so sánh về mức độ hiệu quả của hai thuật toán MCC và BCAL (Boise Center Aerospace Laboratory LiDAR) trong phân loại dữ liệu LiDAR để thành lập DTM Độ chính xác của hai thuật toán được đánh giá qua hơn 7000 điểm đo có độ chính xác cao với 6 kiểu dữ liệu khác nhau Khi đánh giá hiệu suất tổng thể của MCC và BCAL với mỗi độ phân giải khác nhau sẽ cho ngưỡng sai số là khác nhau
Sau quá trình thử nghiệm, các tác giả chỉ ra rằng thuật toán BCAL thích hợp với khu vực có mật độ điểm dày đặc, thảm thực vật liên tục Ở những nơi có độ dốc thay đổi liên tục MCC sẽ có độ chính xác cao hơn
D Phương pháp phân loại dựa trên mô hình học máy
Trang 35Với sự phát triển của học máy, SVM là một trong những bộ phân loại được sử dụng phổ biến để xử lý dữ liệu có chiều cao thông qua lượng mẫu nhỏ Học tập kết hợp, kết hợp một tập hợp các bộ phân loại cơ sở để xác định kết quả đầu ra, được trình bày và tập hợp SVM được sử dụng để cải thiện khả năng phân biệt, do có sự khác biệt nhỏ về tính năng giữa các loại dữ liệu khác nhau Với nghiên cứu [53], [54], [55] và [26] đã chỉ ra những ưu điểm của SVM trong bài toán phân loại Trong [53] các tác giả đã sử dụng SVM tuyến tính với phép phân loại được tối ưu hóa dựa trên cây quyết định hướng đối tượng Những đặc trưng thu nhận được từ phương pháp này có thể được áp dụng cho các đối tượng trong mỗi lớp Trong khi đó, [54]
đã đề xuất phương pháp biến thể của phương pháp SVM để phân loại dữ liệu LiDAR thành lớp nhà cao tầng và cây cối Để tiến hành phương pháp, tác giả phân chia khu vực theo mật độ điểm đo LiDAR, mỗi khi có khu vực được chọn, các điểm lân cận của nó sẽ được xác định, mỗi vector sẽ bao gồm 3 thành phần tuy nhiên những điểm nằm ở biên vẫn có lỗi khi phân loại và không thích hợp cho dữ liệu LiDAR thu nhận được từ khu vực đô thị
Với nghiên cứu [55] trong phân loại những điểm ngoại biên sẽ bị loại bỏ, thuật toán Surface Growing được áp dụng để phân đoạn ĐMĐ thành các cụm khác nhau
Phương pháp phân loại SVM sẽ được áp dụng trên đoạn phân loại với hàm cơ bản xuyên tâm (Radial Basis Function - RBF) Dựa trên hai bộ dữ liệu được lựa chọn,
độ chính xác của các lớp cần phân loại lần lượt là 98%, 92% và 94% Độ chính xác trên kết quả có ý nghĩa để xây dựng DTM và phát hiện nhà cao tầng trong khu vực
đô thị Tuy nhiên, SVM thường gây ra hiện tượng thiếu khớp hoặc quá phù hợp làm giảm hiệu suất tổng quát hóa Do đó, trong [26] một loạt các hàm nhân dựa trên phân tích wavelet được sử dụng để xây dựng các SVM wavelet (WSVM) khác nhau nhằm cải thiện tính không đồng nhất của hệ thống tổng hợp Kết quả thực nghiệm chứng minh rằng phương pháp đề xuất là mạnh mẽ và hiệu quả, có thể áp dụng cho một số công việc thực tế
Trong nhóm dựa trên mô hình học máy thuật toán k-NN và CNN cũng đã được các tác giả sử dụng trong bài toán phân loại ĐMĐ LiDAR như trong các nghiên cứu [51], [56] và [57] Các kết quả thử nghiệm đã chỉ ra rằng, bộ phân loại k-NN thu được độ chính xác 92% bằng cách sử dụng dữ liệu LiDAR Hay với một
mô hình được phát triển dựa trên kiến trúc PointNet đạt được kết quả tốt, với tỷ lệ
Trang 36phân loại đối tượng cao Hay vớ mạng nơ-ron tích chập chú ý đồ thị (GACNN) được thực hiện thử nghiệm trên tập dữ liệu ghi nhãn ISPRS 3D cho thấy mô hình được đề xuất đạt được hiệu suất hiện đại mới về điểm F1 trung bình (71,5%) và độ chính xác tổng thể đạt yêu cầu (83,2%)
Qua những nghiên cứu về bài toán phân loại dữ liệu LiDAR ngoài nước có thể thấy:
- Các nghiên cứu của các tác giả rộng hơn và lĩnh vực áp dụng phong phú đa dạng: nghiên cứu đô thị, rừng, phát hiện các địa vật trên bề mặt Trái đất
- Có những thuật toán cải tiến được áp dụng trong khu vực nghiên cứu mang lại độ chính xác cao
- Thuật toán phân loại K-means, EM, SVM, … được sử dụng để tăng cao độ chính xác cho các phương pháp phân loại
- Kết quả ứng dụng của các công bố hầu hết tập trung vào việc xây dựng DSM, DTM, DEM
- Tại các khu vực có sự phân bố phức tạp, độ chính xác của các thuật toán sẽ
bị giảm xuống
- Thuật toán có sử dụng phép toán nội suy thường được sử dụng cho những khu vực có sự phân bố phức tạp Thêm vào đó, thuật toán sử dụng phép nội suy sẽ giúp tăng độ chính xác của bài toán ứng dụng thông qua các thử nghiệm trên bộ dữ liệu khác nhau
- Thuật toán EM được sử dụng để hỗ trợ nâng cao độ chính xác của bài toán phân loại, với khu vực có sự thay đổi phức tạp thuật toán thường cho độ chính xác không ổn định và độ hội tụ chậm
- Thuật toán MCC thích hợp với khu vực có sự phân bố phức tạp của đối tượng Thuật toán có độ chính xác phụ thuộc vào tham số khởi tạo, tuy nhiên, tham
số này lại được định nghĩa bởi người dùng Phép nội suy TPS của thuật toán có thời gian chạy phụ thuộc vào số lượng điểm kiểm soát, số lượng điểm kiểm soát càng nhiều sẽ khiến cho phép nội suy TPS bị chậm lại qua mỗi lần lặp
- Thuật toán MCC chỉ phân loại ĐMĐ thành ground và non – ground, trong
đó, lớp ground được giữ lại để thành lập DEM/DTM, với lớp non – ground bị loại
bỏ, trong khi đây là lớp chứa thông tin về đối tượng bên trên bề mặt Trái đất
Trang 37- Thuật toán EM có khả năng phân loại tốt với những điểm LiDAR phản xạ
Trong khi đó, thuật toán MCC phân loại tốt với những điểm LiDAR tán xạ
- Bộ dữ liệu sau khi phân loại hầu hết chỉ lưu giữ thông tin của các lớp ground, non-ground, … trong khi dữ liệu phản xạ về khu vực quét từ LiDAR là tương đối phong phú do đặc tính không bị hấp thụ bởi địa vật của LiDAR
1.5 Phương pháp đề xuất
Qua nghiên cứu đã được công bố của các nhà khoa học ngoài nước, NCS tập trung thực hiện thử nghiệm với các thuật toán MCC, k-NN, K-means, PCA Mỗi thuật toán đều có những ưu và nhược điểm riêng Với những kết quả thử nghiệm thu nhận được với thuật toán MCC, Kmeans, kNN, PCA nhận thấy các thuật toán thường gặp khó với khu vực có sự phân bố phức tạp, thuật toán MCC cho khả năng phân loại với lớp ground và non-ground tốt trong môi trường có nhiều thực vật che phủ, thêm vào đó đây là phương pháp sử dụng bộ lọc dựa trên phép nội suy lặp lại
Phép lặp TPS sử dụng trong MCC có thể sử dụng GMM để tăng độ chính xác của phép nội suy và lặp bề mặt Qua đó, có thể sử dụng thuật toán cực đại hóa kỳ vọng
để hỗ trợ nâng cao độ chính xác cho MCC trong phân loại Từ đó, NCS đề xuất phát triển thuật toán EM và MCC trong phương pháp phân loại dữ liệu ĐMĐ LiDAR
Phương pháp được đề xuất như sau:
- Trọng tâm của phương pháp đề xuất là tiến hành cải tiến thuật toán EM và MCC trong phân loại ĐMĐ Do EM và MCC đều phù hợp với khu vực có sự phân
bố phức tạp của đối tượng Thuật toán EM là thuật toán có khả năng giúp cải thiện hiệu quả của kết quả phân loại
- Khi sử dụng EM trong phân loại ĐMĐ LiDAR, thuật toán cho kết quả phân loại tốt với dữ liệu phản xạ Trong khi đó, MCC là thuật toán thích hợp với bộ dữ liệu tán xạ Như vậy, khi kết hợp hai thuật toán sẽ giúp sử dụng được toàn bộ dữ liệu LiDAR
- Phép nội suy TPS được sử dụng trong MCC có thể sử dụng mô hình RPM – GMM (Robust Point Matching – Gaussian Mixture Model) để thực hiện cải tiến, do
đó, nếu cải tiến EM và sử dụng trong mô hình RPM – GMM để cải tiến phép nội suy TPS khi đó sẽ giúp thuật toán MCC khắc phục được những hạn chế đã được chỉ
ra trong phần kết luận của mục 1.4
Trang 38Phương pháp đề xuất được thể hiện tronh hình 1.14, với hai hướng chính:
Hướng thứ nhất, NCS thực hiện cải tiến thuật toán EM (thuật toán EM – D) và sử dụng EM – D trong phân loại dữ liệu ĐMĐ phản xạ LiDAR Hướng thứ hai, sử dụng thuật toán EM – D để cải tiến phép nội suy TPS sử dụng trong MCC thành thuật toán MCC – D và sử dụng thuật toán MCC – D trong phân loại dữ liệu ĐMĐ tán xạ LiDAR Khi thực hiện phương pháp đề xuất sẽ khắc phục độ hội tụ chậm của thuật toán EM với những bộ dữ liệu lớn, giảm sự ảnh hưởng của tham số khởi tạo của MCC với độ chính xác của phân loại, phân loại được nhóm non-ground bị loại
bỏ sau khi phân loại với MCC
Thực hiện phương pháp đề xuất và thử nghiệm được tiến hành trong chương
2
Hình 1.12 Các bước thực hiện phương pháp đề xuất
Trang 391.6 Kết luận chương
Phân loại dữ liệu ĐMĐ LiDAR là bước rất quan trọng trong quá trình xử lý
dữ liệu LiDAR khi đây là bước giúp xác định nhãn cho điểm để từ đó có thể sử dụng trong nhiều ứng dụng và bài toán khác nhau Chương I NCS đã trình bày tổng quan về công nghệ LiDAR, bài toán phân loại điểm dữ liệu LiDAR và phân tích các thuật toán phân loại dữ liệu ĐMĐ hiện có Từ đó xác định bài toán là phân loại dữ liệu ĐMĐ LiDAR
Trang 40CHƯƠNG 2 CHƯƠNG 2 PHÁT TRIỂN THUẬT TOÁN NÂNG CAO CHẤT
LƯỢNG PHÂN LOẠI ĐMĐ LIDAR
Trong chương 2, NCS tiến hành cải tiến thuật toán EM và MCC để phân loại ĐMĐ LiDAR Tiến hành thử nghiệm và đánh giá độ chính xác của kết quả phân loại với độ đo Precision, Recall và F1
2.1 Cải tiến thuật toán EM
2.1.1 Mô tả thuật toán EM
Cực đại hóa kỳ vọng (Expectation Maximization – EM) là thuật toán được Hartley đề xuất năm 1958 Dempster và các cộng sự đã hiện thực sớm phương pháp này cho bài toán ước lượng tham số cực đại trong trường hợp thiếu dữ liệu vào năm
1976 EM là thuật toán được sử dụng để ước tính khả năng ước lượng tối đa cho mô hình tham số khi dữ liệu chưa đầy đủ, thiếu dữ liệu, hoặc có các biến tiềm ẩn không quan sát được Thuật toán EM có thể tìm mô hình tham số ngay cả trong bộ dữ liệu không đầy đủ Thuật toán chọn giá trị ngẫu nhiên cho dữ liệu bị thiếu và sử dụng những dự đoán để tính toán được bộ thứ hai của dữ liệu Các giá trị mới sẽ được sử dụng để tạo ra một dự đoán tốt hơn cho tập dữ liệu đầu, và quá trình này sẽ lặp đi lặp lại cho đến khi thuật toán hội tụ EM là thuật toán kinh điểm của học máy và thống kê
Theo [16], [17]các bước thực hiện thuật toán EM:
a Bước khởi tạo: một tập hợp các giá trị ban đầu của các tham số được khởi tạo Một tập hợp dữ liệu quan sát không đầy đủ được đưa cho hệ thống với giả định rằng dữ liệu quan sát đến từ một mô hình cụ thể
b Bước kì vọng (Expectation - E): Trong bước này, sử dụng dữ liệu quan sát
để ước tính hoặc đoán giá trị của dữ liệu bị thiếu hoặc không đầy đủ Về cơ bản, nó được sử dụng để cập nhật các biến
c Bước cực đại hóa (Maximization - M): Trong bước này, sử dụng dữ liệu đầy đủ được tạo trong bước “Kỳ vọng” trước đó - để cập nhật giá trị của các tham số Về cơ bản nó được sử dụng để cập nhật giả thuyết
d Hội tụ: để kiểm tra sự hội tụ của thuật toán, cần xem các giá trị có hội tụ hay không, nếu có, kết thúc thuật toán, nếu không, lặp lại bước 2 và bước 3, tức là lặp bước E và M cho đến khi sự hội tụ xảy ra
Pseudocode của thuật toán được biểu diễn như sau :