1. NHỮNG KẾT LUẬN MỚI CỦA LUẬN ÁN Ở môi trường trong nhà, các điều kiện khách quan khác nhau như sự thay đổi của môi trường xung quanh (cửa đóng/mở, người đi lại…); sự suy hao của tín hiệu Wi-Fi; thiết bị thu phát Wi-Fi đột ngột ngừng hoạt động làm cho tập dữ liệu thu thập từ một điểm truy cập Wi-Fi (bao gồm các phép đo chỉ số cường độ tín hiệu nhận được - RSSI) có phân bố gồm đa thành phần Gauss; một phần dữ liệu có thể không quan sát được do bị “cắt”, bị “rớt”. Xuất phát từ thực tế này, luận án đề xuất các giải pháp nhằm nâng cao độ chính xác, tối ưu thời gian định vị của hệ thống định vị trong nhà sử dụng kỹ thuật định vị dựa trên dấu vân tay Wi-Fi RSSI. Các kết quả mới của luận án bao gồm: (1) Đề xuất thuật toán ước lượng các tham số trong mô hình mô tả phân bố của Wi-Fi RSSI (mô hình hỗn hợp Gauss - GMM) trong trường hợp không quan sát được một phần dữ liệu; (2) Đề xuất thuật toán ước lượng số thành phần Gauss của GMM trong trường hợp không thu thập được đầy đủ dữ liệu; (3) Đề xuất thuật toán định vị trong trường hợp không thu thập đủ dữ liệu ở giai đoạn định vị trực tuyến. Các giải pháp đã đề xuất được kiểm nghiệm không qua dữ liệu mô phỏng và dữ liệu thực. Các kết quả thực nghiệm chứng minh hiệu quả của các đề xuất so với các kết quả trong các nghiên cứu gần nhất khi áp dụng cho hệ thống định vị trong nhà.
Trang 2VŨ TRUNG KIÊN
NGHIÊN CỨU, PHÁT TRIỂN KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
LUẬN ÁN TIẾN SĨ KỸ THUẬT
Chuyên ngành: KỸ THUẬT ĐIỆN TỬ
Trang 3Tôi xin cam đoan các kết quả trình bày trong luận án là công trình nghiên cứu của tôi dưới sự hướng dẫn của các cán bộ hướng dẫn Các số liệu, kết quả trình bày trong luận án là hoàn toàn trung thực và chưa được công bố trong bất kỳ công trình nào trước đây Các kết quả sử dụng tham khảo đều đã được trích dẫn đầy đủ theo đúng quy định
Hà Nội, ngày tháng năm 2019
Trang 4Trong quá trình nghiên cứu và hoàn thành luận án này, tác giả đã nhận được nhiều sự giúp đỡ và đóng góp quý báu
Đầu tiên, tác giả xin bày tỏ lòng biết ơn sâu sắc tới GS.TS Lê Hùng Lân đã tận tình hướng dẫn và giúp đỡ tác giả trong quá trình nghiên cứu
Tác giả xin chân thành cảm ơn Viện Ứng dụng Công nghệ - Bộ Khoa học và Công nghệ đã tạo điều kiện thuận lợi để tác giả hoàn thành nhiệm vụ Tác giả cũng xin cảm ơn Trường Đại học Công nghiệp Hà Nội, là đơn vị chủ quản, đã tạo điều kiện cho phép tác giả có thể tham gia nghiên cứu trong các năm làm nghiên cứu sinh
Tác giả cũng xin bày tỏ lòng cảm ơn sâu sắc đến TS Hoàng Mạnh Kha, người luôn đồng hành cùng tác giả trong thời gian nghiên cứu; xin chân thành cảm ơn TS Lê Văn Thái và các anh chị em đồng nghiệp thuộc khoa Điện tử, trường Đại học Công nghiệp Hà Nội đã luôn tạo mọi điều kiện giúp tác giả hoàn thành luận án
Cuối cùng, tác giả xin bày tỏ lòng cảm ơn chân thành đến gia đình, bạn bè, các đồng chí, đồng nghiệp đã luôn động viên, giúp đỡ tác giả vượt qua mọi khó khăn để đạt được những kết quả nghiên cứu như ngày hôm nay
LỜI CẢM ƠN
Trang 5LỜI CAM ĐOAN i
LỜI CẢM ƠN ii
DANH MỤC HÌNH VẼ iv
DANH MỤC BẢNG BIỀU, LƯỢC ĐỒ vi
DANH MỤC CÁC TỪ VIẾT TẮT vii
DANH MỤC CÁC KÝ HIỆU CHÍNH x
MỞ ĐẦU 1
1 Tính cấp thiết của đề tài 1
2 Đối tượng và phạm vi nghiên cứu 5
3 Mục tiêu nghiên cứu 5
4 Phương pháp nghiên cứu 6
5 Bố cục của luận án 6
CHƯƠNG 1 TỔNG QUAN VỀ KỸ THUẬT ĐỊNH VỊ TRONG NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi 8
1.1 Các kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-Fi 8
1.1.1 Kỹ thuật định vị tiệm cận 8
1.1.2 Kỹ thuật định vị sử dụng ToA 9
1.1.3 Kỹ thuật định vị sử dụng TDoA 10
1.1.4 Kỹ thuật định vị sử dụng AoA 11
1.1.5 Kỹ thuật định vị sử dụng kết hợp AoA và ToA 12
1.1.6 Kỹ thuật định vị sử dụng RSSI và mô hình suy hao đường truyền 14
1.1.7 Kỹ thuật định vị dựa trên dấu vân tay RSSI 15
1.1.7.1 RSSIF-IPT sử dụng phương pháp tất định 15
1.1.7.2 RSSIF-IPT sử dụng phương pháp xác suất 17
1.1.8 Đánh giá các kỹ thuật định vị 21
MỤC LỤC
Trang 61.2 Đặt vấn đề nghiên cứu 27 1.3 Kết luận chương 1 33 CHƯƠNG 2 ƯỚC LƯỢNG THAM SỐ CỦA MÔ HÌNH MÔ TẢ PHÂN BỐ Wi-Fi RSSI 35 2.1 Đặt vấn đề 35 2.2 Giới thiệu thuật toán EM 39 2.3 Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring 41 2.4 Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do dropping 44 2.5 Ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring và dropping 46 2.6 Đánh giá sai số của các tham số trong GMM ước lượng được bằng thuật toán EM 52 2.7 Kết luận chương 2 56 CHƯƠNG 3 ƯỚC LƯỢNG SỐ THÀNH PHẦN GAUSS TRONG MÔ HÌNH MÔ TẢ PHÂN BỐ Wi-Fi RSSI 57 3.1 Đặt vấn đề 57 3.2 Các phương pháp ước lượng số thành phần Gauss trong GMM 60 3.2.1 Ước lượng số thành phần Gauss trong GMM bằng phương pháp
PF 60 3.2.2 Ước lượng số thành phần Gauss trong GMM bằng phương pháp
CF 62 3.3 Ước lượng số thành phần Gauss trong GMM khi một phần dữ liệu không quan sát được do censoring và dropping 63 3.4 Đánh giá các thuật toán ước lượng số thành phần Gauss trong GMM 68 3.5 Kết luận chương 3 77 CHƯƠNG 4 XÂY DỰNG THUẬT TOÁN ĐỊNH VỊ VÀ CÁC KẾT QUẢ
Trang 7THỰC NGHIỆM IPS 78
4.1 Đặt vấn đề 78
4.2 Thuật toán định vị dựa trên phương pháp MaP 79
4.3 Các kết quả thực nghiệm IPS 82
4.3.1 Sai số định vị 82
4.3.1.1 Thực nghiệm IPS trên dữ liệu mô phỏng 83
4.3.1.2 Thực nghiệm IPS trên dữ liệu thực 86
4.3.2 Mức độ phức tạp của thuật toán định vị 90
4.4 Kết luận chương 4 92
KẾT LUẬN 93
A Các kết quả chính của luận án 93
B Các đóng góp mới của luận án 93
C Hướng phát triển của luận án 94
DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ 96 PHỤ LỤC PL1
Trang 8Hình 1.1 Mô tả kỹ thuật định vị tiệm cận 8
Hình 1.2 Mô tả ToA-IPT 9
Hình 1.3 Mô tả TDoA-IPT 11
Hình 1.4 Mô tả AoA-IPT 12
Hình 1.5 Mô tả kỹ thuật định vị sử dụng kết hợp AoA và ToA 13
Hình 1.6 Mô tả RSSIF-IPT 15
Hình 1.7 Mô tả D-RSSIF-IPT 17
Hình 1.8 Biểu đồ tần suất của Wi-Fi RSSI thu thập được tại các vị trí khác nhau trong điều kiện tĩnh 29
Hình 1.9 Biểu đồ tần suất của Wi-Fi RSSI được thu thập trong các điều kiện động khác nhau 31
Hình 1.10 Biểu đồ tần suất của Wi-Fi RSSI thể hiện các vấn đề censoring, dropping và đa thành phần Gauss 31
Hình 2.2 Mô tả hiện tượng dropping 37
Hình 2.3 Tương quan giữa số lượng mẫu dữ liệu (N) và MSE của các tham số trong GMM được ước lượng bởi EM-CD-GMM 56
Hình 3.1 Biểu đồ tần suất của Wi-Fi RSSI thu thập từ một AP 59
Hình 3.2 Thuật toán ước lượng số thành phần Gauss trong GMM bằng phương pháp PF 61
Hình 3.3 Thuật toán ước lượng số thành phần Gauss trong GMM bằng phương pháp CF 63
Hình 3.4 Thuật toán EM-CD-GMM-PFBIC-CD 67
Hình 3.5 Biểu đồ tần suất của tập dữ liệu mô phỏng được tạo bằng hàm ngẫu nhiên với J=2 76
Hình 3.6 Tương quan giữa số mẫu dữ liệu và xác suất ước lượng đúng số thành phần Gauss khi c 92dBm và 0.1 76
DANH MỤC HÌNH VẼ
Trang 9Hình 4.1 Mặt bằng mô phỏng được tạo trên Matlab 83Hình 4.2 CDF của sai số định vị sau 1000 lần thực nghiệm với dữ liệu mô phỏng 86Hình 4.3 Mặt bằng của khu vực thực nghiệm IPS 87Hình 4.4 Giao diện của phần mềm thu thập Wi-Fi RSSI 87Hình 4.5 Nội dung các file *.xml chứa Wi-Fi RSSI thu thập từ các AP khác nhau 88Hình 4.6 Tổng hợp dữ liệu thu thập được trong giai đoạn huấn luyện 88Hình 4.7 CDF của sai số định vị sau 100 lần thực nghiệm với dữ liệu thực 89Hình 4.8 CDF của sai số định vị tương ứng với bốn thực nghiệm 91
Trang 10Bảng 1.1 Thống kê sai số định vị của một số nghiên cứu về các kỹ thuật định
vị dựa trên vị trí của các AP 23
Bảng 1.2 Thống kê sai số định vị của một số nghiên cứu về RSSIF-IPT 23
Bảng 1.3 Thông tin cần thu thập xây dựng cơ sở dữ liệu với các kỹ thuật định vị 24
Bảng 1.4 Tổng hợp các ưu điểm, nhược điểm của các kỹ thuật định vị 26
Bảng 2.1 KLD của các thuật toán EM sau 1000 lần thực nghiệm 54
Bảng 2.2 KLD của các thuật toán EM sau 1000 lần thực nghiệm 54
Bảng 3.1 Các bộ tham số được sử dụng tạo tập dữ liệu mô phỏng 68
Bảng 3.2 Thống kê xác suất ước lượng đúng, lệch một và lệch từ hai thành phần Gauss trở lên của các thuật toán 70
Bảng 3.2 (tiếp) 71
Bảng 3.3 Thống kê số lần ước lượng số thành phần Gauss khi c 94, 0 , tỉ lệ dữ liệu quan sát được là 98.8% 72
Bảng 3.4 Thống kê số lần ước lượng số thành phần Gauss khi c 92, 0.1 , tỉ lệ dữ liệu quan sát được là 82.6% 73
Bảng 3.5 Thống kê số lần ước lượng số thành phần Gauss khi c 90, 0.2 , tỉ lệ dữ liệu quan sát được là 59.2% 74
Bảng 4.1 Giá trị trung bình và phương sai của sai số định vị sau 1000 lần thực nghiệm với dữ liệu mô phỏng 86
Bảng 4.2 Giá trị trung bình và phương sai của sai số định vị sau 100 lần thực nghiệm với dữ liệu thực 89
Bảng 4.3 Trung bình thời gian thực hiện, giá trị trung bình và phương sai của sai số định vị tương ứng với bốn thực nghiệm 91
DANH MỤC BẢNG BIỀU, LƯỢC ĐỒ
Trang 11Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt
AIC Akaike Information Criterion Tiêu chuẩn thông tin Akaike
AIC3 Akaike Information Criterion 3 Tiêu chuẩn thông tin Akaike 3
AoA Angle of Arrival Góc tới (của tín hiệu Wi-Fi)
BIC Bayesian Information Criterion Tiêu chuẩn thông tin Bayes CDF Cumulative Distribution Function Hàm phân phối tích lũy
CF Characteristic Function Hàm đặc trưng
CIR Channel Impulse Response Đáp ứng xung của kênh truyền
D-RSSIF-IPT Deterministic RSSI Fingerprinting based IPT
Kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI
sử dụng phương pháp tất định
EM Expectation Maximization Cực đại kỳ vọng
EM-CD-G
EM algorithm for parameter estimation of Gaussian distribution in the presence
of Censored and Dropped data
Thuật toán EM ước lượng các tham số của phân phối Gauss khi một phần dữ liệu không quan sát được do censoring và dropping
EM-CD-GMM
EM algorithm for parameter estimation of the GMM in the presence of Censored and Dropped mixture data
Thuật toán EM ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring
Thuật toán ước lượng các tham số và số thành phần Gauss trong GMM sử dụng EM-CD-GMM và PFBIC-CD
DANH MỤC CÁC TỪ VIẾT TẮT
Trang 12Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt
EM-C-G
EM algorithm for parameter estimation of Gaussian distribution in the presence
of Censored data
Thuật toán EM ước lượng các tham số của phân phối Gauss khi một phần dữ liệu không quan sát được do censoring
EM-C-GMM
The EM algorithm for parameter estimation of the GMM in the presence of Censored mixture data
Thuật toán EM ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do censoring EM-D-GMM
The EM algorithm for parameter estimation of the GMM in the presence of Dropped mixture data
Thuật toán EM ước lượng các tham số của GMM khi một phần dữ liệu không quan sát được do dropping
EM-GMM-PFAIC
Model selection and parameter estimation algorithm utilizing EM-GMM and PFAIC
Thuật toán ước lượng các tham số và số thành phần Gauss sử dụng EM-GMM
Thuật toán ước lượng các tham số và số thành phần Gauss sử dụng EM-GMM
Thuật toán ước lượng các tham số và số thành phần Gauss sử dụng EM-GMM
và SWRLCF GMM Gaussian Mixture Model Mô hình hỗn hợp Gauss IPS Indoor Positioning System Hệ thống định vị trong nhà IPT Indoor Positioning Technique Kỹ thuật định vị trong nhà KLD Kullback Leibler Divergence Khoảng cách Kullback Leibler KNN K-Nearest Neighbors K láng giềng gần nhất
LLF Log-Likelihood Function Logarit của hàm hợp lý
MaP Maximum a Posteriori Cực đại xác suất hậu nghiệm
Trang 13Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt
MSE Mean Squared Error Sai số toàn phương trung bình
NLoS Non Light of Sight Không trực thị
PDF Probability Density
PFBIC-CD
PF of extended BIC in the presence of Censored and Dropped data
Hàm phạt trong BIC mở rộng cho trường hợp một phần dữ liệu không quan sát được do censoring và
dropping
truyền P-RSSIF-IPT Probabilistic RSSI Fingerprinting based IPT
Kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI
sử dụng phương pháp xác suất
RSSI Received Signal Strength Indication Chỉ số cường độ tín hiệu nhận được RSSIF-IPT RSSI Fingerprinting based IPT Kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI SWRLCF
Sum of Weighted Real parts
of all Log-Characteristic Functions
Tổng có trọng số của các phần thực trong logarit của hàm đặc trưng
TDoA Time Difference of Arrival Chênh lệch về thời gian tới
TSARS Time and Space Attributes of Received Signal
Thuộc tính về không gian
và thời gian của tín hiệu nhận được
WLAN Wireless Local Area Network Mạng nội bộ không dây
Trang 14Q(.) Hàm phụ (auxiliary function), biểu diễn kỳ vọng
erf(.) Hàm lỗi (error function)
DANH MỤC CÁC KÝ HIỆU CHÍNH
Trang 15I (.) Các tích phân (chi tiết như trong phụ lục 1, 2, 3)
MSE(.) Sai số toàn phương trung bình
PF(.) Hàm phạt của BIC hoặc AIC hoặc AIC3
BIC
PF (.) Hàm phạt của BIC
BIC D
PF (.) Hàm phạt của BIC mở rộng cho trường hợp một số mẫu dữ
liệu không quan sát được do dropping
BIC C
PF (.) Hàm phạt của BIC mở rộng cho trường hợp một số mẫu dữ
liệu không quan sát được do censoring
BIC CD
PF (.) Hàm phạt của BIC mở rộng cho trường hợp một số mẫu dữ
liệu không quan sát được do censoring và dropping
Trang 16w Trọng số của thành phần Gauss thứ j trong GMM
Xác xuất xảy ra dropping
y Tập dữ liệu đầy đủ, không quan sát được
n
y Các mẫu dữ liệu trong tập y
x Tập dữ liệu không đầy đủ, quan sát được
n
x Các mẫu dữ liệu trong tập x
d Tập các biến nhị phân biểu thị khi xảy ra dropping (dn=1)
hoặc không xảy ra dropping (dn=0)
n
z Tập các biến nhị phân biểu thị khi xảy ra censoring (zn 1)
hoặc không xảy ra censoring (zn 0)
Trang 17Ký hiệu Ý nghĩa
( ) k Chỉ số của các vòng lặp trong thuật toán EM
N Số mẫu dữ liệu thu thập được tại một RP từ một AP
N Số điểm tham chiếu (RP)
CF Ngưỡng hội tụ của SWRLCF
Trang 181 Tính cấp thiết của đề tài
Từ thời nguyên thủy, nhu cầu về định vị và dẫn đường đã xuất hiện trong lĩnh vực hàng hải Khi đó, con người dựa vào việc quan sát các vì sao, hướng gió, dòng hải lưu để định hướng khi đi biển Sau này khi khoa học phát triển, các hệ thống định vị dựa trên vệ tinh ra đời cũng là thời điểm đánh dấu một bước phát triển đột phá trong lĩnh vực định vị và dẫn đường Các hệ thống định vị toàn cầu như: GPS (Global Positioning System) của Mỹ, GLONASS (Global Navigation Satellite System) của Nga, Galileo của châu
Âu, hay BDS (BeiDou Navigation Satellite System) của Trung Quốc đã và đang mang lại rất nhiều lợi ích trong các mặt của đời sống xã hội Ở môi trường ngoài trời, các hệ thống định vị dựa trên vệ tinh có thể định vị với sai
số chỉ vài mét Tuy nhiên, trong đô thị hay trong tòa nhà, độ chính xác của các
hệ thống định vị này giảm đi rất nhiều
Ở các khu vực trong nhà có diện tích rất lớn như trung tâm thương mại, nhà ga, sân bay, việc tìm một địa điểm hoặc di chuyển tới một địa điểm nào đó trong các khu vực này là rất khó khăn nếu như không có dịch vụ định
vị hoặc dẫn đường Mặt khác theo kết quả khảo sát năm 2016 của Sithole.G
và nhóm tác giả [46], trung bình hàng ngày mỗi người dành 80% đến 90% thời gian để làm việc, sinh hoạt ở môi trường trong nhà; 70% điện thoại di động và 80% dữ liệu được sử dụng và truyền/nhận trong môi trường trong nhà Đây chính là các lý do vì sao trong những năm gần đây, hệ thống định vị trong nhà (IPS: Indoor Positioning System) rất được quan tâm nghiên cứu, phát triển
Công nghệ định vị trong nhà đã có những bước phát triển rất nhanh Ban đầu từ hệ thống RADAR được giới thiệu bởi Microsoft Research Asia [6]
MỞ ĐẦU
Trang 19năm 2000 Năm 2005, hệ thống Horus được xây dựng bởi đại học Maryland [58] Những hệ thống được phát triển trong những năm gần đây (2015) có thể
kể đến như: hệ thống LIFS của đại học Tsinghua [53]; hệ thống WHERE@UM của đại học Minho [41] Theo thời gian, các hệ thống được phát triển sau có độ chính xác cao hơn, giá thành thấp hơn và nhiều kỹ thuật tiên tiến hơn được áp dụng so với các hệ thống được phát triển trước
IPS có thể hoạt động trong trong không gian hai chiều (2D: 2 Dimension) và trong không gian ba chiều (3D: 2 Dimension) Hệ thống định
vị 3D có giá thành cao hơn hệ thống định vị 2D do phải bổ sung các thiết bị phục vụ định vị [54] Mặt khác đa số các nhu cầu về định vị trong nhà chỉ cần thực hiện trong không gian hai chiều, bởi vậy công nghệ định vị trong không gian hai chiều được quan tâm nghiên cứu phát triển nhiều hơn [46, 54]
IPS có thể định vị đối tượng bằng cách tham chiếu tới tín hiệu, vị trí của các thiết bị trong hạ tầng mạng có sẵn, ví dụ mạng nội bộ không dây (WLAN: Wireless Local Area Network), hoặc quán tính của đối tượng cần định vị (OB: Object) được xác định bằng các cảm biến, ví dụ con quay hồi chuyển, gia tốc kế Sử dụng cảm biến trên chính đối tượng cần định vị, còn gọi là công nghệ định vị dự đoán (DR: Dead Reckoning), có độ chính xác cao trong khoảng thời gian ngắn Tuy nhiên khi OB di chuyển xa, di chuyển trong một khoảng thời gian dài, sai số định vị được tích lũy, bởi vậy DR được dùng như một kỹ thuật hỗ trợ nhằm cải thiện độ chính xác trong IPS [20, 40]
IPS có thể sử dụng camera, bức xạ hồng ngoại (Infrared Radiation), sóng siêu âm (Ultrasound), nhận dạng qua tần số vô tuyến (Radio Frequency Identification), công nghệ mạng không dây băng rộng (Ultra Wideband) hoặc các tín hiệu vô tuyến có sẵn để định vị [17] Ngoài ra, trong vài năm gần đây, một hướng nghiên cứu khác cũng được đề cập, đó là công nghệ định vị dựa trên đáp ứng xung của kênh truyền (CIR: Channel Impulse Response) [11,
Trang 2059] Đây là một công nghệ định vị mới, tuy nhiên cần bổ sung phần cứng cho các thiết bị thu, phát tín hiệu vô tuyến Trong số các công nghệ định vị, công nghệ định vị sử dụng sóng vô tuyến được sử dụng rộng rãi nhất [17] Các tín hiệu vô tuyến được sử dụng phổ biến trong IPS bao gồm: Zigbee [39], Bluetooth [36] và Wi-Fi [56] Trong số này, tín hiệu Wi-Fi trong WLAN được quan tâm hơn cả bởi các lý do: WLAN có sẵn ở hầu hết các khu vực trong nhà; điện thoại thông minh, máy tính là đại đa số các thiết bị di động hoạt động trong môi trường trong nhà đều được trang bị bộ thu phát Wi-Fi, vì vậy việc triển khai IPS sẽ dễ dàng và ít tốn kém hơn [23]
Các kỹ thuật định vị sử dụng tín hiệu Wi-Fi trong WLAN có thể chia thành hai nhóm chính:
- Nhóm các kỹ thuật định vị dựa trên thuộc tính về không gian và thời gian của tín hiệu nhận được (TSARS: Time and Space Attributes of Received Signal) TSARS có thể là thời gian tới (ToA: Time of Arrival), chênh lệch về thời gian tới (TDoA: Time Difference of Arrival) hoặc góc tới (AoA: Angle
of Arrival) Để thu thập được TSARS phục vụ định vị thường phải bổ sung thêm phần cứng, ví dụ như ăng ten dải trên thiết bị thu (OB) để xác định AoA, thiết bị đồng bộ để xác định ToA, điều này làm cho giá thành của hệ thống tăng lên [20, 23] Mặt khác TSARS sẽ bị sai số khi trạm phát, ví dụ các điểm truy cập Wi-Fi (AP: Access Point) và trạm thu không trực thị (NLoS: Non-Light of Sight) với nhau [56] Vì những lý do này, các kỹ thuật định vị trong WLAN sử dụng TSARS ít được triển khai trong môi trường trong nhà [17]
- Nhóm các kỹ thuật định vị sử dụng chỉ số cường độ tín hiệu nhận được (RSSI: Received Signal Strength Indication) Các kỹ thuật này có thể thực hiện định vị cho đại đa số các thiết bị di động hoạt động trong WLAN, ví
dụ điện thoại thông minh, máy tính bảng, máy tính xách tay , mà không cần
bổ sung phần cứng cho IPS do các thiết bị này đều có thể thu thập được RSSI
Trang 21Ngoài ra các kỹ thuật này không yêu cầu trực thị (LoS: Light of Sight) giữa
AP và OB [17, 56], bởi vậy rất phù hợp với môi trường trong nhà Theo thống
kê trong bài báo khảo sát về định vị trong nhà [17], có tới 94,42% các công trình nghiên cứu về IPS sử dụng kỹ thuật định vị dựa trên RSSI Nhóm các kỹ thuật định vị sử dụng Wi-Fi RSSI bao gồm:
+ Kỹ thuật định vị tiệm cận (Promixity) Đây là kỹ thuật định vị đơn giản nhất, được giới thiệu sớm nhất nhưng có sai số lớn
+ Kỹ thuật định vị sử dụng RSSI và mô hình suy hao đường truyền (PLM: Path Loss Model) Khi thu thập được RSSI từ tối thiểu ba AP có tọa
độ biết trước, khoảng cách từ OB tới ba AP này có thể ước lượng thông qua PLM [5], từ đó tính ra vị trí của OB Việc tính khoảng cách thông qua RSSI
và PLM bị sai số khi môi trường xung quanh thay đổi (cửa đóng/mở, người đi lại ) dẫn tới các hệ số trong PLM không thể xác định trước [37] Bởi vậy kỹ thuật định vị này chỉ phù hợp với môi trường tĩnh [5]
+ Kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI [54] IPT: Received Signal Strength Indication Fingerprinting based Indoor Positioning Technique) RSSIF-IPT bao gồm giai đoạn huấn luyện ngoại tuyến và định vị trực tuyến Ở giai đoạn huấn luyện, RSSI được thu thập tại các điểm tham chiếu (RP: Reference Point) có vị trí xác định để xây dựng cơ
(RSSIF-sở dữ liệu Ở giai đoạn định vị trực tuyến, RSSI do OB thu thập được so sánh với cơ sở dữ liệu, từ đó ước lượng ra vị trí của OB thông qua vị trí của một hoặc một số RP Nếu thu thập một số lượng đủ lớn các mẫu dữ liệu (là các giá trị RSSI) ở nhiều thời điểm, trong nhiều hoàn cảnh khác nhau, cơ sở dữ liệu của IPS sử dụng RSSIF-IPT có thể phản ánh được sự biến đổi của RSSI do hiện tượng đa đường, do môi trường xung quanh thay đổi gây ra, qua đó hạn chế được sai số định vị [20] Tuy mất nhiều thời gian cho việc thu thập RSSI
để xây dựng cơ sở dữ liệu nhưng bù lại, IPS sử dụng RSSIF-IPT có sai số chỉ
Trang 22từ 1,6m đến 5m [38]; có giá thành thấp; có thể triển khai được ở hầu hết các khu vực trong nhà [9] Bởi vậy, có tới 94,12% bài báo nghiên cứu về RSSIF-IPT trong số các bài báo nghiên cứu về IPS [17]
Xuất phát từ những thực tế nêu trên, luận án tập trung nghiên cứu kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI sử dụng tín hiệu Wi-Fi trong WLAN
2 Đối tượng và phạm vi nghiên cứu
Nghiên cứu kỹ thuật định vị cho đối tượng tĩnh trong không gian hai chiều ở môi trường trong nhà Kỹ thuật định vị được tập trung nghiên cứu là RSSIF-IPT, sử dụng tín hiệu Wi-Fi trong WLAN Các vấn đề được nghiên cứu bao gồm: Đặc điểm của Wi-Fi RSSI; mô hình xác suất mô tả phân bố của Wi-Fi RSSI; thuật toán ước lượng các tham số, tối ưu hóa các tham số của mô hình được sử dụng mô tả phân bố của Wi-Fi RSSI; thuật toán định vị trực tuyến
3 Mục tiêu nghiên cứu
- Mục tiêu chung: Nghiên cứu phát triển kỹ thuật định vị trong nhà dựa trên dấu vân tay RSSI sử dụng tín hiệu Wi-Fi trong WLAN nhằm giảm thiểu sai số định vị, tối ưu thời gian định vị
Trang 23+ Thực nghiệm IPS với các kỹ thuật đã nghiên cứu, phát triển nhằm kiểm nghiệm, so sánh với IPS sử dụng các kỹ thuật khác
4 Phương pháp nghiên cứu
Phương pháp thống kê (toán) để xác định xu hướng diễn biến của tập
dữ liệu (là các phép đo Wi-Fi RSSI) thu thập được từ đó đề xuất mô hình toán học mô tả phân bố của dữ liệu; phương pháp giải tích để tính toán các tham số của mô hình và vị trí của đối tượng cần định vị; phương pháp Monte Carlo để đánh giá sai số của các tham số mô hình; cuối cùng, các phương pháp thực nghiệm trên cả dữ liệu mô phỏng và dữ liệu thực tế để kiểm chứng hiệu quả của các đề xuất khi áp dụng cho IPS
Trang 24Chương 3 Ước lượng số thành phần Gauss trong mô hình mô tả phân
bố Wi-Fi RSSI: Nghiên cứu xây dựng thuật toán ước lượng số thành phần Gauss trong mô hình mô tả phân bố của Wi-Fi RSSI, qua đó giảm thiểu số lượng tham số cần lưu trong cơ sở dữ liệu, tạo tiền đề giảm số phép tính trong thuật toán định vị nhằm tối ưu thời gian định vị; đánh giá, so sánh sai số của
số thành phần Gauss được ước lượng bằng thuật toán đã xây dựng với một số phương pháp khác đã được công bố
Chương 4 Xây dựng thuật toán định vị và các kết quả thực nghiệm IPS: Nghiên cứu xây dựng thuật toán định vị trong trường hợp một phần dữ liệu do OB thu thập trong giai đoạn định vị trực tuyến không quan sát được; thực nghiệm IPS được áp dụng các thuật toán đã xây dựng và so sánh với IPS
áp dụng các đề xuất trong các nghiên cứu khác đã công bố gần đây
Trang 25Chương 1 bao gồm các nội dung: Các kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-Fi, ưu điểm, nhược điểm của từng kỹ thuật; các nghiên cứu
về RSSIF-IPT, những vấn đề đã được giải quyết và chưa được giải quyết, qua
đó, luận án đưa ra định hướng nghiên cứu
1.1 Các kỹ thuật định vị trong nhà sử dụng tín hiệu Wi-Fi
1.1.1 Kỹ thuật định vị tiệm cận
Kỹ thuật định vị tiệm cận (proximity) [27, 51] còn gọi là kỹ thuật định
vị dựa trên vị trí của AP trong WLAN có cường độ tín hiệu nhận được lớn nhất
Hình 1.1 mô tả kỹ thuật định
vị tiệm cận với ba AP và đối tượng
(OB) cần định vị Khi OB nằm trong
vùng phủ sóng của AP1 (vị trí 1), vị
trí của OB sẽ là vị trí của AP1 Tại vị
trí 2, OB nằm trong vùng phủ sóng
của AP1 và AP2 Nếu RSSI do OB
thu thập được từ AP2 lớn hơn từ
Ở vị trí 3, OB nằm trong vùng phủ sóng của cả ba AP, khi đó vị trí của
OB sẽ là vị trí của AP tương ứng với RSSI lớn nhất mà OB thu thập được
CHƯƠNG 1 TỔNG QUAN VỀ KỸ THUẬT ĐỊNH VỊ TRONG
NHÀ SỬ DỤNG TÍN HIỆU Wi-Fi
Trang 261.1.2 Kỹ thuật định vị sử dụng ToA
Kỹ thuật định vị sử dụng thông tin ToA của tín hiệu Wi-Fi (ToA-IPT: ToA based Indoor Positioning Technique) dựa trên thời gian lan truyền của sóng vô tuyến từ tối thiểu ba AP có vị trí xác định tới OB hoặc ngượi lại, từ
OB tới tối thiểu ba AP, từ đó tính ra khoảng cách từ OB tới các AP và ước lượng ra vị trí của OB [12, 52]
Hình 1.2 mô tả ToA-IPT với ba AP
Gọi t1, t2 và t3 lần lượt là thời gian lan
truyền của sóng vô tuyến từ OB tới AP1,
AP2 và AP3; v là vận tốc lan truyền của
sóng vô tuyến Khi đó r = vt1 1, r = vt2 2 và
Hình 1.2 Mô tả ToA-IPT
Một cách tổng quát, giả thiết OB ở tọa độ ( , )x y có NAP AP khả dụng
AP thứ i(i 1 N) có tọa độ ( , )x yi i Gọi ri là khoảng cách từ OB tới AP thứ
Trang 27Chênh lệch giữa khoảng cách từ OB tới AP thứ i và khoảng cách từ
OB tới AP thứ j được xác định bằng công thức (1.5):
Trang 29chiều kỹ thuật này có thể xác định được vị trí của OB thông qua vị trí của hai
AP (AP1 và AP2) và góc của tín hiệu từ các AP này tới OB (1 và 2) nếu
OB không nằm trên đường thẳng thẳng nối giữa hai AP (hình 1.4)
y
Đường thẳng tham chiếu Hướng đến của tín hiệu
Hình 1.4 Mô tả AoA-IPT Gọi ii 1 N là góc tới của AP thứ i, x y, và x yi, i lần lượt là tọa độ của OB và AP thứ i, khi đó:
sincos
1.1.5 Kỹ thuật định vị sử dụng kết hợp AoA và ToA
Kỹ thuật định vị sử dụng thông tin kết hợp về AoA và ToA có thể sử dụng tối thiểu một AP có tọa độ biết trước để xác định vị trí của OB trong không gian hai chiều (Hình 1.5)
Trang 30Hình 1.5 Mô tả kỹ thuật định vị sử dụng kết hợp AoA và ToA
Gọi ii 1 N là góc tạo bởi đường thẳng tham chiếu với tín hiệu
từ OB tới AP thứ i hoặc ngược lại, từ AP thứ i tới OB; ri là khoảng cách từ
Trang 311.1.6 Kỹ thuật định vị sử dụng RSSI và mô hình suy hao đường truyền
Kỹ thuật định vị sử dụng RSSI và mô hình suy hao đường truyền (PLM: Path Loss Model) dựa vào RSSI do OB thu thập được từ các AP từ đó tính ra khoảng cách tới các AP thông qua PLM cho trước Có hai loại PLM được sử dụng trong IPS:
- Mô hình kết hợp suy hao theo khoảng cách và suy hao do tín hiệu không được truyền thẳng [19]:
tín hiệu từ AP không được truyền thẳng tới OB (với môi trường trong nhà,
Khi xác định được khoảng cách từ OB tới tối thiểu ba AP có tọa độ biết trước, vị trí của OB có thể ước lượng theo phương pháp LS (tương tự kỹ thuật định vị sử dụng ToA [5])
Trang 321.1.7 Kỹ thuật định vị dựa trên dấu vân tay RSSI
Kỹ thuật định vị dựa trên dấu vân tay RSSI (RSSIF-IPT) được đề xuất lần đầu vào năm 2000 [6] RSSIF-IPT bao gồm giai đoạn huấn luyện ngoại tuyến và định vị trực tuyến (hình 1.6)
OB thu thập Wi-Fi RSSI từ các AP
Ước lượng vị trí của
OB
Mô hình hóa phân bố của Wi-Fi
RSSI; Ước lượng các tham số
của mô hình
Có thể có hoặc không (tùy hệ thống) Các AP Các RP
Giai đoạn huấn luyện ngoại tuyến Giai đoạn định vị
trực tuyến
Hình 1.6 Mô tả RSSIF-IPT
Vị trí của OB được ước lượng bằng cách so sánh RSSI do OB thu thập với cơ sở dữ liệu Các phương pháp ước lượng vị trí của OB bao gồm: Phương pháp tất định (deterministic approach), ví dụ như K láng giềng gần nhất [6, 15] (KNN: K-Nearest Neighbors) và phương pháp xác suất (probabilistic approach)
1.1.7.1 RSSIF-IPT sử dụng phương pháp tất định
Kỹ thuật định vị dựa trên dấu vân tay RSSI sử dụng phương pháp tất định (D-RSSIF-IPT: Deterministic RSSIF-IPT) được đề xuất bởi P Bahl và
Trang 33V.N Padmanabhan [6] D-RSSIF-IPT ước lượng vị trí của OB bằng cách tính khoảng cách Euclid [6, 15] hoặc khoảng cách Manhattan [42] hoặc khoảng cách Mahalanobis [32] giữa tập dữ liệu do OB đo được với RSSI thu thập tại các RP từ các AP lưu trong cơ sở dữ liệu
Giả thiết trong khu vực cần định vị có NRP điểm tham chiếu (RP) và
có NAP điểm truy cập (AP) Wi-Fi khả dụng Gọi xq i, là Wi-Fi RSSI đo được tại RP thứ q từ AP thứ i Khi đó, cơ sở dữ liệu thu thập trong giai đoạn huấn luyện sẽ là:
D k K , vị trí của
OB được ước lượng bằng phương pháp KNN như sau:
1 1
k kK E
k k
DD
Trang 34Trong công thức (1.18), KNN là số láng giềng gần nhất KNNcó thể chọn cố định [6], hoặc có thể tùy biến để đạt được kết quả định vị chính xác hơn [15] Hình 1.7 mô tả một ví dụ đơn giản về D-RSSIF-IPT
60dBm và 40dBm Ở vị trí hiện tại, OB đo được RSSI với giá trị 70dBm,
khi đó khoảng cách Euclid được tính theo công thức (1.17) như sau:
2 1
2 2
2 3
E E E
DDD
1.1.7.2 RSSIF-IPT sử dụng phương pháp xác suất
RSSIF-IPT sử dụng phương pháp xác suất (P-RSSIF-IPT: Probabilistic RSSIF-IPT) được giới thiệu lần đầu vào năm 2003 [57] Trong giai đoạn huấn luyện, một số lượng đủ lớn dữ liệu là các Wi-Fi RSSI được thu
Trang 35thập tại từng RP từ mỗi AP và hàm mật độ xác suất (PDF: Probability Density Function) được sử dụng mô tả phân bố của dữ liệu Với phương pháp này, gọi
,
p (.)q i là PDF mô tả phân bố của dữ liệu thu thập tại RP thứ q từ AP thứ i , khi
đó, cơ sở dữ liệu của IPS sẽ là:
Ước lượng PDF bằng mô hình không có tham số:
Biểu đồ tần suất [3, 16] và hàm kernel [33, 45] là các mô hình không
có tham số điển hình được sử dụng ước lượng PDF Với biểu đồ tần suất, cơ
sở dữ liệu được xây dựng trong giai đoạn huấn luyện sẽ là tần suất xuất hiện của từng mẫu dữ liệu trong tập dữ liệu thu thập được, cụ thể như sau:
Gọi xminvà xmax là giá trị nhỏ nhất và lớn nhất trong số các Wi-Fi RSSI thu thập được; s,
q i
N là số mẫu dữ liệu có giá trị bằng sđo được từ AP thứ i tại
RP thứ q s x minxmax Tùy theo thiết bị được sử dụng để thu thập dữ liệu,
s hoặcs , ví dụ, khi sử dụng điện thoại thông minh để thu thập dữ liệu, s Khi đó, PDF là một hàm rời rạc mô tả tần suất xuất hiện các mẫu
dữ liệu có giá trị bằng svà được xác định như sau:
Trang 36với P ( )off,
q i s là xác suất xuất hiện mẫu dữ liệu có giá trị bằng s; Noff là tổng số mẫu dữ liệu thu thập tại mỗi RP từ một AP trong giai đoạn huấn luyện ngoại tuyến
Trong giai đoạn định vị trực tuyến, OB sẽ thu thập Non mẫu dữ liệu từ mỗi AP khả dụng Tần suất xuất hiện của các mẫu dữ liệu này được so sánh với cơ sở dữ liệu bằng cách tính hệ số Bhattacharyya [16, 34]:
Ước lượng PDF bằng mô hình có tham số:
Khi sử dụng mô hình có tham số, một mô hình phù hợp nhất với phân
bố của dữ liệu sẽ được sử dụng (ví dụ GMM [4], phân phối Gauss [25]) và một phương pháp cụ thể được áp dụng để ước lượng các tham số của mô hình Cơ sở dữ liệu sẽ lưu các tham số của mô hình thay vì toàn bộ dữ liệu như D-RSSIF-IPT hoặc xác suất của từng mẫu dữ liệu như P-RSSIF-IPT sử dụng mô hình không có tham số Khi đó, cơ sở dữ liệu sẽ là:
Trang 37với p ;y là PDF của mô hình được chọn để mô tả phân bố của dữ
liệu, ví dụ, nếu chọn phân phối Gauss, p ; 1 exp 22
22
Với phương pháp ML, hợp lý (còn gọi là khả năng - likelihood) của mẫu dữ liệu xon do OB thu thập sẽ được tính với từng RP:
Với phương pháp MaP, xác suất hậu nghiệm (posterior probability) sẽ được tính với từng RP:
Trang 38Vị trí của OB sẽ là vị trí của RP thứ q có xác suất hậu nghiệm lớn nhất hoặc tính thông qua vị trí của KNN các RP có xác suất hậu nghiệm lớn nhất bằng phương pháp KNN
1.1.8 Đánh giá các kỹ thuật định vị
Việc lựa chọn một kỹ thuật định vị cho IPS được căn cứ vào yêu cầu của hệ thống (độ chính xác, thời gian trả về kết quả định vị, giá thành…) và hiện trường nơi triển khai hệ thống Trong mục này, các kỹ thuật định vị đã trình bày trong các mục 1.1.1 đến 1.1.7 sẽ được phân tích, đánh giá trên các khía cạnh khác nhau, qua đó có thể chỉ ra các ưu điểm, nhược điểm, tính khả thi của từng kỹ thuật
Sai số định vị:
Sai số định vị (hoặc độ chính xác định vị) là tiêu chí quan trọng nhất, thường được xem xét trước tiên khi lựa chọn các kỹ thuật định vị để triển khai IPS Sai số định vị được thể hiện thông qua hai tham số: Trung bình sai số định vị (giữa vị trí thực và vị trí ước lượng được) và xác suất định vị với sai
số nhỏ hơn một ngưỡng cụ thể Xác suất định vị với sai số (e) nhỏ hơn ngưỡng ( d ) hay hàm phân phối tích lũy (CDF: Cumulative Distribution Function) của sai số định vị được xác định như sau:
Sai số của kỹ thuật định vị tiệm cận chính là khoảng cách từ vị trí của
OB tới vị trí của AP có RSSI lớn nhất Ở môi trường trong nhà đôi khi OB ở rất gần một AP nhưng RSSI thu được từ AP này lại rất nhỏ so với các AP khác ở xa hơn do đường truyền của tín hiệu Wi-Fi từ AP ở gần bị nhiều vật
Trang 39cản Khi đó thay vì trả về kết quả định vị tương ứng với vị trí của AP gần nhất, thuật toán định vị trong kỹ thuật này trả về kết quả định vị tương ứng với vị trí của AP xa hơn, đồng nghĩa với sai số định vị lớn hơn Kỹ thuật này
có sai số trung bình dao động từ vài mét tới vài chục mét [51]
Các kỹ thuật định vị sử dụng TSARS (bao gồm ToA, TDoA và AoA) cho kết quả định vị với độ chính xác cao hơn nhiều so với kỹ thuật định vị tiệm cận khi tín hiệu được truyền thẳng từ AP với OB hoặc ngược lại Khi tín hiệu không được truyền thẳng, AoA đo được không còn là góc tạo bởi đường thẳng nối giữa OB với AP và một đường thẳng tham chiếu; ToA và TDoA không tương ứng với độ dài đoạn thẳng nối giữa AP và OB, vì vậy độ chính xác của các kỹ thuật này giảm đi rất nhiều [2]
Độ chính xác của kỹ thuật định vị sử dụng RSSI và PLM phụ thuộc vào việc lựa chọn các tham số trong PLM Mô hình phản ánh càng chính xác sự suy hao của tín hiệu Wi-Fi thì độ chính xác càng cao và ngược lại Vì vậy khi triển khai IPS cần khảo sát kỹ hiện trường, thực hiện nhiều phép đo RSSI để chọn các tham số của mô hình sao cho phù hợp nhất với thực tế Tuy nhiên ngay cả khi đã chọn được các tham số phù hợp với môi trường ở khu vực cần định vị thì cũng chỉ là các tham số tương ứng với môi trường tĩnh (các vật cản, hướng ăng ten… cố định) trong khi với nhiều khu vực, môi trường thường xuyên thay đổi (đóng/mở cửa, người đi lại…) Đây cũng chính là những vấn đề thực tế làm cho kỹ thuật định vị thông qua vị trí của các AP, sử dụng RSSI thu thập được và PLM có độ chính xác thấp với nhiều vị trí trong môi trường trong nhà [20, 23]
Với RSSIF-IPT, sai số định vị chủ yếu phụ thuộc vào quá trình xây dựng cơ sở dữ liệu trong giai huấn luyện ngoại tuyến và thuật toán định vị trong giai đoạn định vị trực tuyến Sai số của kỹ thuật này ít phụ thuộc vào các điều kiện ngoại cảnh khách quan như các kỹ thuật định vị đã nêu trên
Trang 40Bảng 1.1 và 1.2 thống kê sai số của các kỹ thuật định vị từ một số công trình nghiên cứu
Bảng 1.1 Thống kê sai số định vị của một số nghiên cứu về các kỹ
thuật định vị dựa trên vị trí của các AP
Kỹ thuật định vị Sai số trung bình (m) CDFe d
P-RSSIF-IPT
Mô hình không sử dụng
tham số
CDFe(2.1m)=0.45 [25] CDFe(4m)=0.82 [16]
Mô hình sử dụng tham số CDFe(4m)=0.89 [4]
CDFe(2.1m)=0.62[25] Yêu cầu về phần cứng:
Các kỹ thuật định vị khác nhau yêu cầu các nền tảng phần cứng khác nhau Khi lựa chọn một kỹ thuật định vị cho IPS, tiêu chí này là căn cứ quan trọng để xác định giá thành của IPS Với các khu vực có sẵn WLAN, để triển khai IPS cho các thiết bị di động thông dụng như điện thoại, máy tính, các kỹ thuật định vị sử dụng RSSI thường không yêu cầu bổ sung phần cứng, trong khi các kỹ thuật định vị sử dụng TSARS thường cần bổ sung phần cứng