Nói một cách khác, dữ liệu thu được từ các cảm biến này có tính tương đồng, hay một cách tổng quát các dữ liệu này có tính chất tương quan với nhau.. Từ các lý do trên, tác giả đã lựa ch
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Nguyễn Thị Thanh Nga
NÂNG CAO HIỆU QUẢ TRUYỀN DỮ LIỆU TRONG MẠNG CẢM BIẾN KHÔNG DÂY DỰA TRÊN TƯƠNG QUAN DỮ LIỆU
Ngành: Kỹ thuật Máy tính
Mã số: 9480106
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT MÁY TÍNH
Hà Nội – 2018
Trang 2Công trình được hoàn thành tại:
Trường Đại học Bách khoa Hà Nội
Người hướng dẫn khoa học:
Có thể tìm hiểu luận án tại thư viện:
1 Thư viện Tạ Quang Bửu – Trường ĐHBK Hà Nội
2 Thư viện Quốc gia Việt Nam
Trang 3DANH MỤC CÁC CÔNG TRÌNH ĐÃ CÔNG BỐ
CỦA LUẬN ÁN
1 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, and Son Ngo Hong "Entropy
based correlation clustering for wireless sensor network in
multi-correlated regional environment." Electronics, Information, and Communications (ICEIC), 2016 International Conference on IEEE, 2016
2 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, Ngo Hong Son, and Ngo
Quynh Thu “Correlation-based Clustering for Energy Saving in Wireless
Sensor Network.” Journal of Science and Technology Technical Universities, No 115 (2016), pp 51-57
3 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, and Son Ngo Hong
“Entropy-based Correlation Clustering for Wireless Sensor Networks in
Multi-Correlated Regional Environments.” IEIE Trans on Smart Proc and Comput., vol 5, no 2, (2016), 85-93
4 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, and Son Ngo Hong
"Entropy correlation and its impact on routing with compression in
wireless sensor network." Proceedings of the Seventh Symposium on Information and Communication Technology (SoICT) ACM, 2016
5 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, and Son Ngo Hong, Ngo Lam
Trung “Entropy Correlation and Its Impacts on Data Aggregation in a
Wireless Sensor Network.” Sensors (2018); 18(9):3118 (SCIE).E) E)
6 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, and Son Ngo Hong “Study
on Entropy Correlation in Wireless Sensor Networks for Energy
Efficiency.” Journal of Science and Technology Technical Universities,
No 128 (2018), pp 41-47
7 Nguyen Thi Thanh Nga, Nguyen Kim Khanh, and Son Ngo Hong “Entropy
Correlation based Clustering Method for Representative Data
Aggregation in Wireless Sensor Networks.” International Journal of Sensor Networks, 2018, Vol.28 No.4, pp.270 – 283.
Trang 4MỞ ĐẦU
1 Lý do lựa chọn đề tài
Mạng cảm biến không dây (WSN) là tập lợp các nút cảm biến liên kết với nhau để giám sát môi trường, sự kiện xung quanh trong các không gian vật lý rộng Các tiến bộ trong việc tích hợp các hệ thống vi cơ điện tử và
sự phát triển nhanh chóng của truyền thông không dây đã cho phép WSN ngày càng được triển khai một cách rộng rãi Các nút cảm biến trong WSN được trang bị nhiều chức năng cảm biến khác nhau cùng với năng lực xử
lý ngày càng cao cho phép WSN có thể đáp ứng được các yêu cầu khác nhau từ rất nhiều các ứng dụng hiện đại Do tính chất của WSN là giá thành rẻ, kích thước nhỏ và không thể thay thế nguồn năng lượng cấp cho các nút cảm biến, vấn đề tiết kiệm năng lượng luôn là một thách thức lớn trong việc thiết kế và vận hành mạng cảm biến không dây
Trong các ứng dụng điển hình của WSN, các cảm biến được triển khai một cách dày đặc trong không gian giám sát để đảm bảo tính chính xác của kết quả giám sát Điều này dẫn tới việc có nhiều cảm biến sẽ thu thập thông tin của cùng một sự kiện Nói một cách khác, dữ liệu thu được từ các cảm biến này có tính tương đồng, hay một cách tổng quát các dữ liệu này có tính chất tương quan với nhau Việc tồn tại đặc tính tương quan này có thể đem lại rất nhiều lợi thế cho việc phát triển các giao thức truyền thông hiệu quả cho WSN
Từ các lý do trên, tác giả đã lựa chọn đề tài nghiên cứu “Nâng cao hiệu quả truyền dữ liệu trong mạng cảm biến không dây dựa trên tương quan dữ liệu” với mục tiêu khám phá và khai thác tính chất tương quan
trong WSN dưới góc độ tiết kiệm năng lượng Đề tài này được hi vọng có ứng dụng rộng rãi do tính chất tương quan là khá phổ biến trong các môi trường mà WSN được triển khai trong thực tế Đặc biệt nghiên cứu này
sẽ có hữu dụng với các mạng cảm biến không dây đa phương tiện, là mạng cảm biến không dây mà ở đó mức độ tương quan cao và dữ liệu truyền lớn
2 Mục tiêu và nội dung của đề tài
Các nghiên cứu trước đây về vấn đề tương quan trong mạng cảm biến không dây thường chỉ tập trung vào tính tương quan phụ thuộc vào khoảng cách Giả thiết này không tổng quát và trong một số trường hợp không còn đúng khi các nút cảm biến gần nhau nhưng bị ngăn cách bởi
Trang 5một rào cản vật lý Do vậy mục tiêu của nghiên cứu này là đề xuất một
mô hình tương quan mới không phụ thuộc vào khoảng cách dựa trên lý thuyết tương quan entropy để mô tả tính chất tương quan trong WSN Từ
mô hình tương quan này, ảnh hưởng của tính chất tương quan tới một số
cơ chế kết tập dữ liệu như nén dữ liệu hay nút đại diện được phân tích và đánh giá Thêm vào đó, một giao thức định tuyến tiết kiệm năng lượng với kết tập dữ liệu dựa vào tính tương quan được xây dựng
3 Nhiệm vụ nghiên cứu của luận án
Để đạt được mục tiêu nghiên cứu, luận án cần phải giải quyết các nhiệm
vụ sau:
<1> Đề xuất phương pháp đánh giá joint entropy cho một tập dữ liệu Xây dựng định nghĩa vùng tương quan dựa vào các dữ liệu cảm biến đo được và xây dựng thuật toán phân nhóm tương quan entropy
<2> Phân tích ảnh hưởng của tương quan entropy tới các cơ chế kết tập
dữ liệu như nén dữ liệu và nút đại diện trong WSN
<3> Xây dựng giao thức định tuyến với kết tập dữ liệu dựa vào tính tương quan
4 Đối tượng và phạm vi nghiên cứu của luận án
Đối tượng của luận án là mạng cảm biến không dây hoạt động trong môi trường có độ tương quan cao, nghĩa là các dữ liệu thu thập bởi các nhóm cảm biến có tính tương đồng/tương quan với nhau Phạm vi nghiên cứu của luận án là nhận biết tính chất tương quan và ứng dụng đặc tính tương quan môi trường để phát triển các giao thức định tuyến năng lượng Cụ thể, đối tượng và phạm vi nghiên cứu cho các nhiệm vụ bao gồm:
- Với nhiệm vụ 1: Lý thuyết entropy được sử dụng để xem xét tính chất tương quan Xây dựng cách thức đánh giá joint entropy sử dụng giá trị entropy của mỗi nút và hệ số tương quan entropy giữa hai nút Tính chất tương quan sẽ được nhận biết dựa trên thuộc tính của giá trị joint entropy của nhóm dữ liệu Dữ liệu thực tế được sử dụng để xác thực tính chính xác của phương pháp đề xuất
- Với nhiệm vụ 2: Để khai thác đặc tính tương quan môi trường, hai cơ chế kết tập dữ liệu chính bao gồm nén dữ liệu và nút đại diện được xem xét và phân tích sử dụng mô hình tương quan đã đề xuất trong nhiệm vụ
1 Cơ chế nén dữ liệu được xem xét với các cấu trúc mạng kiểu 1D và 2D, nén dọc đường truyền về nút trưởng nhóm hoặc chỉ nén tại nút trưởng
Trang 6nhóm Cơ chế nút đại diện được xem xét với việc sử dụng hàm méo entropy
- Với nhiệm vụ 3: Dựa trên các kết quả phân tích và đánh giá trong nhiệm
vụ 2, giao thức định tuyến sử dụng kết tập dữ liệu dựa trên tương quan entropy sẽ được xây dựng với mục tiêu tiết kiệm năng lượng Cấu trúc và hoạt động của giáo thức được mô tả và khả năng tiết kiệm năng lượng của giao thức sẽ được đánh giá
5 Ý nghĩa khoa học thực tiễn của luận án
Luận án đã đề xuất một định nghĩa vùng tương quan mới từ đó xây dựng được thuật toán gom nhóm tương quan có thể thực hiện một cách đơn giản trong thực tế Thêm vào đó, mô hình tương quan không phụ thuộc vào khoảng cách được đề xuất trong luận án có thể được sử dụng trong các nghiên cứu khác về tính tương quan
Luận án cũng đã xây dựng được một giao thức tiết kiệm năng lượng sử dụng đặc tính tương quan Giao thức này cho phép kéo dài thời gian hoạt động của mạng trong khi vẫn đảm bảo độ chính xác dữ liệu theo yêu cầu
6 Phương pháp nghiên cứu của luận án
Luận án kết hợp song song phương pháp nghiên cứu lý thuyết và phương pháp nghiên cứu thực nghiệm
Về lý thuyết: luận án sử dụng lý thuyết entropy và khái niệm tương quan
entropy để xây dựng mô hình tương quan, vùng tương quan và thuật toán phân nhóm tương quan Luận án cũng phát triển giao thức định tuyến cho WSN Tất cả các kết quả đều được chứng minh tính đúng đắn thông qua các công cụ toán học
Về thực nghiệm: tất cả các kết quả lý thuyết đều được xác thực với các
bộ dữ liệu thực tế Các sai khác giữa điều kiện thực tế và giả thiết trong lý thuyết đều được xem xét và hiệu chỉnh Thêm vào đó, mô phỏng máy tính cũng được tiến hành để đánh giá khả năng tiết kiệm năng lượng của giao thức định tuyến đề xuất
7 Kết quả nghiên cứu, đóng góp của luận án
Các kết quả và đóng góp chính của luận án bao gồm:
<1> Xây dựng thuật toán phân nhóm tương quan entropy và xây dựng
mô hình tương quan entropy để mô tả tính chất tương quan của một nhóm tương quan
<2> Phân tích và đánh giá ảnh hưởng của tương quan entropy tới các cơ
Trang 7chế kết tập dữ liệu nén dữ liệu và nút đại diện
<3> Xây dựng giao thức định tuyến với kết tập dữ liệu dựa trên tương quan entropy Giao thức này cho phép khai thác đặc tính tương quan của môi trường mạng cảm biến không dây làm việc
8 Nội dung luận án
Nội dung của luận án được trình bày trong 5 chương bao gồm:
Chương 1: Giới thiệu tổng quan Chương này trình bày giới thiệu về WSN, các cơ chế tiết kiệm năng lượng và vấn đề tương quan dữ liệu trong WSN Các đóng góp chính của luận án cũng được đề cập trong chương này
Chương 2: Vấn đề tương quan trong mạng cảm biến không dây Trong chương này, các mô hình tương quan trong mạng cảm biến không dây được khảo sát Vấn đề tương quan dưới góc độ lý thuyết entropy thông tin cũng được xem xét và ý tưởng để có thể thiết lập một mô hình tương quan mới cũng được mô tả
Chương 3: Phân nhóm tương quan entropy Trong chương này, đầu tiên,
lý thuyết entropy đề cập Sau đó phương pháp đánh giá xấp xỉ joint entropy được xây dựng Từ đánh giá xấp xỉ này, các định nghĩa về vùng tương quan cũng như thuật toán phân nhóm tương quan được xây dựng Quá trình xác thực tính đúng đắn của các đề xuất cũng được thực hiện trong chương này
Chapter 4: Kết tập dữ liệu dựa trên tương quan entropy Chương này trình bày các phân tích và đánh giá ảnh hưởng của tương quan entropy tới các kết tập dữ liệu kiểu nén dữ liệu và kiểu nút đại diện
Chapter 5: Giao thức kết tập dữ liệu dựa trên tương quan entropy (ECODA) Chương này xây dựng chi tiết giao thức ECODA sử dụng thuật toán phân nhóm tương quan ở chương 3 và các các cơ chế kết tập
dữ liệu trong chương 4 Các mô phỏng cũng được tiến hành trong chương này
Chapter 6: Kết luận và kiến nghị Chương này tổng kết các kết quả đạt được, các giới hạn và hướng nghiên cứu tiếp theo của luận án
1 GIỚI THIỆU TỔNG QUAN
1.1 Tổng quan
1.2 Vấn đề tiết kiệm năng lượng trong mạng cảm biến không dây 1.2.1 Tối ưu thông số radio
Trang 81.2.2 Các cơ chế thức/ngủ
1.2.3 Định tuyến tiết kiệm năng lượng
1.2.4 Giảm dữ liệu truyền
1.2.5 Các giải pháp về nạp năng lượng
1.3 Tương quan dữ liệu và vấn đề tiết kiệm năng lượng trong mạng cảm biến không dây
Tính chất tương quan có thể đem lại rất nhiều thuận lợi cho việc xây dựng các giao thức tiết kiệm năng lượng trong mạng cảm biến không dây Ví
dụ như do sự tương quan cao, các dữ liệu trong một vùng tương quan có thể được nén với tỉ số nén cao Do vậy lượng dữ liệu gửi sẽ được giảm thiểu Thậm chí trong trường hợp tương quan đủ cao, ta có thể chỉ phải sử dụng một số nút đại diện để thu thập thông tin Các nút khác có thể được nghỉ để tiết kiệm năng lượng mà vẫn đảm bảo độ chính xác, tin cậy của thông tin thu thập Điều đó cho thấy tính chất tương quan có thể cho phép chúng ta giảm thiểu được lượng dữ liệu truyền, và do đó giúp tiết kiệm năng lượng tiêu thụ của mạng cảm biến không dây một cách đáng kể
1.4 Các vấn đề nghiên cứu và đóng góp của luận án
Vấn đề chính đặt ra cho luận án này là làm thế nào để có thể nhận biết được sự tương quan của các dữ liệu mà chỉ xem xét giá trị của bản thân
dữ liệu đó, và làm thể nào để khai thác được tính chất tương quan cho mục tiêu tiết kiệm năng lượng trong mạng cảm biến không dây
& Akyildiz, 2004), các nút tương quan được giả thiết là các nút giám sát
Trang 9cùng một nguồn và dữ liệu đo được tại mỗi nút là tổng của dữ liệu tương quan với nguồn và nhiễu đo Mô hình tương quan là hàm hiệp phương sai
𝐾𝜗 (hoặc hệ số tương quan ) và được chọn là một hàm phụ thuộc vào khoảng cách Có 4 nhóm hàm được xem xét là dạng cầu, hàm mũ, hàm tỉ
lệ bậc 2 và hàm Matern Một số nghiên cứu khác cũng xây dựng mô hình tương quan trong đó hệ số tương quan là hàm của khoảng cách giữa các nút như trong (Shakya, Singh, & Verma, 2013), (von Rickenbach & Wattenhofer, 2004) Nhược điểm của các mô hình trên là chỉ xem xét đến mối tương quan tuyến tính và phụ thuộc vào khoảng cách
Một số nghiên cứu khác xem xét tính tương quan như là sự tương đồng của các dữ liệu như trong (C Liu, Wu, & Pei, 2007), (Peng, Tsai, & Lee, 2008), (Z Liu, Xing, Zeng, Wang, & Lu, 2013) Một số nghiên cứu khác định nghĩa mô hình tương quan theo một số cách khác như là mô hình dự đoán tuyến tính (Gupta, Navda, Das, & Chowdhary, 2008), trọng số nút (Ma, Guo, Tian, & Ghanem, 2011), độ tương quan mật độ dữ liệu (Yuan
et al., 2014) Cũng giống như các mô phương pháp được đề cập trước, các
mô hình này chỉ xem xét tương quan tuyến tính và đều phụ thuộc vào khoảng cách Để xây dựng mô hình tổng quát hơn mô hình tương quan tuyến tính, mô hình tương quan entropy được xem xét (R Dai & Akyildiz, 2009; Long, Liu, Fan, Dick, & Yang, 2009; Pattem, Krishnamachari, & Govindan, 2008; F Wang, Wu, Wang, & Hu, 2016) Tuy nhiên các mô hình này vẫn là mô hình phụ thuộc vào khoảng cách
Hầu hết các mô hình trong các nghiên cứu ở trên đều phụ thuộc vào khoảng cách giữa các nút Khoảng cách càng nhỏ, độ tương quan càng cao Tuy nhiên, giả thiết này không phải luôn đúng do một số rào cản vật
lý có thể làm cho các nút gần nhau có dữ liệu không tương quan nhau Do
đó cần phải thiết lập một mô hình tương quan không phụ thuộc vào khoảng cách Điều này càng được khẳng định trong (Dang et al., 2007)
Do đó ta cần nhìn sâu vào bên trong bản thân dữ liệu hơn là chỉ xem xét các thuộc tính mô tả dữ liệu như khoảng cách hay thời gian Luận án này
sẽ sử dụng lý thuyết entropy thông tin để khám phá tính chất tương quan dựa trên giá trị của các dữ liệu
2.2 Lý thuyết entropy thông tin
2.2.1 Tổng quan
2.2.2 Khái niệm entropy
Trang 102.2.3 Joint entropy
2.3 Sự tương quan và entropy
2.3.1 Sự tương quan của hai biến
2.3.1.1 Tương hỗ thông tin
2.3.1.2 Hệ số tương quan entropy
2.3.2 Sự tương quan của nhiều hơn hai biến
Theo lý thuyết entropy thông tin, các biến trong một nhóm tương quan với nhau càng cao thì giá trị joint entropy của nhóm biến càng khác biệt
so với tổng giá trị entropy của từng biến Tuy nhiên việc sử dụng sự so sánh này để nhận biết tính tương quan Thay vào đó ta sẽ xem xét sự tăng lên của joint entropy của một nhóm khi có một biến được thêm vào nhóm
đó Nếu biến đó tương cao cao với các biến trong nhóm thì giá trị joint entropy chỉ tăng lên một lượng nhỏ Do đó, nếu ta xem xét mối liên hệ giữa giá trị joint entropy và số lượng biến trong nhóm, ta có thể thấy tốc
độ tăng của joint entropy sẽ giảm dần và tiệm cận về 0 khi số lượng nút tăng lên Nói cách khác, giá trị joint entropy sẽ tiến đến trạng thái “bão hòa” khi số biến tăng lên Độ tương quan càng cao thì joint entropy tiến đến trạng thái bão hòa càng nhanh
2.4 Kết luận
Trong chương này ta đã khảo sát các mô hình tương quan trong WSN Các mô hình dựa trên lý thuyết xác suất thống kê kinh điển chỉ mô tả được quan hệ tương quan tuyến tính Lý thuyết entropy thông tin có thể cho phép mô tả quan hệ tương quan một cách tổng quát Hầu hết các mô hình tương quan đều phụ thuộc vào thông tin khoảng cách Tuy nhiên, cần phải nhìn vào giá trị của dữ liệu để xem xét Và khi đó mối gian hệ giữa giá trị joint entropy và số lượng biến trong nhóm có thể được sử dụng để nhận biết tính tương quan
3 PHÂN NHÓM TƯƠNG QUAN ENTROPY
3.1 Đánh giá joint entropy
3.1.1 Xác định giới hạn trên của joint entropy
Với nhóm có một nút, joint entropy của nhóm là entropy của nút đó:
𝐻1 = 𝐻(𝑋𝑖) ≤ 𝑘1𝐻𝑚𝑎𝑥 (3.3)
trong đó k 1 =1 Với nhóm gồm 2 nút, X i and X j, từ định nghĩa hệ số tương
quan entropy ta có:
Trang 11𝐻2 = 𝐻(𝑋𝑖, 𝑋𝑗) =2 − 𝜌(𝑋𝑖, 𝑋𝑗)
2 (𝐻(𝑋𝑖) + 𝐻(𝑋𝑗)) Thêm vào đó, 𝐻(𝑋𝑖), 𝐻(𝑋𝑗) ≤ 𝐻𝑚𝑎𝑥, và 𝜌(𝑋𝑖, 𝑋𝑗) = 𝜌𝑖𝑗 ≥ 𝜌𝑚𝑖𝑛,
𝐻2 ≤ 𝑘2𝐻𝑚𝑎𝑥 = 𝑏𝐻𝑚𝑎𝑥 (3.4) với 𝑘2 = 𝑏 = 2 − 𝜌𝑚𝑖𝑛
Với nhóm gồm 3 nút, X i , X j , và X k , đầu tiên, hai nút X i và X j được thay thể
bởi một nút tương đương X ij có entropy 𝐻(𝑋𝑖𝑗) = 𝐻(𝑋𝑖, 𝑋𝑗) ≤ 𝑘2𝐻𝑚𝑎𝑥 Theo (R Dai & Akyildiz, 2009; Jain et al., 1999), hệ số tương quan giữa hai nhóm nút có thể được xác định bằng giá trị lớn nhất/nhỏ nhất/trung bình của hệ số tương quan giữa một nút thuộc nhóm này và một nút thuộc nhóm khác Do đó, 𝜌(𝑋𝑖𝑗, 𝑋𝑘) = min{𝜌(𝑋𝑖, 𝑋𝑘), 𝜌(𝑋𝑗, 𝑋𝑘)} ≥ 𝜌𝑚𝑖𝑛 Vì vậy,
2(𝑘2+ 1)
Tương tự, joint entropy H m của một nhóm m nút có thể được coi như là joint entropy của nhóm con với m-1 nút với nút còn lại Entropy của nhóm con có giá trị bằng joint entropy của m-1 nút; hệ số tương quan entropy
giữa nhóm con và nút còn lại là giá trị lớn nhất/nhỏ nhất/trung bình của
hệ số tương quan giữa một nút thuộc nhóm con và nút còn lại
3.1.2 Xác định giới hạn dưới của joint entropy
Giới hạn dưới joint entropy của nhóm m nodes có thể được xác định theo
Trang 12cách tương tự như với giới hạn trên Cuối cùng, với một nhóm gồm m nút
{𝑋1, 𝑋2, … , 𝑋𝑚 } thỏa mãn điều kiện sau:
𝐻𝑚𝑖𝑛≤ 𝐻(𝑋𝑖) ≤ 𝐻max ∀𝑖 ∈ 𝑚 (3.13)
Joint entropy H m của nhóm sẽ thỏa mãn:
𝑘𝑚𝑖𝑛𝐻𝑚𝑖𝑛≤ 𝐻𝑚 ≤ 𝑘𝑚𝑎𝑥𝐻𝑚𝑎𝑥 (3.15) trong đó
với b max = 2-𝜌min
3.1.3 Xác thực phương pháp đánh giá joint entropy
Để xác thực phương pháp đánh giá joint entropy ở trên trong thực tế, chúng ta sẽ tính toán joint entropy của các nhóm dữ liệu được cấp bởi ( Intel Berkeley Research Lab, 2004) Một nhóm 11 nút được gọi là tập dữ liệu 1 được lựa chọn từ 48 nút with 𝜌𝑚𝑖𝑛= 0.6, 𝐻𝑚𝑖𝑛 = 2.16, and
𝐻𝑚𝑎𝑥 = 2.55
Thuật toán lựa chọn nút sẽ được trình bày ở phần sau của luận án Với mỗi nút, ta chọn 256 mẫu để tính entropy, joint entropy và hệ số tương quan entropy Từ các giá trị này, giới hạn trên, giới hạn dưới joint entropy
Trang 13của nhóm nút sẽ được xác định Thêm vào đó giá trị joint entropy của các nhóm nút hình thành từ 11 nút này cũng được tính toán để so sánh với các giá trị giới hạn trên và giới hạn dưới Kết quả được trình bày trong bảng 3.3 và hình 3.3 Có thể thấy rằng giá trị joint entropy thực tế luôn nằm giữa giá trị giới hạn trên và giới hạn dưới Ví dụ này đã chứng thực tính đúng đắn của phương pháp đề xuất
3.2 Vùng tương quan và thuật toán phân nhóm tương quan
3.2.1 Đánh giá joint entropy và sự tương quan
Hình 3.4 chỉ ra mối quan hệ giữa giá trị đánh giá joint entropy theo số lượng nút trong nhóm với các trường hợp hệ số tương quan entropy khác nhau Khi hệ số tương quan joint entropy đủ lớn, giá trị đánh giá joint entropy có tính chất tương tự như giá trị joint entropy thực tế của nhóm tương quan Đó là joint entropy sẽ tăng dần đến giá trị “bão hòa” khi số lượng nút tăng Tốc độ tiếp cận giá trị bão hòa càng cao, độ tương quan giữa các nút càng lớn Từ đó ta có thể kết luận rằng:
• Có thể chấp nhận việc sử dụng giá trị giới hạn trên/dưới của joint entropy để đánh giá joint entropy của nhóm tương quan bởi chúng đều có tính chất tiến đến “bão hòa” tăng số lượng nút giống nhau
• Hệ số tương quan của các cặp nút trong nhóm có thể là đại diện cho mức độ tương quan của nhóm
Trong luận án này ta sử dụng hàm giới hạn trên Hình 3.5 cho thấy so sánh giữa giá trị giới hạn trên và giá trị joint entropy thực tế của tập dữ liệu 1 Hai đường đều có đặc tính tương tự nhau và của nhóm tương quan Sự khác nhau về giá trị là do sự khác nhau về giá trị entropy và
hệ số tương quan entropy giữa các nút của dữ liệu thực tế
3.2.2 Định nghĩa vùng tương quan
Định nghĩa 2: Một nhóm m nút {𝑋1, 𝑋2, … , 𝑋𝑚} được gọi là trong một vùng tương quan với mức tương quan 𝜌0 nếu giá trị entropy của tất cả