Nghiên cứu ứng dụng mạng LSTM để dự đoán nhiệt độ cho hệ thống HVAC Võ Thiện Lĩnh1, Lê Mạnh Tuấn1, Lâm Quang Thái1 1 Phân Hiệu tại Thành phố Hồ Chí Minh, Trường Đại học Giao thông vận tải, 450 Lê Văn[.]
Trang 1Nghiên cứu ứng dụng mạng LSTM để dự đoán
nhiệt độ cho hệ thống HVAC
Võ Thiện Lĩnh1, Lê Mạnh Tuấn1, Lâm Quang Thái1
1 Phân Hiệu tại Thành phố Hồ Chí Minh, Trường Đại học Giao thông vận tải, 450 Lê Văn Việt, Tăng Nhơn Phú A,
TP Thủ Đức, TP Hồ Chí Minh, Việt Nam Email: linhvt_ph@utc.edu.vn, vtlinh@utc2.edu.vn, lmtuan@utc2.edu.vn, lqthai@utc2.edu.vn
Abstract— Các hệ thống điều khiển và giám sát trong
các tòa nhà hiện đại tiêu thụ rất nhiều năng lượng điện,
đặc biệt là hệ thống kiểm soát nhiệt độ, độ ẩm và chất
lượng không khí - HVAC (Heating-Ventilating-Air
Conditioning) Các giải pháp tiết kiệm năng lượng cho
hệ thống HVAC là rất cần thiết và đang nhận được
nhiều sự quan tâm Do đó việc dự đoán trước chính xác
các thông số nhiệt độ trong tòa nhà sẽ giúp kiểm soát
nhiệt độ ổn định hơn và góp phần giảm năng lượng tiêu
hao cho hệ thống HVAC Để điều khiển tối ưu hóa hệ
thống HVAC, bài báo này đề xuất một giải pháp áp
dụng mạng nơron dự đoán theo chuỗi thời gian LSTM
(Long short-term memory) cho việc dự đoán nhiệt độ
trong tòa nhà Tập dữ liệu của mô hình được thu thập
trong thời gian dài thông qua Wemos D1 kết hợp cảm
biến nhiệt độ LM35 và được lưu trữ trên Google Sheets
Kết quả thử nghiệm cho thấy mô hình mạng LSTM dự
đoán rất hiệu quả các xu hướng thay đổi của nhiệt độ
theo thời gian Mô hình LSTM là mô hình dự đoán có
độ chính xác rất cao vì vậy hoàn toàn có thể áp dụng
vào hệ thống HVAC
Keywords- hệ thống HVAC; dự đoán nhiệt độ; mạng
RNN; mạng LSTM
I GIỚITHIỆU Trong các tòa nhà hiện đại ngày nay, hệ thống
HVAC là một thành phần quan trọng và tiêu thụ
chiếm phần lớn tổng năng lượng tòa nhà, do đó nếu
có giải pháp tối ưu hóa năng lượng cho hệ thống này
thì có thể giúp tiết kiệm năng lượng điện một cách
đáng kể [1] Hệ thống HVAC là một hệ thống kiểm
soát nhiệt độ, độ ẩm và chất lượng không khí trong
không gian trong nhà hoặc xe cộ, vì vậy việc điều
khiển thường không kịp thời do tính chất của nhiệt độ
không thể đáp ứng tức thời mà cần phải có một
khoảng thời gian nhất định Do đó, cần phải dự đoán
chính xác nhiệt độ bên trong nhà và cung cấp dữ liệu
làm tham chiếu để điều chỉnh hệ thống nhằm đạt được
sự kiểm soát nhiệt độ một cách ổn định Hệ thống
HVAC là một hệ thống phi tuyến với độ trễ và quán
tính lớn Trong quá trình hệ thống hoạt động, việc mở
van khí, lượng nước làm mát lưu thông và các điều
kiện môi trường ngoài trời ảnh hưởng rất nhiều đến hệ
thống HVAC Do đó, rất khó để xây dựng một mô
hình với nhiều tham số và yếu tố nhiễu đầu vào Hiện
nay, phương pháp dự đoán nhiệt độ trong nhà cho hệ
thống HVAC được chia thành hai loại: phương pháp thống kê và phương pháp dựa trên học sâu Các phương pháp thống kê bao gồm phương pháp Monte Carlo [2], hồi quy tuyến tính [3], và phương pháp hàm
mũ [4] hầu hết các phương pháp được sử dụng trong các bài báo trên là đơn giản và tuyến tính, đồng thời yêu cầu tính chính xác cao của dữ liệu gốc Do đó, khi
áp dụng các phương pháp trên tính chính xác của dự đoán không cao là điều khó tránh khỏi trong các tình huống phức tạp với lượng dữ liệu lớn Tuy nhiên, các phương pháp dựa trên học sâu thì cho thấy độ chính xác cao hơn rất nhiều do việc xấp xỉ phi tuyến giữa nhiệt độ và các thông số khác như thông số thời gian Các mạng nơron nhân tạo luôn hoạt động tốt hơn các
mô hình tuyến tính cả về hiệu suất dự đoán và tổng quát tốt hơn khi được sử dụng để dự đoán nhiệt độ trong tòa nhà [5,6] Đã có những nghiên cứu cho thấy việc xây dựng mô hình dự đoán nhiệt độ trong tòa nhà dựa trên mạng nơron nhiều lớp (MLP - Multi Layer Perceptron) cho kết quả sai số dự đoán trung bình giữa nhiệt độ trong tòa nhà và nhiệt độ trong nhà đo được là tương đối cao [7] Trong hệ thống HVAC, thông số nhiệt độ là thông số có giá trị biến thiên theo thời gian, do đó cần một mô hình áp dụng để nghiên cứu dữ liệu theo chuỗi thời gian Các mô hình trên không thể giải quyết được yêu cầu này Một mạng nơron hồi quy (RNN - Recurrent Neural Network), với việc được áp dụng rộng rãi trong các ứng dụng nhận dạng giọng nói [8,9], xử lý hình ảnh [10,11] và
xử lý ngôn ngữ tự nhiên [12,13],… là một trong các
mô hình học sâu có thể sử dụng để dự đoán dữ liệu chuỗi thời gian Trong đó, mô hình mạng LSTM [14]
có những ưu điểm của mạng nơron hồi quy gốc RNN
và có nhiều khả năng hơn trong phân tích và nghiên cứu dữ liệu chuỗi thời gian [15-18] Hiện nay, vẫn chưa có nghiên cứu nào ứng dụng LSTM về dự đoán nhiệt độ của hệ thống HVAC ở Việt Nam
Trong bài báo này, nhóm tác giả sử dụng kiến trúc mạng LSTM để dự đoán nhiệt độ trong tòa nhà để cung cấp dữ liệu cho việc tối ưu hệ thống HVAC Bố cục của bài báo được trình bày như sau: Phần 1 giới thiệu tổng quan về các phương pháp cũng như tầm quan trọng của dự đoán nhiệt độ cho hệ thống HVAC
và việc ứng dụng LSTM trong công tác dự đoán nhiệt
độ Phần 2 trình bày nội dung chính bao gồm: Mô hình hệ thống; Mô hình mạng LSTM; Xây dựng tập
Trang 2dữ liệu; Quá trình xử lý và phân chia dữ liệu mẫu;
Huấn luyện và dự đoán Phần 3 Đánh giá kết quả và
Phần 4 Kết luận
II NỘIDUNG
2.1 Mô hình hệ thống
Hình 1 Sơ đồ khối của hệ thống
Các thành phần chính của hệ thống dự đoán nhiệt
độ được mô tả như hình 1 Phần cứng của hệ thống dự
đoán nhiệt độ bao gồm : Kit Wemos D1 và cảm biến
nhiệt độ LM35 được mô tả ở hình 2 Kết nối Kit
Wemos D1 với cảm biến LM35 để đọc dữ liệu rồi
thông qua kết nối Wifi để cập nhật dữ liệu lên Google
Sheet Phần mềm của hệ thống để cập nhật dữ liệu, hệ
thống sử dụng tiện ích Google Sheets có sẵn trong
Google Drive kết hợp cùng với Google Apps Script
tạo một API để cập nhật dữ liệu từ Wemos D1 thông
qua kết nối wifi Hệ thống sử dụng Google Colab để
xử lý tính toán dữ liệu và xây dựng mô hình mạng
LSTM cho việc huấn luyện dữ liệu và dự đoán nhiệt
độ
Hình 2 Sơ đồ kết nối phần cứng của hệ thống
2.2 Mô hình mạng LSTM
LSTM - là một dạng đặc biệt của RNN, nó có khả
năng học được các phụ thuộc xa LSTM được giới
thiệu bởi Hochreiter & Schmidhuber (1997), và sau
đó đã được cải tiến và phổ biến bởi rất nhiều người
trong ngành Chúng hoạt động cực kì hiệu quả trên
nhiều bài toán khác nhau nên dần đã trở nên phổ biến
như hiện nay
LSTM được thiết kế để tránh được vấn đề phụ thuộc xa (long-term dependency) Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định mà không cần phải huấn luyện Tức là kiến trúc của mạng
có thể ghi nhớ được mà không cần bất kì can thiệp nào Hình 3 mô tả cấu trúc của mạng LSTM
Hình 3 Mô hình LSTM
Ở trạng thái thứ t của mô hình LSTM:
• Đầu ra: Ct, ht ta gọi C là trạng thái tế bào, h là trạng thái ẩn
• Đầu vào: Ct-1, ht-1, xt Trong đó xt là đầu vào ở trạng thái thứ t của mô hình Ct-1, ht−1 là đầu ra của lớp trước h đóng vai trò gần giống như s ở RNN, trong khi c là điểm mới của LSTM [14]
LSTM được phát triển từ mạng RNN rất phù hợp với các dự đoán theo chuỗi thời gian, nhưng các mô-đun trong nó có cấu trúc khác với mạng RNN chuẩn Thay vì chỉ có một tầng mạng nơron, chúng có tới 4 tầng tương tác với nhau một cách rất đặc biệt Là một dạng đặc biệt của một mạng nơron tuần hoàn đặc biệt (RNN) có những ưu điểm của bộ nhớ động của RNN
và có nhiều khả năng hơn trong phân tích chuỗi thời gian, đồng thời LSTM cũng tránh các vấn đề về giá trị đạo hàm quá nhỏ trong RNN Từ những ưu điểm của
mô hình LSTM được so sánh với các mô hình khác ở trên thì việc nghiên cứu áp dụng vào việc dự đoán theo chuỗi thời gian sẽ mang lại hiệu suất dự đoán chính xác rất cao [15-18]
2.3 Lưu đồ thuật toán
Quá trình huấn luyện mô hình được trình bày như hình 4, cụ thể chi tiết các bước được trình bày lần lượt
ở những mục sau:
2.3.1 Xây dựng tập dữ liệu Tập dữ liệu nhiệt độ sử dụng cho bài báo này được thu thập trong tòa nhà sau mỗi 5 phút và có kích thước là 5115 giá trị được thu thập từ ngày 23/05/2021 đến 19/06/2021, gồm có các trường: thứ, ngày, giờ và nhiệt độ được thể hiện ở Bảng 1
2.3.2 Tiền xử lý và chuẩn hóa dữ liệu Tập dữ liệu gốc là tập hợp thời gian thực có các vấn đề như dữ liệu không đầy đủ và không nhất quán Nếu sử dụng dữ liệu gốc để huấn luyện trực tiếp cho
Đọc và
gửi dữ
liệu
Thu thập
dữ liệu
Xử lý
dữ liệu
Huấn luyện
và dự đoán
Trang 3mô hình thì kết quả thường không đạt yêu cầu Do đó,
cần phải xử lý dữ liệu trước khi huấn luyện Các bước
xử lý bao gồm:
Bước 1 Định dạng lại dữ liệu: “Date-Time”,
“TempC”
Bước 2 Kiểm tra lại và quan sát tập dữ liệu: Kết quả
như Bảng 2
Bắt đầu
Nhập tệp dữ liệu
Tiền xử lý và chuẩn
hóa dữ liệu
Phân chia tập mẫu
Mô hình LSTM
Hoàn thành huấn
luyện
Lưu giữ trọng số
Kết thúc
Đúng
Sai
Hình 4 Lưu đồ huấn luyện mô hình
Bảng 1 Bảng dữ liệu nhiệt độ
Bảng 2 Bảng định dạng kiểu dữ datetime cho cột
ngày tháng
Bước 3 Lọc nhiễu dữ liệu
Dữ liệu sau khi thu thập được biểu diễn như Hình 4a, giá trị thu thập được có sự sai số cao do các nguyên nhân như bị ảnh hưởng bởi nhiễu trong quá trình đọc ADC, bị mất kết nối,… nếu sử dụng dữ liệu này để huấn luyện trực tiếp cho mô hình thì kết quả thường không đạt yêu cầu Vì vậy cần phải lọc nhiễu trước khi đưa dữ liệu vào quá trình huấn luyện Hình 4b là dữ liệu sau khi lọc nhiễu, điều này cho phép mô hình hội tụ với trọng số tốt hơn và kết quả dự đoán của mô hình sẽ chính xác hơn
a) Dữ liệu trước khi lọc nhiễu Nhập dữ liệu
mẫu
Trang 4b) Dữ liệu sau khi lọc nhiễu
Hình 5 Đồ thị mô tả dữ liệu theo thời gian trước khi huấn
luyện
Bước 4 Phân chia tập huấn luyện và tập kiểm tra
Trong mô hình mạng LSTM, nhóm nghiên cứu
tiến hành chia dữ liệu thành 2 phần bao gồm 80% dữ
liệu sẽ được đưa vào mạng để tiến hành huấn luyện
cho mô hình mạng và 20% dữ liệu còn lại sẽ sử dụng
để kiểm tra mô hình mạng sau khi quá trình huấn
luyện kết thúc Việc xử lí dữ liệu sau khi phân chia:
loại bỏ 20% cuối cùng chỉ lấy 80% để đưa vào mạng
tương ứng 4092 mẫu Xây dựng dữ liệu Train và Test
dưới dạng Batch_Size thì đầu vào của LSTM có dạng
(batch_size, time_steps, feature) như hình 6
Hình 6 Dạng đầu vào của mạng LSTM
2.3.3 Kết quả huấn luyện và dự đoán
Trong thí nghiệm này, mô hình LSTM được huấn
luyện bằng cách sử dụng tập huấn luyện mẫu ở trên
và các tham số được xác định bởi hàm tổn thất là sai
số giữa nhiệt độ dự đoán và giá trị thực tế Kết quả dự
đoán và sai số được thể hiện trong các hình 7 và 8
Hình 7 Kết quả nhiệt độ dự đoán so với thực tế
Hình 8 Sai số giữa nhiệt độ dự đoán so với thực tế
Hình 9 Đồ thị hàm loss
Từ kết quả thực nghiệm có thể thấy rằng giá trị hàm loss giảm liên tục trong mỗi lần lặp và cuối cùng gần như hội tụ sau 50 epoch (hình 9)
III ĐÁNHGIÁKẾTQUẢ Thông qua kết quả dự đoán trên hình 7, có thể thấy đường mô tả dữ liệu về nhiệt độ dự đoán (prediction) so với đường nhiệt độ thực tế (reality) là bám sát với nhau, điều này chứng tỏ mô hình đã được huấn luyện và đưa ra dự đoán gần chính xác Dựa trên kết quả hiển thị hình 8, có thể thấy sai số nhiệt độ dự đoán so với thực tế rất là thấp, trong đó sai số lớn nhất chỉ khoảng 0.40C Sau toàn bộ quá trình huấn luyện, theo hình 9, giá trị hàm loss dưới 0,002 Từ các đánh giá trên chứng minh được rằng mô hình mạng LSTM hiệu quả với xu hướng dữ liệu nhiệt độ, mặc dù tập dữ liệu thu thập còn hạn chế
IV KẾTLUẬN Dựa trên tập dữ liệu thu thập được từ nhiệt độ trong tòa nhà thông qua cảm biến LM35, độ chính xác
dự đoán của mô hình LSTM được kiểm chứng giữa
dự đoán và thực tế Kết quả thực nghiệm cho thấy: Thứ nhất, sự phi tuyến tính của nhiệt độ trong tòa nhà
và các thông số khác có thể được khắc phục bằng mô hình LSTM Thứ hai, so với các phương pháp truyền thống, mô hình dự đoán dựa trên LSTM có thể mô tả tốt hơn các đặc tính của dữ liệu hệ thống HVAC và độ chính xác dự đoán cao hơn Kết quả dự đoán có độ chính xác khá cao so với giá trị thực tế, sai số dự đoán của mô hình rất thấp hoàn toàn có thể áp dụng vào hệ thống HVAC
Trang 5TÀILIỆUTHAMKHẢO
[1] Wang Weitong, “The Application of Reinforcement
Learning in HVAC System Operation Optimization,” M.S
Thesis, Sch of Mechanical Engineering, Tongji Univ.,
Shanghai, 2018 Accessed on: December, 18, 2019
[2] J Zhao, Y Duan, and X Liu, “Uncertainty analysis of weather
forecast data for cooling load forecasting based on the Monte
Carlo method,” Energies, vol 11, pp 1900-1919, July 2018
[3] MEH Dyson, SD Borgeson, MD Tabone, and DS Callaway,
“Using smart meter data to estimate demand response
potential, with application to solar energy integration,”
Energy Policy, vol 73, pp 607-619, October 2014
[4] Da-Si He and Xu Zhang, “Analysis of Air Conditioning Load
Prediction by Modified Seasonal Exponential Smoothing
Model,” Journal of Tongji University (Natural Science
Edition), vol 33, pp 1672-1676, December 2005
[5] Primož Potočnik, Boris Vidrih, Andrej Kitanovski, and
Edvard Govekar, “Neural network, ARX, and extreme
learning machine models for the short-term prediction of
temperature in buildings,” Building Simulation, vol 12, pp
1077-1093, April 2019
[6] Shuqing Xu, “The Research on Building Heating Indoor
Temperature Forecasting and Controlling,” M.S Thesis, Sch
of Information Science and Technology, Dalian Maritime
Univ., Dalian, 2015 Accessed on: February, 25, 2020
[7] PAN Shiying, DING Xin, CUI Yue, LYU Haozheng,
WANG Tong, and MA Lezhi, “Application of MLP Neural
Network to Prediction of Heating Indoor Temperature,” Gas
& Heat, vol 2019, pp 40-44, July 2019
[8] Ivan Medennikov and Anna Bulusheva, “LSTM-Based
Language Models for Spontaneous Speech Recognition,”
International Conference on Speech & Computer, Budapest,
2016, pp 469-475
[9] A Graves, A Mohamed and G Hinton, "Speech recognition
with deep recurrent neural networks," 2013 IEEE
International Conference on Acoustics, Speech and Signal
Processing, Vancouver, BC, 2013, pp 6645-6649
[10] Davis Abe, Rubinstein Michael, Wadhwa Neal, Mysore
Gautham J., Durand Fredo, and Freeman William T., “The
visual microphone: Passive recovery of sound from video,”
ACM Trans Graph, vol 33, pp 79:1–79:10, July 2014
[11] Y Lecun, L Bottou, Y Bengio and P Haffner,
"Gradient-based learning applied to document recognition," in
Proceedings of the IEEE, vol 86, pp 2278-2324, Nov 1998
[12] Ren Zhihui, Xu Haoyu, Feng Songlin, Zhou Han, and Shi
Jun, “Sequence labeling Chinese word segmentation method
based on LSTM networks,” Application Research of
Computers, vol 2017, pp 1321-1324+1341, May 2017
[13] Devlin, J., Zbib, R., Huang, Z., Lamar, T., Schwartz, R., and
Makhoul, J, “Fast and robust neural network joint models for
statistical machine translation,” In Proceedings of the 52nd
Annual Meeting of the Association for Computational
Linguistics, vol 1, pp 1370-1380, June 2014
[14] Hochreiter S and Schmidhuber J, “Long Short-Term
Memory,” Neural Computation, vol 9, pp 1735-1780,
November 1997
[15] Malhotra P, Vig L, Shroff G, and Agarwal P, “Long short
term memory networks for anomaly detection in timeseries,”
Proceeding of European symposium on artificial neural
networks, computational intelligence, and machine learning,
Bruges, 2015, pp 89–94
[16] YANG Hong-fu and JIA Xiao-liang, “Aero Engine Exhaust
Gas Temperature Prediction Based on LSTM,” Aeronautical
Computing Technique, vol 48, pp 65-69, April 2018
[17] Min Cheng, Qian Xu, Jianming Lv, Wenyin Liu, Qing Li,
and Jianping Wang, “a Multi-Scale LSTM Model for BGP
Anomaly Detection,” 24th IEEE International Conference on
Network Protocols(ICNP 2016), Singapore, 2016, pp 1-6
[18] R Jiao, T Zhang, Y Jiang, and H He, “Short-term non-residential load forecasting based on multiple sequences LSTM recurrent neural network,” IEEE Access, vol 6, pp 59438-59448, October 2018