document

Nghiên cứu ứng dụng mạng LSTM để dự đoán nhiệt độ cho hệ thống HVAC Võ Thiện Lĩnh1, Lê Mạnh Tuấn1, Lâm Quang Thái1 1 Phân Hiệu tại Thành phố Hồ Chí Minh, Trường Đại học Giao thông vận tải, 450 Lê Văn[.]

Trang 1

Nghiên cứu ứng dụng mạng LSTM để dự đoán

nhiệt độ cho hệ thống HVAC

Võ Thiện Lĩnh1, Lê Mạnh Tuấn1, Lâm Quang Thái1

1 Phân Hiệu tại Thành phố Hồ Chí Minh, Trường Đại học Giao thông vận tải, 450 Lê Văn Việt, Tăng Nhơn Phú A,

TP Thủ Đức, TP Hồ Chí Minh, Việt Nam Email: linhvt_ph@utc.edu.vn, vtlinh@utc2.edu.vn, lmtuan@utc2.edu.vn, lqthai@utc2.edu.vn

Abstract— Các hệ thống điều khiển và giám sát trong

các tòa nhà hiện đại tiêu thụ rất nhiều năng lượng điện,

đặc biệt là hệ thống kiểm soát nhiệt độ, độ ẩm và chất

lượng không khí - HVAC (Heating-Ventilating-Air

Conditioning) Các giải pháp tiết kiệm năng lượng cho

hệ thống HVAC là rất cần thiết và đang nhận được

nhiều sự quan tâm Do đó việc dự đoán trước chính xác

các thông số nhiệt độ trong tòa nhà sẽ giúp kiểm soát

nhiệt độ ổn định hơn và góp phần giảm năng lượng tiêu

hao cho hệ thống HVAC Để điều khiển tối ưu hóa hệ

thống HVAC, bài báo này đề xuất một giải pháp áp

dụng mạng nơron dự đoán theo chuỗi thời gian LSTM

(Long short-term memory) cho việc dự đoán nhiệt độ

trong tòa nhà Tập dữ liệu của mô hình được thu thập

trong thời gian dài thông qua Wemos D1 kết hợp cảm

biến nhiệt độ LM35 và được lưu trữ trên Google Sheets

Kết quả thử nghiệm cho thấy mô hình mạng LSTM dự

đoán rất hiệu quả các xu hướng thay đổi của nhiệt độ

theo thời gian Mô hình LSTM là mô hình dự đoán có

độ chính xác rất cao vì vậy hoàn toàn có thể áp dụng

vào hệ thống HVAC

Keywords- hệ thống HVAC; dự đoán nhiệt độ; mạng

RNN; mạng LSTM

I GIỚITHIỆU Trong các tòa nhà hiện đại ngày nay, hệ thống

HVAC là một thành phần quan trọng và tiêu thụ

chiếm phần lớn tổng năng lượng tòa nhà, do đó nếu

có giải pháp tối ưu hóa năng lượng cho hệ thống này

thì có thể giúp tiết kiệm năng lượng điện một cách

đáng kể [1] Hệ thống HVAC là một hệ thống kiểm

soát nhiệt độ, độ ẩm và chất lượng không khí trong

không gian trong nhà hoặc xe cộ, vì vậy việc điều

khiển thường không kịp thời do tính chất của nhiệt độ

không thể đáp ứng tức thời mà cần phải có một

khoảng thời gian nhất định Do đó, cần phải dự đoán

chính xác nhiệt độ bên trong nhà và cung cấp dữ liệu

làm tham chiếu để điều chỉnh hệ thống nhằm đạt được

sự kiểm soát nhiệt độ một cách ổn định Hệ thống

HVAC là một hệ thống phi tuyến với độ trễ và quán

tính lớn Trong quá trình hệ thống hoạt động, việc mở

van khí, lượng nước làm mát lưu thông và các điều

kiện môi trường ngoài trời ảnh hưởng rất nhiều đến hệ

thống HVAC Do đó, rất khó để xây dựng một mô

hình với nhiều tham số và yếu tố nhiễu đầu vào Hiện

nay, phương pháp dự đoán nhiệt độ trong nhà cho hệ

thống HVAC được chia thành hai loại: phương pháp thống kê và phương pháp dựa trên học sâu Các phương pháp thống kê bao gồm phương pháp Monte Carlo [2], hồi quy tuyến tính [3], và phương pháp hàm

mũ [4] hầu hết các phương pháp được sử dụng trong các bài báo trên là đơn giản và tuyến tính, đồng thời yêu cầu tính chính xác cao của dữ liệu gốc Do đó, khi

áp dụng các phương pháp trên tính chính xác của dự đoán không cao là điều khó tránh khỏi trong các tình huống phức tạp với lượng dữ liệu lớn Tuy nhiên, các phương pháp dựa trên học sâu thì cho thấy độ chính xác cao hơn rất nhiều do việc xấp xỉ phi tuyến giữa nhiệt độ và các thông số khác như thông số thời gian Các mạng nơron nhân tạo luôn hoạt động tốt hơn các

mô hình tuyến tính cả về hiệu suất dự đoán và tổng quát tốt hơn khi được sử dụng để dự đoán nhiệt độ trong tòa nhà [5,6] Đã có những nghiên cứu cho thấy việc xây dựng mô hình dự đoán nhiệt độ trong tòa nhà dựa trên mạng nơron nhiều lớp (MLP - Multi Layer Perceptron) cho kết quả sai số dự đoán trung bình giữa nhiệt độ trong tòa nhà và nhiệt độ trong nhà đo được là tương đối cao [7] Trong hệ thống HVAC, thông số nhiệt độ là thông số có giá trị biến thiên theo thời gian, do đó cần một mô hình áp dụng để nghiên cứu dữ liệu theo chuỗi thời gian Các mô hình trên không thể giải quyết được yêu cầu này Một mạng nơron hồi quy (RNN - Recurrent Neural Network), với việc được áp dụng rộng rãi trong các ứng dụng nhận dạng giọng nói [8,9], xử lý hình ảnh [10,11] và

xử lý ngôn ngữ tự nhiên [12,13],… là một trong các

mô hình học sâu có thể sử dụng để dự đoán dữ liệu chuỗi thời gian Trong đó, mô hình mạng LSTM [14]

có những ưu điểm của mạng nơron hồi quy gốc RNN

và có nhiều khả năng hơn trong phân tích và nghiên cứu dữ liệu chuỗi thời gian [15-18] Hiện nay, vẫn chưa có nghiên cứu nào ứng dụng LSTM về dự đoán nhiệt độ của hệ thống HVAC ở Việt Nam

Trong bài báo này, nhóm tác giả sử dụng kiến trúc mạng LSTM để dự đoán nhiệt độ trong tòa nhà để cung cấp dữ liệu cho việc tối ưu hệ thống HVAC Bố cục của bài báo được trình bày như sau: Phần 1 giới thiệu tổng quan về các phương pháp cũng như tầm quan trọng của dự đoán nhiệt độ cho hệ thống HVAC

và việc ứng dụng LSTM trong công tác dự đoán nhiệt

độ Phần 2 trình bày nội dung chính bao gồm: Mô hình hệ thống; Mô hình mạng LSTM; Xây dựng tập

Trang 2

dữ liệu; Quá trình xử lý và phân chia dữ liệu mẫu;

Huấn luyện và dự đoán Phần 3 Đánh giá kết quả và

Phần 4 Kết luận

II NỘIDUNG

2.1 Mô hình hệ thống

Hình 1 Sơ đồ khối của hệ thống

Các thành phần chính của hệ thống dự đoán nhiệt

độ được mô tả như hình 1 Phần cứng của hệ thống dự

đoán nhiệt độ bao gồm : Kit Wemos D1 và cảm biến

nhiệt độ LM35 được mô tả ở hình 2 Kết nối Kit

Wemos D1 với cảm biến LM35 để đọc dữ liệu rồi

thông qua kết nối Wifi để cập nhật dữ liệu lên Google

Sheet Phần mềm của hệ thống để cập nhật dữ liệu, hệ

thống sử dụng tiện ích Google Sheets có sẵn trong

Google Drive kết hợp cùng với Google Apps Script

tạo một API để cập nhật dữ liệu từ Wemos D1 thông

qua kết nối wifi Hệ thống sử dụng Google Colab để

xử lý tính toán dữ liệu và xây dựng mô hình mạng

LSTM cho việc huấn luyện dữ liệu và dự đoán nhiệt

độ

Hình 2 Sơ đồ kết nối phần cứng của hệ thống

2.2 Mô hình mạng LSTM

LSTM - là một dạng đặc biệt của RNN, nó có khả

năng học được các phụ thuộc xa LSTM được giới

thiệu bởi Hochreiter & Schmidhuber (1997), và sau

đó đã được cải tiến và phổ biến bởi rất nhiều người

trong ngành Chúng hoạt động cực kì hiệu quả trên

nhiều bài toán khác nhau nên dần đã trở nên phổ biến

như hiện nay

LSTM được thiết kế để tránh được vấn đề phụ thuộc xa (long-term dependency) Việc nhớ thông tin trong suốt thời gian dài là đặc tính mặc định mà không cần phải huấn luyện Tức là kiến trúc của mạng

có thể ghi nhớ được mà không cần bất kì can thiệp nào Hình 3 mô tả cấu trúc của mạng LSTM

Hình 3 Mô hình LSTM

Ở trạng thái thứ t của mô hình LSTM:

• Đầu ra: Ct, ht ta gọi C là trạng thái tế bào, h là trạng thái ẩn

• Đầu vào: Ct-1, ht-1, xt Trong đó xt là đầu vào ở trạng thái thứ t của mô hình Ct-1, ht−1 là đầu ra của lớp trước h đóng vai trò gần giống như s ở RNN, trong khi c là điểm mới của LSTM [14]

LSTM được phát triển từ mạng RNN rất phù hợp với các dự đoán theo chuỗi thời gian, nhưng các mô-đun trong nó có cấu trúc khác với mạng RNN chuẩn Thay vì chỉ có một tầng mạng nơron, chúng có tới 4 tầng tương tác với nhau một cách rất đặc biệt Là một dạng đặc biệt của một mạng nơron tuần hoàn đặc biệt (RNN) có những ưu điểm của bộ nhớ động của RNN

và có nhiều khả năng hơn trong phân tích chuỗi thời gian, đồng thời LSTM cũng tránh các vấn đề về giá trị đạo hàm quá nhỏ trong RNN Từ những ưu điểm của

mô hình LSTM được so sánh với các mô hình khác ở trên thì việc nghiên cứu áp dụng vào việc dự đoán theo chuỗi thời gian sẽ mang lại hiệu suất dự đoán chính xác rất cao [15-18]

2.3 Lưu đồ thuật toán

Quá trình huấn luyện mô hình được trình bày như hình 4, cụ thể chi tiết các bước được trình bày lần lượt

ở những mục sau:

2.3.1 Xây dựng tập dữ liệu Tập dữ liệu nhiệt độ sử dụng cho bài báo này được thu thập trong tòa nhà sau mỗi 5 phút và có kích thước là 5115 giá trị được thu thập từ ngày 23/05/2021 đến 19/06/2021, gồm có các trường: thứ, ngày, giờ và nhiệt độ được thể hiện ở Bảng 1

2.3.2 Tiền xử lý và chuẩn hóa dữ liệu Tập dữ liệu gốc là tập hợp thời gian thực có các vấn đề như dữ liệu không đầy đủ và không nhất quán Nếu sử dụng dữ liệu gốc để huấn luyện trực tiếp cho

Đọc và

gửi dữ

liệu

Thu thập

dữ liệu

Xử lý

dữ liệu

Huấn luyện

và dự đoán

Trang 3

mô hình thì kết quả thường không đạt yêu cầu Do đó,

cần phải xử lý dữ liệu trước khi huấn luyện Các bước

xử lý bao gồm:

Bước 1 Định dạng lại dữ liệu: “Date-Time”,

“TempC”

Bước 2 Kiểm tra lại và quan sát tập dữ liệu: Kết quả

như Bảng 2

Bắt đầu

Nhập tệp dữ liệu

Tiền xử lý và chuẩn

hóa dữ liệu

Phân chia tập mẫu

Mô hình LSTM

Hoàn thành huấn

luyện

Lưu giữ trọng số

Kết thúc

Đúng

Sai

Hình 4 Lưu đồ huấn luyện mô hình

Bảng 1 Bảng dữ liệu nhiệt độ

Bảng 2 Bảng định dạng kiểu dữ datetime cho cột

ngày tháng

Bước 3 Lọc nhiễu dữ liệu

Dữ liệu sau khi thu thập được biểu diễn như Hình 4a, giá trị thu thập được có sự sai số cao do các nguyên nhân như bị ảnh hưởng bởi nhiễu trong quá trình đọc ADC, bị mất kết nối,… nếu sử dụng dữ liệu này để huấn luyện trực tiếp cho mô hình thì kết quả thường không đạt yêu cầu Vì vậy cần phải lọc nhiễu trước khi đưa dữ liệu vào quá trình huấn luyện Hình 4b là dữ liệu sau khi lọc nhiễu, điều này cho phép mô hình hội tụ với trọng số tốt hơn và kết quả dự đoán của mô hình sẽ chính xác hơn

a) Dữ liệu trước khi lọc nhiễu Nhập dữ liệu

mẫu

Trang 4

b) Dữ liệu sau khi lọc nhiễu

Hình 5 Đồ thị mô tả dữ liệu theo thời gian trước khi huấn

luyện

Bước 4 Phân chia tập huấn luyện và tập kiểm tra

Trong mô hình mạng LSTM, nhóm nghiên cứu

tiến hành chia dữ liệu thành 2 phần bao gồm 80% dữ

liệu sẽ được đưa vào mạng để tiến hành huấn luyện

cho mô hình mạng và 20% dữ liệu còn lại sẽ sử dụng

để kiểm tra mô hình mạng sau khi quá trình huấn

luyện kết thúc Việc xử lí dữ liệu sau khi phân chia:

loại bỏ 20% cuối cùng chỉ lấy 80% để đưa vào mạng

tương ứng 4092 mẫu Xây dựng dữ liệu Train và Test

dưới dạng Batch_Size thì đầu vào của LSTM có dạng

(batch_size, time_steps, feature) như hình 6

Hình 6 Dạng đầu vào của mạng LSTM

2.3.3 Kết quả huấn luyện và dự đoán

Trong thí nghiệm này, mô hình LSTM được huấn

luyện bằng cách sử dụng tập huấn luyện mẫu ở trên

và các tham số được xác định bởi hàm tổn thất là sai

số giữa nhiệt độ dự đoán và giá trị thực tế Kết quả dự

đoán và sai số được thể hiện trong các hình 7 và 8

Hình 7 Kết quả nhiệt độ dự đoán so với thực tế

Hình 8 Sai số giữa nhiệt độ dự đoán so với thực tế

Hình 9 Đồ thị hàm loss

Từ kết quả thực nghiệm có thể thấy rằng giá trị hàm loss giảm liên tục trong mỗi lần lặp và cuối cùng gần như hội tụ sau 50 epoch (hình 9)

III ĐÁNHGIÁKẾTQUẢ Thông qua kết quả dự đoán trên hình 7, có thể thấy đường mô tả dữ liệu về nhiệt độ dự đoán (prediction) so với đường nhiệt độ thực tế (reality) là bám sát với nhau, điều này chứng tỏ mô hình đã được huấn luyện và đưa ra dự đoán gần chính xác Dựa trên kết quả hiển thị hình 8, có thể thấy sai số nhiệt độ dự đoán so với thực tế rất là thấp, trong đó sai số lớn nhất chỉ khoảng 0.40C Sau toàn bộ quá trình huấn luyện, theo hình 9, giá trị hàm loss dưới 0,002 Từ các đánh giá trên chứng minh được rằng mô hình mạng LSTM hiệu quả với xu hướng dữ liệu nhiệt độ, mặc dù tập dữ liệu thu thập còn hạn chế

IV KẾTLUẬN Dựa trên tập dữ liệu thu thập được từ nhiệt độ trong tòa nhà thông qua cảm biến LM35, độ chính xác

dự đoán của mô hình LSTM được kiểm chứng giữa

dự đoán và thực tế Kết quả thực nghiệm cho thấy: Thứ nhất, sự phi tuyến tính của nhiệt độ trong tòa nhà

và các thông số khác có thể được khắc phục bằng mô hình LSTM Thứ hai, so với các phương pháp truyền thống, mô hình dự đoán dựa trên LSTM có thể mô tả tốt hơn các đặc tính của dữ liệu hệ thống HVAC và độ chính xác dự đoán cao hơn Kết quả dự đoán có độ chính xác khá cao so với giá trị thực tế, sai số dự đoán của mô hình rất thấp hoàn toàn có thể áp dụng vào hệ thống HVAC

Trang 5

TÀILIỆUTHAMKHẢO

[1] Wang Weitong, “The Application of Reinforcement

Learning in HVAC System Operation Optimization,” M.S

Thesis, Sch of Mechanical Engineering, Tongji Univ.,

Shanghai, 2018 Accessed on: December, 18, 2019

[2] J Zhao, Y Duan, and X Liu, “Uncertainty analysis of weather

forecast data for cooling load forecasting based on the Monte

Carlo method,” Energies, vol 11, pp 1900-1919, July 2018

[3] MEH Dyson, SD Borgeson, MD Tabone, and DS Callaway,

“Using smart meter data to estimate demand response

potential, with application to solar energy integration,”

Energy Policy, vol 73, pp 607-619, October 2014

[4] Da-Si He and Xu Zhang, “Analysis of Air Conditioning Load

Prediction by Modified Seasonal Exponential Smoothing

Model,” Journal of Tongji University (Natural Science

Edition), vol 33, pp 1672-1676, December 2005

[5] Primož Potočnik, Boris Vidrih, Andrej Kitanovski, and

Edvard Govekar, “Neural network, ARX, and extreme

learning machine models for the short-term prediction of

temperature in buildings,” Building Simulation, vol 12, pp

1077-1093, April 2019

[6] Shuqing Xu, “The Research on Building Heating Indoor

Temperature Forecasting and Controlling,” M.S Thesis, Sch

of Information Science and Technology, Dalian Maritime

Univ., Dalian, 2015 Accessed on: February, 25, 2020

[7] PAN Shiying, DING Xin, CUI Yue, LYU Haozheng,

WANG Tong, and MA Lezhi, “Application of MLP Neural

Network to Prediction of Heating Indoor Temperature,” Gas

& Heat, vol 2019, pp 40-44, July 2019

[8] Ivan Medennikov and Anna Bulusheva, “LSTM-Based

Language Models for Spontaneous Speech Recognition,”

International Conference on Speech & Computer, Budapest,

2016, pp 469-475

[9] A Graves, A Mohamed and G Hinton, "Speech recognition

with deep recurrent neural networks," 2013 IEEE

International Conference on Acoustics, Speech and Signal

Processing, Vancouver, BC, 2013, pp 6645-6649

[10] Davis Abe, Rubinstein Michael, Wadhwa Neal, Mysore

Gautham J., Durand Fredo, and Freeman William T., “The

visual microphone: Passive recovery of sound from video,”

ACM Trans Graph, vol 33, pp 79:1–79:10, July 2014

[11] Y Lecun, L Bottou, Y Bengio and P Haffner,

"Gradient-based learning applied to document recognition," in

Proceedings of the IEEE, vol 86, pp 2278-2324, Nov 1998

[12] Ren Zhihui, Xu Haoyu, Feng Songlin, Zhou Han, and Shi

Jun, “Sequence labeling Chinese word segmentation method

based on LSTM networks,” Application Research of

Computers, vol 2017, pp 1321-1324+1341, May 2017

[13] Devlin, J., Zbib, R., Huang, Z., Lamar, T., Schwartz, R., and

Makhoul, J, “Fast and robust neural network joint models for

statistical machine translation,” In Proceedings of the 52nd

Annual Meeting of the Association for Computational

Linguistics, vol 1, pp 1370-1380, June 2014

[14] Hochreiter S and Schmidhuber J, “Long Short-Term

Memory,” Neural Computation, vol 9, pp 1735-1780,

November 1997

[15] Malhotra P, Vig L, Shroff G, and Agarwal P, “Long short

term memory networks for anomaly detection in timeseries,”

Proceeding of European symposium on artificial neural

networks, computational intelligence, and machine learning,

Bruges, 2015, pp 89–94

[16] YANG Hong-fu and JIA Xiao-liang, “Aero Engine Exhaust

Gas Temperature Prediction Based on LSTM,” Aeronautical

Computing Technique, vol 48, pp 65-69, April 2018

[17] Min Cheng, Qian Xu, Jianming Lv, Wenyin Liu, Qing Li,

and Jianping Wang, “a Multi-Scale LSTM Model for BGP

Anomaly Detection,” 24th IEEE International Conference on

Network Protocols(ICNP 2016), Singapore, 2016, pp 1-6

[18] R Jiao, T Zhang, Y Jiang, and H He, “Short-term non-residential load forecasting based on multiple sequences LSTM recurrent neural network,” IEEE Access, vol 6, pp 59438-59448, October 2018

Định dạng
Số trang	5
Dung lượng	1,19 MB