- Xây dựng mô hình dự báo mức tiêu thụ năng lượng bằng cách sử dụng các thuật toán trí tuệ nhân tạo và kêt hợp tôi ưu các thuật toán.. Luận văn này đưa ra những nhân tố và mức độ ảnh hưở
Trang 1DU BAO MUC TIEU THU NANG LUGNG TRONG CAN HO SU
DUNG MO HINH TIEN HOA TRI TUỆ NHÂN TẠO
Chuyén nganh : QUAN LY XAY DUNG
Trang 2
CÔNG TRÌNH KHOA HỌC ĐƯỢC HOÀN THÀNH TẠI
TRUONG DAI HOC BACH KHOA ĐẠI HỌC QUỐC GIA THANH PHO HO CHI MINH
Cán bộ Hướng dan khoa hoc : TS Tran Dirc Hoc
Luan Van Thac Si được bảo vệ tại Hội đồng chấm bảo vệ Luận văn Thạc sĩ Trường
Đại học Bách Khoa thành phố Hồ Chí Minh Tp.HCM, ngày 10 tháng 01 năm 2020 Thành phần Hội đồng đánh giá luận văn thạc sĩ gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc Si)
1 PGS TS Luong Duc Long
2 PGS TS Pham Hồng Luân
3 TS Pham Hai Chién
4 TS Nguyén Thanh Việt
5 TS Nguyén Anh Thu
Xác nhận của Chủ tịch Hội đồng đánh giá luận văn và Trưởng Khoa quản lý chuyên ngành sau khi luận văn đã được sửa chữa (nếu có)
CHỦ TỊCH HỘI ĐỒNG TRƯỞNG KHOA KỸ THUẬT XÂY DỰNG
Trang 3
DAI HOC QUOC GIA TP HCM CONG HOA XA HOI CHU NGHIA VIET NAM
TRUONG DAI HOC BACH KHOA Độc lập - Tự do - Hạnh phúc
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: ĐỖ TRUNG HẬU MSHV:1770646
Ngày, tháng, năm sinh: 07 — 12 - 1994 Noi sinh: Phu Yén
Chuyén nganh: Quan Ly Xay Dung Mã số : 60580302
L TÊN ĐẺTÀI:
DỰ BẢO MỨC TIÊU THỤ NĂNG LƯỢNG TRONG CĂN HỘ SỬ DỰNG
MÔ HÌNH TIỀN HÓA TRÍ TUỆ NHÂN TAO
I NHIỆM VỤ VÀ NOI DUNG:
- Xác định được những nhân tố ảnh hưởng đến nhu cầu tiêu thụ năng lượng của
căn hộ trong các tòa chung cư tại TP Hồ Chí Minh
- Đưa ra những nhân tố có mức độ ảnh hưởng nhiều đến nhu cầu tiêu thụ năng
lượng băng việc khảo sát, đánh giá, xếp hạng các nhân tô
- Xây dựng mô hình dự báo mức tiêu thụ năng lượng bằng cách sử dụng các thuật
toán trí tuệ nhân tạo và kêt hợp tôi ưu các thuật toán Đưa ra một mô hình dự
báo tôi ưu
IIL NGÀY GIAO NHIỆM VỤ: 19/08/2019
IV NGÀY HOÀN THÀNH NHIỆM VỤ: 08/12/2019
V HOVA TEN CAN BO HUONG DAN: TS TRAN ĐỨC HOC
Trang 4Trước tiên, tôi xin chân thành cảm ơn chân thành nhất đến TS Trần Đức Học,
Thầy đã hướng dẫn tận tình hướng và góp ý nhiều kiến thức quý báu trong suốt thời
gian tôi thực hiện luận văn Những hướng dẫn và góp ý này là rất quan trọng cho thành công của luận văn này
Xin chân thành cảm ơn quý Thay, Cô Khoa Kỹ Thuật Xây Dựng — bộ môn Thi Công và Quản lý Xây dựng đã truyền đạt những kiến thức bổ ích trong suốt thời gian tôi học chương trình cao học
Xin cảm ơn gia đình, các anh chị, bạn bè cùng lớp cao học khóa 2017 và những
người bạn, anh chị em đồng nghiệp đã động viên, giúp đỡ, chia sẻ kinh nghiệm và dành
thời gian hỗ trợ tôi thực hiện tốt giai đoạn khảo sát đữ liệu trước khi tiến hành nghiên
cứu
Cuối cùng, tôi xin đặc biệt cảm ơn đến anh chị chuyên gia, người có kinh nghiệm liên quan đến khảo sát trong luận văn, những anh chị cư dân trong các chung cư đã bỏ chút thời gian tham gia giúp đỡ tôi thực hiện khảo sát này Sự giúp đỡ của các anh chị là
sự đóng góp to lớn vào sự thành công của luận văn
Tp HCM, ngày 8 tháng I2 năm 2019
Đỗ Trung Hậu
Trang 5TOM TAT Việc sử dụng năng lượng điện nói chung và sử dụng năng lượng điện trong căn
hộ nói riêng ở Việt Nam 1a van dé dang được quan tâm nhiều trong bối cảnh giá điện
tăng cùng với nhiệt độ tăng, khí hậu khắc nghiệt — hệ quả của hiệu ứng nhà kính Mức
sử dụng điện trong căn hộ phụ thuộc vào đặc điểm căn hộ, thiết bị trong căn hộ và cả
người sử dụng Luận văn này đưa ra những nhân tố và mức độ ảnh hưởng của chúng đến việc sử dụng năng lượng điện trong căn hộ bằng cách tông hợp những nhân tố từ nhiều nguồn tài liệu, khảo sát các ý kiến chuyên gia và thông qua khảo sát những người có liên quan trong lĩnh vực kiến trúc, xây dựng, năng lượng
Cùng với đó, để thực hiện dự báo mức tiêu thụ năng lượng trong căn hộ, cụ thể là điện năng, luận văn đã xây dựng các mô hình dự đoán sử dụng các thuật toán trí tuệ
nhân tạo, học máy bằng việc xây đựng các mô hình đơn và mô hình kết hợp Cụ thể là
mô hình LR, SVM (SVR), ANN, CART, các mô hình kết hợp ensemble và kết hợp hai
mô hình bằng trọng số Sau khi đánh giá và phân tích hiệu suất giữa các mô hình, luận văn đê xuât mô hình có hiệu suât dự báo tôt nhât
Trang 6apartments in particular in Vietnam is a concerning problem in the context of rising
electricity prices, rising temperatures, harsh climates- the results of greenhouse effect
Electricity usage in apartments depends on characteristics of apartments, equipment and residents — who use electrical energy This thesis defines the factors and their influence
on the use of electrical energy in apartments by summarizing factors from various sources, surveying expert opinions and people involved in the fields of architecture, construction and energy
Besides that, to make the forecast of energy consumption in the apartment, particularly electricity, the thesis has built predictive models using artificial intelligence
algorithms, machine learning by building single models and ensemble models
Specifically, they are LR, SVM (SVR), ANN, CART models, ensemble models and weighted models After evaluating and analyzing performance among models, the prediction model with the best performance is given
Trang 7LOI CAM DOAN
Tôi xin cam đoan luận văn này là công trình nghiên cứu của ca nhân tôi, được thực
hiện dưới sự hướng dẫn khoa học của TS Trần Đức Học Các số liệu, những kết luận
nghiên cứu được trình bày trong luận văn này hoàn toàn trung thực và chưa được công
Trang 8
MỤC LỤC CHUONG 1: DAT VAN DE 6
INECiiii i0 0 6
1.2 Xác định vấn đề nghiên CỨU: - - s6 % E* SE EEx SE 49339 cv 7 IES© Ti vài(-ì8/14i1-/ãui 0000708 a 9
I5 i020i1)0 (203i 0n 9
I2 0i 930i 40ï0( (0u nh .a 9
1e 6n nn 9
CHƯƠNG 2: TỎNG QUANN ỏ.- 5 55 s9 9239299 5990599 5090536098050 050009080002880 11 "N0 v‹ án 11
2.1.1 Năng lượng sử dụng trong căn hộỘ s5 s53 s93 9S 99.5 9 590 0 0 vn ve 11 2.1.2 Phát triển bền Vững: 22s +2 x.E13 35 31318 1312313513 18123 1.13.11 2 re 11 2.1.3 Trí tuệ nhân tạo và mơ hình thuật tốn trí tuệ nhân †ạo - - «<< << <<<+ 12 2.1.4 Các thuật tốn phố biến, ensermble G ss s sEsE9ESE#ESE€ESEeE£EEEe ke eSzEEseeese 14 2.2 Tình hình ngh1Ên CỨU: - G G 2G G55 1 3989491589993 8994.9308090 3008004 189008088889 88996 23 CHƯƠNG 3: : PHƯƠNG PHÁP NGHIÊN CỨPU .- 5- 5 es< cssevsseese 26 SN) Ä0ïì(i:8//42) (i8 1 26
3.2 Thu thap dit li@u va phan tich: 011 28
3.2.1 Xác định các nhân tố ảnh hưởng đến việc sử đụng điện trong căn hộ chung cư: .28
3.2.2 Thiết kế bảng câu hỏi, thu thập dữ liệu: . . - + 5° 5< 2 £zseceerxreerserxee 29 3.2.3 Kiểm tra độ tin cậy thang đo và phân tích nhân tố: .- 2 + «se cs+eeeeces 32 SN (080ì1:0ix8: 51:19 34
3.3.1 Lưu đồ chungg - s£ +25 +keEk£EE L3 AE 31313151538 121 1515253511312 xE 34 3.3.2 Đánh giá hiệu suất các mơ hìnhh - SE E®£E€E€E#£EeEk£EeEEezxeeerererreced 35 3.4 Phần mềm thống kê và mơ phỏng .- 2-2-2 2 2 2+2 Ex£E£EE£E£EZEEZ£E£+EeEzrEsrrsred 36 3.4.1 Phần mềm IBM SPSS Statistics - + cccserrirerrrrrirrrrrrrrrrrrrrrrrrrrrree 36 3.4.2 Phần mềm Rapidminer StUđiO - - ©- ®E®<£ £Ek£S£k£ xxEE*vcEz g2 xercea 36 CHƯƠNG 4: THU THAP DU LIEU VA KET QUA PHAN TICH THONG KE, KET QUA MO HINH DU BAO .cccssssssssssssssscsssssesssssseesssssssonssossssnsessscessesesseesecsess 37 4.1 Thu thập đữ liệu giai đoạn 1 và kết quả phân tích thống kê: . 2- 2 «5< 37 4.1.1 Đặc điểm của mẫu nghiên cứu: . + 22 ©®©ce++S£EsEEs+EEEEEEEEEsrestsererrsree 37 4.1.2 Kiểm định Cronbach”s aÏpHa: .- 2-2 2£ 2+2 sE+S£Ek£ESEESEESEEEEEEESEEsEEevsererreree 40 4.1.3 Xếp hạng mức độ ảnh hưởng các nhân tỐ: . + 222 2 e++£Ss£ss+szxsersces 44 4.2 Thu thập dữ liệu và kết quả các mơ hình dự ĐáO << << 5< 91391153 19855355855555 555 46 4.2.1 Thu thap iïg 0a 46
4.2.2 Mơ hình các thuật tốn - - - - - CÁ CẢ G0090 000.01 cọ He Em 48 4.2.3 M6 hinh két hop (ensemble 1mo de ]Ì) - < s- s £ SE *£E£E*££ + z£E+x£x£zscxe 53
4.2.4 Kết hợp các mơ hình cĩ hiệu suất tốt bằng trọng số: . - 5-5 se «ccsc«e 57 4.2.5 Áp dụng mơ hình với trường hợp thực thế: . << 6s s£x£Es£s£Eezxexerscxe 62
CHUONG 5: KET LUẬN 55s e<cssescsSesvsesesensessvssesessnsesesseesessnsosens 67
5.2 Hướng nghiên cứu tiẾp theo: .ccsccceccsssssessssssssessssssssssessessssecsssssssesssssssessessssesssssssessssseees 68
TAI LIEU THAM KHAO c.cscsscsssscssossssossssosssssssossssossssossassscsssosssensscessossnsoseaceseossees 68
Trang 9Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Trang 10
DANH MUC BANG BIEU
Bang 2.1 Tóm tắt tình hình nghiên cứu các tác giả liên quan . - : ‹c- 23
Bảng 3.1 Các nhân tố ảnh hưởng đến mức tiêu thụ điện trong căn hộ chung cư 28
Bảng 3.2 Thang điểm đánh giá mức độ ảnh hưởng các nhân tố . - 30
Bảng 3.3 Các nhóm nhân tố ảnh hưởng sử dụng trong bảng câu hỏi 30
Bang 3.4 Các nhân tố sử dụng cho khảo sát định lượng . - se cxecccrvceee 31 Bảng 3.5 Hé sé factor loading trong phan tich EFA dua theo số lượng mẫu 33
Bảng 4.1 Thông kê yếu tố số năm kinh nghiệm của đôi tượng khảo sát 37
Bảng 4.2 Thống kê chuyên ngảnh, lĩnh vực làm việc đối tượng khảo sát 38
Bảng 4.3 Loại công trình nhóm đối tượng khảo sát đã tham gia -c- 39 Bảng 4.4 Hệ số Cronbach”s alpha cho từng nhóm nhân tỐ .-se- ve crz 40 Bảng 4.5 Hệ số Cronbach”s alpha nhóm nhân tố liên quan đến khí hậu 41
Bảng 4.6 Hệ số Cronbach's alpha nhóm nhân tố liên quan đến thiết bị sử dụng điện 4l Bảng 4.7 Hệ số Cronbach”s alpha nhóm nhân tố liên quan đến đặc điêm tòa nhà 42
Bảng 4.8 Hệ số Cronbach”s alpha nhóm nhân tố liên quan đến đặc điêm căn hộ 42
Bảng 4.9 Hệ số Cronbach”s alpha nhóm nhân tố khác ‹c¿:©c++seecccvsee¿ 43 Bảng 4.10 Xếp hạng các nhân tỐ 2 -222+©EEESE22111112121152 12711 1.1 xcetrrved 44 Bảng 4.14.11 Các nhân tố ảnh hưởng nhiều đến khả năng tiêu thụ điện trong căn hộ 46
Bảng 4.14.12 Các nhân tố và kiểu dữ liệu được chọn để khảo sát - 46
Bảng 4.14.13 Mã hóa và gọi tên biến các nhân tỐ - ¿- sec ket 48 Bảng 4.14 Thiết lập các thông số ban đầu cho các mô hình đơn .‹ :- 50
Bảng 4.15 Kết quả hiệu suất các mô hình đơn . - 5c 22vscccEEkveerrrrrseed 52 Bang 4.16 Các thông số sau khi tối ưu của các mô hình -‹.-¿:csce:+ccvsee¿ 52 Bảng 4.17 Kết quả hiệu suất các mô hình đơn sau khi tối ưu các tham sỐ 5
Bảng 4.18: Hiệu suất các mô hình kết hợp bằng phương pháp voting 54
Bảng 4.19 Hiệu suất các mô hình kết hợp bằng phương pháp Bagging 55
Bang 4.20 Hiệu suất các mô hình kết hợp bằng phương pháp Stacking 57
Bảng 4.21 Hiệu suất giữa các mô hình kết hợp và các mô hình đơn 59
Bảng 4.22 Kết quả hé s6 Ket hop vsccecssssssssssssssssssssssssssssssssssssssesssssseesssssssesssssssesssssseeessssees 62 Bảng 4.23 So sánh hiệu suất các mô hình sau khi kết hợp -‹cce-cccsce¿ 62 Bảng 4.24 Số liệu khảo sát mới tháng 12/2019 - ¿+ v+seettervveeerrrrrke 63 Bảng 4.25 Giá điện áp dụng tháng 12/20109 - cv 1101112191010 0101011110111 ke 63 Bảng 4.26 Bảng mã hóa và quy đổi từ giá điện sang kWh điện -c 64 Bảng 4.27 Tổng hợp kết quả dự báo của mô hình so với thực tế -‹- 66
Trang 11Luận văn tốt nghiệp GVHD: TS Trần Đức Học
DANH MỤC HÌNH ẢNH
Hình 1.1 Tỉ lệ sản lượng năng lượng theo nguồn nhiên liệu ở Việt Nam nam 2017 6
Hình 2.1 Minh hoa Support Vector Regression [ 1Ó] . -s «sex sxeveevekesekses l6
Hình 2.2 Cấu trúc mô hình cây phân loại [20] - 2 +e£©E++e£+EE+eeevEEvseerrr 18
Hình 2.3 Cầu trúc của ANN ccvv thi 20
Hình 2.4 Ví dụ về Boostrap[/27] sc+to2ELkt SE SE 1027111 0517100E71102711 22712 crxcree 22
Hình 3.1 Quy trình nghiÊn CỨU (St 3919191193491 91111130 0111611011161 1901101 1 4 26
Hình 3.2 Khung làm việc của mô hình các thuật toán + + +x*xevexevexsves 35 Hình 4.1 Biêu đồ phần trăm số năm kinh nghiệm . ¿ 5552 +vceeccevsee¿ 38 Hình 4.2 Biểu đồ phần trăm chuyên ngành nhóm đối tượng khảo sát 39
Hình 4.3 Lưu đồ các mô hình đơn :-+©:+tttttttkrrrtrtrrrrrririiriiiiiiiiee 49
Hình 4.4 Phương pháp xác thực chéo 10 lần -s-+c++xetvEEExtrsrrkererrrkrrrrre 50
Hình 4.5 Lưu đồ mô hình voting ensemble + ket SEE+tecEEEecvEkeeeerreree 54 Hình 4.6 Luu dé m6 hinh Bagging ensemble .c ccccsssssccssecsssessssssecsssecsssesessssecessesenseses 55 Hình 4.7 Lưu đồ mô hình Stacking ensemble ccccccecsssscssssecssssescsssseesssssecssssesssssseeen 56 Hình 4.8 Biểu đồ hệ số tương quan R của các mô hình . ¿ sec c+zeecrz 37
Hình 4.9 Biéu đồ phân trăm sai số trung bình MAPE của các mô hình 58
Hình 4.10 Biéu đồ sai số trung bình tuyệt đối MAE của các mô hình 58 Hinh 4.11 Biéu đồ sai số toàn phương trung bình RMSE của các mô hình 59 Hình 4.12 Lưu đồ tính toán hệ số a, b kết hợp hai mô hình .- «eo ccxceet 61
Hình 4.13 Áp dụng vào mô hình dự báo - ¿v22 EE4vetEEE1x2e1Ecrrrrreed 64
Hình 4.14 Kết quả mô hình dự báo thực tế Stacking (LR + ANN, CART) 65 Hình 4.15 Kết quả mô hình dự báo thực tế Bagging ANN . -ccccceccre 65
Trang 12
DANH MUC CAC TU VIET TAT
LR: Hồi quy tuyén tinh (Linear Regression)
ANN: Mang than kinh nhan tao (Artificial neural network)
SVM: Vector hé tro (Support Vector Machine)
SVR: Vector hỗ trợ hồi quy (Support Vector fRegresstion)
CART: Cay phan loại và hồi quy (Classification and regression trees)
EFA: Phân tích nhân tô chính (Exploratory Factor Analysic)
NL tái tạo: năng lượng tái tạo
Khí TN: khí tự nhiên
AI: Tri tué nhan tao (Artificial Intelligence)
SI: Chỉ số tông hợp
R: Hệ số tương quan tuyến tính
MPAE: Phân trăm sai số trung bình tuyệt đối
MAE: Sai số trung bình tuyệt đối
RMSE: Sai số toàn phương trung bình
Trang 13Luận văn tốt nghiệp GVHD: TS Trần Đức Học
CHUONG |: DAT VAN DE
1.1 Giới thiệu chung:
Theo trang thông tin điện tử của tạp chí năng lượng Việt Nam [1]: trong những năm
qua, Việt Nam là một trong những nên kinh tế phát triển năng động, với nhịp độ phát triển khá
cao so với các nước trong khu vực và trên thế giới Ngành năng lượng đóng vai trò then chốt trong việc thúc đây phát triển kinh tế - xã hội của đất nước Tuy nhiên, quá trình phát triển năng lượng đã bộc lộ những yếu kém, bất cập trong việc cung cấp và sử dụng năng lượng, đặc
biệt là sử dụng điện kém hiệu quả, lãng phí
Theo BP Statistical Review of World Energy 2018 [2], tỉ lệ sản lượng năng lượng theo
các nguôn nhiên liệu ở Việt Nam năm 2017 chiêm phân lớn ở thủy điện, than và khí tự nhiên
NL tai tao Dau 0.4
0.2
hiện nay đang ở mức cao đỉnh điềm [3] (tháng 05/2019), cùng với đó là nguy cơ thiếu hụt điện
[4] đặt ra một vấn đề lớn trong việc tiết kiệm năng lượng điện cũng như sử dụng năng lượng điện một cách hiệu quả Việc tiết kiệm điện góp phần giảm áp lực lên ngành năng lượng nước
nhà, đồng thời cũng góp phần giảm thiểu sử dụng các nguồn nhiên liệu hóa thạch làm chất đốt
tạo ra điện năng như than đá, khí tự nhiên, từ đó làm giảm ô nhiễm môi trường, giảm hiệu
ứng nhà kính Điện năng có vai trò then chốt trong việc thúc đây kinh tế - xã hội, có vai trò
quan trọng trong đời sống con người, phục vụ cho các nhu cầu thiết yếu trong đời sống, sản
xuât
HVTH: Đỗ Trung Hậu Trang 6
Trang 14Tháng 4 năm 2019, giá điện tăng hơn 8% [5] ảnh hưởng nhiều đến sản xuất và đời
sống Ngày một nhiêu người chú trọng hơn đến lượng điện sử dụng và những nguyên nhân dẫn
đến việc tiêu hao điện Vì VẬY, VIỆC tiết kiệm điện là điều luôn cần thiết Nó đồng nghĩa với
việc tiết kiệm một khoản chi phí phải trả cho việc sử dụng điện, góp phần giảm bớt áp lực cung cấp từ ngành điện Ở các thành phố lớn với tốc độ đô thị hóa cao như Hà Nội và thành phố Hồ
Chí Minh, nhu cầu nhà ở chung cư rất lớn [6], nhiều công trình chung cư cao tầng được xây
dựng, kéo theo nhu cầu sử dụng năng lượng ngày một tăng
Ngành xây dựng có mức tăng trưởng trong những năm gần đây đạt 12% và tốc độ đô thị hóa là 3.4%/năm, dự kiến đạt ngưỡng 50% vào năm 2025 Cùng với đó, mức tiêu thụ năng lượng trong khoảng thời gian này có tốc độ tăng trưởng bình quân cao hơn cả GDP
(14%/năm) Các công trình xây dựng tại Việt Nam đang sử dụng khoảng 36% tổng năng lượng
tiêu thụ cả nước, trong đó điện năng chiếm 33%, và gây ra hiệu ứng khí thải nhà kính chiếm tỉ
trọng 25% với một phần ba là CO›, tác nhân gây ra biến đồi khí hậu [7]
Thị trường xây dựng nước ta được dự báo đạt 14 tỷ USD năm 2021, với phần khúc nhà
ở mật độ xây dựng (chung cu cao tang) cao gia tăng Với sự tăng trưởng nhanh chóng của nền kinh tế và tốc độ xây dựng, đô thị hóa cao như trên, Việt Nam sẽ còn đối mặt với nhiều sự ảnh hưởng tiêu cực đến nên sinh thái và kinh tế trừ khi không có giải pháp giải quyết hiệu quả về năng lượng công trình [8] Để giải quyết được vấn đề này, xu hướng công trình xanh đã được nhiều nước áp dụng trên thê giới Việt Nam cũng bắt đầu áp dụng từ năm 2007 và được sự ủng
hộ của chính phủ và các tô chức tư nhân [8] Công trình xanh mang lại nhiều lợi ích, đặc biệt là cách tiếp cận thông mình về năng lượng Công trình xanh khuyến khích việc lập kế hoạch và mục tiêu về sử dụng năng lượng ngay từ khi khởi đầu dự án, tận dụng những thế mạnh của khu vực công trình và điều kiện khí hậu nhằm giảm thiêu nhu cầu sưởi âm, làm mát và chiếu sáng; kết hợp thiết kế cảnh quan trong chắn nắng, chăn gió; khuyến khích sử dụng phương tiện giao thông công cộng; tích hợp giải pháp sử dụng năng lượng tái tạo [9]
1.2 Xác định vẫn đề nghiên cứu:
Với tốc độ đô thị hóa ngày một tăng, sự phát triển của các chung cư cao tầng ở các
thành phô lớn trở nên mạnh mẽ đề đáp ứng nhu cầu nhà ở Tại thành phố Hồ Chí Minh, năm
2018 đã cấp 60.000 giấy phép xây dung, trong đó 25% là giấy phép xây chung cư Thị trường
Trang 15Luận văn tốt nghiệp GVHD: TS Trần Đức Học
năm 2018 có khoảng 80,000 căn hộ và dự kiến tăng 74% trong 3 năm tới [10] Tuy nhiên, các công trình xây dựng tại Việt Nam đang sử dụng khoảng 36% tông năng lượng tiêu thụ cả nước, trong đó điện năng chiếm 33%, và gây ra hiệu ứng khí thải nhà kính chiếm tỉ trọng 25% với
một phần ba là COz, tác nhân gây ra biến đôi khí hậu [7]
Ngày nay, công trình xanh được biết đến và cũng được áp dụng ở Việt Nam Một trong
hai xu hướng phát triển công trình xanh là xu hướng kiến trúc tập trung vào nhận thức môi
trường, thiết kế tích hợp, hiệu quả và sáng tạo [9] Như vậy, thiết kế kiến trúc đáp ứng được
hiệu quả năng lượng sẽ góp phan giảm thiểu việc tiêu thụ năng lượng trong tòa nhà Kiến trúc đạt hiệu quả năng lượng khi tiết kế được hợp lý, tôi ưu về năng lượng kết hợp với từng thiết bị tiêu thụ năng lượng Hiệu quả năng lượng phụ thuộc đến ý thức tiết kiệm của người sử dụng được xây dựng thành thói quen và có sự đóng góp của công nghệ năng lượng Hiệu quả năng lượng sẽ càng cao nếu có sự kết hợp đồng bộ của tất cả các giải pháp [11] Các giải pháp tiết kiệm năng lượng trong công trình [11]:
e Giải pháp quy hoạch: vị trí, hướng công trình
e Giải pháp kiến trúc: tận dụng các yếu tố có lợi về khí hậu và năng lượng đề bố
trí không gian kiến trúc; cầu tạo lớp vỏ bao che
e_ Giải pháp thiết kế khác hỗ trợ: giải pháp hình khối, giải pháp bê mặt, giải pháp
Do đó, đê có được một cái nhìn trực quan hơn cũng như phân nào dự báo trước mức sử
dụng điện trong căn hộ chung cư thì một công cụ dự báo là cần thiết Đê tài “Dự báo mức tiêu
thụ năng lượng trong căn hộ sử dụng mô hình tiễn hóa trí tuệ nhân tạo” nhằm đáp ứng yêu câu trên Đề tài đưa ra những nhân tô, đặc điểm thiết kế kiến trúc, thiết bị sử dụng điện trong căn
Trang 16
hộ chung cư ảnh hưởng như thế nào đến việc sử dụng điện và đưa ra một công cụ đề dự báo được mức sử dụng điện trong căn hộ chung cư
1.3 Các mục tiêu nghiên cứu:
Nghiên cứu này thực hiện với các mục tiêu:
- Xác định các yếu tố ảnh hưởng đến mức tiêu thụ điện năng trong căn hộ chung cư
- _ Đưa ra mô hình thuật toán để dự báo mức tiêu thụ điện năng trong căn hộ chung cư
1.4 Phạm vi nghiên cứu:
- _ Đối tượng nghiên cứu khảo sát: Các chuyên gia, người có kinh nghiệm trong lĩnh vực kiến trúc, xây dựng, năng lượng, phát triển bền vững ; các cư dân sống trong
các căn hộ chung cư tại thành phố Hồ Chí Minh
- Địa điểm nghiên cứu: Nghiên cứu được thực hiện tại thành phố Hồ Chí Minh, Việt
Nam
1.5 Dong gop nghiên cứu:
Về mặt thực tiễn:
Nghiên cứu đưa ra được những nhân tô ảnh hưởng đến việc sử dụng năng lượng trong
căn hộ chung cư bằng việc thu thập dữ liệu và khảo sát các ý kiến chuyên gia, người có kinh nghiệm trong lĩnh vực liên quan đến xây dựng, kiến trúc, năng lượng Từ đó các nhà quản lý có
thé chú trọng và xem xét kỹ lưỡng hơn về các nhân tô này đề có những điều chỉnh phù hợp
Đưa ra một công cụ dự báo mức tiêu thụ năng lượng làm tham khảo cho các nhà quản
lý có thể ra quyết định cho các chung cư tương tự
Về mặt học thuật:
Đề tài có thê được sử dụng làm tham khảo cho những nghiên cứu tiếp theo như mở
rộng khu vực nghiên cứu, có thê phát triển các nghiên cứu xoay quanh các nhân tố; làm tham
khảo cho việc phát triển các mô hình dự báo tốt hơn, hiệu quả hơn
1.6 Cấu trúc luận văn:
Cấu trúc luận văn gồm 5 chương và phụ lục:
Chương l1: Đặt van dé
Trang 17Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Chương 2: Tổng quan
Chương 3: Phương pháp nghiên cứu
Chương 4: Thu thập dữ liệu và kết quả phân tích thống kê, kết quả mô hình dự báo
Chương 5: Kết luận
Bài báo khoa học
Tài liệu tham khảo
Phụ Lục
Trang 18
CHƯƠNG 2: TỎNG QUAN
2.1 Các khái niệm:
2.1.1 Năng lượng sử dụng trong căn hộ
Các loại năng lượng mà chúng ta thường hay sử dụng: điện, gas, xăng, dầu, năng lượng mặt trời Chúng ta có thê phân năng lượng thành 2 loại chính:
e Năng lượng tái tạo được xem là nguồn năng lượng vô tận như sức gió (phong năng), năng lượng mặt trời, năng lượng địa nhiệt, sức thuỷ triều và năng lượng
thuỷ điện Đây là nguồn năng lượng sạch và rất thân thiện với môi trường
e Năng lượng không tái tạo thường là các nhiên liệu hoá thạch như than, dầu và khí thiên nhiên Các loại nhiên liệu hóa thạch này phải mất hàng trăm triệu năm
mới hình thành và hiện đang cạn kiệt dần theo thời gian
Ở luận văn nảy, nghiên cứu giới hạn năng lượng sử dụng trong căn hộ được hiểu là điện năng Do đó, mức tiêu thụ năng lượng trong căn hộ có nghĩa là mức tiêu thụ điện năng
2.1.2 Phát triển bền vững:
Thuật ngữ “phát triển bền vững” xuất hiện lần đầu tiên vào năm 1980 trong ấn phẩm
Chiến lược bảo tồn Thế giới (công bố bởi Hiệp hội Bảo tồn Thiên nhiên và Tài nguyên Thiên nhiên Quốc tế - IUCN) với nội dung rất đơn giản: “Sự phát triển của nhân loại không thể chỉ
chú trọng tới phát triển kinh tế mà còn phải tôn trọng những nhu cầu tất yếu của xã hội và sự
tác động đến môi trường sinh thái học
Phát triển bền vững là “ sự phát triển đáp ứng những nhu cầu hiện tại mà không làm tôn hại đến khả năng phát triển của thế hệ tương lai” Khái niệm này được phô biến rộng rãi vào
năm 1987 nhờ Báo cáo Brundrland (còn gọi là Báo cáo Our Common Future) của Ủy ban Môi
trường và Phát triển Thế giới - WCED (nay là Ủy ban Brundtland) Nói cách khác, phát triển bền vững phải đảm bảo có sự phát triển kinh tế hiệu quả, xã hội công bằng và môi trường được bảo vệ, giữ gìn Để đạt được điều này, tất cả các thành phân kinh tế - xã hội, nhà cầm quyên,
các tô chức xã hội, phải bắt tay nhau thực hiện nhăm mục đích dung hòa 3 lĩnh vực chính:
kinh tế - xã hội - môi trường
Trang 19Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Phát triển bền vững là một khái mệm nhằm định nghĩa một sự phát triển về mọi mặt trong hiện tại mà vẫn phải bảo đảm sự tiếp tục phát triển trong tương lai xa Khái niệm này hiện đang 1a mục tiêu hướng tới của nhiều quốc gia trên thế giới Mỗi quốc gia sé dựa theo đặc
thù kinh tế, xã hội, chính trị, địa lý, văn hóa riêng để hoạch định chiến lược phù hợp nhất với
quốc gia đó
2.1.3 Trí tuệ nhân tạo và mô hình thuật toán trí tuệ nhân tạo
Định nghĩa trí tuệ nhân tạo: (AI: Artificial Intelligence) cé thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc tự động hóa các hành vi thông minh AI
là một bộ phận của khoa học máy tính và do đó nó phải được đặt trên những nguyên lý lý thuyết vững chắc, có khả năng ứng dụng được của lĩnh vực này [12]
Ở thời điểm hiện tại, thuật ngữ này thường dùng để nói đến các máy tính có mục đích không nhất định và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của trí tuệ nhân tạo Tức là mỗi loại trí tuệ nhân tạo hiện nay đang dừng lại ở mức độ những máy tính hoặc siêu
máy tính dùng để xử lý một loại công việc nảo đó như điều khiển một ngôi nhà, nghiên cứu
nhận diện hình ảnh, xử lý dữ liệu của bệnh nhân để đưa ra phác đồ điều trị, xử lý đữ liệu đẻ tự
học hỏi, khả năng trả lời các câu hỏi về chân đoán bệnh, trả lời khách hàng về các sản phẩm của một công ty,
Machine learning (máy học) là một nhánh con của AI, Machine Learning là một lĩnh vực nhỏ của Khoa Học Máy Tính, nó có khả năng tự học hỏi dựa trên dữ liệu đưa vào mà
không cần phải được lập trình cụ thê [13]
Có hai cách phổ biến phân nhóm các thuật toán Machine learning Một là dựa trên phương thức học (learning style), hai là dựa trên chức năng (function) (của mỗi thuật toán)
[13]:
Phân nhóm dựa trên phương thức học [13, 14]:
Theo phương thức học, các thuật toán Machine Learning thường được chia làm 4
nhóm: Supervise learning, Unsupervised learning, Semi-supervised lerning va Reinforcement
learmng Có một sô cách phân nhóm không có SemI-supervised learmng hoặc Reinforcement learning
Trang 20
Supervised Learning (Hoc co gidm sdt)
Supervised learning 1a thuat toan dy doan dau ra (outcome) của một dữ liệu mới (new
inpuf) dựa trên các cặp (input, outcome) đã biết từ trước Cặp dữ liệu này còn được gọi là (data, label), tức (dữ liệu, nhãn) Supervised learmng là nhóm phố biến nhất trong các thuật toán Machine Learning Thuật toán supervised learning còn được tiếp tục chia nhỏ ra thành hai loại chính:
Classification (Phan loai)
Một bài toán được goi 1a classification nêu các nhãn của đữ liệu đầu vào được chia
thành một số hữu hạn nhóm
Regression (Hồi quy)
Nếu nhãn không được chia thành các nhóm mà là một giá trỊ thực cụ thể thì bài toán sẽ
trở thành bài toán hồi quy, tìm giá trị cho nhãn đó
Unsupervised Learning (Hoc khéng giám sát)
Trong thuật toán này, chúng ta không biết được đầu ra hay nhãn mà chỉ có dữ liệu đầu vào Thuật toán unsupervised learning sẽ dựa vào cầu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm (clustering) hoặc giảm số chiều của đữ liệu (dimension reduction) đề thuận tiện trong việc lưu trữ và tính toán
Những thuật toán loại này được gọi là Unsupervised learning vì không giống như Supervised learning, chúng ta không biết câu trả lời chính xác cho mỗi dữ liệu đầu vào
Cac bai toan Unsupervised learnng được tiếp tục chia nhỏ thành hai loại:
Clustering (phân nhóm): bài toán phân nhóm toàn bộ dữ liệu thành các nhóm nhỏ dựa trên sự liên quan giữa các dữ liệu trong mỗi nhóm; Association: bài toán khi chúng ta muốn
khám phá ra một quy luật dựa trên nhiều đữ liệu cho trước
Semi-Supervised Learning (Học bán giám sát)
Các bài toán khi chúng ta có một lượng lớn dữ liệu nhưng chỉ một phần trong chúng
được gán nhãn được gọi là Semi-Supervised Learning Những bài toán thuộc nhóm này nằm giữa hai nhóm được nêu bên trên
Trang 21Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Reinforcement Learning (Học Củng Cố)
Reinforcement learning là các bài tốn giúp cho một hệ thống tự động xác định hành vi
dựa trên hồn cảnh để đạt được lợi ích cao nhất (maximizing the performance) Hiện tại,
Reinforcement learning chủ yếu được áp dụng vào Lý Thuyết Trị Chơi (Game Theory), các
thuật tốn cần xác định nước đi tiếp theo để đạt được điểm số cao nhất
Phân nhĩm dựa trên chức năng [13, 14]:
Thuật tốn hồi quy
Thuật tốn dựa trên sơ đồ Thuật tốn chính quy
Thuật tốn Bayesian
Thuật tốn phân cụm
Thuật tốn Nơ ron nhân tao
Thuật tốn kết hợp ensemble model
2.1.4 Các thuật tốn phố biến, ensemble
Danh sách các thuật tốn machine learning phố biến [14]:
e Phương thức phân loại thuật tốn machine learning của Nạve Bayes
Nĩi chung, sẽ rất khĩ và gần như là khơng thê để phân loại trang web, tài liệu, email hay các ghi chú văn bản dài khác theo cách thủ cơng Vì vậy, chúng ta sẽ cần tới
thuật tốn Nạve Bayes ClassifIer Machine Learning
Ngồi ra, trình phân loại là hàm phân bổ giá trị phần tử của một tập hợp Ví dụ, Spam Eiltering là một ứng dụng phơ biến của thuật tốn Nạve Bayes Do đĩ, bộ lọc spam ở đây là một trình phân loại vả gán nhãn “Spam” hoặc “Not Spam” cho tất cả các email Về cơ bản, nĩ là một trong những phương pháp machine learning phơ biến nhất
được nhĩm lại theo những điểm giống nhau và hoạt động dựa trên định lý Bayes về
Trang 22Nói chung, K-means là một thuật toán machine learning không giám sát để
phân tích cụm Ngoài ra, K-Means là một phương pháp không xác định và lặp lại Bên
cạnh đó, thuật toán hoạt động trên một tập dữ liệu đã cho thông qua một số cụm được
xác định trước, k Do đó, đầu ra của thuật toán K Means là cụm k với dữ liệu đầu vào
được phân tách giữa các cụm
e _ Thuật toán machine learning Support Vector
Về cơ bản, nó là một thuật toán machine learning được giám sát đề phân loại
hoặc giải quyết các vấn đề hồi quy Nói cách khác, SVM có thê phân loại bat ky dữ liệu
mới nào Ngoài ra, nó hoạt động bằng cách phân loại dữ liệu vào các class khác nhau vì
vậy mà còn được sử dụng dé tach các dataset thanh class Hơn nữa, SVM còn cỗ găng tôi đa hóa khoảng cách giữa các class khác nhau SVM được phân thành hai loại: SVM tuyến tính — Về cơ bản, trong dữ liệu đào tạo phải được phân loại riêng bằng siêu mặt phang (hyperplane)
SVM phi tuyén tinh- Vé co ban, ban sé khong thể tách dữ liệu đào tạo bằng siêu mặt phang (hyperplane)
Support Vector Machine (SVM) 1 m6t thuật toán được Vapnik giới thiệu lần đầu tiên
năm 1995 [15] Phương pháp học có giám sát này là tạo những điểm (vector) bằng các hàm ánh xạ đầu vào — đầu ra bằng các tập huấn luyện Hàm này dùng để phân loại và
dé tính toán hồi quy Thông thường, tính toán hồi quy được sử dụng Support Vector Regression (SVR) — một biến thể của SVM, để tìm hàm f(x) với sai số £ so với mục tiêu thực sự cần tìm y¡ cho tat cả các dữ liệu huẫn luyện [16] Dữ liệu đầu vào đầu tiên được ánh xạ trong không gian m chiều bằng hàm chức năng như sau [16]:
f (x, @) =(@,x)+b VOl x,b 6 + (2.1) Ham f(x) được xem là tốt có thể tính dựa hàm mất mát L(x):
Oif y—f(x%,w)<e 2.2
L(x, @) =[y, f(x, @)] -|
Trang 23Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Hinh 2.1 Minh hoa Support Vector Regression [16]
Mô hình SVR sử dụng tham số £ được dùng để tính hàm hồi quy trong một không
Trang 24Về cơ bản, nó là một thuật toán machine learning không giám sát được sử dụng
để tạo ra các quy tắc kết hợp từ một tập dữ liệu đã cho Ngoải ra, quy tắc kết hợp
ngụ ý răng nếu một mục A xảy ra, thì mục B cũng xảy ra với một xác suất nhất
định
Hơn nữa, hầu hết các quy tắc kết hợp được tạo ra đều ở định dạng IF_THEN
Cách thức mà thuật toán machine learning Apriori hoạt động: Nếu một tập hợp mục (item set) xảy ra thường xuyên thì tất cả các tập hợp con của tập hợp mục (item set) đó cũng xuất hiện thường xuyên và ngược lại
e_ Thuật toán machine learning hồi quy tuyến tính (Linear Regression Machine Learning Algorithm)
Nó cho thấy mối quan hệ giữa 2 biến Ngoài ra, cho thay sự thay đổi trong một
biến sẽ có tác động như thế nào đến biến khác Về cơ bản, thuật toán cho thay những tác động lên biến bị phụ thuộc vào biến độc lập Do đó, các biến độc lập có
thé được xem như là các biến giải thích vì chúng cho biết các yếu tô tác động đến
biến bị phụ thuộc
Multiple linear regression (LR): mô hình hồi quy đa biến là mở rộng của mô hình hồi quy đơn giản, nhằm xác định mối quan hệ giữa hai hay nhiều biến [17] Công thức chung của LR [18]:
i=1
Với Y là thông số đầu ra, hay gọi là giá trị hồi quy; /đ,, / lần lượt là hằng số và
hệ số hồi quy; £ là sai số, X là biến đầu vào
e Thuật toán machine learning cây quyết định (Decision Tree Machine Learning Algorithm)
Về cơ bản, thuật toán sử dụng phương pháp phân nhánh để minh họa tất cả các
kết quả có thể có của một quyết định Với phần thân chính là đại diện cho một test
lên các thuộc tính, cành là kết quả và lá chính là một class label
Trang 25Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Mô hình cây phân loại và hồi quy (Classification and regression trees- CART) là
phương pháp cây quyết định hỗ trợ cho việc phân loại hoặc hồi quy [16] Quy tắc cơ
bản của CART là phân chia dữ liệu thành 2 tập con với tập con mới này có mức
đồng nhất và rõ ràng hơn tập con trước đó [16] Mỗi nút gốc đại điện cho một biến
đầu vào và phân chia làm 2 nhánh, mỗi nhánh chưa một biến đầu ra [ 19]
XI<0.028 (42.02)
X2<0.038 0.1 (16.5)
Hình 2.2 Cấu trúc mô hình cây phân loại [20]
© Thuật toán Machine Learning rừng ngấu nhiên (Random Forest Machine Learning Algorithm)
Đây là thuật toán sử dụng phương pháp đóng gói để tạo ra một loạt các cây quyết định với một subset dữ liệu ngẫu nhiên Vì vậy nên chúng ta phải đào tạo
một mô hình nhiều lần trên mẫu ngẫu nhiên của tập dữ liệu Tuy nhiên, bạn sẽ
cần đạt được hiệu suất dự báo tốt từ thuật toán rừng ngẫu nhiên Ngoài ra, trong
phương pháp học tập toàn bộ này, chúng ta phải kết hợp đầu ra của tất cả các
cây quyết định đề đưa ra dự đoán cuối cùng
e© Thuật toán học tập hôi quy logistic (Logistic Regression Machine Learning Algorithm)
Trang 26
Nói chung, tên của thuật toán này có thể hơi dễ nhằm lẫn vì nó chỉ tập trung
vào nhiệm vụ phân loại và các vấn đề không phải là hồi quy Hơn nữa, thuật toán này áp dụng một hàm hậu cần (logistic function) cho mét sự két hop cac tính năng tuyến tính với khả năng cần phải phân loại được một biến bị phụ
thuộc
e Mang than kinh nhân tao
Mang thần kinh nhan tao Artificial neural network (ANN) 1a mé hinh bat chuéc
cách làm việc của bộ não con người đề thực hiện việc “học tap” (learning) va
dự đoán, dựa trên sự học tập sinh học và có cau trúc tương tự như mạng nơ-ron
của con người Mạng nơ-ron sử dụng các nơ-ron liên kết với nhau với đầu vào, trọng số tiếp nhận, đầu ra và sai số Các nơ-ron kết nối với nhau bằng trọng số mạng no-ron [16]
Mang no-ron lan truyén ngược được sử dụng rộng rải và hiệu quả Sự hoạt
động của mỗi nơ-ron trong lớp đầu ra ân được tính với công thức (2.5), trong quá trình học thì mạng lan truyền ngược lưu trữ những điểm mạnh Trọng số kết nối được điều chỉnh trong suốt quá trình huấn luyện để đưa ra giá trị dự đoán gần với giá trị yêu cầu Do đó mạng lan truyền ngược được sử dụng có hiệu quả trong quá trình huấn luyện
1
net, = 3_,wUO, & y, = ƒ (met,)= lem (2.5) Voi net, 1a sy kich hoat no-ron thir k, j 1a tập hợp các nơ-ron ở lớp trước đó, w„ là
trọng số liên kết giữa noron thứ k và nơron thứ j O; là giá trị đầu ra của no ron j; va yx
là hàm truyền tín hiệu đầu ra [18]
Trang 27Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Hinh 2.3 Cau tritc cha ANN Công thức cho việc huấn luyện và cập nhật trọng số sau mỗi vòng lặp thứ t [18]:
Ensemble
Phương pháp ensemble là mô hình được tông hợp từ nhiều mô hình con (weaker model) được huấn luyện độc lập Kết quả dự đoán cuối cùng dựa trên kết quả “bỏ
phiếu” của từng mô hỉnh con đó cho kết quả đầu ra [21]
Các thuật toán cải tiến cho phương pháp này thường nhắm tới cách làm thế nào đề lấy mẫu huấn luyện hiệu quả cho từng mô hình con và làm thế nảo để lựa chọn các mô hình con sao cho chúng kết hợp lại có thể tạo ra kết quả dự đoán tốt nhất Một số kĩ
thuật esemble [21]:
Trang 28
Boosting Bootstrapped Aggregation (Bagging) AdaBoost Stacked Generalization (blending)
Gradient Boosting Machines (GBM) Random Forest
Gradient Boosted Regression Trees (GBRT)
Phương pháp, hay mô hình kết hợp (ensemble) là một kỹ thuật máy học bằng cách kết
hợp các mô hình cơ sở dé tao thành mô hình dự đoán tốt hơn [22] Một số cách để tăng hiệu suất các mô hình tốt hơn là giảm phương sai (bagging), giảm sai lệch (boosting)
và cải thiện dự đoán (stacking) [23]
Voting (Bỏ phiếu)
Voting là phương pháp kết hợp đơn giản bằng cách kết hợp những mô hình phân loại thông qua bỏ phiếu đa số hoặc lấy phần lớn Mục đích chính của việc kết hợp này à hiệu quả và chính xác [24] Averaging là phương pháp kết hợp lẫy trung bình các dự đoản giữa các mô hình Voting dùng cho mô hình phân loại còn Averaging dung cho
mô hình hồi quy [25]
Bagging (Dong goi)
Bagging 1A viét tat cua Bootstrap Aggregation, st dung bootstrap để tổng hợp lại thành
một mô hình [26]
Bagging (Bootstrap Ageregation) là phương pháp đơn giản và mạnh mẽ Bagsing là mô hình áp dụng phương pháp Boostrap cho thuật toán máy học có phương sai cao [27]
Boostrap là cách lấy ngẫu nhiên các tập hợp con của dữ liệu từ một bộ dữ liệu gốc và có
thay thế Xác suất lẫy ngầu nhiên 1a như nhau
Trang 29Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Hinh 2.4 Vi du vé Boostrap[27]
Trinh tu cua Bagging như sau: [28]
© Lay mau (tap con T)) tir tap dé liéu ban đầu T cách ngẫu nhiên có thay thế
(Boostrap)
e Cac tập con được chọn để tạo mô hình đào tao
e _ Tổng hợp các mô hình con này lại thành một mô hình đã được đào tạo bằng cách bỏ phiếu hoặc lây trung bình
Stacking - Stacked Generalization (Xếp chông)
Stacking được đưa ra bởi Wolert năm 1992 [29], kỹ thuật học máy kết hợp bằng cách
tông hợp các mô hình phân loại hoặc hồi quy với các mô hình phân loại, hồi quy thứ
cấp Mô hình ban đầu được đào tạo và dữ liệu đầu ra của mô hình ban đầu được đưa
vào đào tạo mô hình thứ cấp [23]
Quy trình của Stacking như sau [30]:
e _ Phân chia tập dữ liệu thành 2 phân riêng biệt
e _ Huấn luyện mô hình cơ sở bằng phân thứ nhất
Trang 30
e _ Kiếm tra lại mô hình cơ sở (được huấn luyện) bằng phần thứ 2
® Sử dụng các kết quả dự đoán ở bước 3 ở trên làm dữ liệu đầu vào và
đưa vào mô hình thứ cấp
2.2 Tình hình nghiên cứu:
Có nhiều tác giả đã có các nghiên cứu về các nhân tô ảnh hưởng trong việc sử dụng năng lượng, một vài ví dụ như tác giả Koen Steemers và cộng sự đã nghiên cứu về tiêu thụ
năng lượng của hộ gia đình [31] năm 2009, Parasonis và các cộng sự đã có nghiên cứu về giải
pháp kiến trúc để tăng hiệu quả năng lượng trong tòa nhà [32] năm 2012, Ali Najmi va các cộng sự đã nghiên cứu những nhân tố tác động đến sử dụng năng lượng trong căn hộ chung cư [33] năm 2014,
Về việc áp dụng các thuật toán trí tuệ nhân tạo trong việc dự báo mức tiêu thụ năng
lượng đã có nhiều tác giả trên thế giới áp dụng các thuật toán này trong việc nghiên cứu, dự báo kết quả Một vài ví dụ tiêu biéu như Bing Dong đã áp dụng máy hỗ trợ vectơ để du báo mức tiêu thụ năng lượng ở vùng nhiệt đới năm 2005 [34] , Qiong Li đã dùng các mang no ron thần kinh nhân tạo đề mô hình dự báo mức tiêu thụ năng lượng hàng năm của các tòa nhà chung cu nam 2010 [35], Jui-Sheng Chou và các cộng sự đã áp dụng các thuật toán machine
learning để dự báo về cường độ bê tông, mức tiêu thụ năng lượng từ năm 2013 đến 2018 [16,
18, 36] , .Amber và cộng sự đã dùng các kỹ thuật thông minh để dự báo mức năng lượng tiêu thụ của tòa nhà năm 2018 [37], Mohandes và cộng sự đã đánh giá toàn diện về ứng dụng mạng
nơ ron nhân tạo trong phân tích năng lượng năm 2019 [38], Ngoc-Tri Ngo đã công bố bài báo
“Dự đoán sớm tải làm mát cho thiết kế tiết kiệm năng lượng trong các tòa nha văn phòng bằng
học máy (Machine learning) năm 2019 [39]
Bảng 2.1 Tóm tắt tình hình nghiên cứu các tác giả liên quan
L4 aA aA Ak -
STT Tác gia Tên đề tài thương pháp nghiên cứu Mục feu, Ket qua nghiên cứu
Thu thập dữ liệu năng — | Cho thấy các yêu tô TA 2 , kinh tê, xã hội cũng
Koen Household energy | lượng từ nhà ở theo các kok 3 , ảnh hưởng đên khả , , k ;
1 Steemers, consumption: a yéu to ảnh hưởng năng tiêu thu năn
Geun Young | study of the role of | Phân tích thông kê các g ten ẽ Yun (2009) | occupants yếu tô và mối liên hệ giữa lượng, bên cạnh các
s Ộ yêu tô chính là đặc
các yêu †ö diém cua nha 6 ©Ä › vã
Trang 31
Luận văn tốt nghiệp GVHD: T§ Trần Đức Học
STT Tác giả Tên đề tài Phương pháp nghiên Mục teu, ket qua
Architectural Đưa ra được môi quan
Parasonis và | Solutions to Ạ kiên trúc của tòa nhà và ho 2232 LÀ " rộng, diện tích nhà và A ¬w + <a
2 | cộng sự Increase the Energy tác động của nó đên hiệu | môi liên quan giữa ||, „ ne ak aon Ấ: 1A + (2012) Efficiency of Buildings quả năng lượng vo chúng đôi với hiệu quả , ke pean ,
tiêu thụ năng lượng
Energy Bảng khảo sát thu thập we ra cae nhan to của Najmi Ali consumption in the | các dữ liệu vê đặc điêm nó Dòng thời du báo
3 | và cộng sự residential sector: a | căn hộ bin m ô hình hồi qu
(2014) study on critical Phân tích độ tin cay, md | „ ề tiêu thu ning y
factors hinh hoi quy lượng của 13 nhân tố
Đưa ra mô hình SVM
Applying support Thu thập dữ liệu năng dự báo Trức neu th ụ ` ` năng lượng với các Dong Bing | vector machines to | lượng từ 4 toàn nhà ở SA a4: thông sô, hệ sô tương nh pa ak
(2005) energy consumption | Su dung SVM dé dy bao Son ánh đô chính xác
1n tropical region mức tiêu thụ năng lượng so với mô hình mạng bt oa 4s
nơ ron và lai phép Qiong Li và Prediction model of | Sử dụng mô hình ANNs | Dưa ra mô hình dự báo
5 loôn a annual energy va SVM dé du bao mức | SVM và so sánh sai sô (2 0 10) consumption of tiêu thụ năng lượng trong | toàn phương trung bình
residential buildings | căn hộ chung cư cua SVM so véi ANNs
Enhanced artificial cường độ bê tông kết hợp Sử dụng bộ đữ liệu _ ° Đưa ra các mô hình, on k ` intelligence for res Saree m6 hinh két hop va với sử dụng các mô hình nk oe Chou Jui- ensemble approach dư báo trí tuê nhân tao: hiệu suât dự báo của
6 cộng sự ˆ performance ANNs, CART, LR, CHAID GEIIN SVMs Đê xuât phương pháp hk ,
(2013) concrete Kếth 'các mô hình với xác thực chéo trong
nhau đê cho hiệu suât dự TA
strength bao tot hon , XÃ ligu
Modeling heating Su dun g dữ | ven cua toa Đưa ra các mô hình dự
Chou Jui- and cooling loads 2+ TA X1 ẰẲ , | bao va hiéu suat du bao
7 cộng sự ˆ intelligence for nó băng việc sử dụng các ^ tà t2 1z 43 1EA So sánh tôc độ xử lý 4 4k aR 2 TỰ (2014) energy-efficient mô hình khai phá dữ liệu, may tính giữa các mô
building design | đườáấo ANN,CARI, | oh, GLR, SVR, Ensemble
Trang 32
Phương pháp nghiên Mục tiêu, kết quả
Su dung phuong phap Forecasting energy hybid ensemble két hop consumption time gitta LSSVR (last square
Chou Jui- series using và thuật toán tìm kiếm tối Đưa ra mô hình kết hợp
8 Sheng va machine learning wu PSO dé dự báo mức hybid ensemble voi
cộng sự techniques based on tiêu thụ năn lươn hiệu suât dự báo tôt
(2018) usage patterns of residential Chạy các mô hình dự báo pans ene | nhất
householders năng lượng đơn, 2
ensemble, SAMIRA dé
so sánh
rate gent for Sử dụng các mô hình Đưa ra mô hình và các
Amber, K P forecasin MR, GP, DNN, SVM, hiệu suất Mô hình
9| và cộng sự electricit 5 ANN đê dự báo mức tiêu ANN có kêt quả tôt (2018) consum on of thy dién So sanh hiéu nhât ứng với trường
buil dings suât giữa các mô hình hợp nghiên cứu
Sử dụng đữ liệu có thu
Early predicting thập để đưa vào mô hình er ` cooling loads for dự báo Fas suấ fe me Ne
10 Ngo Ngoc- | energy-efficient Các mô hình dự báo gôm suất lữa các mô hình
Tri design in office ANNs, CART, LR, SVR | 2'Ẽ che
buildings by Các mô hình kết hợp Mê hình dự báo tôt nhât là Bagging ANNs
Trường hợp nghiên cứu của luận văn, phương pháp nghiên cứu là sử dụng bảng câu hỏi
để thu thập dữ liệu về mức độ ảnh hưởng các nhân tô ảnh hưởng đến mức tiêu thụ năng lượng
trong ca hé chung cu Tiép đến, luận văn áp dụng 4 mô hình machine learning là ANN, CART,
LR, SVM, các mô hình kết hợp ensemble gitta cac m6 hinh don (Voting, Bagging, Stacking) và có sử dụng kết hợp bằng trọng số giữa hai mô hình có hiệu suất dự báo tốt nhất (trình bày ở chương 4) Sau cùng, mô hình dự báo với hiệu suất tốt nhất được
để xuất nhằm làm một công cụ tham khảo cho các nhà quản lý khi đưa ra các quyết định liên quan
Trang 33Luận văn tốt nghiệp GVHD: TS Trần Đức Học
CHƯƠNG 3: : PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Quy trình nghiên cứu:
THU THAP TU XAC DINHCAC NHAN TO
CAC NGUON TAI —_y ẢNH HƯỞNG ĐỀN VIỆC TIÊU
LIỆU TRONG VÀ THỤ NĂNG LƯỢNG ĐIỆN
NGOÀI NƯỚC TRONG CĂN HỘ
THAM KHAO Y KIEN NHUNG
<q-——- CHUYEN GIA,
NGƯỜI CÓ KINH NGHIỆM
Trang 34
Quy trình nghiên cứu được chia làm 2 giai đoạn, giải quyêt 2 mục tiêu của luận văn nêu
ra Giai đoạn 1 cân giải quyêt vân đê là tìm ra những nhân tô thực sự ảnh hưởng đên việc tiêu
thụ năng lượng điện trong căn hộ chung cư
Bước 1: Thu tập từ các tài liệu trong và ngoài nước, chọn ra các nhân tố “thô” ảnh hưởng đến mức tiêu thụ năng lượng trong căn hộ/ tòa nhà Song song với đó là việc tham khảo
các ý kiến chuyên gia trong lĩnh vực xây dựng, năng lượng, kiến trúc, phát triển bền vững
Bước 2: Sau khi tìm ra được những nhân tô ở bước 1, tiến hành xây dựng bảng khảo
Bước 3: Tiến hành khảo sát thu thập dữ liệu
Bước 4: Xử lý dữ liệu thu thập được và tiễn hành phân tích để đưa ra được bảng các
nhân tố ảnh hưởng, giải quyết được mục tiêu 1 đề ra Cũng từ đây, kết quả cũng đưa ra được
các nhân tố ảnh hưởng nhiều đến việc tiêu thụ năng lượng điện trong căn hộ chung cư Các
nhân tố này phục vụ cho giai đoạn 2, giai đoạn xây dựng mô hình thuật toán để dự báo mức tiêu thụ năng lượng
Ở giải đoạn 2, từ bảng các nhân tô chính tìm được ở Bước 4 (giai đoạn 1), luận văn tiếp
tục tiễn hành các bước như sau:
Bước 1: Thiết kế bảng câu hỏi khảo sát đề thu thập những dữ liệu định lượng
Bước 2: Tiến hành khảo sát và thu thập dữ liệu và xử lý dữ liệu
Bước 3: Áp dụng vào thuật toán/ mô hình trí tuệ nhân tạo
Bước 4: Đưa ra mô hình dự báo (mục tiêu 2)
Sau khi thực hiện xong 2 giai đoạn, đưa ra nhận xét và kết luận
Trang 35Luận văn tốt nghiệp GVHD: T§ Trần Đức Học
3.2 Thu thập dữ liệu và phân tích:
3.2.1 Xác định các nhân tố ảnh hướng đến việc sử dụng điện trong căn hộ chung cư:
Như đã trình bày ở quy trình nghiên cứu, sau khi tổng hợp được các nhân tố từ các
nguôn khác nhau cũng như tham khảo các ý kiên chuyên gia, luận văn đã xác định các nhân tô
như Bảng 3.1
Bảng 3.1 Các nhân tổ ảnh hưởng đến mức tiêu thụ điện trong căn hộ chung cư
[11]
3 fTéc dé gid (cap gió) 13 [40], [41], [31]
5 Số lượng máy điêu hòa sử dụng I1 [33], [42]
6 Tuôi đời đã sử dụng của máy điều hòa I2 [33] [42]
8 _ Số lượng máy làm nóng nước sử dụng I4 [33] [42]
9 Tuôi đời đã sử dụng của máy làm nóng nước IL5 [33], [42]
13 |uôi đời sử dụng của tủ lạnh IL9 [33], [42]
14 |ỗ lượng tivi và máy tính sử dụng II.10 [33], [42]
15 _ Số lượng lò nướng, bếp điện sử dụng I1 [33] [42]
16 Vị trí tọa lạc của tòa nhà ILI Chuyên gia, [33]
[41]
17 |Kích thước (chiều ngang, chiều sâu) tòa nhà I2 [16], [11]
18 Diện tích mặt bằng của tòa nhà I3 [16], [31]
Trang 36
Câu kiện che bóng (mái hiên, lam chan nang, )
21 III.6 [11]
cua toa nha
22 Số lượng căn hộ trong tòa nha HL7 Đê xuất
24 Mặc điểm tường bao ngoài của tòa nhà 9 [32], [11] Việc sử dụng thiết bị cung cap năng lượng sạch
của tòa nhà
26 Mức độ tiện nghi của tòa nhà HIL11 Chuyên gia
27 Tông diện tích của căn hộ IV.1 [33], [31]
Chiêu cao trân (chiêu cao thông thủy) của căn vs
hộ
29 Sô lượng cửa sô của căn hộ IV.3 [33], [31], [40]
30 |Hướng cửa số của căn hộ IV.4 Chuyên gia, [11]
31 |Loại kính cửa sô của căn hộ IV.5 Chuyên gia, [33]
32 Màu kính cửa sô của căn hộ IV.6 [33], [11]
Việc sử dụng các cảm biên người (occupancy
sensors) dé bat tát thiệt bi trong căn hộ
3.2.2 Thiết kế bảng câu hồi, thu thập dữ liệu:
Luận van chia lam 2 giai doan thu thập dữ liệu, giai đoạn 1 là khảo sát các ý kiến của những người có kinh nghiệm trong lĩnh vực xây dựng, kiến trúc, năng lượng, phát triển bền vững để tìm ra sự ảnh hưởng của các nhân tô đến việc sử dụng năng lượng điện trong căn hộ Trong khi đó, giai đoạn 2 là phát triển từ giai đoạn 1, thu thập dữ liệu định lượng Cụ thể, các nhân tô ảnh hưởng nhiều từ giai đoạn 1, được chọn lọc và xây dựng bảng câu hỏi hướng dén những cư dân sống trong các căn hộ chung cư (khu vực thành phố Hỗ Chí Minh)
Trang 37Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Bảng 3.2 Thang điểm đánh giá mức độ ảnh hưởng các nhân tổ
quan liên quan | I3 Tốc độ gió (cấp gió) L3
đến khíhậu |T 4 Bức xạ mặt trời L4
I2 Tuổi đời đã sử dụng của máy điều hòa H2
I4 Số lượng máy làm nóng nước sử dụng IL4
H Nhóm các IIL5 Tuổi đời đã sử dụng của máy làm nóng nước IL5
II.8 Kích cỡ tủ lạnh sử dụng IL8
II.10 Số lượng tivi và máy tính sử đụng 11.10
I.11 Số lượng lò nướng, bếp điện sử dụng IL11
Ill Nhóm các | IH.1 VỊ trí tọa lạc của tòa nhà HLI nhân tố liên | IL2 Kích thước (chiều ngang, chiều sâu) tòa nhà HIL2
quan đến đặc | 111.3 Diện tích mặt bằng của tòa nhà 111.3
Trang 38
III9 Đặc điểm tường bao ngoài của tòa nhà II9 II.10.Việc sử dụng thiết bị cung cấp năng lượng sạch của tòa
IV.2 Chiều cao trần (chiều cao thông thủy) của căn hộ IV.2
IV Nhóm các IV.3 Số lượng cửa số của căn hộ IV.3
điểm của căn IV.5 Loại kính cửa SỐ của căn hộ IV.5
ho IV.6 Màu kính cửa sô của căn hộ IV.6
IV.7 Việc sử dụng các cảm biến người (occupancy sensors) để bật tắt thiệt bị trong căn hộ IV.7
V.Nhómcác | V.2 Nhận thức về tiết kiệm năng lượng của người trong căn hộ | V.2
nhân tố khác | V.3 Đơn giá điện quy định của chung cư V.3
Giai đoạn 2:
Bảng câu hỏi giai đoạn 2 bao gồm các nhân tố được chọn lọc và được xây dựng thang
đo định lượng nhằm xác định được giá trị định lượng các nhân tố ảnh hưởng nhất (các nhân tô tìm được từ kết quả của giai đoạn 1), cụ thể kết quả sẽ được trình bày trong chương 4 Bảng
3.4 dưới đây là thể hiện các nhân tô và thang đo của chúng
Bảng 3.4 Các nhân tổ sử dụng cho khảo sát định lượng
Ký hiệu Nhân tô Nguôn Kiểu dữ liệu
XI Tổng diện tích Khảo sát (Số lượng)
X3 | Hướng chính cửa số Khảo sát Hướng (mã hóa)
_- ư (1) Cách nhiệt; (0)
X6 Số lượng lò nướng và bêp điện Khảo sát (Sô lượng)
X7 | Thểtích tủ lạnh Khảo sát (Số lượng)
Trang 39Luận văn tốt nghiệp GVHD: TS Trần Đức Học
Giai đoạn 2
Cũng giống như giai đoạn 1, kiểu lẫy mẫu thuận tiện Các bảng câu hỏi được gửi trực tiép và qua online đên người khảo sát là những cư dân sông trong các căn hộ chung cư (khu
vực TP Hồ Chí Minh)
3.2.3 Kiếm tra độ tin cậy thang đo và phân tích nhân tố:
Kiểm tra độ tin cây thang đo:
Những kết quả thu về được kiểm tra để loại bỏ những bảng bị thiếu dữ liệu hoặc dữ liệu không phù hợp Để đánh giá các mức độ chặt chẽ mà các mục hỏi trong thang đo tương quan với nhau thì kiểm định Cornbach alpha được sử dụng để giải quyết vấn đề này [43] Hệ
số cronbach”s alpha đo lường độ tin cậy năm trong khoảng từ 0 đến 1, với mức chấp nhận tối
thiêu 0.6-0.7 thì các mục hỏi trong thang đo được coi là sử dụng được [44] Hơn nữa, các mục hỏi nay được xem là tốt dùng để đo lường khi hệ số cronbach”s alpha lớn hơn 0.8 [43]
Np
_—12 — trong đó ø là hệ số tương isp) § 40 pla he 8q quan trung bình
Công thức của hệ số alpha [43]: œ =
giữa các mục hỏi, N là sô mục hỏi
Trang 40
Các tham số phân tích nhân tổ:
Bartlett's test of sphericity: đại lượng Bartlett là một đại lượng thông kê dụng để xem
xét giả thuyết các biến không có tương quan tổng thể Điều kiện cần để áp dụng phân tích
nhân tổ là các biến phải có tương quan với nhau [43]
Correlation matrix (ma trận tương quan): cho biết hệ số tương quan giữa các cặp biến trong phân tích [43]
Eigenvalue: dai dién cho phan biến thiên được giải thích bởi mỗi nhân tô [43] Eigenvalue dugc cho 1a pht hop khi nó phải lớn hon 1 [44]
Factor loadings (hé s6 tai nhân tố): là những hệ số tương quan don giữa các biến và các
nhân tố[43] Hệ số tải này là mức đảm bảo ý nghĩa khi phân tích nhân tố khám phá
(Exploratory Factor Analysis) Giá trị của hệ số này tùy thuộc vào cỡ mẫu, được quy định trong bảng dưới đây [44]:
Bang 3.5 Hé sé factor loading trong phân tích EFA dựa theo số lượng mẫu
Factor Loading Số lượng cỡ mẫu
0.30 350 0.35 250 0.40 200 0.45 150 0.50 120 0.55 100 0.60 85 0.65 70 0.70 60 0.75 50
Kaiser-Meyer-Olkin (KMO): 1a chi số dùng để xem xét sự thích hợp của phân tích
nhân tố Trị số của KMO lớn (giữa 0.5 va 1) là điều kiện đủ để phân tích nhân tố là thích hợp
[43]
Trong quá trình phân tích nhân tô với các nhân tố có hệ số tải < hệ số tải cho trước
(theo kích thước mẫu) đều được loại vì xem như lả không có ý nghĩa trong phân tích Các nhân
tố lần không đảm bảo tính cấu thành một nhóm nhân tố (tối thiêu 3 nhân tố) thì sẽ bị loại [45]