NHIỆM VỤ LUẬN VĂN: Luận văn bao gồm các nội dung sau: Giới thiệu, Tổng quan, Phương pháp nghiên cứu và công cụ nghiên cứu; Thu thập và xử lý số liệu; Tối ưu trọng số, lập và kiểm chứ
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA
-
LÊ XUÂN KHÁNH
ƯỚC LƯỢNG CHI PHÍ XÂY DỰNG CỦA CÁC CÔNG TRÌNH TRƯỜNG HỌC BẰNG LẬP LUẬN DỰA VÀO TÌNH HUỐNG (CASE - BASED REASONING_ CBR)
Chuyên Ngành : QUẢN LÝ XÂY DỰNG
LUẬN VĂN THẠC SĨ
TP HOÀ CHÍ MINH, Tháng 01 năm 2016
Trang 2TRƯỜNG ĐẠI HỌC BÁCH KHOA TP HỒ CHÍ MINH Cán bộ hướng dẫn khoa học: TS LÊ HOÀI LONG
Cán bộ chấm nhận xét 1: PGS.TS PHẠM HỒNG LUÂN
Cán bộ chấm nhận xét 2: PGS.TS LƯU TRƯỜNG VĂN
Luận văn thạc sĩ được bảo vệ tại Trường Đại học Bách Khoa, ĐHQG Tp HCM ngày 24 tháng 01 năm 2016
Thành phần Hội đồng đánh giá luận văn thạc sĩ bao gồm:
(Ghi rõ họ, tên, học hàm, học vị của Hội đồng chấm bảo vệ luận văn thạc sĩ)
Trang 3KHOA KỸ THUẬT XÂY DỰNG Độc Lập - Tự Do - Hạnh Phúc
Tp HCM, ngày 24tháng 01 năm 2016
NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ và tên học viên: LÊ XUÂN KHÁNH
Ngày, tháng, năm sinh: 10-12-1988
Chuyên ngành: QUẢN LÝ XÂY DỰNG
Mã học viên: 13080026 Nơi sinh: KHÁNH HÒA
Mã ngành: 60.58.03.02
1 TÊN ĐỀ TÀI: ƯỚC LƯỢNG CHI PHÍ XÂY DỰNG CỦA CÁC CÔNG TRÌNH TRƯỜNG HỌC BẰNG LẬP LUẬN DỰA VÀO TÌNH HUỐNG
2 NHIỆM VỤ LUẬN VĂN: Luận văn bao gồm các nội dung sau:
Giới thiệu, Tổng quan, Phương pháp nghiên cứu và công cụ nghiên cứu;
Thu thập và xử lý số liệu; Tối ưu trọng số, lập và kiểm chứng mô hình CBR; Chương trình ứng dụng ƯLCPXD đối với một công trình trường học bất kì ngoài thực tế;
Kết luận và kiến nghị
3 NGÀY GIAO NHIỆM VỤ: 06 -07- 2015
4 NGÀY HOÀN THÀNH NHIỆM VỤ: 24-01-2016
5 HỌ VÀ TÊN CÁN BỘ HƯỚNG DẪN:
GVHD1: TS ĐINH CÔNG TỊNH, GVHD2: TS LÊ HOÀI LONG
Nội dung và đề cương Luận văn thạc sĩ đã được Hội Đồng Chuyên Ngành thông qua
Trang 4Luận văn Thạc sĩ kỹ thuật với đề tài “Ước lượng chi phí xây dựng của các công trình trường học bằng lập luận dựa vào tình huống” được thực hiện với kiến thức
lĩnh hội trong suốt quá trình học tập tại trường Cùng với sự cố gắng của bản thân là sự giúp đỡ, động viên của các thầy cô, bạn bè, đồng nghiệp và gia đình trong suốt quá trình học tập và thực hiện luận văn
Tôi xin gởi lời cảm ơn chân thành đến TS Đinh Công Tịnh đã cho tôi những kiến
thức bổ ích về Chi phí xây dựng công trình thông qua môn Định giá trong xây dựng do
thầy giảng dạy; TS Lê Hoài Long đã nhiệt tình hướng dẫn, động viên tôi trong suốt quá
trình thực hiện luận văn
Xin gửi lời cảm ơn đến quý thầy cô bộ môn Thi Công và quản lý xây dựng, những người đã cho tôi những kiến thức và kinh nghiệm quý báu trong suốt quá trình học tập tại trường
Xin gửi lời cảm ơn đến các học viên chuyên ngành Quản Lý Xây Dựng khóa 2013, những người bạn đã đồng hành và giúp đỡ tôi trong suốt quá trình học
Xin gửi lời cảm ơn đến các đồng nghiệp Trung tâm Thông tin và Dịch Vụ Xây dựng thành phố Hồ Chí Minh những người đã tạo điều kiện và giúp đỡ rất nhiều trong suốt quá trình thu thập dữ liệu thực hiện luận văn
Cuối cùng, tôi xin cảm ơn vợ, gia đình đã động viên và tạo điều kiện tốt nhất cho tôi trong những năm tháng học tập tại trường
Luận văn được hoàn thành nhưng không thể tránh được những thiếu sót và hạn chế Rất mong nhận được sự đóng góp của quý thầy cô, bạn bè và đồng nghiệp để luận văn được hoàn thiện và có ý nghĩa thực tiễn
Trân trọng!
T.P Hồ Chí Minh 24 tháng 01 năm 2016
Lê Xuân Khánh
Trang 5Luận văn đề cập đến việc ước lượng chi phí xây dựng ở giai đoạn đầu của dự án nhằm đảm bảo chi phí của dự án được đáp ứng Luận văn này nghiên cứu việc ước lượng sớm chi phí xây dựng có thể của dự án bằng cách sử dụng Trí tuệ nhân tạo Để đạt được mục tiêu này, mô hình lập luận theo tình huống (Case base reasoning_CBR) được phát triển và định dạng thành bảng tính Bộ trọng số thuộc tính của mô hình CBR được thiết lập bằng phương pháp giải thuật di truyền (Genetic algorithms_GA)
Cơ sở dữ liệu được thu thập từ 27 công trình trường học đã và đang thực hiện tại thành phố Hồ Chí Minh Trong đó dùng 24 công trình để huấn luyện, 3 công trình dùng
để thử nghiệm Kết quả cho thấy độ chính xác cao, bằng phương pháp sử dụng giải thuật di truyền (GA) để xác định bộ trọng số đưa vào bảng tính CBR thì kết quả chính xác lên đến 93,82%
Từ kết quả tính toán, lập công cụ ước lượng chi phí xây dựng công trình trường học dựa trên chức năng Record Macro trong Excel 2013 nhằm giúp cho tư vấn thiết kế, chủ đầu tư, nhà thầu, cơ quan quản lí nhà nước về chi phí có thêm một công cụ ước tính chi phí xây dựng công trình xây dựng ngay cả khi chưa có thiết kế chi tiết
ABSTRACT
Thesis refers to predict construction costs in the early design stages in order to make sure that target costs are met This study investigates the possibility of predicting the cost of construction early in the design phase by using Artificial intelligence To achieve this objective, case based reasoning (CBR) prediction model was developed in
a spreadsheet-based format Model CBR’s a set of the attribute weights was established
by genetic algorithms method
The database was collected from 27 school projects was and is being carried out
in Ho Chi Minh city Being randomly split into an input set containing 24 projects, and
a test set containing 3 projects The result was high prediction accuracy, using GA method to establish a set of the attribute weights, being input into the CBR-Excel application with an accuracy to 93,82%
From the computation results, a school building construction costs estimation tool is established by Record Macro function in Excel 2013 to help Engineering Consultants, Investors, Bidders, Cost’s State management agency have added an updated a school building construction costs estimation tool even before having detailed design
Trang 6Tôi xin cam đoan Luận văn này hoàn toàn do tôi thực hiện
Tất cả các tài liệu tham khảo, tài liệu trích dẫn, số liệu khảo sát đều chính xác, trung thực và có nguồn gốc cụ thể trong phạm vi hiểu biết của tôi
Tp HCM, ngày 24 tháng 01 năm 2016
Lê Xuân Khánh
Trang 7CHƯƠNG 1: GIỚI THIỆU 1
1.1 Cơ sở hình thành đề tài: 1
1.2 Mục tiêu nghiên cứu: 1
1.3 Phạm vi nghiên cứu: 2
1.3.1 Đối tượng nghiên cứu: 2
1.3.2 Phạm vi nghiên cứu: 3
1.4 Đóng góp dự kiến của nghiên cứu: 3
1.4.1 Về mặt học thuật: 3
1.4.2 Về mặt thực tiễn: 3
CHƯƠNG 2: TỔNG QUAN 4
2.1 Đặc điểm của công trình trường học 4
2.2 Ngoài nước: 4
2.2.1 Các nghiên cứu trước đây về lý thuyết CBR: 4
2.2.2 Các nghiên cứu trước đây về việc ứng dụng CBR để ƯLCPXD: 4
2.2.3 Các nghiên cứu trước đây về việc ứng dụng CBR để ƯLCPXD đối với các dự án Trường học: 7
2.3 Trong nước: 8
2.3.1 Các nghiên cứu trước đây về việc ứng dụng Giải thuật di truyền: 8
2.3.2 Các nghiên cứu trước đây về ƯLCPXD: 10
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU VÀ CÔNG CỤ NGHIÊN CỨU 12
3.1 Phương pháp nghiên cứu: 12
3.2 Công cụ nghiên cứu: 14
3.2.1 Phần mềm sử dụng: 14
3.2.2 Lý thuyết về thống kê dữ liệu sử dụng trong đề tài nghiên cứu 14
3.2.3 Lập luận theo tình huống (CBR): 14
CHƯƠNG 4: THU THẬP VÀ XỬ LÝ SỐ LIỆU 32
4.1 Chi phí xây dựng công trình trường học tại thành phố Hồ Chí Minh và các nhân tố ảnh hưởng 32
4.1.1 Từ các nghiên cứu đã thực hiện: 32
4.1.2 Các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học 33
Trang 84.3 Khảo sát các nhân tố ảnh hưởng 35
4.3.1 Phân tích thống kê mô tả 35
4.3.1.1 Mã hóa bảng câu hỏi 35
4.3.1.2 Đặc điểm của mẫu khảo sát 36
4.3.1.3 Phân tích các nhân tố ảnh hưởng đến chi phí xây dựng 40
4.4 Thu thập số liệu từ các công trình, dự án thực tế 43
4.4.1 Bảng thu thập dữ liệu: 43
4.4.2 Phương pháp thu thập và xử lý dữ liệu 44
CHƯƠNG 5: TỐI ƯU TRỌNG SỐ, LẬP VÀ KIỂM CHỨNG MÔ HÌNH CBR; CHƯƠNG TRÌNH ỨNG DỤNG ƯLCPXD ĐỐI VỚI MỘT CÔNG TRÌNH TRƯỜNG HỌC BẤT KÌ NGOÀI THỰC TẾ 50
5.1 Tối ưu trọng số 50
5.2 Lập và kiểm chứng mô hình CBR 51
5.2.1 Tổ chức và định dạng dữ liệu 51
5.2.2 Tính toán độ tương đồng của thuộc tính (TC1) 52
5.2.3 Tính toán độ tương đồng của thuộc tính (TC2) 53
5.2.4 Tính toán độ tương đồng của thuộc tính (TC3) 55
5.2.5 Tính toán trọng số độ tương đồng của tình huống cần ước lượng chi phí so với từng tình huống trong CSDL 56
5.2.6 Tính toán sai số giữa giá trị chi phí xây dựng ước lượng so với chi phí xây dựng trong tổng dự toán của dự án 57
5.3 Cơ sở xây dựng và mục tiêu chương trình 58
5.4 Sử dụng chức năng Record Macro trong Excel 2013 để xây dựng công cụ ước lượng chi phí xây dựng 58
5.5 Ứng dụng khi điều chỉnh dự án: 59
CHƯƠNG 6: KẾT LUẬN VÀ KIẾN NGHỊ 60
6.1 Kết luận mô hình ước tính chi phí xây dựng công trình trường học 60
6.2 Kiến nghị và hướng phát triển đề tài 62
TÀI LIỆU THAM KHẢO 63
PHỤ LỤC: 65
Trang 9Phụ lục 2: Biểu đồ Phân tích thống kê mô tả thể hiện đặc điểm của mẫu khảo sát 69
Đối với các biến định tính 69Đối với các biến định lượng 72
Phụ lục 3: Dữ liệu các công trình được thu thập 76
Phụ lục 4: Kết quả huấn luyện các case trong cơ sở dữ liệu để tìm trọng số bằng
roulette với các khe hở tỷ lệ với độ thích nghi 25Hình 3 6: Quy trình nghiên cứu tối ưu trọng số bằng giải thuật di truyền (Genetic
algorithm – GA 28Hình 3 7: Màn hình tối ưu các trọng số thuộc tính CBR bằng Evolver 29Hình 3 8: Ma trận độ tương đồng của tất cả các tình huống cần ước lượng chi phí xây dựng so với từng tình huống trong CSDL 30Hình 3 9: Kết quả xuất ra từ bảng tính CBR và tính sai số 30Hình 3 10: Trình tự các bước thực hiện xây dựng mô hình CBR (thực hiện ứng dụng CBR vào ƯLCPXD cho dự án Trường học ở Thành phố Hồ Chí Minh) 31
Trang 10Bảng 3 1 Các chuỗi của bài toán mẫu và các giá trị thích nghi 24
Bảng 4 1 Bảng tổng hợp các nhân tố ảnh hưởng đến chi phí xây dựng công trình trường học 33
Bảng 4 2 Vai trò của đối tượng khảo sát trong dự án 36
Bảng 4 3 Số năm kinh nghiệm 37
Bảng 4 4 Vị trí cao nhất của đối tượng khảo sát trong dự án 37
Bảng 4 5 Loại vốn của công trình đối tượng khảo sát tham gia nhiều nhất 38
Bảng 4 6 Loại công trình trường học đối tượng khảo sát tham gia nhiều nhất 38
Bảng 4 7 Kinh phí xây dựng lớn nhất của dự án mà đối tượng khảo sát tham gia 39
Bảng 4 8 Chứng chỉ hành nghề của đối tượng tham gia khảo sát 39
Bảng 4 9 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Quy mô công trình” 40
Bảng 4 10 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Vật liệu chính” 40
Bảng 4 11 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Phương án kết cấu” 41
Bảng 4 12 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Hệ thống kỹ thuật (M&E)” 41
Bảng 4 13 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Khoảng thời gian xây dựng” 42
Bảng 4 14 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Nguồn vốn công trình” 42
Bảng 4 15 Bảng trị giá trị trung bình, độ lệch chuẩn Nhóm yếu tố “Địa điểm xây dựng, quy mô cơ sở vật chất” 42
Bảng 4 16 Bảng tổng hợp dữ liệu các công trình, dự án thu thập 47
Bảng 4 17 Tổng hợp dữ liệu các công trình, dự án thu thập quy đổi về quý 4 năm 2014 49
Bảng 5 1 Bộ trọng số tối ưu đưa vào bảng tính CBR 51
Trang 11CHƯƠNG 1: GIỚI THIỆU
1.1 Cơ sở hình thành đề tài:
Theo con số thống kê của Bộ Xây dựng về tình hình thực hiện Chương trình Phát triển đô thị quốc gia giai đoạn 2012– 2020 cho thấy, tính đến hết quý II-2014, tỷ lệ đô thị hóa của nước ta đạt 33,9%, đa số tập trung trong và xung quanh thành phố Hồ Chí Minh và Hà Nội
Thành phố Hồ Chí Minh là một trung tâm kinh tế- văn hóa- xã hội lớn ở phía Nam Tỷ lệ dân số tăng tự nhiên và cơ học rất lớn đến nay đã có 7.396.500 người Tổng số học sinh tính đến 30/09/ 2011 tại khu vực Thành phố Hồ Chí Minh: khối giáo dục mầm non 214.700 học sinh, khối giáo dục phổ thông khoảng 991.965 học sinh, trong đó bậc tiểu học 493.255 học sinh, trung học cơ sở 311.096 học sinh, trung học phổ thông 187.605 học sinh
Thành phố Hồ Chí Minh là một trong những đô thị lớn của cả nước Với tốc độ đô thị hóa mạnh mẽ như thế, nảy sinh nhiều vấn đề nhằm đáp ứng quá trình này Một trong những vấn đề cấp bách đó là giáo dục nói chung và xây dựng Trường học nói riêng
Trong Quản lý dự án xây dựng ở Việt Nam hiện nay, vấn đề Ước lượng chi phí xây dựng (ƯLCPXD) để huy động vốn cũng như xin chủ trương, tìm nguồn hỗ trợ đối với vốn ngân sách gặp nhiều khó khăn; chưa đưa ra được con số tương đối chính xác
để lập tổng mức đầu tư Đôi khi ước tính sai dẫn đến “thối” dự án
Không những thế, ƯLCPXD hợp lý ở giai đoạn lập báo cáo kinh tế kỹ thuật (LBCKTKT) xây dựng công trình (đối với công trình thiết kế 1 bước) và lập dự án đầu
tư (LDAĐT) xây dựng công trình (đối với công trình thiết kế 2 và 3 bước) là yếu tố mấu chốt dẫn đến thành công của dự án Nhưng để ƯLCPXD vừa nhanh, vừa hợp lý ở giai đoạn này thật sự khó khăn vì hồ sơ bản vẽ vẫn chưa hoàn thành
Cho nên vấn đề nghiên cứu để giải bài toán tìm chi phí cho các công trình nói chung và công trường học nói riêng ở giai đoạn ban đầu là cần thiết
Có nhiều phương pháp khác nhau để ƯLCPXD như phân tích hồi quy (Regression analysis), Mạng nơ ron (Neural networks), Máy vectơ hỗ trợ (support vector machine), Lập luận theo tình huống (Case-based Reasoning),…Trong đó, phương pháp Lập luận theo tình huống cho kết quả chính xác, đáng tin cậy nhất và tối ưu nhất [1] Nghiên cứu này trình bày phương pháp Trí tuệ nhân tạo để ƯLCPXD cho các dự án bằng Lập luận theo tình huống (Case Based Reasoning_CBR)
1.2 Mục tiêu nghiên cứu:
Những mục tiêu cần nghiên cứu để đạt được mục đích ƯLCPXD của dự án Trường học ngay ở giai đoạn đầu (LBCKTKT hoặc LDAĐT):
Xác định các yếu tố (thuộc tính) ảnh hưởng đến chí phí xây dựng của dự án trường học;
Lập bảng mô phỏng CBR để ƯLCPXD;
Kiểm tra, đánh giá kết quả mô hình và so sánh kết quả so với thực tế, đánh giá
độ chính xác và khả năng ứng dụng mô hình vào thực tế;
Lập chương trình ứng dụng
Trang 121.3 Phạm vi nghiên cứu:
1.3.1 Đối tượng nghiên cứu:
Chi phí xây dựng các công trình trường học ở thành phố Hồ Chí Minh ở giai đoạn đầu của dự án
Theo điểm 2 điều 4 Nghị định NĐ32/NĐ-CP ngày 25/3/2015 của Chính phủ về quản lý chi phí đầu tư xây dựng thì “Tổng mức đầu tư xây dựng là toàn bộ chi phí đầu
tư xây dựng của dự án được xác định phù hợp với thiết kế cơ sở và các nội dung khác của Báo cáo nghiên cứu khả thi đầu tư xây dựng Nội dung tổng mức đầu tư xây dựng gồm chi phí bồi thường, hỗ trợ và tái định cư (nếu có); chi phí xây dựng; chi phí thiết bị; chi phí quản lý dự án; chi phí tư vấn đầu tư xây dựng; chi phí khác và chi phí dự phòng cho khối lượng phát sinh và trượt giá” được tính như sau:
“T MĐT TXDT TBTGPMB,TĐCT QLDAT TVXDT K T DP
Trong đó:
TMĐT : Tổng mức đầu tư của dự án đầu tư xây dựng công trình
TXD : Chi phí xây dựng của dự án
TTB : Chi phí thiết bị của dự án
TGPMB, TĐC : Chi phí đền bù giải phóng mặt bằng, tái định cư
TQLDA : Chi phí quản lý dự án
TTVXD : Chi phí tư vấn xây dựng
TK : Chi phí khác của dự án
TDP : Chi phí dự phòng.”
Với TXD: “Chi phí xây dựng gồm chi phí phá dỡ các công trình xây dựng, chi phí san lấp mặt bằng xây dựng, chi phí xây dựng các công trình, hạng mục công trình, xây dựng công trình tạm, công trình phụ trợ phục vụ thi công” được tính như sau:
“TXD TXLTPHDTSLTT
Trong đó:
TXL : Chi phí xây dựng các công trình, hạng mục công trình
TPHD : Chi phí phá dỡ các công trình xây dựng
TSL : Chi phí san lấp mặt bằng xây dựng
TT : Chi phí xây dựng công trình tạm, công trình phụ trợ phục vụ thi công” Các chi phí khác được quy định cụ thể trong Nghị định NĐ32/2015NĐ-CP
“Tổng mức đầu tư xây dựng được xác định theo một trong các phương pháp sau:
a) Xác định từ khối lượng xây dựng tính theo thiết kế cơ sở và các yêu cầu cần thiết khác của dự án;
b) Xác định theo suất vốn đầu tư xây dựng công trình;
c) Xác định từ dữ liệu về chi phí các công trình tương tự đã hoặc đang thực hiện:
d) Kết hợp cả 3 phương pháp trên
Trang 13Riêng đối với dự án chỉ yêu cầu lập Báo cáo kinh tế - kỹ thuật đầu tư xây dựng thì phần dự toán xây dựng công trình thuộc tổng mức đầu tư xây dựng được xác định theo quy định tại Điều 9 Nghị định 32/2015NĐ-CP”
Trong Luận văn này, chỉ xem xét ước tính T XD (Chi phí xây dựng công trình, hạng mục công trình) của công trình trường học bằng mô hình CBR nhằm cung cấp thêm
một công cụ tính toán để so sánh với các phương pháp khác
1.3.2 Phạm vi nghiên cứu:
Dữ liệu được sử dụng trong nghiên cứu được thu thập từ các công trình trường học
đã và đang thực hiện tại địa bàn thành phố Hồ Chí Minh
Dữ liệu thu thập dùng cho việc huấn luyện có những hạn chế như sau :
Các công trình trường học được thiết kế hoặc thi công trong khoảng thời gian
từ năm 2009 đến năm 2014 và nguồn vốn của các công trình thu thập là vốn ngân sách;
Các công trình trường học thu thập chủ yếu là mầm non, cấp I (Tiểu học), cấp
II (Trung học cơ sở), cấp III (Trung học Phổ thông)
1.4 Đóng góp dự kiến của nghiên cứu:
Trang 14CHƯƠNG 2: TỔNG QUAN
2.1 Đặc điểm của công trình trường học
Trường học là nơi ươm mầm những nhân tài của đất nước Cùng với việc xã hội hoá giáo dục, việc đầu tư xây dựng mới các dự án trường học luôn được Đảng, Nhà nước cũng như ngành giáo dục đặc biệt quan tâm Nhiều cơ sở vật chất từ hệ thống mầm non đến cao đẳng, đại học đã được đầu tư xây dựng mới, đáp ứng nhu cầu học tập và rèn luyện của các thế hệ tương lai đất nước
Công trình trường học (giáo dục), theo QCVN 03:2012/BXD mục A.2.1 bao gồm:
“Trường mầm non (nhà trẻ, mẫu giáo);
Trường phổ thông (trường tiểu học, trường trung học cơ sở, trường trung học phổ thông, trường phổ thông có nhiều cấp học);
Trường cao đẳng, đại học, học viện;
Trường trung cấp chuyên nghiệp;
Trường dạy nghề (trường cao đẳng nghề, trường trung cấp nghề, trung tâm dạy nghề);
Các loại trường khác”
2.2 Ngoài nước:
2.2.1 Các nghiên cứu trước đây về lý thuyết CBR:
Trên thế giới có rất nhiều nghiên về lý thuyết CBR như:
Agnar Aamodt, Enric Plaza [04] đã nghiên cứu về CBR CBR là phương pháp dùng để giải quyết và học lại vấn đề đây là một phương pháp nhận được nhiều sự quan tâm Khởi nguồn ở Mỹ, nhưng ý tưởng cơ bản và những lý thuyết nền móng đã lan rộng đến các lục địa khác; từ năm 1994 Âu Châu nghiên cứu mạnh về CBR Nghiên cứu này mô tả một bức tranh tổng quan các vấn đề nền tảng liên quan đến CBR, miêu
tả các phương pháp luận chính của CBR
Ramon López De Mántaras & ctg [05] đề cập chi tiết bốn bước cơ bản của CBR đó là truy xuất, sử dụng lại, hiệu chỉnh, lưu lại Mục đích của nghiên cứu cung cấp một cách tổng quan, súc tích nhận thức khoa học về nền tảng CBR
2.2.2 Các nghiên cứu trước đây về việc ứng dụng CBR để ƯLCPXD:
Đối với nghiên cứu ứng dụng CBR trong quản lý xây dựng trên thế giới có một số nghiên cứu sau:
Gwang-Hee Kim & ctg [01] đã ứng dụng ba kĩ thuật là Hồi qui, Mạng Nơ ron
& CBR để ƯLCPXD của các chung cư ở Hàn Quốc Tập cơ sở dữ liệu gồm 530 chi phí của các công trình đã xây trước đó Kết quả mô hình Mạng Nơ ron dùng để ƯLCPXD cho kết quả phù hợp hơn mô hình CBR và Hồi qui Tuy nhiên, xây dựng mô hình Mạng Nơ ron tốt là thấp do hạn chế trong số lần chạy thử và quá trình sai số Thêm vào đó, độ chính xác của kết quả ước lượng phụ thuộc thời gian, tính rõ ràng minh bạch trong mô hình ƯLCP nên được xem xét
Mô hình CBR hiệu quả hơn, đặc biệt chí phí ước lượng rõ ràng hơn các mô hình khác Một khía cạnh quan trọng trong mô hình ước lượng là sử dụng được lâu dài Vì vậy, mô hình CBR hiệu quả hơn trong việc ƯLCPXD
Trang 15Mô hình CBR và ANN là thích hợp cho việc ƯLCPXD Nghiên cứu này đã nêu
ra hướng đi cho các nghiên sau nên phát triển mô hình lai, tích hợp với những công cụ khác CBR kết hợp với giải thuật di truyền
Sang-Yong Kim & ctg [02] đã tìm ra, nếu sử dụng mô hình CBR để ƯLCPXD thì sai số so với thực tế là 3.69%, nếu sử dụng mô hình ANN để ƯLCPXD thì sai số so với thực tế là 6.52% Điều này cho ta thấy sự chính xác của CBR trong ƯLCPXD so với ANN
Nghiên cứu đã trình bày hai phương pháp ƯLCP là CBR và ANN, giúp dễ dàng đưa ra kết quả chi phí dự án ngay ở giai đoạn đầu Trong nghiên cứu, đã sử dụng dữ liệu của 540 căn hộ đã được xây ở Seoul, Hàn Quốc từ giai đoạn 2007 đến 2001 được dùng để huấn luyện và kiểm chứng mô hình
Những đóng góp của nghiên cứu trong ƯLCPXD, Quản lý xây dựng sau:
o Thứ nhất, kết nối dữ liệu ước lượng và kĩ thuật trí tuệ nhân tạo (AI_ Artificial Intelligent) mới là CBR và ANN
o Thứ hai, đây là công cụ chuyên nghiệp hỗ trợ quản lý xây dựng để thực hiện ước lượng trong vòng thời gian ngắn
o Thứ ba, nghiên cứu này trình bày 2 phương pháp kiểm nghiệm và CBR là phương pháp cho kết quả phù hợp hơn ANN trong việc ƯLCPXD ở giai đoạn đầu
o Cuối cùng, CBR có thể được áp dụng đối với nhiều lĩnh vực khác của ngành công nghiệp xây dựng nếu có sẵn dữ liệu của tình huống trước đó Trong mô hình CBR thì trọng số ảnh hưởng rất lớn đến kết quả
Dù rằng nghiên cứu này giới thiệu phương pháp hữu hiệu như là công cụ cho người ƯLCP dùng để ƯLCP ở giai đoạn thiết kế ý tưởng đối với quản lý xây dựng ở Hàn Quốc Nhưng nghiên cứu này cũng kiến nghị các nghiên cứu về sau có thể nâng cao hiệu quả theo các bước sau:
o Thứ nhất, mô hình CBR ảnh hưởng rất nhiều bởi trọng số Vì thế, các nghiên cứu sau về CBR cần công cụ khác để tìm trọng số thay cho phương pháp đã dùng trong nghiên cứu này
o Thứ hai, kết hợp CBR với giải thuật di truyền hoặc phương pháp trí tuệ nhân tạo khác để xử lí các dữ liệu không theo một xu hướng nào như giải phóng mặt bằng, chi phí thiết bị trong quản lý xây dựng
o Thứ ba, khi sử dụng hai kĩ thuật CBR và ANN càng nhiều dữ liệu và nhiều biến (thuộc tính) thì kết quả càng phù hợp
o Cuối cùng, mô hình dữ liệu chi tiết về chi phí để người dùng có thể sửa tất cả các loại ước lượng cho phù hợp với từng giai đoạn của dự án
Sung-Hoon An & ctg [03] đã dùng mô hình CBR để ƯLCPXD Các tình huống cơ sở (Case base) được tạo bằng cách phỏng vấn các chuyên gia và thu thập kinh nghiệm của họ Sau đó dùng AHP để lựa chọn ý kiến tốt nhất
Nghiên cứu nêu ra rằng mô hình ƯLCPXD bằng mô hình CBR là một phương pháp hiệu quả, phương pháp này sử dụng lại kinh nghiệm của chuyên gia từ các tình huống trước đó để tìm được chi phí của dự án mới Tuy nhiên, khó khăn nhất là tìm trọng số tầm quan trọng của thuộc tính Vì thế, nghiên cứu này đã đề xuất một mô hình CBR sử dụng AHP để tìm trọng số của các thuộc tính Trong mô hình này, AHP được
Trang 16sử dụng để tìm ra trọng số tầm quan trọng của thuộc tính từ các chuyên gia Kết quả nghiên cứu chỉ ra rằng mô hình AHP-CBR là chính xác hơn, đáng tin cậy hơn và rõ ràng hơn mô hình EW-CBR (Trọng số cân bằng kết hợp CBR) và mô hình GDM-CBR (Phương giảm độ dốc kết hợp CBR) Mô hình AHP-CBR, xem xét đến hiệu quả mô hình ƯLCPXD Tuy nhiên, mô hình AHP-CBR đòi hỏi cấu trúc thứ bậc và so sánh từng đôi để đánh giá sự ảnh hưởng của các thuộc tính trong chi phí xây dựng dựa vào kinh nghiệm Nghiên cứu này kiến nghị các nghiên cứu sau này cần phải phát triển hơn nữa để cải tiến mô hình CBR bằng cách làm sao để kinh nghiệm phản ánh trong quá trình ước lượng không ảnh hưởng bởi cấu trúc thứ bậc và so sánh cặp
Nie-Jia Yau, Jyh-Bin Yang [06] đã áp dụng kỹ thuật CBR để chọn tường chắn tối ưu nhất Cụ thể:
Nghiên cứu này giới thiệu một hệ thống lựa chọn tường chắn đất trong cơ sở dữ liệu (gọi tắt là CASTLES), hệ thống này dễ dàng đưa ra quyết định chọn một loại tường chắn đất ngay ở giai đoạn lên kế hoạch của dự án CASTLES kết hợp 254 tình huống về tường chắn đất trước đây từ thuyết minh thiết kế của các công ty tư vấn thiết
kế của Đài Loan Những nhân tố chính; bao gồm độ sâu của hồ đào, giải pháp điều kiện biên, cao độ mực nước ngầm, tính chất của đất, được xem như là các điều kiện công trường khi lưu các tình huống thành tập các tình huống làm cơ sở dữ liệu Đối với một dự án mới, CASTLES tạo ra một tập hợp các hệ thống có thể chấp nhận và hệ thống yêu cầu từ 11 đáp án có thể về tường chắn đất bằng việc truy xuất lại các tình huống tương tự trong cơ sở dữ liệu Kết quả kiểm nghiệm chứng minh rằng CASTLES
là phương pháp có triển vọng cao, lựa chọn dễ dàng Thêm vào đó, hiệu quả của CASTLES có thể cao hơn nữa nếu cải thiện bằng việc kết nối vai trò các chuyên gia để loại ra các tình huống không thích hợp
Nghiên cứu này cũng xác nhận rằng lập luận theo tình huống CBR là một kĩ thuật trí tuệ nhân tạo khá hiệu quả trong việc hỗ trợ lựa chọn tường chắn đất phù hợp Tương tự thì phương pháp lập luận theo tình huống có thể áp dụng cho các lĩnh vực khác trong nền công nghiệp xây dựng lấy kinh nghiệm để định hướng, nếu các tình huống xây dựng trước đây có sẵn Tuy nhiên, hàm xác định độ tương tự ảnh hưởng rất nhiều đến kết quả Hàm này xác định liệu một tình huống nên được truy xuất từ cơ sở
dữ liệu cho việc giải quyết vấn đề hiện tại Trong hàm này, mỗi giá trị độ tương tự của mỗi lĩnh vực đối với mỗi tình huống cụ thể, như là tầm quan trọng của mối quan hệ, v…v…, trọng số trong mỗi lĩnh vực nên được xác định và kiểm nghiệm cẩn thận Nghiên cứu này chỉ dùng một kĩ thuật lập luận theo tình huống đơn lẻ để giải quyết lại những vấn đề đã đề cập bên trên Những kĩ thuật trí tuệ nhân tạo khác, như là
hệ thống chuyên gia và quy tắc suy diễn, các phương pháp này áp dụng các quy tắc để đưa ra quyết định, có thể kết nối vào trong mô hình để đề ra nhiều hơn nữa một hệ thống thiết thực có tính ứng dụng thực tế cao Như là các quy tắc có thể bao gồm việc xem xét chi phí và áp dụng kĩ thuật xây dựng mới mà không tồn tại ở tình huống trước Nghiên cứu này kiến nghị các nghiên cứu sau này nên nghiên cứu sát, kĩ hơn nữa vấn
đề này
Sevgi Zeynep Doğan & ctg [08] bài báo này so sánh hiệu quả của 3 phương pháp tối ưu: giảm độ dốc (gradient descent), thuật toán di truyền (genetic algorithms), đếm các đặc trưng (feature counting) trong việc tìm ra trọng số của thuộc tính (attribute weight) Trọng số này là phần không thể thiếu của quá trình lập bảng tính CBR để ước lượng chi phí Bài báo miêu tả rất chi tiết 3 kỹ thuật tối ưu để tìm trọng số của thuộc tính và phát triển quy trình sử dụng mô hình CBR để ước lượng chi phí Kết
Trang 17quả chỉ ra rằng dùng thuật toán di truyền (GA) để tìm trọng số của thuộc tính áp dụng vào mô hình CBR cho kết quả tốt nhất
Jieh-Haur Chen, S.C Hsu [09] mục đích của bài báo này là đưa ra phương pháp giải quyết những vấn đề tranh chấp do những thay đổi so với ban đầu trong các
dự án xây dựng bằng cách sử dụng phương pháp lai giữa ANN và CBR Dữ liệu của nghiên cứu được thu thập Tòa án tối cao và Tòa thượng thẩm ở 48 bang và 1 quận ở
Mỹ Mức độ dự đoán chính xác của phương pháp này lên đến 84,61%, không chỉ dự đoán được khả năng xảy ra tranh chấp bằng việc sử dụng phương pháp ANN mà còn báo trước hiệu suất thắng thua bằng cách sử dụng phương pháp CBR Đồng thời, đưa
ra được những thông tin tranh chấp từ những tình huống quá khứ Tiếp theo, đánh giá
31 tình huống thử nghiệm cho kết quả rằng mô hình lai này có kết quả đặc biệt chính xác đối với các dự án có qui mô vừa
2.2.3 Các nghiên cứu trước đây về việc ứng dụng CBR để ƯLCPXD đối với các
hỗ trợ (Support Vector Machine_SVM)
Nghiên cứu này áp dụng 3 kĩ thuật Hồi qui (RA), Mạng Nơ ron (NN) và Máy vectơ hỗ trợ (SVM) để ƯLCPXD công trình trường học 197 công trình được sử dụng cho việc phát triển và tính hợp lệ dữ liệu của mô hình, trong khi đó thì 20 công trình còn lại được dùng để kiểm chứng độ chính xác của mô hình Cả 3 mô hình cho ra mối tương quan cao giữa chi phí ước lượng và chi phí thực tế tức 2 chi phí này chênh lệch không nhiều
Dù Hồi qui (RA), Mạng Nơ ron (NN) và Máy vectơ hỗ trợ (SVM) đều là 3 ứng dụng tốt Tuy nhiên, mô hình Mạng Nơ ron (NN) cho kết quả ước lượng phù hợp hơn
2 mô hình Hồi qui (RA) và Máy vectơ hỗ trợ (SVM)
Jae-Min Shin và Gwang-Hee Kim [10] đã xây dựng mô hình để ước lượng chi phí xây dựng đối với công trình giáo dục bằng phương pháp Máy vectơ hỗ trợ (SVM)
và đánh giá độ chính xác của mô hình Dữ liệu của nghiên cứu được lấy từ 217 công trình Trường học đã hoàn thành từ năm 2004 đến 2007 ở Gyeonggi-Do (Hàn Quốc) Kết quả nghiên cứu cho thấy rằng sai số trung bình của mô hình SVM là 7,48%
Ước lượng chi phí hợp lí ở giai đoạn đầu của các công trình trường học là một trong những yếu tố chuẩn mực dẫn đến thành công của dự án Vì thế nhiều kĩ thuật khác nhau được phát triển để ƯLCPXD hợp lí và nhanh chóng Trong số những kĩ thuật, Máy vec tơ hỗ trợ (SVM) là ưu việt hơn cả Vì thế, mục đích của nghiên cứu là xây dựng mô hình ƯLCPXD cho các dự án trường học sử dụng kĩ thuật máy vec tơ hỗ trợ và kiểm tra độ chính xác của mô hình ƯLCPXD Dữ liệu để thực hiện nghiên cứu
là 217 chi phí của các công trình trường học mà đã và đang thực hiện từ năm 2004 đến
2007 ở Gyeonggi-Do, Hàn Quốc Kết quả đã chỉ ra rằng sai số trung bình là 7,48% khi
áp dụng mô hình SVM Vì vậy sử dụng mô hình SVM để ƯLCPXD các công trình trường học sẽ có hiệu quả đáng kể ở giai đoạn ban đầu
Trang 182.3 Trong nước:
2.3.1 Các nghiên cứu trước đây về việc ứng dụng Giải thuật di truyền:
Giải thuật di truyền GA là giải thuật được ứng dụng rộng rãi trong nhiều lĩnh vực trong đó có xây dựng Vận dụng ưu điểm vượt trội do giải thuật này mang lại, một số tác giả đã ứng dụng để làm Luân văn:
Đỗ Ngọc Khánh [17] “Ứng dụng giải thuật di truyền vào tối ưu chi phí, thời gian và nhân vật lực” Các doanh nghiệp hoạt động trong lĩnh vực xây dựng đều hướng đến một mục tiêu là lợi nhuận Để đạt lợi nhuận cao thì họ phải đề ra phương án thi công sao cho tiết kiệm chi phí nhưng vẫn phải đáp ứng yêu cầu về tiến độ của Chủ đầu
tư đồng thời phải phù hợp với năng lực thi công của họ Luận văn này sẽ đề xuất một phương pháp để giải bài toán tối ưu chi phí, thời gian và nhân vật lực đó là ứng dụng giải thuật di truyền vào việc tìm kiếm các phương án lập tiến độ sao cho chi phí là cực tiểu, thời gian thi công của dự án là nhỏ nhất và đạt được biểu đồ phân phối nhân vật lực là hợp lý Đồng thời đưa ra nhiều phương án kế hoạch giúp ta có nhiều sự lựa chọn phương án nào là phù hợp với người sử dụng nhất
Đặng Hoài Nam [18] “Tối ưu hóa chi phí dự trữ vật tư trên công trường xây dựng bằng việc ứng dụng thuật giải di truyền (bài toán áp dụng cho công trình xây dựng tại Tp HCM)” Luận văn nhận định rằng “Một dự án xây dựng thành công khi công trình thi công đạt chất lượng, đúng tiến độ, có lợi nhuận cao nhất và an toàn lao động Để đạt được sự thành công trên phải có sự kết hợp của các thành tố mà các nhà quản lý gọi là “5M” chủ đạo sau: Machines (Máy móc thiết bị), Manpower (Nhân lực), Materials (Vật tư), Money (Tiền) và Management (Quản lý) Các nghiên cứu đã chỉ ra rằng vật tư chiếm 60% chi phí và kiểm soát 80% tiến độ dự án Một hệ thống quản lý vật tư hiệu quả còn làm tăng năng suất lao động và kiểm soát tốt chi phí dự án Trong
đó với một phương án dự trữ vật tư hợp lý, nhà quản lý sẽ đảm bảo một dòng vật tư trơn tru cung cấp cho công trình đủ về lượng, đúng về chủng loại, kịp thời với chi phí thấp nhất Nghiên cứu này đã ứng dụng giải thuật di truyền để đề xuất một phương án
dự trữ tốt nhất, đồng thời tối ưu hóa chi phí dự trữ vật tư trên”
Trần Duy Phương [19] “Cân đối thời gian và lợi nhuận trong dự án xây dựng bằng thuật giải di truyền” Luận văn đã nghiên cứu về “Quản lý chi phí và tiến độ cho nhà thầu trong giai đoạn thi công là một khâu quan trọng trong quá trình quản lý dự
án Ở Việt Nam, các công cụ và biện pháp phục vụ cho công tác này còn nhiều hạn chế, ít được nghiên cứu phát triển nên hiện tại các doanh nghiệp chủ yếu sử dụng các biện pháp mang tính tự phát, thủ công hoặc quản lý theo kinh nghiệm Hậu quả là các
dự án xây dựng hay xảy ra tình trạng vượt chi phí, tiến độ, nhà thầu thường bị động về mặt tài chính làm ảnh hưởng đến mức độ thành công của dự án Vì thế, tác giả Luận văn đã nêu lên phương thức tối ưu hóa đa mục tiêu, là phương thức mới và duy nhất có khả năng đưa ra và định giá chính xác hoặc gần đúng nhất các tài nguyên hữu ích và lên kế hoạch đồng bộ hóa giữa việc giảm thiểu chi phí về thời gian và đem lại lợi nhuận tối đa cho dự án xây dựng Việc tính toán trong phương thức này được xây dựng dựa trên ba mô đun chính sau: (1) mô đun liệt kế phát triển từ việc hoạch định của dự án xây dựng thực tế, (2) mô đun lợi nhuận tính toán lợi nhuận của dự án, và (3)
mô đun đa mục tiêu nhằm tìm kiếm và đồng nhất một cách chính xác hoặc gần đúng
sự cân đối giữa thòi gian của dự án và lợi nhuận thu được Một dự án quy mô lớn sẽ được phân tích nhằm minh họa cách sử dụng phương pháp này và chứng minh khả năng ứng dụng, mô hình hóa sự cân đối giữa thời gian và lợi nhuận”
Trang 19 Cao Minh Đăng [20] “Nghiên cứu và ứng dụng thuật giải di truyền vào tối ưu hóa bố trí mặt bằng công trường xây dựng” Luận văn đề cập đến vấn đề “Thực tế hầu hết các công trường xây dựng đều vấp phải những khó khăn về quản lý hơn là những vấn đề kỹ thuật Do đó việc bố trí tốt mặt bằng công trường xây dựng tiến tới bố trí tối
ưu sẽ góp phần làm tăng hiệu quả và đảm bảo an toàn lao động trên công trường trong quá trình thi công Tuy nhiên đây là một bài toán phức tạp và đã được nhiều nhà nghiên cứu sử dụng các thuật toán để tìm giải pháp tối ưu cho bài toán Nghiên cứu này đề xuất một mô hình áp dụng giải thuật di truyền để truy tìm lời giải tối ưu cho bài toán Bốn vấn đề chính sau đã được Luận văn giới thiệu và giải quyết, bao gồm:
o Xác định hàm mục tiêu của bài toán;
o Xác định các ràng buộc trong bài toán;
o Ứng dụng giải thuật di truyền vào việc truy tìm lời giải tối ưu cho bài toán;
o Mô hình hóa bài toán bằng chương trình tin học”
Huỳnh Văn Anh Tuấn [21] “Kết hợp lý thuyết tập mờ và giải thuật di truyền
để giải bài toán cực tiểu hóa về thời gian và chi phí dự án” Luận văn đề cập đến
“Phương pháp phân tích truyền thống để giải bài toán tối ưu về thời gian và chi phí dự
án đểu giả định rằng thời gian và chi phí của một công tác là xác định chắc chắn Tuy nhiên, trong quá trình thực hiện dự án, thời gian thực hiện các công tác là không chắc chắn vì chịu nhiều sự tác động của môi trường bên ngoài như: sự thay đổi thời tiết, sự đông đúc trên công trường làm việc, trình độ tay nghề của người công nhân, … Luận vẵn đã xuất một phương pháp mới để giải bài toán tối ưu thời gian và chi phí dự án dưới điều kiện không chắc chắn Lý thuyết tập mờ được áp dụng để mô phỏng sự không chắc chắn của thời gian công tác Thuật giải di truyền sẽ được sử dụng để tìm kiếm cực tiểu chi phí trực tiệp của dự án tương ứng với một thời gian xác định Mặt khác, mục tiều của mô hình là thiết lập các được cong tối ưu về thời gian và chi phí dự
án dựa trên những mức rủi ro khác nhau xác định bởi người ra quyết định”
Lê Đình Nhật Tân [22] “Dùng giải thuật di truyền tối ưu hóa lợi nhuận các dự
án xây lắp có sự ràng buộc về tài chính” Trong suốt thời gian thi công dự án, nhà thầu không thể tiến hành công việc như tiến độ đã đề ra khi khoản tiền có sẵn không đủ mặc dù trên công trường không thiếu nhân công, máy móc thi công và cả biện pháp thi công Do đó vấn đề quan trọng đầu tiên của mỗi nhà thầu là làm sao để cân bằng về mặt tài chính trong nội bộ của mình Mặt khác trong quá trình đấu thầu, hiện nay vẫn chưa có phương pháp nào xác định được năng lực tài chính hiện tại của nhà thầu, nên không có cơ sở nào để đảm bảo dự án sẽ thành công Đề tài sẽ đề ra một phương pháp giúp cho nhà thầu vừa có thể cân bằng tài chính của mình vừa có thể đạt được lợi nhuận tối đã của dự án ứng với một số tiền có sẵn (vay mượn tự ngân hàng), và cũng giúp cho các quản lý trong công tác xét thầu có một các nhìn đúng đắn hơn về năng lực tài chính hiện tại của nhà thầu
Trần Thế Cường [23] “Quy hoạch tổng bình đồ công trường theo mô hình động ứng dụng giải thuật di truyền trên nền Autocad” Luận văn đề cập đến “Thiết kế tổng mặt bằng thi công là một trong những vấn đề quan tâm hàng đầu của các nhà quản lý dự án Công việc bố trí sắp xếp công trình tạm, kho bãi chủ yếu dựa trên kinh nghiệm và trực quan của nhà hoạch định chính điều này làm gia tăng chi phí lưu thông giữa các hạng mục công trường, làm giảm tiến độ thi công, và kém hiệu quả trong việc sử dụng các nguồn tài nguyên của dự án Ngược lại, dự án có tổng mặt bằng thi công hợp lý sẽ đem đến hiệu quả kinh tế cũng như tiến độ và chất lượng của dự án
Trang 20Nghiên cứu này trình bày giải pháp thiết kế tối ưu tổng bình đồ công trường Năm vấn
đề sau đây đã được trình bày trong đề tài, bao gồm:
o Ứng dụng thuật toán di truyền trong thiết kế tổng bình đồ công trường;
o Nghiên cứu thiết kế tổng mặt bằng thi công theo phương pháp “tĩnh”;
o Nghiên cứu thiết kế tổng mặt bằng thi công theo phương pháp “động”;
o Thiết kế chương trình giải bài toán quy hoạch tổng bình đồ công trường theo hai phương pháp “tĩnh” và “động” ứng dụng giải thuật di truyền;
o Ví dụ minh họa bài toán tối ưu tổng bình đồ công trường”
2.3.2 Các nghiên cứu trước đây về ƯLCPXD:
Trong những năm gần đây, ở Việt Nam có rất nhiều nghiên cứu ứng dụng kỹ thuật trí tuệ nhân tạo để Ước lượng chi phí xây dựng công trình:
Nguyễn Hữu Thái Hòa [11] “Ước lượng chi phí xây dựng cao ốc dựa trên hiệu chỉnh phương pháp Storey Enclosure Method” Nghiên cứu trình bày phương pháp để xác định chi phí xây dựng trong giai đoạn chuẩn bị đầu tư Cao ốc bằng mô hình hồi quy tuyến tính và mô hình ANN với các biến đầu vào dựa trên hiệu chỉnh phương pháp Storey Enclosure Method Nghiên cứu sử dụng 63 Cao ốc tại thành phố Hồ Chí Minh Đối với mô hình ANN, nghiên cứu đã xác định được các biến có ảnh hưởng lớn nhất đến chi phí xây dựng dựa trên tần suất xuất hiện của các biến quan trọng >50% Kết quả nghiên cứu xác định không thể sử dụng mô hình hồi quy tuyến tính để ước lượng chi phí xây dựng Cao ốc tại thành phố Hồ Chí Minh do các vi phạm về kiểm định giả thuyết hồi quy, đồng thời mô hình hồi quy có sai số tốt hơn các nghiên cứu trước với số lượng biến đầu vào ít hơn
Nguyễn Hữu Thức [12] “Dự trù chi phí xây dựng cao ốc văn phòng bằng mô hình hồi quy tuyến tính và mạng Neuron nhân tạo” Nghiên cứu đã tìm ra 16 yếu tố ảnh hưởng mạnh đến chi phí xây dựng Cao ốc văn phòng trong giai đoạn hình thành ý tường dự án Từ việc khảo sát 53 chuyên gia về quản lý dự án và tính dự toán Từ đó tiến hành thu thập 73 dự án Cao ốc văn phòng trên địa bản thành phố Hồ Chí Minh để tiến hành mô hình hồi quy tuyến tính và mạng Neuron nhân tạo để ước lượng chi phí xây dựng cao ốc văn phòng Trong đó mô hình hồi quy được sử dụng như một chuẩn
để so sánh và đánh giá mô hình ANN Kết quả cho thấy mô hình ANN mô hình được tính phi tuyến của dữ liệu và cho kết quả tốt hơn mô hình hồi quy với sai số phần trăm tuyệt đối trung bình MAPE=14,4% Tuy nghiên kết quả nghiên cứu có thể tốt hơn nếu nghiên cứu giải quyết được 2 biến đầu vào là “Vị trí xây dựng” và biến “M&E”
Phan Văn Khoa [13] “Ước lượng chi phí đầu tư xây dựng dự án chung cư bằng Neural Networks” Trong Luận văn tác giả đã trình bày cách ứng dụng mạng Neuron Nhân tạo để dự đoán chi phí xây dựng cho các dự án chung cư thông qua việc
“học” từ kinh nghiệm các chung cư đã được xây dựng trước đây với sự hỗ trợ của công cụ Mathlab để tìm được bảng ma trận trọng số Với bộ ma trận trọng số tìm được thông qua việc học từ các dự án chung cư đã hoàn thành, một chương trình viết bằng Visual C++ được thực hiện cùng với mục đích trên Với mô hình xây dựng, mô hình cho phép cập nhật lại mạng Neuron với các số liệu mới
Trương Anh Tuấn [14] “Đánh giá vượt chi phí dự án trường học theo phương pháp kiểm soát bằng thống kê” Đề tài này nghiên cứu về các nguyên nhân gây ra phát sinh trong thi công công trình trường học sử dụng vốn ngân sách nhà nước 52 công
Trang 21trình đã hoàn tất công tác quyết toán được thu thập làm mẫu dữ liệu phục vụ nghiên cứu Kết quả nghiên cứu cho thấy, trung bình tổng phát sinh của các dự án trường học
sử dụng vốn ngân sách là 2,027% Kết quả nghiên cứu chỉ ra rằng: có 23 nguyên nhân thường gây ra phát sinh trong thi công Các nguyên nhân thường xuất hiện sắp xếp theo thứ tự về tần số xuất hiện và giá trị trung bình tương ứng lần lượt là:
o Khối lượng mời thầu không xét đến hoặc không đầy đủ và dự toán trúng thầu không xét đến: 0,482%
o Bổ sung thiết kế do hồ sơ thiết kế sai sót – sơ sài hoặc chưa có thiết kế: 0,182%
o Những phát sinh theo kiến nghị của đơn vị vận hành: 0,108%
o Thay đổi thiết kế do TVTK gây ra hoặc đề nghị: 0,072%
o Dự toán phần xây lắp do đơn vị TV lập thiếu chính xác về khối lượng: 0,199%
o Thay đổi hay bổ sung thiết kế do CĐT hoặc BQLDA gây ra hay đề nghị: 0,066%
o Thay đổi thiết kế móng: 0,020%
o Khảo sát hiện trạng mặt bằng khu đất không chính xác: 0,023%
o Đề tài đã xây dựng biểu đồ nguyên nhân – kết quả về các nguyên nhân gây ra phát sinh Các nhóm nguyên nhân chính được kết luận là:
o Do lỗi hiệu quả của sản phẩm thiết kế
o Do lỗi khảo sát và lập dự án
o Do lỗi dự toán và khối lượng thực tế thi công
o Do lỗi kỹ thuật thi công và giám sát
o Do công tác lựa chọn nhà thầu
o Do thay đổi các quy định của nhà nước có liên quan
Đề tài đã xây dựng được các biểu đồ kiểm soát đối với các biến tỷ lệ tổng phát sinh so với giá trúng thầu, tỷ lệ phát sinh do các nguyên nhân gây ra so với giá trúng thầu Các biểu đồ kiểm soát này có thể vận dụng để kiểm soát các phát sinh tương ứng của các dự án trường học tương tự
Đề tài đã xây dựng được mô hình hồi quy quan hệ giữa tổng phát sinh và các biến nguyên nhân gây phát sinh theo dạng định danh
Trang 22CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU VÀ CÔNG CỤ NGHIÊN
CỨU
3.1 Phương pháp nghiên cứu:
Trong nghiên cứu trước hết xác định các nhân tố ảnh hưởng tới chi phí xây dựng công trình trường học Từ các nhân tố ảnh hưởng, xây dựng bảng câu hỏi phỏng vấn các chuyên gia trong ngành là những người có kinh nghiệm trong lĩnh vực quản lý dự
án, tư vấn thiết kế, tư vấn thẩm tra thiết kế, tư vấn giám sát, thi công xây dựng công trình trường học đặc biệt là các chuyên gia về chi phí, các kỹ sư lập dự toán, thẩm tra
dự toán cũng như chuyên viên về quản lý chi phí của dự án trường học Từ các bảng câu hỏi phỏng vấn thu được, sử dụng phương pháp thông kê mô tả xác định các nhân
tố ảnh hưởng chính tới chi phí xây dựng công trình trường học Sau khi đã xác định được các nhân tố ảnh hưởng chính đến chi phí xây dựng, thu thập dữ liệu các nhân tố chính và chi phí xây dựng công trình trường học từ các công trình đã có thiết kế kỹ thuật và dự toán chi tiết hoặc các công trình đã hoàn thành việc thẩm tra Từ các số liệu các nhân tố ảnh hưởng chính và chi phí xây dựng của các công trình thu thập được, tiến hành dùng giải thuật di truyền (GA) tìm bộ trong số tối ưu đưa vào bảng tính CBR Lập trình xác định chi phí xây dựng công trình trường học từ các thông số của mô hình CBR Các bước nghiên cứu được thực hiện theo qui trình sau đây
Trang 23XÁC ĐỊNH ĐỀ TÀI
NHẬN DẠNG CÁC NHÂN TỐ ẢNH HƯỞNG TỚI CHI PHÍ XÂY DỰNG CÔNG TRÌNH TRƯỜNG HỌC
THIẾT KẾ BẢNG CÂU HỎI KHẢO SÁT
TIẾN HÀNH KHẢO SÁT
TỪ CÁC NGHIÊN CỨU TRƯỚC,
THAM KHẢO Ý KIẾN CHUYÊN GIA,
ĐẶC THÙ RIÊNG CỦA CÔNG TRÌNH
XÁC ĐỊNH CÁC NHÂN TỐ ẢNH HƯỞNG CHÍNH
THU THẬP DỮ LIỆU CÁC NHÂN TỐ ẢNH HƯỞNG CHÍNH VÀ CHI PHÍ XÂY DỰNG TỪ CÁC CÔNG TRÌNH, DỰ ÁN
XỬ LÝ SỐ LIỆU
XÂY DỰNG MÔ HÌNH ƯỚC LƯỢNG BẰNG CÔNG CỤ CBR
TÌM BỘ TRỌNG SỐ TỐI ƯU BẰNG GIẢI THUẬT DI TRUYỀN (GA) ĐỂ ĐƯA VÀO MÔ HÌNH CBR
LẬP TRÌNH XÁC ĐỊNH CHI PHÍ
XÂY DỰNG CÔNG TRÌNH TRƯỜNG HỌC
Hình 3 1: Quy Trình Nghiên Cứu
Trang 243.2 Công cụ nghiên cứu:
Dùng Evolver v5.5 để tối ưu trọng số của các thuộc tính;
Sử dụng chức năng Record Macro trong Excel 2013 để thiết lập chương trình ứng dụng thực tế
3.2.2 Lý thuyết về thống kê dữ liệu sử dụng trong đề tài nghiên cứu
Xác định các nhân tố chính ảnh hưởng tới chi phí xây dựng công trình trường học bằng bảng câu hỏi khảo sát chuyên gia theo thang đo Likert
Thang đo là quá trình gán số để biểu thị đặc điểm của đối tượng
Thang đo Likert là một dạng thang đo tỷ lệ, thường dùng để gán số cho đánh giá của con người về một vấn đề nào đó Ví dụ: mức độ hài lòng của công nhân về nhà thầu, mức độ hài lòng của học viên khi học tại Trung tâm ngoại ngữ Bách Khoa… Thang đo Likert được sử dụng phổ biến nhất là thang đo 5 mức độ
Các bước xây dựng thang đo Likert:
Nhận diện và đặt tên biến muốn đo lường;
Lập ra một danh sách các phát biểu hoặc câu hỏi mang tính biểu thị Có thể lấy
từ lý thuyết có liên quan, đọc sách, đọc báo, lấy ý kiến chuyên gia, thực nghiệm;
Xác định loại trả lời: ảnh hưởng rất nhỏ, ảnh hưởng nhỏ, ảnh hưởng vừa, ảnh hưởng mạnh, ảnh hưởng rất mạnh;
Kiểm tra toàn bộ các mục hỏi bằng cách khảo sát chuyên gia;
Phân tích mục hỏi trong danh sách để tìm ra một tập hợp các mục hỏi giúp đo lường được một khía cạnh của khái niệm biến muốn nghiên cứu trong mô hình
3.2.3 Lập luận theo tình huống (CBR):
LLTTH là một trong những ứng dụng kỹ thuật trí tuệ nhân tạo thành công trong những năm gần đây Các ứng dụng thông dụng là trong các hệ thống chẩn đoán và ước lượng
Trang 253 Kiểm tra và điều chỉnh (Revise) lại giải pháp cho tình huống mới (nếu cần)
4 Giữ lại (Retain) giải pháp đã được giải quyết đó để giải quyết những vấn đề mới tiếp theo”
Hình 3 2: Quy trình thực hiện Case-based Reasoning
Quy trình thực hiện như sau: “Khi có một vấn đề mới cần phải giải quyết, vấn
đề đó sẽ được biểu diễn dưới dạng tình huống Tình huống mới này sẽ được so sánh với các tình huống trong tập tình huống cơ sở, những tình huống có độ tương đồng cao nhất với tình huống mới sẽ được trích ra từ tập tình huống cơ sở Tập hợp tình huống được trích ra đó sẽ được sử dụng lại nhằm phân tích để đưa ra giải pháp cho tình huống mới Giải pháp đưa ra cho tình huống mới có thể sẽ được kiểm tra lại, nếu giải pháp đó chưa được thỏa đáng thì thực hiện tính toán lại và điều chỉnh để đưa ra giải pháp thỏa đáng hơn Giải pháp cho vấn đề mới sẽ được lưu lại vào tập hợp các vấn đề
đã có giải pháp” [24]
Trang 263.2.3.3 Ưu điểm của CBR:
“Case-based reasoning có nhiều ưu điểm hơn so với những phương pháp kĩ thuật học máy khác Phương pháp này có ưu điểm đó là những mẫu huấn luyện mới có thể được thêm vào một cách rất dễ dàng Sự hạn chế của việc học này là tất cả các mẫu được sử dụng cần phải lưu trữ và hệ thống có thể truy cập được mỗi khi có yêu cầu
Để thực hiện các tiến trình xử lý khi có yêu cầu đòi hỏi tính toán nhiều Tuy nhiên tốc
độ phát triển của phần cứng máy tính rất nhanh do đó sự hạn chế này dễ dàng khắc phục được”[24]
3.2.3.4 Một số kỹ thuật chi tiết trong cách tính độ tương tự giữa các tình huống lập luận:
Một trong những vấn đề khó khăn nhất trong lập luận theo kinh nghiệm là tính độ tương tự giữa các tình huống lập luận trong pha tìm kiếm lại
Hàm tính độ tương tự có ảnh hưởng rất lớn đến hiệu quả và độ chính xác của cả hệ thống
Phương pháp tính độ tương tự giữa các tình huống lập luận:
Công thức tính toán độ tương tự giữa các tình huống lập luận:
Đơn vị tri thức của một hệ thống lập luận theo kinh nghiệm là các tình huống lập luận (cases)
Giả thiết rằng thuộc tính mỗi tình huống lập luận trong tập tình huống cơ sở được biểu diễn dưới dạng các vecto thuộc tính – giá trị có dạng i=(1, 2,…., p), với p là số các thuộc tính biểu diễn tình huống lập luận
Hàm tính độ tương tự giữa hai tình huống có thể được tính bằng các phương thức khác nhau: Weighted sum, Euclidean, Minimum, Maximum Không thể đánh giá phương thức nào là tốt nhất trong các phương thức trên, vì nó tùy thuộc vào dữ liệu
của bài toán Và phương thức Weighted sum là phương thức được sử dụng thông
dụng nhất Độ tương tự giữa hai tình huống lập luận i và j được tính theo công thức sau:
j
1
i ij
1
ww
p
k p k k
k k S
Sijk là hàm tính độ tương tự giữa thuộc tính k của 2 tình huống lập luận i và j
wk là trọng số xác định tầm quan trọng của thuộc tính k
Tính toán hàm tương tự của thuộc tính (S ijk ):
Xây dựng các hàm tương đồng của thuộc tính (Sijk) tùy thuộc vào từng bài toán cụ thể với phạm vi ứng dụng cụ thể Cách tính toán chi tiết cho nghiên cứu này được nêu
rõ trong mục 3.2.3.5.2
Xác định được các trọng số w k
Trang 27Khó khăn nhất của việc tính độ tương tự giữa các tình huống lập luận là xác định được các trọng số wi Trong thực tế, việc gán các trọng số này được thực hiện một cách cảm tính theo kinh nghiệm các chuyên gia Việc này rất khó chính xác và cho kết quả phù hợp Để khắc phục khuyết điểm này chúng ta sẽ dựa vào nhận xét của chuyên gia về độ tương tự giữa các trường hợp, từ đó xây dựng bộ trọng số tối ưu cho hàm tương tự
Cách thực hiện của phương pháp là dựa trên các tình huống lập luận và ý kiến
đánh giá của các chuyên gia, xây dựng một hàm mục tiêu đánh giá độ sai lệch trung
bình giữa: các giá trị hàm tương tự (hàm tính độ tương tự trên tập ca lập luận) và
đánh giá của các chuyên gia, sau đó sử dụng phương pháp giảm độ dốc (Gradient
Descent) và giải thuật di truyền (Genetic Algorithms-GA) để tối ưu hàm mục tiêu này
Khi các CSij tiến gần tới yij thì E(w) sẽ tiến tới cực tiểu
E thỏa mãn được các yêu cầu đặt ra cho một hàm đánh giá bộ trọng số, nó thể hiện sai số trung bình bình phương giữa các giá trị độ tương tự tính được nhờ công thức
(3.1) với các giá trị đánh giá tương ứng của các chuyên gia Vấn đề là làm sao để có thể tối thiểu được hàm E? Có 2 phương pháp:
o Phương pháp giảm độ dốc (Gradient descent)
Giảm Gradient là phương pháp tìm lời giải tối ưu cục bộ dựa trên các thông tin đạo hàm mục tiêu;
Giả sử ta có hàm mục tiêu E với p tham số đầu vào, mục tiêu của ta là tìm được giá trị các tham số đầu vào tại vị trí “lim” nhất của E, tức là có giá trị nhỏ nhất;
Phương pháp giảm độ dốc (Gradient descent) bao gồm các bước sau:
Chọn ngẫu nhiên một điểm x
Trang 28 Tính độ dốc của mặt E tại điểm x0;
Cập nhật các trọng số theo hướng dốc nhất của mặt E;
Xem điểm này như điểm x0 mới
Áp dụng vào CBR:
E là hàm đánh giá với các tham số đầu vào là w=(w1, w2, w3, …, wp);
Giả sử có 2 tình huống lập luận i, j khi đó độ tương tự giữa i và j được tính theo công thức(3.1);
Khi đó độ dốc mặt lồi tại w được tính như sau:
Bước 2: khởi tạo ngẫu nhiên wk trong đoạn 0,1 ;
Bước 3: tính wkvới mỗi k theo công thức(3.3);
Bước 4: tính lại wk wk wkvới mỗi k;
Bước 5: lặp lại bước 3, 4 tới khi hội tụ, đó là cho tới khi giá trị của E
một ngưỡng cho trước, hoặc tới khi số các bước lặp tới một giới hạn định trước
o Phương pháp dùng giải thuật di truyền (GA)
GA là một thuật giải mô phỏng các hiện tượng tự nhiên: kế thừa và đấu tranh sinh tồn để cải tiến lời giải và khảo sát không gian lời giải;
GA được dùng dựa trên quan điểm: quá trình tiến hóa tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó mang tính tối ưu, thế hệ sau bao giờ cũng tốt hơn thế hệ trước;
Để tìm nghiệm tối ưu của bài toán, GA sẽ thực hiện các bước sau:
Bước 1: khởi tạo ngẫu nhiên một quần thể ban đầu gồm một số các cá thể;
Bước 2: thực hiện các phép di truyền là lai ghép, đột biến và tái sinh;
Bước 3: thực hiện phép chọn lọc tự nhiên;
Bước 4: lặp lại bước 2 và 3 cho tới khi tìm ra một cá thể tốt nhất hoặc tới khi số thế hệ vượt qua một ngưỡng nào được cho trước;
Áp dụng GA cho CBR:
Biểu diễn mỗi cá thể (case) là một nghiệm bởi một vecto S có p thành phần (tương ứng p thuộc tính trong tình huống lập luận) và cá thể thứ k được biểu diễn với vecto Sk=(1, 2,…, p), mỗi Su là một dãy m bit tương ứng với trọng số wu;
Trang 29 Nếu độ chính xác cần đạt là 3 số lẻ trong khi các giá trị của Su chỉ thuộc đoạn 0,1 thì ta cần phải chia đoạn thành 1.103 khoảng và độ dài m=10bit;
Hàm định nghĩa độ thích nghi hay (hàm đánh giá) là hàm E tính trung bình bình phương (độ lệch) sinh ra bởi mỗi cá thể Sk: (3.3)
( ) 1
i j 1
CS là độ tương tự giữa hai ca lập luận thứ i và j trong tập ca lập luận với vecto trọng số Sk
Để tính được (S k)ij
CS , ta cần phải ánh xạ mỗi Su trong Sk thành một số thực
wv trong đoạn 0,1 , cách tính như sau:
Với mỗi chỉ số v trong Sk:
Biến đổi chỗ bit sv từ cơ số 2 sang cơ số 10, giả sử rằng w'v
Tìm số thực wvtương ứng với w'v
Các tham số khác cho giải quyết bài toán này là tùy chọn
Các quá trình lai ghép, đột biến, chọn lọc được thực hiện như giải thuật di truyền cổ điển
Trong Luận văn này sử dụng phương pháp GA để tìm trọng số, phương pháp này được trình bày chi tiết ở mục 3.2.3.4.3
Ngoài ra để xác định trọng số wk có thể dùng phương phương phân tích hồi qui (Sang-Yong Kim , Jae-Won Choi, Gwang-Hee Kim và Kyung-In Kang, 2005) [2]
o Phương pháp phân tích hồi qui
Phương pháp này cho kết quả chính xác hơn phương pháp giảm hệ số dốc (Gradient descent) Cốt lõi của phân tích hồi qui là phân tích sự tác động của các biến độc lập tới biến phụ thuộc Phân tích hồi quy là một phân tích thống kê để xác định xem các biến độc lập quy định các biến phụ thuộc như thế nào Mô hình phân tích hồi quy sẽ mô tả hình thức của mối liên hệ và qua đó giúp dự đoán được giá trị của biến phụ thuộc khi biết trước giá trị của biến độc lập
3.2.3.5 Các bước xây dựng Lập luận theo tình huống (CBR)
Lập bảng tính mô phỏng CBR
Trong nghiên cứu này, bảng tính mô phỏng CBR được thiết lập trên nền Microsoft Excel Bảng tính mẫu dùng để dự đoán chi phí xây dựng của dự án được hình thành thông qua 6 bước sau:
Bước 1: Tổ chức và định dạng dữ liệu (Organizing and formatting)
Dữ liệu được tổ chức theo dạng 2 ma trận được trình bày như Hình 3.3 Trong đó, một ma trận là các tình huống thử nghiệm (test case) cần ƯLCPXD và một ma trận là các tình huống đầu vào dùng làm CSDL (input case) Dùng khoảng 10% trong tổng số các tình huống được thu thập làm tình huống thử nghiệm
Trang 30Các tình huống thử nghiệm (test case) và các tình huống đầu vào dùng làm CSDL (input case) được bố trí theo hàng Những thuộc tính của các tình huống đầu vào dùng làm CSDL (input case) được bố trí theo cột
Giá trị những thuộc tính của các tình huống thử nghiệm và tình huống đầu vào được kí hiệu lần lượt là Iik và I’jk Trong đó Iik là giá trị của thuộc tính (attribute) k (k=1, 2, …, p) của tình huống thử nghiệm i (i=1, 2, …, m), I’jk là giá trị của thuộc tính (attribute) k (k=1, 2, …, p) của tình huống đầu vào j (j=1, 2, …, n)
Các trọng số (weights) của các thuộc tính wk (k=1, 2,…, p) được bố trí ở đầu ma trận dưới dạng hàng Cách để xác định trọng số này được trình bày ở bước 3 Sau khi định dạng xong, thêm giá trị cụ thể của những thuộc tính của các tình huống, giá trị này có 2 dạng: số (numerical) hoặc phân loại (categorical)
TEST CASEBASE Attributes
INPUT CASEBASE Attributes
là giá trị thuộc tính của tình huống trong kho CSDL;
Áp dụng vào bảng tính CBR như sau:
Trang 31Hàm tương đồng của các thuộc tính dùng để xác định giá trị tương đồng của thuộc tính với nhau Độ tương đồng của các thuộc tính được xác định dựa vào giá trị thuộc tính của tình huống thử nghiệm và giá trị từng thuộc tính của các tình huống được truy xuất từ CSDL Ví dụ tính toán độ tương đồng của dữ liệu dạng số (numerical) và phân loại (categorical) của thuộc tính được trình bày trong Hình 3.3 Độ tương tự của thuộc tính được kí hiệu Sijk Trong đó: i là các tình huống thử nghiệm (i=1, 2, …,m), j là các tình huống đầu vào (j=1, 2, …, n) và k là thuộc tính (k=1, 2, …, p)
Giả thiết rằng: giá trị của thuộc tính đầu tiên ứng với tình huống thử nghiệm đầu tiên là I11 (ở ô B5 trong Hình 3.3) có dạng là phân loại, tương ứng thì giá trị của thuộc tính đầu tiên ứng với tình huống đầu vào đầu tiên là I’11 (ở ô B11 trong Hình 3.3) cũng
có dạng là phân loại thì độ tương tự của thuộc tính trong 2 tình huống được tính như sau: Nếu I11 giống với I’11 thì S111=1, nếu I11 khác với I’11 thì S111=0
Giả thiết rằng: giá trị của thuộc tính thứ 3 ứng với tình huống thử nghiệm đầu tiên
là I13 (ở ô D5 trong Hình 3.3) có dạng là số, tương ứng thì giá trị của thuộc tính thứ 3 ứng với tình huống đầu vào đầu tiên là I’13 (ở ô D11 trong Hình 3.3) cũng có dạng là
số thì độ tương tự của thuộc tính trong 2 tình huống được tính như đã nêu ở mục
3.2.3.4.2 theo công thức (3.5) Chi tiết tính toán cụ thể được trình bày trong Hình 3.4:
Hình 3 4: Tính toán độ tương tự của thuộc tính của Test Case với từng Input Case
Bước 3: Thiết lập những trọng số của các thuộc tính (Establishing
Trang 32Trọng số của các thuộc tính được xác định bằng phương pháp giải thuật di truyền (Genetic Algorithm - GA)
o Giới thiệu giải thuật di truyền
Giải thuật di truyền đã được đề cập trong rất nhiều tài liệu, trong đó có các công trình của D.E Goldberg [15] và Thomas Back [16] Phần này chỉ trình bày các khái niệm căn bản của giải thuật di truyền cũng như khả năng ứng dụng của nó
Từ trước đến nay, trong các nghiên cứu và ứng dụng tin học đã xuất hiện nhiều bài toán chưa tìm ra được phương pháp giải nhanh và hợp lý Phần lớn đó là các bài toán tối ưu nảy sinh trong các ứng dụng Để giải các bài toán này người ta thường phải tìm đến một giải thuật hiệu quả mà kết quả thu được chỉ là xấp xỉ tối ưu Trong nhiều trường hợp chúng ta có thể sử dụng giải thuật xác suất, tuy không bảo đảm kết quả tối
ưu nhưng có thể chọn các giá trị sao cho sai số đạt được sẽ nhỏ như mong muốn Theo lời giải xác suất, việc giải bài toán quy về quá trình tìm kiếm trên không gian tập hợp các lời giải có thể Tìm được lời giải tốt nhất và quá trình được hiểu là tối ưu Với miền tìm kiếm nhỏ, một số thuật toán cổ điển được sử dụng Tuy nhiên đối với các miền lớn, phải sử dụng các kỹ thuật trí tuệ nhân tạo đặc biệt, giải thuật di truyền là một trong những công cụ đó Ý tưởng của GA là mô phỏng những gì mà tự nhiên đã thực hiện GA hình thành dựa trên quan niệm cho rằng: quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó đã mang tính tối ưu
Giải thuật di truyền áp dụng quá trình tiến hóa tự nhiên để giải các bài toán tối ưu trong thực tế (từ tập các lời giải có thể ban đầu thông qua nhiều bước tiến hóa hình thành các tập hợp mới với lời giải tốt hơn và cuối cùng sẽ tìm được lời giải gần tối ưu) [16]
Những vấn đề căn bản được đặt ra là: Áp dụng di truyền tự nhiên vào giải thuật di truyền như thế nào? Cách biểu diễn tập hợp các lời giải ra sao? Chúng ta sẽ tìm hiểu chi tiết vấn đề này trong phần tiếp theo
Tư tưởng chính của giải thuật di truyền
“Giải thuật di truyền là một loại thuật toán mô phỏng các hiện tượng tự nhiên: kế
thừa và đấu tranh sinh tồn để cải tiến lời giải và khảo sát không gian lời giải
Khái niệm kế thừa và đấu tranh sinh tồn được giải thích qua ví dụ về sự tiến hoá của một quần thể thỏ như sau:
Có một quần thể thỏ Trong số đó có một số con nhanh nhẹn và thông minh hơn những con khác Những chú thỏ nhanh nhẹn và thông minh có xác suất bị chồn, cáo ăn thịt nhỏ hơn, do đó chúng tồn tại để làm những gì tốt nhất có thể: tạo thêm nhiều thỏ tốt Dĩ nhiên, một số thỏ chậm chạp, đần độn cũng sống chỉ vì may mắn Quần thể những chú thỏ còn sống sót sẽ bắt đầu sinh sản Việc sinh sản này sẽ tạo ra một hỗn hợp tốt về “nguyên liệu di truyền thỏ”: Một số thỏ chậm chạp có con với những con thỏ nhanh, một số thỏ nhanh với thỏ nhanh, một số thỏ thông minh với thỏ đần độn,…
Và trên tất cả, thiên nhiên thỉnh thoảng lại ném vào một con thỏ “hoang dã” bằng cách làm đột biến nguyên liệu di truyền thỏ Những chú thỏ con, do kết quả này sẽ nhanh hơn và thông minh hơn những con trong quần thể gốc vì có nhiều bố mẹ nhanh nhẹn
và thông minh hơn đã thoát chết khỏi chồn, cáo (Thật hay là những con chồn cáo cũng trải qua những tiến trình tương tự, nếu không những con thỏ sẽ trở nên nhanh chóng và thông minh đến nỗi những con chồn, cáo không thể bắt chúng được)” [25]
Trang 33Khi tìm kiếm lời giải tối ưu, GA cũng thực hiện các bước tương ứng với câu chuyện đấu tranh sinh tồn của loài thỏ GA cũng sử dụng các thuật ngữ vay mượn của
di truyền học Ta có thể nói về các cá thể (hay kiểu gen, cấu trúc) trong một quần thể, những cá thể này cũng còn được gọi là các nhiễm sắc thể (chromosome) Điều này có thể gây một chút nhầm lẫn: mỗi tế bào của một cơ thể của một chủng loại đã cho mang một số loại nhiễm sắc thể nào đó (ví dụ ở người có 46 nhiễm sắc thể), nhưng trong GA
ta chỉ nói về những cá thể có một nhiễm sắc thể Các nhiễm sắc thể được tạo thành từ các đơn vị - các gen - biểu diễn trong một chuỗi tuyến tính Mỗi gen kiểm soát một hoặc nhiều đặc trưng Gen với những đặc trưng nhất định có vị trí nhất định trong nhiễm sắc thể Bất cứ đặc trưng nào của cá thể cũng có thể tự biểu hiện một cách phân biệt và gen có thể nhận một số giá trị khác nhau Một nhóm các gen (nhiễm sắc thể) sẽ biểu diễn một lời giải của bài toán đang giải (ý nghĩa, cấu trúc của nhiễm sắc thể được người sử dụng xác định trước) Một tiến trình tiến hoá được thực hiện trên một quần thể các nhiễm sắc thể tương ứng với một quá trình tìm kiếm lời giải trong không gian lời giải
Thực ra, GA thuộc lớp các thuật toán xác suất, nhưng lại rất khác những thuật toán ngẫu nhiên vì chúng kết hợp các phần tử tìm kiếm trực tiếp và ngẫu nhiên Khác biệt quan trọng giữa phương pháp tìm kiếm của GA và các phương pháp tìm kiếm khác là
GA duy trì và xử lý một tập các lời giải (quần thể) - tất cả các phương pháp khác chỉ
xử lý một điểm trong không gian tìm kiếm Chính vì thế, GA mạnh hơn các phương pháp tìm kiếm hiện có rất nhiều
Cấu trúc của giải thuật di truyền đơn giản tương tự như cấu trúc của bất kì một chương trình tiến hoá nào Ở bước lặp t, giải thuật di truyền duy trì một quần thể các lời giải (các nhiễm sắc thể), P( )t ={x x1 , 2 , , xn } Mỗi lời giải x i t được lượng giá để
biết được độ “thích nghi” của nó Sau đó ở lần lặp thứ t+1, một quần thể mới được
hình thành bằng cách chọn giữ lại những cá thể thích nghi nhất Một số cá thể của quần thể này trải qua những biến đổi nhờ lai tạo (phép lai) và đột biến (phép đột biến), hình thành nên những lời giải mới Phép lai kết hợp các tính chất của hai nhiễm sắc thể
‘cha’ và ‘mẹ’ để tạo ra các nhiễm sắc thể ‘con’ bằng cách hoán vị các đoạn gen tương ứng của cha và mẹ Ví dụ: nếu cha mẹ được biểu diễn bằng vectơ 5 chiều
(a 1 ,b 1 ,c 1 ,d 1 ,e 1 ) và (a 2 ,b 2 ,c 2 ,d 2 ,e 2), thì lai tạo, hoán vị tại vị trí thứ 2 sẽ sinh ra các nhiễm
sắc thể con (a 1 ,b 1 ,c 2 ,d 2 ,e 2 ) và (a 2 ,b 2 ,c 1 ,d 1 ,e 1) Phép lai cho phép trao đổi thông tin giữa các lời giải
Khác với phép lai, phép đột biến thay đổi một cách ngẫu nhiên một hay nhiều gen của nhiễm sắc thể được chọn, thay đổi này được thực hiện với một xác suất thể hiện tốc độ đột biến Phép đột biến cho phép đưa thêm các thông tin mới vào quần thể làm cho chất liệu di truyền phong phú thêm
Sau đây chúng ta sẽ tìm hiểu về một giải thuật di truyền đơn giản
Giải thuật di truyền đơn giản
Cấu trúc của giải thuật di truyền đơn giản
Trong giải thuật di truyền đơn giản, hệ gen của cá thể được biểu diễn thành một chuỗi nhị phân gồm 2 giá trị 0 và 1 Mỗi thành phần trong chuỗi số gọi là allele (gen tương ứng) Giải thuật di truyền đơn giản bao gồm 3 toán tử sau:
Tái tạo (Reproduction)
Trang 34 Đột biến (Mutation)
“Xét ví dụ bài toán hộp đen như sau: Cho một hộp đen với một dãy 5 công tắc ở đầu vào Một tổ hợp các trạng thái của 5 công tắc ứng với một tín hiệu ra (output) của hàm f, biểu diễn theo toán học là f(s), trong đó s là một tổ hợp các trạng thái cụ thể của
5 công tắc Mục tiêu của bài toán là phải đặt các công tắc như thế nào để đặt được giá trị tối đa có thể có của hàm f Với những phương pháp khác của bài toán tối ưu, chúng
ta có thể làm việc trực tiếp với bộ các thông số (việc đặt các công tắc) và bật tắt các công tắc từ một trạng thái này sang trạng thái khác bằng cách dùng những quy tắc chuyển đổi theo phương pháp chuyên biệt Với giải thuật di truyền đơn giản, đầu tiên
ta mã hoá dãy các công tắc thành một chuỗi có chiều dài xác định Cách mã hoá rất tự nhiên: dùng chuỗi dài 5 kí tự gồm các giá trị 0 và 1, với quy ước ‘0’ = tắt, ‘1’ = mở Ví dụ: chuỗi 11101 nghĩa là công tắc thứ 4 tắt, 4 công tắc còn lại mở Với giải thuật di truyền đơn giản, ta không cần biết nguyên tắc làm việc của hộp đen
Giải thuật di truyền đơn giản bắt đầu với một quần thể các chuỗi và sau đó sẽ phát sinh thành công những quần thể chuỗi khác Với bài toán hộp đen, một sự bắt đầu ngẫu nhiên bằng cách tung đồng tiền (ngửa = ‘1’, sấp= ‘0’) có thể sản sinh quần thể ban đầu có kích thước n=4 như sau:
hệ tiếp theo
Thao tác sinh sản hay còn gọi là thao tác chọn cha mẹ được điều khiển bằng cách quay bánh xe roulette, trong đó mỗi chuỗi trong quần thể chiếm một khe có kích thước
tỉ lệ với độ thích nghi (fitness) của nó trên bánh xe
Giả sử các chuỗi của quần thể ban đầu đã khởi tạo trong bài toán hộp đen có các giá trị hàm thích nghi như trong bảng sau Lấy tổng độ thích nghi của 4 chuỗi, chúng
ta được 1170 Ta sẽ tính tỉ lệ % độ thích nghi của từng chuỗi trong quần thể:
Bảng 3 1 Các chuỗi của bài toán mẫu và các giá trị thích nghi
STT Chuỗi Độ thích nghi Tỉ lệ (%)
Trang 35STT Chuỗi Độ thích nghi Tỉ lệ (%)
Tổng cộng 1170 100.0 Bánh xe rollete được đánh trọng số phù hợp cho sự tái tạo của thế hệ này được thể hiện trên hình sau:
Hình 3 5: Sự sinh sản đơn giản phân bố các chuỗi con cháu nhờ sử dụng bánh xe
roulette với các khe hở tỷ lệ với độ thích nghi
Với bài toán hộp đen, để sinh sản chúng ta chỉ cần quay bánh xe roulette 4 lần đối với bài toán này, chuỗi 1 có giá trị thích nghi là 169, đại diện cho 14.4% bánh xe roulette, và cứ mỗi lần quay xác suất chọn chuỗi 1 là 0.144 Tương tự với các chuỗi còn lại Mỗi khi chúng ta yêu cầu một thế hệ khác, một vòng quay đơn giản của bánh
xe đánh trọng số sẽ chọn ra được ứng cử viên để sinh sản Bằng cách này, những chuỗi thích nghi hơn sẽ có một số lượng con cháu lớn hơn trong thế hệ kế tiếp
Lai ghép:
Mỗi khi một chuỗi được chọn để sinh sản, một bản sao chính xác của chuỗi đó sẽ được tạo ra Các bản sao này được đưa vào bể ghép đôi (matingpool) Toán tử lai ghép đơn giản có thể được tiến hành theo hai bước:
Bước 1: Các thành viên của các chuỗi đơn giản mới ở trong bể ghép được ghép đôi với nhau một cách ngẫu nhiên
Bước 2: Mỗi cặp chuỗi sẽ trải qua việc ghép chéo như sau: Một số nguyên chỉ vị trí k dọc theo chuỗi sẽ được lựa chọn qua giá trị ngẫu nhiên nằm trong khoảng từ 1 đến chiều dài chuỗi L-1 ([1, L-1]) Hai chuỗi mới sẽ được tạo ra bằng cách hoán đổi tương ứng các chuỗi ký tự từ vị trí 1 đến k và từ k+1 đến L của hai chuỗi cha-mẹ cho nhau
Ví dụ: xét 2 chuỗi A1 và A2 từ quần thể ban đầu:
A 1 = 0110|1
A2 = 1100|0
Giả sử trong khi chọn một số ngẫu nhiên nằm trong khoảng từ 1 đến 4, chúng ta được k = 4 (như được chỉ ra bằng dấu ngăn cách “|”) Kết quả của việc ghép chéo làm sinh ra hai chuỗi mới A’1 và A’2, trong đó dấu ’ có nghĩa là các chuỗi này là phần tử của thế hệ mới
1 14.4 %
2 49.2 %
3 5.5 %
4 30.9 %
Trang 36A’1 = 01100
A’2 = 11001
Cơ chế sinh sản và ghép chéo đơn giản, bao gồm việc sinh số ngẫu nhiên, sao chép chuỗi và trao đổi các chuỗi thành phần Tuy nhiên, điểm cần nhấn mạnh là việc sinh sản và trao đổi thông tin có cấu trúc (dù là một cách ngẫu nhiên) của cả quá trình ghép chéo làm cho các giải thuật di truyền tăng thêm sức mạnh
Đột biến:
Nếu sự sinh sản theo độ thích nghi kết hợp với sự ghép chéo cho giải thuật di truyền có năng lực xử lý tốt hơn, thì sự đột biến đóng một vai trò quyết định thứ hai trong hoạt động của giải thuật di truyền Sự đột biến là cần thiết bởi vì: cho dù sự sinh sản và ghép chéo đã tìm kiếm hiệu quả và tái kết hợp lại các gen với nhau, nhưng thỉnh thoảng chúng có thể làm mất một vài gen hữu ích nào đó (bít 1 hay bít 0 tại những vị trí đặc biệt nào đó) Trong các hệ thống gen nhân tạo, toán tử đột biến sẽ chống lại sự mất mát không được khôi phục đó Trong giải thuật di truyền đơn giản, đột biến là sự thay đổi ngẫu nhiên và không thường xuyên (với xác xuất nhỏ) trị số vị trí của một chuỗi Trong việc mã hóa nhị phân của bài toán hộp đen có nghĩa là chỉ cần đổi 1 thành 0 và ngược lại Sự đột biến là một hoạt động ngẫu nhiên trong không gian chuỗi, khi được dùng cùng với sự sinh sản và ghép chéo nó sẽ là một chính sách bảo hiểm chống lại nguy cơ mất mát những gen quan trọng
Ba toán tử tái tạo, lai ghép, đột biến được áp dụng lặp đi lặp lại để tạo ra nhiễm sắc thể mới Coi như một thế hệ mới tương ứng với một quá trình sinh sản đã được tạo xong bao gồm một quần thể các chuỗi nhiễm sắc thể, trong giải thuật di truyền có thể sinh ra nhiều thế hệ
Sơ đồ giải thuật di truyền đơn giản
Giải thuật di truyền bao gồm các bước sau:
1 Khởi tạo quần thể ban đầu của các chuỗi nhiễm sắc thể
2 Xác định giá trị hàm mục tiêu cho mỗi một chuỗi nhiễm sắc thể
3 Tạo các chuỗi nhiễm sắc thể mới bằng sinh sản từ các chuỗi nhiễm sắc thể hiện tại, có tính đến ghép chéo và đột biến xảy ra (nếu có)
4 Xác định hàm mục tiêu cho các chuỗi nhiễm sắc thể mới và đưa nó vào trong một quần thể mới
5 Nếu điều kiện dừng đã thỏa mãn thì dừng lại và trả về chuỗi nhiễm sắc thể tốt nhất cùng với giá trị hàm mục tiêu của nó, nếu không thì quay về bước 3
Quy trình tìm trọng số của thuộc tính
GA sử dụng phương pháp tiến hóa, đặc biệt lựa chọn cá thể thích nghi nhất Lý thuyết đằng sau GA là một quần thể của một số loài nhất định sẽ thích nghi để sống tốt hơn trong môi trường sau nhiều sự tiến hóa ngẫu nhiên Vì thế, đầu tiên GA tạo ra một quần thể các giải pháp khả thi để giải quyết vấn đề Sau đó những cá thể trong quần thể được sinh ra ngẫu nhiên, quá trình đó được gọi là lai ghép (crossover), cho tới khi
có được cá thể thích nghi nhất ( giải pháp tốt nhất cho vấn đề) được hình thành Sau khi một số lượng lớn các thế hệ hình thành, cuối cùng sẽ xuất hiện một quần thể mà ở
đó các cá thể sẽ cho một giải pháp tối ưu để giải quyết vấn đề Trong luận văn này, một phần mềm GA thương mại, đó là Evolver được dùng để tìm ra bộ trọng số của mô
Trang 37hình Evolver là việc như là một phần bổ sung (add-in) trong Microsoft Excel (Evolver v5.5) Những trọng số hình thành bằng Evolver được đưa vào mô hình CBR được lập trong Excel
Hình 3.6 trình bày Sơ đồ khối quá trình tối ưu hóa theo GA, phương pháp này dùng để tìm trọng số trong luận văn Để dùng GA để thiết lập những trọng số, một trong những tình huống trong Cơ sở dữ liệu các tình huống đầu vào (Input casebase) được tách ra
và được gọi là “một tình huống đánh giá” (evaluation case) Độ tương tự giữa các thuộc tính của tình huống đánh giá với các thuộc tính tương ứng của các tình huống còn lại được tính bằng công thức …(công thức Sim=min/max đối với dạng số và dạng phân loại) Đặt giả thiết ban đầu rằng các thuộc tính có vai trò quan trọng ngang nhau, những độ tương tự tình huống (CS) giữa tình huống đánh giá và các tình huống còn lại trong cơ sở dữ liệu các tình huống đầu vào được hình thành thông qua bộ trọng số tính được bằng cách lấy trung bình tất cả bộ trọng số tìm được …
Màn hình tối ưu bằng Evolver được trình bày trong Hình 3.7 với những ô thay đổi (the adjustable cells) chứa các biến tối ưu (hay được gọi là các trọng số thuộc tính trong hệ thống CBR và chromsome trong giải thuật GA) Trong luận văn này, miền giá trị của các trọng số thuộc tính là tập hợp giá trị thuộc đoạn 1 đến 10, mặc định kích cỡ quần thể là 50, và Evolver sẽ chạy 15.000 lần để tìm ra các trọng số thuộc tính tối ưu sao cho độ tương tự các tình huống (CS) (hàm mục tiêu) (gần đến 1) Quá trình này được lặp lại nhiều lần, các tình huống trong cơ sở dữ liệu tình huống đầu vào lần lượt được lấy ra để so sánh với tình huống đánh giá để tìm trọng số ở mỗi vòng lặp Giá trị trung bình của bộ trọng số được tính bằng GA được sử dụng để làm bước 4 CBR
Trang 38CƠ SỞ DỮ LIỆU (CSDL) ĐẦU VÀO
XUẤT 1 TÌNH HUỐNG
TRONG CSDL LÀM
TÌNH HUỐNG ĐÁNH GIÁ
CÁC TÌNH HUỐNG CÒN LẠI TRONG CSDL ĐẦU VÀO BỘ TRỌNG SỐ THUỘC TÍNHGIẢ ĐỊNH BAN ĐẦU LÀ 1
TÍNH ĐỘ TƯƠNG TỰ GIỮA CÁC THUỘC TÍNH
TÍNH ĐỘ TƯƠNG TỰ GIỮA CÁC TÌNH HUỐNG
CHỌN TÌNH HUỐNG TIẾP THEO
TRONG CSDL LÀM TÌNH HUỐNG
ĐÁNH GIÁ KẾ TIẾP
TRUY XUẤT TÌNH HUỐNG CÓ KẾT QUẢ GẦN GIỐNG NHẤT VỚI TÌNH HUỐNG ĐÁNH GIÁ
CHO GIÁ TRỊ ĐỘ TƯƠNG TỰ GIỮA CÁC TÌNH HUỐNG ĐƯỢC CHỌN VÀO GA
THỰC HIỆN TỐI ƯU BẰNG GA ĐỂ GIÁ TRỊ ĐỘ TƯƠNG TỰ CỦA TÌNH HUỐNG GẦN ĐẾN 1
PHƯƠNG PHÁP GA SẼ THIẾT LẬP BỘ TRỌNG SỐ THUỘC TÍNH MỚI
TẤT CẢ CÁC TÌNH HUỐNG TRONG CSDL ĐÃ ĐƯỢC LÀM TÌNH HUỐNG
ĐÁNH GIÁ?
ĐÚNG SAI
LẤY TRUNG BÌNH CÁC TRỌNG SỐ ĐƯỢC THIẾT LẬP CỦA TẤT CẢ CÁC TÌNH HUỐNG ĐÁNH GIÁ
CHO CÁC TRỌNG SỐ MỚI THIẾT LẬP CỦA CÁC THUỘC TÍNH VÀO TRONG QUY TRÌNH CBR
Hình 3 6: Quy trình nghiên cứu tối ưu trọng số bằng giải thuật di truyền (Genetic
algorithm – GA
Trang 39Hình 3 7: Màn hình tối ưu các trọng số thuộc tính CBR bằng Evolver
Bước 4: Tính toán trọng số độ tương đồng của tình huống cần ước lượng chi phí so với từng tình huống trong CSDL (Calculating weighted case similarities)
Độ tương đồng của tình huống cần ước lượng chi phí so với từng tình huống trong CSDL được tính dựa vào độ tương đồng của thuộc tính được tính ở bước 2 và trọng số của thuộc tính được tính ở bước 3
Chỉ số độ tương đồng này luôn nằm trong khoảng từ 0 đến 1; nhận giá trị 1 khi hai tình huống hoàn toàn giống nhau, nhận giá trị 0 khi hai tình huống hoàn toàn khác nhau Được xác định theo công thức (1)
Trang 40= SUM($B$2*K4,$C$2*L4,$D$2*M4, ,$F$2*O4)/
SUM($B$2,$C$2,$D$2, ,$F$2)
Chỉ làm một lần và sao chép cho các ô tương tự còn lại.
Hình 3 8: Ma trận độ tương đồng của tất cả các tình huống cần ước lượng chi phí xây
dựng so với từng tình huống trong CSDL
Bước 5: Xuất các tình huống trong CSDL tương ứng với các CSij lớn nhất (Sorting weighted case similarities and corresponding outputs)
Tình huống cần ước lượng i nào giống với tình huống j trong CSDL nhất thì độ tương đồng của 2 tình huống này sẽ có giá trị trọng số độ tương đồng (CSij) lớn nhất Cách tính được (xem Hình 3.9) thực hiện lần lượt đối với mỗi tình huống cần ước lượng chi phí:
maxCSij=max(CSi1, CSi2, …,CSin) với i=1,2,…,m
Một lần nữa giá trị trọng số độ tương đồng (CSij) lớn nhất được xác định (xem cột
AA ở Hình 3.8 và Hình 3.9), tương ứng là số hiệu các tình huống được trích ra từ CSDL (xem cột AB ở Hình 3.9) và xuất ra giá trị của tình huống được trích ra từ CSDL (xem cột AC Hình 3.9)
2 Highest Score Case No Output Value
Actual Outputs for Test Cases
=AVERAGE(AE3,AE4, ,AE8)
Hình 3 9: Kết quả xuất ra từ bảng tính CBR và tính sai số
Bước 6: Tính toán sai số giữa giá trị chi phí xây dựng ước lượng so với chi phí xây dựng thực thế của dự án (Calculating the error)