Phân tích hồi quy đa biến để xây dựng mô hình chi phí xây dựng với sự ảnh hưởng của 10 biến độc lập đã được kiểm tra điều kiện khá thẳng và tương quan giữa các biến với nhau
Trang 1BỘ GIÁO DỤC VÀO ĐÀO TẠO TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
THÁI TÂN DƯƠNG
DÙNG MÔ HÌNH HỒI QUY DỰ BÁO CHI PHÍ THỰC HIỆN CÁC DỰ ÁN XÂY DỰNG THUỘC LĨNH VỰC VĂN HÓA - XÃ HỘI SỬ DỤNG VỐN NGÂN SÁCH TRÊN ĐỊA BÀN HUYỆN CẦN GIỜ, TP.HCM
Chuyên ngành: Xây dựng công trình dân dụng và Công nghiệp
Mã số chuyên ngành: 60 58 02 08
LUẬN VĂN THẠC SĨ XÂY DỰNG
Người hướng dẫn khoa học
TS ĐINH CÔNG TỊNH
Trang 2LỜI CAM ĐOAN
Tôi tên Thái Tân Dương
Tôi cam đoan rằng luận văn này “Dùng mô hình hồi quy dự báo chi phí thực hiện các dự án xây dựng thuộc lĩnh vực Văn hóa - Xã hội sử dụng vốn ngân sách trên địa bàn huyện Cần Giờ, thành phố Hồ Chí Minh” là nghiên cứu của
chính tôi
Ngoài trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được công bố hoặc được sử dụng để nhận bằng cấp ở những nơi khác
Không có sản phẩm hoặc nghiên cứu nào của người khác được sử dụng trong luận văn này mà không được trích dẫn theo quy định
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các trường đại học hoặc cơ sở đào tạo khác
TP Hồ Chí Minh, ngày 01 tháng 8 năm 2017
Thái Tân Dương
Trang 3LỜI CẢM ƠN
Trước hết, Tôi xin trân trọng bày tỏ lòng biết ơn sâu sắc đến TS Đinh Công Tịnh đã quan tâm và tận tình hướng dẫn tôi trong suốt quá trình thực hiện đề tài nghiên cứu Tôi cũng xin bày tỏ lòng biết ơn Ban Giám hiệu, Khoa đào tạo Sau đại học Trường đại học Mở Thành phố Hồ Chí Minh đã truyền đạt kiến thức, kinh nghiệm thực tiễn trong quá trình tôi theo học tại trường
Xin chân thành gửi lời cảm ơn đến toàn thể giảng viên đã tham gia giảng dạy khóa cao học 2013
Tôi xin bày tỏ lòng biết ơn đến toàn thể lãnh đạo và viên chức của Ban Quản lý đầu
tư xây dựng công trình huyện Cần Giờ đã nhiệt tình giúp đỡ tôi trong quá trình khảo sát và thu thập dữ liệu cần thiết cho luận văn
Cuối cùng, tôi xin cảm ơn đến cha mẹ, gia đình và bạn bè đã luôn giúp đỡ tôi trong suốt quá trình thực hiện luận văn này
Xin chân thành cảm ơn!
TP.Hồ Chí Minh, ngày 01 tháng 8 năm 2017
Thái Tân Dương
Trang 4TÓM TẮT
Luận văn sử dụng phân tích hồi quy dự báo chi phí thực hiện các dự án xây dựng thuộc lĩnh vực Văn hóa - Xã hội sử dụng vốn ngân sách trên địa bàn huyện Cần Giờ, thành phố Hồ Chí Minh
Sau khi tham khảo các luận văn, bài báo và khảo sát ý kiến của chuyên gia trong lĩnh vực xây dựng đã xác định được 14 nhân tố ảnh hưởng đến chi phí xây dựng công trình thuộc lĩnh vực Văn hóa - Xã hội
Dữ liệu sơ cấp: Một cuộc khảo sát với 100 bảng câu hỏi đến các kỹ sư, chuyên gia hoạt động trong lĩnh vực xây dựng để lấy ý kiến Kết quả thu được 96 bảng câu hỏi hợp lệ Tiến hành mã hóa dữ liệu vào phần mềm SPSS Version 22 để phân tích độ tin cậy của thang đo thu được hệ số Cronbach Alpha= 0,804
Dữ liệu thứ cấp: Một bộ dữ liệu gồm 35 công trình xây dựng thuộc lĩnh vực Văn hóa - Xã hội (bao gồm Trụ sở Ủy ban nhân dân và Nhà văn hóa thể thao các cấp trên địa bàn huyện Cần Giờ) chia làm 02 nhóm
+ Nhóm 1: Sử dụng 32 dự án để phân tích hồi quy
+ Nhóm 2: Sử dụng 03 dự án để kiểm tra lại mô hình đã xây dựng
Sử dụng biểu đồ Scatterplot kiểm tra điều kiện khá thẳng của 14 biến độc lập và 1 biến phụ thuộc thu được 10 biến đầu vào thỏa mãn điều kiện khá thẳng để đưa vào phân tích hồi quy
Phân tích hồi quy đa biến để xây dựng mô hình chi phí xây dựng với sự ảnh hưởng của 10 biến độc lập đã được kiểm tra điều kiện khá thẳng và tương quan giữa các biến với nhau
Phân tích hồi quy bằng 3 phương pháp lựa chọn biến: phương pháp đưa vào dần (Forward selection), phương pháp lựa chọn từng bước (Stepwise selection), phương pháp loại trừ dần (Backward elimination) Cả 3 phương pháp đều cho một phương trình hồi quy Mô hình thu được đã vượt qua 7 điều kiện giả định và kiểm định giả thuyết Kết quả thu được R2=0,903 và phần trăm sai số tuyệt đối trung bình MAPE
Trang 5MỤC LỤC
CHƯƠNG 1: ĐẶT VẤN ĐỀ 1
1.1 Giới thiệu chung 1
1.2 Xác định vấn đề nghiên cứu: 2
1.3 Các mục tiêu nghiên cứu: 3
1.4 Phạm vi nghiên cứu: 3
1.5 Đóng góp của nghiên cứu: 4
CHƯƠNG 2: TỔNG QUAN 5
2.1 Tình hình đầu tư các công trình thuộc lĩnh vực Văn hóa - Xã hội giai đoạn 2011 - 2016 trên địa bàn huyện Cần Giờ: 5
2.2 Các phương pháp xác định chi phí xây dựng công trình truyền thống: 6
2.2.1 Phương pháp xác định chi phí xây dựng theo thiết kế cơ sở của dự án đầu tư: 6
2.2.2 Phương pháp xác định chi phí xây dựng theo suất vốn đầu tư xây dựng công trình: 6
2.2.3 Phương pháp xác định chi phí xây dựng theo số liệu của các dự án có các công ninh xây dựng có chỉ tiêu kinh tế - kỹ thuật tương tự đã thực hiện: 6
2.2.4 Phương pháp kết hợp để xác định tổng mức đầu tư: 6
2.3 Các nghiên cứu tương tự đã được công bố: 7
2.3.1) Al-Momani [1]: 7
2.3.2 Attalla [2]: 8
2.3.3 Kim [3]: 8
2.3.4 David [4]: 8
2.3.5 Lưu Nhất Phong [9]: 9
2.3.6 Nguyễn Thanh Trúc [12]: 10
2.3.7 Nguyễn Hữu Phúc [11]: 10
CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU 13
3.1 Quy trình nghiên cứu: 13
3.2 Các công cụ nghiên cứu: 14
3.3 Thu thập dữ liệu: 14
Trang 63.4.1 Quy trình thiết kế bảng câu hỏi: 14
3.4.2 Cấu trúc của bảng câu hỏi 15
3.5 Thiết kế mẫu: 16
3.5.1 Khung lấy mẫu 16
3.5.2 Xác định kích thước mẫu 16
3.5.3 Phương pháp lấy mẫu 16
3.6 Thang đo và độ tin cậy của thang đo 16
3.7 Thu thập dữ liệu 16
3.8 Phân tích dữ liệu 17
3.9 Thiết lập mô hình hồi quy đa biến 17
3.9.1 Phân tích hồi quy đa biến: 17
3.9.1.1 Các khái niệm: 17
3.9.1.2 Các giả định trong phân tích hồi quy: 19
3.9.1.3 Giả định độc lập: 19
3.9.1.4 Giả định phân phối chuẩn và phương sai bằng nhau: 19
3.9.1.5 Giả định tuyến tính: 19
3.9.1.6 Các thông số trong phân tích hồi quy: 19
3.9.2 Phương pháp lựa chọn biến [6] 21
3.9.3 Kiểm định các giả thuyết của mô hình hồi quy [6] 22
3.9.3.1 Kiểm định về sự phù hợp của mô hình: 22
3.9.3.2 Kiểm định về ý nghĩa các hệ số hồi quy riêng phần βk 23
3.9.3.3 Kiểm định giả thuyết về tầm quan trọng của các biến 23
3.9.4 Kiểm định các giả định của mô hình hồi quy 23
3.9.4.1 Giả định độc lập của sai số 23
3.9.4.2 Giả định phân phối chuẩn của phần dư 24
3.9.4.3 Giả định phương sai của sai số không đổi 24
3.9.4.4 Giả định liên hệ tuyến tính 24
3.9.4.5 Giả định không có mối tương quan giữa các biến độc lập 24
3.9.5 Các bước xây dựng mô hình hồi quy đa biến 24
CHƯƠNG 4: XÂY DỰNG MÔ HÌNH HỒI QUY ĐA BIẾN 26
Trang 74.1 Xác định các nhân tố chính ảnh hưởng đến chi phí xây dựng công trình thuộc
lĩnh vực Văn hóa - Xã hội 26
4.1.1 Dữ liệu sơ cấp 26
4.1.2 Đánh giá độ tin cậy thang đo 29
4.1.4 Dữ liệu thứ cấp 31
4.2 Xây dựng mô hình hồi quy đa biến 31
4.2.1 Xử lý các số liệu thu thập 31
4.2.1.1 Mã hóa biến 31
4.2.1.2 Phân nhóm dữ liệu: 33
4.2.2 Kiểm tra điều kiện khá thẳng 34
4.2.3 Phân tích tương quan giữa các biến 40
4.2.4 Phân tích MLR bằng phương pháp Forward Selection 43
4.2.4.1 Phân tích MLR bằng SPSS 43
4.2.4.2 Kiểm tra các vi phạm giả thuyết và kiểm định mô hình 46
4.2.4.2.1 Kiểm định giả thuyết về sự phù hợp của mô hình (Phân tích phương sai) 46
4.2.4.2.2 Kiểm định ý nghĩa các hệ số hồi quy trong mô hình 46
4.2.4.2.3 Kiểm định giả định liên hệ tuyến tính 46
4.2.4.2.4 Kiểm định phương sai của sai số không đổi 47
4.2.4.2.6 Kiểm định về độc lập của sai số (không có tương quan giữa các phần dư) 50
4.2.4.2.7 Kiểm định giả định không có tương quan giữa các biến độc lập (đo lường đa cộng tuyến) 51
4.2.5 Phân tích MLR bằng phương pháp Stepwise Selection 51
4.2.5.1 Phân tích MLR bằng SPSS 51
4.2.5.2 Kiểm tra các vi phạm giả thuyết và kiểm định mô hình 53
4.2.5.2.1 Kiểm định giả thuyết về sự phù hợp của mô hình (Phân tích phương sai) 53
4.2.5.2.2 Kiểm định ý nghĩa các hệ số hồi quy trong mô hình 54
4.2.5.2.3 Kiểm định giả định liên hệ tuyến tính 54
Trang 84.2.5.2.4 Kiểm định phương sai của sai số không đổi 55
4.2.5.2.5 Kiểm định giả định về phân phối chuẩn của phần dư 57
4.2.5.2.6 Kiểm định về độc lập của sai số (không có tương quan giữa các phần dư) 59
4.2.5.2.7 Kiểm định giả định không có tương quan giữa các biến độc lập (đo lường đa cộng tuyến) 59
4.2.6 Phân tích MLR bằng phương pháp Backward elimination 59
4.2.6.1 Phân tích MLR bằng SPSS 59
4.2.6.2 Kiểm tra các vi phạm giả thuyết và kiểm định mô hình 63
4.2.6.2.1 Kiểm định giả thuyết về sự phù hợp của mô hình (Phân tích phương sai) 63
4.2.6.2.2 Kiểm định ý nghĩa các hệ số hồi quy trong mô hình 64
4.2.6.2.3 Kiểm định giả định liên hệ tuyến tính 64
4.2.6.2.4 Kiểm định phương sai của sai số không đổi 65
4.2.6.2.5 Kiểm định giả định về phân phối chuẩn của phần dư 67
4.2.6.2.6 Kiểm định về độc lập của sai số (không có tương quan giữa các phần dư) 69
4.2.6.2.7 Kiểm định giả định không có tương quan giữa các biến độc lập (đo lường đa cộng tuyến) 69
4.3 Đánh giá mô hình hồi quy 69
CHƯƠNG 5: KẾT LUẬN VÀ KIẾN NGHỊ 71
5.1 Tổng kết mô hình hồi quy 71
5.2 Những hạn chế của đề tài 71
5.3 Kiến nghị và hướng phát triển của đề tài 72
TÀI LIỆU THAM KHẢO 73
Trang 9DANH MỤC HÌNH VÀ ĐỒ THỊ
Hình 3.1 Quy trình nghiên cứu 13
Hình 3.2 Quy trình thiết kế bảng câu hỏi 15
Hình 4.1 Độ tuổi của ứng viên trong cuộc khảo sát 27
Hình 4.2 Kinh nghiệm của ứng viên trong cuộc khảo sát 27
Hình 4.3 Lĩnh vực hoạt động của ứng viên trong cuộc khảo sát 28
Hình 4.4 Vị trí công tác của ứng viên trong cuộc khảo sát 28
Hình 4.5 Cửa sổ thực hiện phân tích Cronbach Alpha 29
Hình 4.6 Biểu đồ phân tán chiphixaydung và tongdientichphongnghiepvu 35
Hình 4.7 Biểu đồ phân tán chiphixaydung và tongdientichphonglanhdao 35
Hình 4.8 Biểu đồ phân tán chiphixaydung và tongdientichphonghanhchinh 36
Hình 4.9 Biểu đồ phân tán chiphixaydung và tongdientichhoitruong 36
Hình 4.10 Biểu đồ phân tán chiphixaydung và tongdientichcongtrinhphu 37
Hình 4.11 Biểu đồ phân tán chiphixaydung và thoigian 37
Hình 4.12 Biểu đồ phân tán chiphixaydung và giaiphapmong 38
Hình 4.13 Biểu đồ phân tán chiphixaydung và sotang 38
Hình 4.14 Biểu đồ phân tán chiphixaydung và capcongtrinh 39
Hình 4.15 Biểu đồ phân tán chiphixaydung và vitrixaydung 39
Hình 4.16 Hộp thoại phân tích tương quan các biến 40
Hình 4.17 Hộp thoại phân tích hồi quy phương pháp Forward 44
Hình 4.18 Hộp thoại lưu giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa 47
Hình 4.19 Biểu đồ phân tán giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa 47
Hình 4.20 Hộp thoại lấy trị tuyệt đối phần dư (Compute Variable) 48
Hình 4.21 Hộp thoại kiểm định tương quan hạng 48
Trang 10Hình 4.22 Đồ thị tần suất phần dư chuẩn hóa 49
Hình 4.23 Đồ thị Normal P-P plot 50
Hình 4.24 Hộp thoại phân tích hồi phương pháp Stepwise 51
Hình 4.25 Hộp thoại lưu giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa 54
Hình 4.26 Biểu đồ phân tán giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa 55
Hình 4.27 Hộp thoại lấy trị tuyệt đối phần dư (Compute Variable) 56
Hình 4.28 Hộp thoại kiểm định tương quan hạng 56
Hình 4.29 Đồ thị tần suất phần dư chuẩn hóa 58
Hình 4.30 Đồ thị Normal P-P plot 58
Hình 4.31 Hộp thoại phân tích hồi phương pháp Backward 59
Hình 4.32 Hộp thoại lưu giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa 64
Hình 4.33 Biểu đồ phân tán giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa 65
Hình 4.34 Hộp thoại lấy trị tuyệt đối phần dư (Compute Variable) 66
Hình 4.35 Hộp thoại kiểm định tương quan hạng 66
Hình 4.36 Đồ thị tần suất phần dư chuẩn hóa 68
Hình 4.37 Đồ thị Normal P-P plot 68
Trang 11DANH MỤC BẢNG BIỂU
Bảng 4.1 Kết quả phân tích Cronbach Alpha 29
Bảng 4.2 Xếp hạng các nhân tố 30
Bảng 4.3 Mã hóa và phân loại biến 32
Bảng 4.4: Bảng phân tích tương quan giữa các biến 41
Bảng 4.5 Model summary phương pháp Forward 44
Bảng 4.6 Anova phương pháp Forward 45
Bảng 4.7 Hệ số của mô hình MLR phương pháp Forward 45
Bảng 4.8 Kết quả kiểm định tương quan hạng của các biến 49
Bảng 4.9 Model Summary phương pháp Stepwise 51
Bảng 4.10 Anova phương pháp Stepwise 52
Bảng 4.11 Hệ số của mô hình MLR phương pháp Stepwise 53
Bảng 4.12 Kết quả kiểm định tương quan hạng của các biến 57
Bảng 4.13 Model summary phương pháp Backward 60
Bảng 4.14 Anova phương pháp Backward 61
Bảng 4.15 Hệ số của mô hình MLR phương pháp Backward 62
Bảng 4.16 Kết quả kiểm định tương quan hạng của các biến 67
Trang 12CHƯƠNG 1: ĐẶT VẤN ĐỀ
1.1 Giới thiệu chung
Cần Giờ là huyện biển duy nhất của thành phố Hồ Chí Minh, nằm ở phía Đông Nam, cách trung tâm thành phố khoảng 50 km đường bộ Phía Bắc ngăn cách với huyện Nhà Bè bởi sông Soài Rạp Phía Nam giáp biển Đông Phía Tây ngăn cách với huyện Cần Giuộc và huyện Cần Đước của tỉnh Long An, huyện Gò Công Đông của tỉnh Tiền Giang, ranh giới là sông Soài Rạp Phía Đông Bắc ngăn cách với huyện Nhơn Trạch, tỉnh Đồng Nai bởi sông Lòng Tàu Phía Đông Nam tiếp giáp với huyện Tân Thành, tỉnh Bà Rịa-Vũng Tàu, ranh giới là sông Thị Vải Cần Giờ giống như một hòn đảo tách biệt với xung quanh, bốn bề là sông và biển Huyện Cần Giờ (gồm có: Thị trấn Cần Thạnh và 6 xã là: Bình Khánh, An Thới Đông, Tam Thôn Hiệp, Thạnh An, Lý Nhơn, Long Hòa) có diện tích 704 km2
chiếm khoảng 1/3 diện tích toàn thành phố
Tình hình đầu tư qua các năm trên địa bàn huyện:
Năm 2012 2013 2014 2015 2016
Vốn ngân sách nhà
nước đầu tư xây dựng
968,8 tỷ đồng
784,1 tỷ đồng
870 tỷ đồng
827,3 tỷ đồng
974,7 tỷ đồng
(Nguồn: Báo cáo phát triển kinh tế xã hội huyện Cần Giờ hàng năm)
Ước lượng chi phí đầu tư cho dự án là một nhiệm vụ rất quan trọng của công tác quản lý xây dựng Cùng với sự phát triển đô thị hóa và sự gia tăng dân số ngày càng nhanh, các dự án xây dựng sử dụng ngân sách nhà nước đang xuất hiện ngày càng nhiều Việc ước lượng chi phí xây dựng nhờ đó có thể dự trù được kinh phí thực hiện dự án giúp công tác quản lý dự án của chủ đầu tư được tốt hơn và là vấn
đề sống còn của các doanh nghiệp xây dựng Giới hạn của đề tài nghiên cứu là dự báo chi phí xây dựng của dự án, tức chỉ là giá trị xây lắp của dự án
Đến nay, đã có một số nghiên cứu về ứng dụng mô hình hồi quy để dự báo chi phí thực hiện các dự án xây dựng như: Một đánh giá về tính chính xác của nhiều phương pháp hồi quy trong dự báo nhu cầu ngành xây dựng ở Singapore [1]; Mô hình dự báo cho thời gian thi công và chi phí thực tế [2] Riêng đối với địa bàn
Trang 13huyện Cần Giờ, một địa bàn đặc thù về vị trí địa lý, điều kiện khí hậu thì chưa có một nghiên cứu nào về ứng dụng mô hình trên để dự báo chi phí thực hiện các dự án xây dựng, đặc biệt là đối với các dự án xây dựng sử dụng nguồn vốn ngân sách Nhà nước
1.2 Xác định vấn đề nghiên cứu:
a Lý do nghiên cứu:
Việc ước lượng chi phí xây dựng, cũng như xác định tổng mức đầu tư dự án xây dựng công trình dân dụng (các công trình thuộc lĩnh vực văn hóa - xã hội) chủ yếu dựa trên bốn phương pháp truyền thống:
- Căn cứ vào thiết kế cơ sở;
- Dựa vào dự án có các tiêu chuẩn kinh tế - kỹ thuật tương tự cùng loại;
- Tính theo diện tích hoặc công suất sử dụng của công trình và giá xây dựng tổng hợp, suất vốn đầu tư xây dựng công trình;
- Kết hợp các phương pháp trên
Các phương pháp này ít nhiều vẫn có các hạn chế nhất định: Tốn nhiều thời gian và còn nhiều bất cập trong suất vốn đầu tư xây dựng công trình; các dạng công trình được đưa vào trong suất vốn đầu tư còn chưa đầy đủ, thiếu tính đại diện, khó áp dụng do sự khác biệt về các điều kiện vị trí địa lý, nguồn nhân vật lực,…
Trên thực tế, công tác quản lý dự án đầu tư xây dựng công trình trên địa bàn huyện vẫn còn tồn tại một số vấn đề nhất định Có không ít công trình phải điều chỉnh chi phí xây dựng, điều chỉnh tiến độ thực hiện (theo chiều hướng tăng) dẫn đến lãng phí và gây khó khăn trong quá trình quản lý dự án Do vậy việc nghiên cứu áp dụng các mô hình dự báo từ cơ sở dữ liệu của các dự án đã thực hiện có ý nghĩa quan trọng, giúp Chủ đầu tư, Ban quản lý dự án và các cơ quan chức năng có những ước lượng chính xác hơn tạo tiền đề cho các giai đoạn tiếp theo đạt hiệu quả kinh tế (đúng tiến độ, tránh trình điều chỉnh dự án nhiều lần gây lãng phí thời gian và phát sinh tăng chi phí không cần thiết, hỗ trợ tốt công tác kế hoạch tài chính) Tạo điều
Trang 14kiện cho quá trình hoạt động của dự án được thuận lợi, nhanh chóng đưa dự án vào khai thác sử dụng, đáp ứng kịp thời nhu cầu kinh tế - xã hội của địa phương
b Các câu hỏi nghiên cứu:
- Các yếu tố ảnh hưởng đến tổng mức đầu tư trong dự án xây dựng công trình thuộc lĩnh vực văn hóa - xã hội là gì?
- Liệu có thể dự báo chi phí xây dựng công trình thuộc lĩnh vực văn hóa - xã hội dựa trên các số liệu khách quan đã có hay không?
- Dùng các công cụ gì để thực hiện dự báo đó? Cách thức tiến hành như thế nào? Phương pháp kiểm tra như thế nào để đảm bảo tin chắc rằng mô hình dự báo là đáng tin cậy?
- Những nguyên nhân nào gây ra sự điều chỉnh tổng mức đầu tư trong dự án xây dựng công trình sử dụng ngân sách nhà nước thuộc lĩnh vực văn hóa - xã hội?
1.3 Các mục tiêu nghiên cứu:
- Nhận dạng các nhân tố ảnh hưởng đến chi phí xây dựng cho các dự án xây dựng sử dụng vốn ngân sách nhà nước
- Phân tích mức độ ảnh hưởng của các nhân tố đến chi phí các dự án xây dựng sử dụng vốn ngân sách nhà nước
- Thiết lập mô hình hồi quy đa biến để ước lượng chi phí xây dựng
1.4 Phạm vi nghiên cứu:
- Đề tài được giới hạn trong phạm vi các công trình xây dựng thuộc lĩnh vực Văn hóa - Xã hội có tổng mức đầu tư từ 5 tỷ đồng trở lên sử dụng vốn ngân sách nhà nước trên địa bàn huyện Cần Giờ, thành phố Hồ Chí Minh
- Đối tượng nghiên cứu là các công trình xây dựng thuộc lĩnh vực Văn hóa -
Xã hội trong giai đoạn thực hiện đầu tư đến khi công trình hoàn thành đưa vào sử dụng đối với các công trình chỉ sử dụng vốn ngân sách
Trang 15- Không gian: Thời điểm thu thập số liệu từ tháng 6 năm 2016; nghiên cứu thực hiện trong khoảng từ tháng 6 năm 2015 đến tháng 12 năm 2016 Các dự án được khảo sát được thực hiện trong giai đoạn từ năm 2011 đến năm 2016
- Địa điểm: Nghiên cứu được thực hiện tại huyện Cần Giờ, thành phố Hồ Chí Minh
- Quan điểm phân tích: Phân tích và thảo luận theo quan điểm của chủ đầu tư
1.5 Đóng góp của nghiên cứu:
Đến thời điểm hiện nay tại Việt Nam và trên thế giới đã có nhiều nghiên cứu liên quan đến ứng dụng hồi quy đa biến, để ước lượng chi phí thông qua việc khai thác các dữ liệu quá khứ Nghiên cứu này đóng góp thêm một tình huống ứng dụng để ước lượng chi phí xây dựng công trình sử dụng ngân sách nhà nước thuộc lĩnh vực văn hóa - xã hội, đặc biệt là trên địa bàn huyện Cần Giờ, thành phố Hồ Chí Minh
Việc thực hiện nghiên cứu này góp phần vào sự hiểu biết tốt hơn các nhân tố ảnh hưởng đến chi phí xây dựng các công trình thuộc lĩnh vực văn hóa - xã hội Đồng thời tạo thêm một sự lựa chọn mới trong việc ước lượng chi phí xây dựng không chỉ dựa vào các phương pháp do nhà nước ban hành mà còn dựa vào các giá trị hiện thực của các dự án đã xây dựng trên địa bàn
Quá trình thực hiện nghiên cứu sử dụng các dữ liệu từ quá khứ thông qua các phân tích thống kê, để đưa ra các mô hình dự báo chi phí xây dựng giúp các chủ đầu
tư, cơ quan quản lý nhà nước ước lượng chi phí khách quan, quản lý tốt chi phí đầu
tư ban đầu, hạn chế điều chỉnh, phát sinh tăng tổng vốn đầu tư gây lãng phí
Phương pháp nghiên cứu của đề tài là phân tích các yếu tố ảnh hưởng đến chi phí xây dựng các công trình xây dựng bằng việc phân tích hồi quy (phầm mềm SPSS version 22) để xác định các nhân tố ảnh hưởng chính
Trang 16CHƯƠNG 2: TỔNG QUAN
2.1 Tình hình đầu tư các công trình thuộc lĩnh vực Văn hóa - Xã hội giai đoạn
2011 - 2016 trên địa bàn huyện Cần Giờ:
Các công trình thuộc lĩnh vực Văn hóa - Xã hội có ý nghĩa quan trọng trong việc nâng cao đời sống tinh thần của người dân; góp phần tuyên truyền, phổ biến chủ trương, đường lối của Ðảng, chính sách, pháp luật của Nhà nước; kiến thức khoa học, kỹ thuật; giáo dục tư tưởng, đạo đức, lối sống, nếp sống văn hóa lành mạnh trên địa bàn Nơi sinh hoạt văn hóa, văn nghệ, thể dục - thể thao, vui chơi giải trí, nâng cao mức hưởng thụ văn hóa của nhân dân, góp phần xây dựng nông thôn mới Nơi tổ chức hội họp, học tập cộng đồng và các sinh hoạt khác ở địa phương
Những năm vừa qua được sự quan tâm của Thành ủy, Ủy ban nhân dân Thành phố, huyện Cần Giờ là một trong năm huyện của Thành phố (Bình Chánh, Hốc Môn, Nhà Bè, Củ Chi, Cần Giờ) thực hiện chương trình quốc gia xây dựng nông thôn mới Qua đó, ngân sách thành phố đã đầu tư để huyện phát triển cơ sở hạ tầng nhằm nâng cao đời sống vật chất, tinh thần của người dân trên địa bàn huyện Để nâng cao đời sống tinh thần cho người dân, huyện Cần Giờ đã chủ động đề xuất và đã được thành phố chấp thuận chủ trương, thực hiện xây dựng các nhà văn hóa - thể thao tương đối, từ cấp huyện đến cấp xã Tuy chưa phủ kín hết các địa phương nhưng cũng phần nào đáp ứng được nhu cầu vui chơi, giải trí cũng như nhu cầu sinh hoạt văn hóa của người dân địa phương
Đầu tư cụ thể các công trình phục vụ đời sống tinh thần người dân qua các năm, giai đoạn 2011 - 2016:
Năm 2011 đã đầu tư 04 công trình với tổng mức đầu tư hơn 32 tỷ đồng Năm 2012 đã đầu tư 06 công trình với tổng mức đầu tư hơn 46 tỷ đồng Năm 2013 đã đầu tư 06 công trình với tổng mức đầu tư hơn 54 tỷ đồng Năm 2014 đã đầu tư 13 công trình với tổng mức đầu tư hơn 97 tỷ đồng Năm 2015 đã đầu tư 16 công trình với tổng mức đầu tư hơn 207 tỷ đồng
Trang 17Tuy đã được quan tâm đầu tư, huyện Cần Giờ vẫn còn nhiều Ấp thiếu các công trình đáp ứng nhu cầu đời sống tinh thần của địa phương (chủ trương của
Thành phố là mỗi ấp có một văn phòng ấp kết hợp tụ điểm sinh hoạt văn hóa)
2.2 Các phương pháp xác định chi phí xây dựng công trình truyền thống:
2.2.1 Phương pháp xác định chi phí xây dựng theo thiết kế cơ sở của dự án đầu tư: Phương pháp này yêu cầu đầu vào phải xác định cụ thể quy mô của dự
án, từ đó thiết kế sơ bộ kết cấu công trình, bóc tách khối lượng thực hiện và lập dự
toán sơ bộ của dự án trên cơ sở quy định hiện hành
- Ưu điểm: Xác định chi phí xây dựng công trình tương đối chuẩn xác
- Nhược điểm: Mất nhiều thời gian
2.2.2 Phương pháp xác định chi phí xây dựng theo suất vốn đầu tư xây dựng công trình: Phương pháp này tương đối đơn giản; căn cứ vào các Tập Suất
vốn đầu tư do Bộ Xây dựng ban hành và các Chỉ số giá xây dựng hàng tháng, hàng
quý và từng năm của Sở Xây dựng địa phương (nơi có dự án thực hiện) ban hành
- Ưu điểm: Phương pháp này xác định chi phí xây dựng công trình nhanh
- Nhược điểm: Chỉ mang tính tham khảo, chi phí xây dựng xác định chỉ mang tính tương đối, độ chính xác không cao
2.2.3 Phương pháp xác định chi phí xây dựng theo số liệu của các dự án
có các công trình xây dựng có chỉ tiêu kinh tế - kỹ thuật tương tự đã thực hiện:
Phương pháp này căn cứ vào chi phí thực hiện dự án đã thực hiện tại địa phương (chi phí xây dựng đã được quyết toán) làm căn cứ, cơ sở để ước tính chi phí xây
dựng cho công trình tương lai
- Ưu điểm: Phương pháp này xác định chi phí xây dựng công trình nhanh
- Nhược điểm: Chỉ mang tính lý thuyết, độ chính xác không cao
2.2.4 Phương pháp kết hợp để xác định tổng mức đầu tư: Đối với các dự
án có nhiều công trình, tùy theo điều kiện cụ thể của dự án và nguồn số liệu có được
có thể vận dụng kết hợp các phương pháp nêu trên để xác định tổng mức đầu tư của
Trang 18dự án đầu tư xây dựng công trình; đồng thời, có thể kết hợp Phương pháp xác định chi phí xây dựng theo số liệu của các dự án có các công trình xây dựng có chỉ tiêu kinh tế - kỹ thuật tương tự đã thực hiện và Phương pháp xác định chi phí xây dựng theo suất vốn đầu tư xây dựng công trình để quy đổi chi phí xây dựng công trình đã thực hiện trong quá khứ về năm dự kiến thực hiện công trình tương lai
- Ưu điểm: Xác định chi phí xây dựng công trình tương đối chuẩn xác
- Nhược điểm: Phụ thuộc nhiều vào kinh nghiệm của người thực hiện, mất nhiều thời gian để có thể xác định chi phí xây dựng công trình
Ngoài bốn phương pháp trên còn có nhiều phương pháp khác để xác định chi phí xây dựng cho các công trình đã được nghiên cứu và công bố rộng rãi: Sử dụng
mô hình hồi quy đa biến để ước lượng chi phí đầu ra dựa trên các biến đầu vào; sử dụng mạng nơ-ron nhân tạo và hồi quy đa biến; mô hình hồi quy tuyến tính,…
2.3 Các nghiên cứu tương tự đã được công bố:
Để ước lượng chi phí xây dựng cho các công trình, có rất nhiều nghiên cứu sử dụng mô hình hồi quy đa biến để ước lượng chi phí đầu ra dựa trên các biến đầu vào như:
2.3.1) Al-Momani [1]: đã thu thập dữ liệu 125 dự án quá khứ từ năm 1984 -
1994 Sử dụng mô hình hồi quy đa biến để phân tích các dữ liệu thu thập được:
+ Y: Chi phí xây dựng
+ X1: Chi phí xây dựng theo hợp đồng
+ X2: Thay đổi thiết kế
+ X3: Diện tích sàn /m2
+ X4: Ngày hoàn thành thực tế
+ X5: Ngày hoàn thành dự kiến
+ X6: Thời gian chậm tiến độ
+ X7: Giá thầu cao nhất
Trang 19+ X8: Giá thầu thấp nhất
Kết quả: Xác định được các yếu tố ảnh hưởng và ước lượng được chi phí xây dựng cho các công trình trường công lập ở Jordan
Log Yi = 1.574 + 0.277logXi1 + 0.03logXi2 + 0.717logXi3 (2.7) Với hệ số xác định R2 = 0.88 và tất cả các hệ số có mức độ ý nghĩa là 99.9% độ tin cậy
2.3.2 Attalla [2]: dự báo độ lệch chi phí xây dựng trong các dự án tái xây
dựng sử dụng mạng nơ-ron nhân tạo và hồi quy đa biến
Thông tin thu thập được thông qua một cuộc khảo sát các chuyên gia xây dựng từ 50 dự án tái thiết
Đối với từng dự án có độ lệch chi phí thực tế so với chi phí dự toán
Dựa trên các thông tin thu thập đã xác định được 36 yếu tố có tác động trực tiếp đến chi phí xây dựng của các dự án tái thiết
Sử dụng phân tích thống kê hồi quy và ANN để phát triển các mô hình dự đoán
Kết quả: Nghiên cứu đã góp phần tìm ra các lý do dẫn đến sự sai lệch chi phí của các dự án tái thiết và có thể định lượng các độ lệch chi phí này
2.3.3 Kim [3]: So sánh mô hình ước lượng chi phí xây dựng dựa trên phân
tích hồi quy, ANN và trường hợp cơ sở
Thông qua chi phí xây dựng thực tế của 530 dự án dân dụng từ năm 1997 đến năm 2000 ở Seoul, Hàn Quốc Trong 530 dự án được chia ngẫu nhiên thành
490 bộ dùng để huấn luyện và 50 bộ dùng để kiểm tra
Kết quả: Sau khi kiểm tra 40 bộ dữ liệu trong 50 bộ dữ liệu dùng để kiểm tra thì tỉ lệ sai số tuyệt đối trung bình là 6.95, 2.97, 4.81 Dựa vào kiểm định phương sai thì mô hình ANN cho kết quả ước lượng tốt nhất
2.3.4 David [4]: Nghiên cứu phát triển mô hình hồi quy tuyến tính để dự
báo chi phí xây dựng dựa trên 286 bộ dữ liệu đã được thu thập tại Anh Hai phương
Trang 20pháp phân tích đã được thực hiện là Forward và Backward Stepwise, đưa ra được 6
mô hình và xác định được 41 biến độc lập trong đó có 5 biến xuất hiện trong cả 6
mô hình là:
+ X1: Tổng diện tích sàn
+ X2: Chức năng công trình
+ X3: Thời gian hoàn thành công trình
+ X4: Hệ thống cơ điện
+ X5: Lắp đặt đường ống
Mô hình tốt nhất là mô hình log chi phí với phương pháp Backward:
R2 = 0.661, MAPE= 19.3%
2.3.5 Lưu Nhất Phong [9]: Nghiên cứu sử dụng mạng nowrron nhân tạo và
hồi quy đa biến xây dựng mô hình dự báo tổng mức đầu tư Dữ liệu thu thập từ 33
dự án xây dựng công trình giao thông tại Bình Định từ năm 2000 đến năm 2009 (3
dự án dùng để kiểm tra và 30 dự án dùng làm bộ dữ liệu xây dựng mô hình) và tìm
ra được 7 nhân tố ảnh hưởng đến tổng mức đầu tư xây dựng công trình giao thông đường bộ bằng phân tích hồi quy đa biến:
+ X1: Thời gian thực hiện dự án
+ X2: Chiều dài tuyến đường
+ X3: Số lượng cống bê tông cốt thép thoát nước trên tuyến
+ X4: Số lượng cầu bản bê tông cốt thép thoát nước trên tuyến
+ X5: Số lượng cầu dầm bê tông cốt thép thoát nước trên tuyến
+ X6: Bề rộng nền đường
+ X7: Bề rộng mặt đường
Mô hình tốt nhất theo phương pháp Stepwise là:
Tongmuc = 0,149Snen + 78,081Lcaudam + 22,493Lcong (2.8)
Trang 212.3.6 Nguyễn Thanh Trúc [12]: Nghiên cứu sử dụng phân tích hồi quy đa
biến để xây dựng mô hình ước lượng chi phí cho các dự án công trình trường học Nghiên cứu khảo sát được thực hiện với 44 ứng viên tham gia trả lời bảng câu hỏi và tìm được 6 nhân tố Dữ liệu thu thập từ 27 công trình xây dựng trường học tại tỉnh Vĩnh Long từ năm 2007 đến 2014
Kết quả R Adjusted Square = 0,971 và MAPE = 12,01%
2.3.7 Nguyễn Hữu Phúc [11]: Nghiên cứu sử dụng phân tích hồi quy đa
biến và mô hình ANN để dự báo thời gian thi công của công trình cầu đường bộ Thông qua cuộc khảo sát 20 ứng viên đã tìm được 16 nhân tố chính Dữ liệu thu thập từ 44 dự án xây dựng cầu đường bộ từ năm 2000 đến năm 2014
1 Tổng diện tích sàn
2 Tổng diện tích sàn phần văn phòng
3 Tổng diện tích sàn phần thương mại
4 Tổng diện tích sàn phần căn hộ
5 Tổng diện tích phần hầm
6 Số tầng
7 Tổng chiều cao phần thân
Trang 228 Tổng chiều cao phần hầm
9 Loại kết cấu phần thân
10 Loại kết cấu phần sàn
11 Loại kết cấu phần móng
12 Số lượng thang máy
13 Số tầng hầm
14 Loại cao ốc văn phòng
15 Vị trí xây dựng
16 Cảnh quang xung quanh
Kết quả mô hình ANN dự báo tốt hơn MLR với R Square = 0,9045 và MAPE=5,28%
Tổng kết từ các tài liệu tham khảo: Từ các nghiên cứu đã được công bố nêu trên, nhận thấy chi phí xây dựng các công trình (đặc biệt các công trình dân dụng) phụ thuộc nhiều vào tổng diện tích xây dựng, thời gian xây dựng công trình, phương án gia cố nền, vị trí xây dựng công trình… Từ đó, sơ bộ xác định 17 yếu tố ảnh hưởng đến chi phí xây dựng các công trình phục vụ cho mục tiêu nghiên cứu Các yếu tố cụ thể:
+ Tổng diện tích phòng nghiệp vụ
+ Tổng diện tích phòng lãnh đạo
+ Tổng diện tích phòng hành chính
+ Tổng diện tích hội trường
+ Tổng diện tích công trình phụ
+ Loại kết cấu phần sàn
+ Thời gian thực hiện dự án
+ Giải pháp kết cấu móng
Trang 23+ Diện tích sân đường
+ Khối lượng san nền
+ Hệ thống cơ điện
+ Lắp đặt đường ống
Trang 24CHƯƠNG 3: PHƯƠNG PHÁP NGHIÊN CỨU
3.1 Quy trình nghiên cứu:
Hình 3.1 Quy trình nghiên cứu
(Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)
XÁC ĐỊNH TÊN ĐỀ TÀI
Thông qua các nghiên cứu trước đây, tạp chí,
tài liệu để xác định các nhân tố
Tham khảo ý kiến chuyên gia, bảng câu hỏi để tìm ra các nhân tố chính bằng các phân tích thống kê
Thu thập và xử lý số liệu
Xây dựng mô hình hồi quy
Đánh giá sự phù hợp của mô hình dựa trên các kiểm định
thống kê Đánh giá kết quả hồi quy
Kết luận và kiến nghị
Trang 253.2 Các công cụ nghiên cứu:
Công cụ nghiên cứu
Xác định các nhân tố ảnh hưởng chi phí
xây dựng công trình thuộc lĩnh vực văn
hóa - xã hội
Thông qua các nghiên cứu tương
tự trước đây, tạp chí, tài liệu
Xác định các nhân tố chính
Bảng câu hỏi
Phân tích thống kê của phần mềm SPSS
Phân tích mô hình hồi quy và kiểm định
- Dữ liệu các nhân tố chính của các dự án đã thực hiện từ năm 2011 - 2016 của các dự án xây dựng công trình thuộc lĩnh vực Văn hóa - Xã hội được thu thập Bao gồm các số liệu về thiết kế và tổng dự toán cho từng hạng mục và có dữ liệu quyết toán hoàn thành công trình Đây là một bộ dữ liệu đóng vai trò quan trọng là
cơ sở để thực hiện phân tích hồi quy đa biến
3.4 Thiết kế bảng câu hỏi
3.4.1 Quy trình thiết kế bảng câu hỏi:
Trang 26Hình 3.2 Quy trình thiết kế bảng câu hỏi (Nguồn: Bài giảng phương pháp nghiên cứu khoa học, Lưu 2014)
3.4.2 Cấu trúc của bảng câu hỏi
Cấu trúc bảng câu hỏi được chia làm 3 thành phần chính:
+ Phần 1: Giới thiệu thông tin về cá nhân và định hướng cho các ứng viên hiểu được các vấn đề, mục đích của việc khảo sát giúp cho các ứng viên trả lời phù hợp với kinh nghiệm và hiểu biết của bản thân
+ Phần 2: Sử dụng thang đo tỷ lệ Likert với các mức độ ảnh hưởng từ 1 đến
5 Thông qua điểm từ bảng câu hỏi sẽ đánh giá các yếu tố ảnh hưởng đến chi phí xây dựng cho các công trình
+ Phần 3: Các thông tin cá nhân của người tham gia khảo sát
Chi tiết bảng câu hỏi được trình bày ở phụ lục 1
Đọc những bài báo và nghiên cứu trước
Nhận dạng các nhân tố ảnh hưởng đến
chi phí
Xác định được các nhân tố chính đưa vào
bảng câu hỏi
Tham khảo ý kiến chuyên gia
Xây dựng bảng câu hỏi và chuyển đến
đối tượng khảo sát
Thu thập lại bảng câu hỏi
Trang 273.5 Thiết kế mẫu:
3.5.1 Khung lấy mẫu
Dữ liệu sơ cấp được thu thập thông qua các bảng câu hỏi được gửi trực tiếp đến các cá nhân hoạt động trong các lĩnh vực thiết kế, thi công, tư vấn thiết kế, giám sát, thẩm định dự án… nhằm mục đích xác định các nhân tố chính trong 14 nhân tố và mức độ ảnh hưởng của các yếu tố này đến chi phí xây dựng cho các công trình
3.5.2 Xác định kích thước mẫu
Để đảm bảo ý nghĩa về mặt thống kê thì kích thước mẫu phải đủ lớn Số lượng mẫu lớn hơn 5 lần số lượng các nhân tố Mẫu khảo sát dùng bảng câu hỏi dự kiến với kích thước khoảng 100 mẫu
3.5.3 Phương pháp lấy mẫu
Thu thập dữ liệu quá khứ: Phương pháp lấy mẫu được chọn là phương pháp
lấy mẫu thuận tiện trên các dữ liệu của chủ đầu tư
Khảo sát bằng bảng câu hỏi: theo phương pháp thuận tiện từ các kĩ sư Phương pháp này được sử dụng rất nhiều, tuy nhiên về mặt thống kê không thể xác định mức độ chính xác vì không biết được sai số lấy mẫu [10]
3.6 Thang đo và độ tin cậy của thang đo
Thang đo tỷ lệ Likert với mức độ từ 1 đến 5 dùng để hỏi người khảo sát về mức độ đồng ý Thông qua hệ số Cronbach Alpha để đánh giá mức độ chặt chẽ của các mục câu hỏi trong thang đo Các điểm số trong bảng câu hỏi cũng sẽ được tính toán và xếp hạng dựa trên giá trị trung bình Từ đó xác định các nhân tố ảnh hưởng chính đến vấn đề khảo sát
3.7 Thu thập dữ liệu
Thu thập dữ liệu dùng trong nghiên cứu này dựa trên 2 nguồn dữ liệu:
Trang 28- Dữ liệu sơ cấp: là các dữ liệu từ bảng câu hỏi được gửi trực tiếp đến các đối tượng phù hợp với vấn đề khảo sát Sau khi nhận lại các bảng câu hỏi sẽ thu được các nhân tố chính ảnh hưởng đến chi phí xây dựng cho công trình
- Dữ liệu thứ cấp: là các dữ liệu trong quá khứ từ các công trình
3.8 Phân tích dữ liệu
- Từ các dữ liệu sơ cấp được thu thập thông qua bảng câu hỏi, sau khi tiến hành làm sạch và mã hóa thông tin sẽ nhập vào phần mềm SPSS Version 22
- Đánh giá độ tin cậy của thang đo thông qua hệ số Cronbach Alpha
- Tính toán điểm trung bình và xếp hạng các nhân tố dựa trên điểm trung bình để chọn ra các nhân tố chính ảnh hưởng đến chi phí xây dựng cho các công trình
3.9 Thiết lập mô hình hồi quy đa biến
3.9.1 Phân tích hồi quy đa biến:
3.9.1.1 Các khái niệm:
Dự báo là một khoa học và nghệ thuật tiên đoán những sự việc xãy ra trong tương lai, trên cơ sở phân tích khoa học về các dữ liệu đã thu thập được Khi tiến hành dự báo ta căn cứ vào việc thu thập, xử lý số liệu trong quá khứ và hiện tại để xác định xu hướng vận động của các vấn đề trong tương lai nhờ vào một số mô hình toán học
Đôi khi dự báo là một dự đoán mang tính chủ quan hoặc trực giác về tương lai nhưng để cho dự báo được chính xác hơn, người ta cố loại trừ những tính chủ quan của người làm dự báo
Phân tích hồi quy là tìm mối quan hệ phụ thuộc của một biến (gọi là biến phụ thuộc) và một hoặc nhiều biến khác, được gọi là biến độc lập nhằm mục đích ước lượng giá trị kỳ vọng của biến phụ thuộc khi biết trước giá trị của biến độc lập
Trang 29Liên hệ tương quan là mối quan hệ không hoàn toàn chặt chẽ giữa tiêu thức
nguyên nhân và tiêu thức kết quả Cứ mỗi giá trị của tiêu thức nguyên nhân sẽ có
nhiều giá trị tương ứng của tiêu thức kết quả
Phân tích hồi quy đa biến (hồi quy tuyến tính bội) là một công cụ thống kê để
mô hình mối liên hệ giữa một biến phụ thuộc và các biến độc lập Mô hình có dạng
như sau:
Yi = 0 + 1X1i + 2X2i + … +kXpi + ei (3.1)Trong đó:
+ Y: là biến phụ thuộc
+ 0: là tung độ gốc
+ Xpi: là các biến độc lập thứ p tại quan sát thứ i
+ k: là các hệ số hồi quy riêng phần (Partial regression coefficients)
+ ei: là một biến độc lập ngẫu nhiên (yếu tố nhiễu) có phân phối chuẩn với
trung bình là 0 và phương sai không đổi 2
Mô hình hồi quy tuyến tính bội giả định rằng biến phụ thuộc có phân phối
chuẩn đối với bất kỳ sự kết hợp nào của các biến độc lập trong mô hình Ngoài ra,
không có biến giải thích nào có thể được biểu thị dưới dạng tổ hợp tuyến tính của
những biến giải thích còn lại Nếu tồn tại một quan hệ tuyến tính như vậy, khi đó
xảy ra hiện tượng cộng tuyến [7]
Phương pháp phân tích hồi quy thường được sử dụng để nghiên cứu mối liên
hệ giữa các hiện tượng, như mối liên hệ giữa các yếu tố đầu vào của quá trình thực
hiện với kết quả thực hiện
Phân tích hồi quy giải quyết các vấn đề sau:
- Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến
độc lập
- Kiểm định giả thuyết về bản chất của sự phụ thuộc
Trang 30- Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập
- Kết hợp các vấn đề trên
3.9.1.2 Các giả định trong phân tích hồi quy:
Phân tích hồi quy không phải chỉ là mô tả lại các dữ liệu đã quan sát, mà từ các kết quả quan sát trong tập mẫu phải được suy rộng cho mối liên hệ giữa các biến trong tổng thể Các kết quả trong phân tích hồi quy được chấp nhận và diễn giải thông qua các giả định cần thiết Nếu các giả định bị vi phạm thì các kết quả trong phân tích hồi quy không đáng tin cậy nữa [7]
3.9.1.3 Giả định độc lập:
Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không bị ảnh hưởng bởi các quan sát khác [7]
3.9.1.4 Giả định phân phối chuẩn và phương sai bằng nhau:
Nếu các biến độc lập (X) được đưa vào với bất kì giá trị nào thì phân phối của biến phụ thuộc (Y) cũng đều là phân phối chuẩn, trung bình của (Y) tại một giá trị (X) cụ thể là μ (Y/X) và phương sai không đổi [7]
Cơ sở để xem xét vấn đề này cần phải quan sát biểu đồ phân tán phần dư với mỗi biến, hoặc đối với giá trị ước lượng Ŷ Nếu đồ thị phân tán của phần dư không theo một quy luật nào, dữ liệu là độc lập, đồ thị không phân bố dày đặc thì khả năng diễn đạt của mô hình đáng tin cậy [9]
3.9.1.5 Giả định tuyến tính:
Nếu mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ liệu
ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa Cho nên cần thiết phải kiểm tra điều kiện đủ thẳng thông qua các biểu đồ phân tán (Scatterplot) của biến phụ thuộc (Y) với mỗi biến độc lập (X) phải đủ thẳng ở điều kiện chấp nhận được [9]
3.9.1.6 Các thông số trong phân tích hồi quy:
Trang 31Hệ số tương quan bội R (Coefficient of correlation): là hệ số thể hiện mức
độ chặt chẽ của mối liên hệ giữa 2 biến định lượng:
1
2 2 1
N i N i
X X Y Y R
- R nhận giá trị trong [-1, 1]
- R = 0 thì 2 biến không tồn tại mối liên hệ tuyến tính nào, dấu (+) hoặc (-) thể hiện mối liên hệ đồng biến hoặc nghịch biến [6]
Hệ số xác định R 2 (Coefficient of determination): Dùng để đo mức độ phù hợp của phương trình hồi quy với các số liệu quan sát được:
^ 2
2 1
n i i
Y Y RSS
adj
ánh sát hơn mức độ phù hợp của mô hình hồi quy đa biến Giá trị R Squared Adj không nhất thiết tăng lên khi nhiều biến được thêm vào phương trình hồi quy, vì nó không phụ thuộc vào độ lệch phóng đại của R2 [6]
Hệ số hồi quy riêng phần β k : Hệ số này cho biết ảnh hưởng của các thay
đổi một đơn vị trong Xk đối với giá trị trung bình của biến phụ thuộc (Y) khi loại trừ ảnh hưởng của các biến độc lập khác [6]
Hệ số beta: Độ lớn của các hệ số phụ thuộc vào đơn vị đo lường của các
biến, để so sánh các hệ số của các biến độc lập với cần phải quy đổi các biến độc
Trang 32lập về cùng đơn vị Một cách khác có thể làm cho các hệ số so sánh được với nhau là tính trọng số beta, đó là hệ số của biến độc lập (X) khi tất cả dữ liệu trên các biến được biểu diễn bằng đơn vị đo lường độ lệch chuẩn
k
k k
Y
S B S
Với Sk là độ lệch chuẩn của biến độc lập thứ k [6]
Độ chấp nhận của biến (Tolerance): Được sử dụng đo lường hiện tượng đa
cộng tuyến và được định nghĩa bằng 2
1 R k , trong đó 2
k
R là hệ số tương quan bội khi biến độc lập Xk được dự đoán từ các biến độc lập còn lại Nếu độ chấp nhận của một biến nhỏ, thì nó gần như là một kết hợp tuyến tính của các biến độc lập, đó là
dấu hiệu đa cộng tuyến [6]
Hệ số phóng đại phương sai VIF (variance inflation factor): là nghịch
đảo của độ chấp nhận
2
1 IF
1 k
V
R
và hiện tượng đa cộng tuyến xảy ra khi VIF >10
3.9.2 Phương pháp lựa chọn biến [6]
Để xây dựng được mô hình hồi quy đa biến hợp lý thì việc xác định các biến độc lập để dự báo tốt cho biến phụ thuộc là cần thiết Các phương pháp lựa chọn
biến phổ biến trong SPSS:
- Phương pháp đưa dần vào (forward selection):
+ Là phương pháp đưa dần vào và biến đầu tiên được xem xét khi đưa vào phương trình có tương quan thuận hay nghịch lớn nhất với biến phụ thuộc Kiểm định F đối với giả thuyết hệ số của biến đưa vào bằng 0 sẽ được tính toán và so sánh với 2 tiêu chuẩn: F ≥ FIN (F-to-enter) hoặc F ≤ PIN (Probability of F - to - enter)
Trang 33+ Biến đầu tiên được chọn là biến thỏa mãn tiêu chuẩn và xem xét các biến đưa vào tiếp theo Nếu các biến tiếp theo có hệ số tương quan riêng lớn trong mô hình hồi quy giữa biến phụ thuộc và các biến độc lập còn lại thì sẽ loại bỏ biến đầu tiên Quá trình này sẽ được lặp lại khi không còn biến nào thỏa tiêu chuẩn vào
- Phương pháp loại trừ dần (backward elimination)
+ Là phương pháp đưa tất cả các biến vào mô hình và sẽ loại bỏ dần bằng 2
tiêu chuẩn FOUT (F-to-remove) hoặc POUT (Probability of F-to-remove)
+ Nếu biến thỏa F ≥ FOUT hoặc F ≤ POUT thì biến đó sẽ được giữ lại Biến có hệ số tương quan từng phần nhỏ nhất sẽ được kiểm tra đầu tiên, nếu biến này không thỏa tiêu chuẩn thì phương trình sẽ tính toán lại, quá trình này được lặp lại
cho đến khi không còn biến nào vi phạm tiêu chuẩn
- Phương pháp lựa chọn từng bước (Stepwise selection)
+ Là phương pháp phổ biến nhất và nó phối hợp cả 2 phương pháp forward
3.9.3 Kiểm định các giả thuyết của mô hình hồi quy [6]
3.9.3.1 Kiểm định về sự phù hợp của mô hình:
- Khi xây dựng mô hình hồi quy mà các hệ số đứng trước biến độc lập đều bằng không (β 1= β2 =β3…=β n=0)thì phương trình hồi quy mẫu là không phù hợp
vì các biến độc lập không ảnh hưởng đến biến phụ thuộc
- Kiểm định F được dùng trong bảng phân tích phương sai để kiểm định giả thuyết về sự phù hợp của mô hình được xây dựng so với mô hình tổng thể
Trang 343.9.3.2 Kiểm định về ý nghĩa các hệ số hồi quy riêng phần β k
- Là hệ số cho biết ảnh hưởng của các thay đổi một đơn vị trong Xk đối với giá trị trung bình của biến phụ thuộc Y khi loại trừ ảnh hưởng của các biến độc lập
khác
- Trị thống kê được dùng cho kiểm định giả thuyết này Nếu kết quả kiểm định không đủ bác bỏ H0 thì mô hình hồi quy đã xây dựng không có căn cứ nào cho thấy βk ≠ 0 Tuy nhiên vẫn không thể khẳng định biến độc lập Xk không có ảnh
hưởng đến biến phụ thuộc Y
3.9.3.3 Kiểm định giả thuyết về tầm quan trọng của các biến
Hệ số tầm quan trọng của một biến được đặc trưng bởi R square change và được xác định khi đưa thêm biến vào phương trình hồi quy mẫu:
R N p F
3.9.4 Kiểm định các giả định của mô hình hồi quy
3.9.4.1 Giả định độc lập của sai số
Các giá trị (Y) độc lập thống kê với nhau, tức là các quan sát này không bị ảnh hưởng bởi các quan sát khác
Giả định về sai số thực ei cho nó là biến ngẫu nhiên, độc lập (các phần dư không có mối tương quan) có phân phối chuẩn với giá trị trung bình bằng 0 và phương sai không đổi σ2
Đại lượng thống kê Durbin-Watson (d) dùng để kiểm định tương quan các sai số kề nhau:
2 1 2
2
N
i i i
N i
E E d
Trang 353.9.4.2 Giả định phân phối chuẩn của phần dư
Mô hình hồi quy lý tưởng là với bất kì giá trị nào của biến phụ thuộc thì phần
dư đều tuân theo phân phối chuẩn
Việc sử dụng sai mô hình, phương sai không phải là hằng số thì phần dư có thể không tuân theo phân phối chuẩn
Để khảo sát sự phân phối của phần dư có thể sử dụng 2 biểu đồ là: Biểu đồ tần suất Histogram hoặc biểu đồ tần suất Q-Q plot
3.9.4.3 Giả định phương sai của sai số không đổi
Nếu sai số của phần dư tăng hoặc giảm cùng với giá trị của các biến độc lập thì mô hình hồi quy tuyến tính bội có thể có phương sai thay đổi Hiện tượng phương sai thay đổi làm cho mô hình ước lượng bằng phương pháp bình phương bé nhất không hiệu quả
Để kiểm tra phương sai không đổi thì phần dư phải phân bố xung quanh giá trị trung bình trong phạm vi không đổi
3.9.4.4 Giả định liên hệ tuyến tính
Nếu các mối liên hệ không phải là quan hệ tuyến tính, mà trong phân tích dữ liệu ta dùng quan hệ tuyến tính để mô tả dữ liệu thì sẽ không có ý nghĩa Cho nên cần phải kiểm tra giả định liên hệ tuyến tính
Sử dụng biểu đồ phân tán Scatter plot để kiểm tra điều kiện khá thẳng của biến phụ thuộc với mỗi biến độc lập
3.9.4.5 Giả định không có mối tương quan giữa các biến độc lập
Hiện tượng đa cộng tuyến xảy ra khi các biến độc lập có mối tương quan chặt chẽ với nhau sẽ làm tăng độ lệch chuẩn của các hệ số trong mô hình hồi quy, đồng thời làm giảm trị thống kê Vì thế cần phải kiểm tra giả định không có mối tương quan giữa các biến độc lập
3.9.5 Các bước xây dựng mô hình hồi quy đa biến
Bước 1: Thu thập và xử lý các dữ liệu sơ cấp, thứ cấp
Trang 36Bước 2: Tiến hành phân tích tương quan giữa các biến
Bước 3: Phân tích lựa chọn biến (forward selection, backward elimination,
Stepwise selection, Enter)
Bước 4: Kiểm định các giả thuyết của mô hình hồi quy
Bước 5: Kiểm định các giả định của mô hình hồi quy
Bước 6: Đánh giá mô hình hồi quy
Trang 37CHƯƠNG 4: XÂY DỰNG MÔ HÌNH HỒI QUY ĐA BIẾN
4.1 Xác định các nhân tố chính ảnh hưởng đến chi phí xây dựng công trình thuộc lĩnh vực Văn hóa - Xã hội
Sau khi đã xác định sơ bộ 17 yếu tố ảnh hưởng đến chi phí xây dựng từ các nghiên cứu liên quan đã công bố, đồng thời thông qua việc tham khảo các nghiên cứu trên và tham khảo ý kiến của 9 chuyên gia (các kỹ sư xây dựng) hoạt động trong các lĩnh vực thiết kế, thi công, giám sát… hoạt động trong các dự án xây dựng công trình dân dụng trên 10 năm, từ đó xác định được 14 nhân tố chính ảnh hưởng chi phí xây dựng công trình thuộc lĩnh vực Văn hóa - Xã hội, cụ thể như sau:
+ Tổng diện tích phòng nghiệp vụ
+ Tổng diện tích phòng lãnh đạo
+ Tổng diện tích phòng hành chính
+ Tổng diện tích hội trường
+ Tổng diện tích công trình phụ
+ Thời gian thực hiện dự án
+ Giải pháp kết cấu móng
+ Diện tích sân đường
+ Khối lượng san nền
Chi tiết bản câu hỏi được trình bày ở phụ lục 1
4.1.1 Dữ liệu sơ cấp
Là các bảng câu hỏi khảo sát được gửi trực tiếp đến các kĩ sư xây dựng
Trang 38Tổng số bảng câu hỏi được phát đi là 100, kết quả thu lại được sau khi kiểm tra là
96 bảng câu hỏi, tỉ lệ là 96%
Hình 4.1 Độ tuổi của ứng viên trong cuộc khảo sát
Hình 4.2 Kinh nghiệm của ứng viên trong cuộc khảo sát
Trang 39Hình 4.3 Lĩnh vực hoạt động của ứng viên trong cuộc khảo sát
Hình 4.4 Vị trí công tác của ứng viên trong cuộc khảo sát Các hình từ 4.1 đến 4.4 thể hiện kinh nghiệm của các ứng viên tham gia trong cuộc phỏng vấn Kết quả phỏng vấn là đáng tin cậy Điển hình là thời gian làm việc của ứng viên trên 5 năm chiếm 60%, ứng viên từ 3 đến 5 năm chiếm 22% và ứng viên dưới 3 năm là 18% (thể hiện tại hình 4.2)
Trang 404.1.2 Đánh giá độ tin cậy thang đo
Kết quả tổng hợp bảng câu hỏi khảo sát được trình bày trong phụ lục 2 Từ kết quả tổng hợp của bảng câu hỏi khảo sát Tiến hành phân tích đánh giá độ tin cậy của thang đo
Analyze>> Scale>> Reliability Analysis
Hình 4.5 Cửa sổ thực hiện phân tích Cronbach Alpha
Bảng 4.1 Kết quả phân tích Cronbach Alpha
Item-Total Statistics Scale Mean if
Item Deleted
Scale Variance
if Item Deleted
Corrected Total Correlation
Item-Cronbach's Alpha if Item Deleted