Giới thiệu chung
Các khu đô thị hiện nay phát triển nhanh chóng, đòi hỏi hạ tầng kỹ thuật đồng bộ để đáp ứng nhu cầu sản xuất và sinh hoạt Tuy nhiên, mạng lưới cấp nước tại nhiều khu vực đô thị vẫn chưa hoàn thiện, ảnh hưởng đến nhu cầu sử dụng nước của người dân Trong tương lai, áp lực từ sự gia tăng dân số và nhu cầu nước sẽ cần hoàn thiện hơn nữa mạng lưới cấp nước trong khu vực.
Đầu tư vào mạng lưới cấp nước cho khu vực này là rất cần thiết để đảm bảo áp lực nước ổn định và cung cấp nước an toàn liên tục cho người dân Điều này cũng giúp hoàn thiện mạng lưới cấp nước cho các khu đô thị và thành phố Hồ Chí Minh trong tương lai.
Tình hình cổ phần hóa doanh nghiệp Nhà nước và thoái vốn đang gây khó khăn tài chính cho các công ty cổ phần cấp nước Đầu tư xây dựng công trình cần chú trọng đến hiệu quả để không ảnh hưởng đến cổ đông Trong giai đoạn lập dự án, việc cân nhắc nguồn vốn cho phép là rất quan trọng, giúp ước lượng chi phí thực hiện công trình mạng lưới cấp nước một cách chính xác và nhanh chóng, từ đó đánh giá tính khả thi của dự án.
Xác định vấn đề nghiên cứu
1.2.1 Lý do dẫn đến nghiên cứu
Nghiên cứu về chi phí thực hiện dự án xây dựng đã được tiến hành nhiều, nhưng đối với các công trình mạng lưới cấp nước, vẫn còn thiếu sót Hiện nay, các nhà đầu tư, công ty tư vấn và nhà thầu thường xác định giá xây dựng công trình cấp nước thông qua việc thiết lập dự toán cơ sở Tuy nhiên, quy trình này tốn nhiều thời gian và công sức do sự khác biệt về vị trí địa lý, hiện trạng kinh tế xã hội, cơ sở hạ tầng và mật độ dân cư tại các khu vực khác nhau ở thành phố Hồ Chí Minh.
Nghiên cứu và xác định các nguyên nhân chính ảnh hưởng đến chi phí là yếu tố quan trọng trong việc ước lượng chi phí cho dự án mạng lưới cấp nước tại thành phố Hồ Chí Minh Việc này giúp tối ưu hóa ngân sách và đảm bảo hiệu quả trong quá trình triển khai dự án.
Minh một cách nhanh chóng và chính xác trước khi có thiết kế chi tiết
Từ yêu cầu thực tiễn như trên, đề tài được chọn để thực hiện nghiên cứu là
“Ước lượng chi phí thực hiện công trình mạng lưới cấp nước trong giai đoạn lập dự án”
1.2.2 Các câu hỏi nghiên cứu
- Các yếu tố nào quyết định đến giá xây dựng thực hiện công trình mạng lưới cấp nước?
- Dùng công cụ nào để phân tích các yếu tố quyết định giá xây dựng và thực hiện như thế nào?
- Dùng công cụ và kiểm định thống kê nào để xây dựng mô hình ước lượng chi phí thực hiện công trình cũng như kiểm tra mô hình đó?
Mục tiêu nghiên cứu
- Phân tích, nhận dạng các yếu tố quyết định đến giá xây dựng công trình mạng lưới cấp nước giai đoạn lập dự án
- Xây dựng mô hình hồi quy đa biến dựa trên những yếu tố quyết định chính kết hợp với phương pháp Bootstrap
Kiểm tra và đánh giá kết quả mô hình là bước quan trọng để so sánh với kết quả thực tế, từ đó xác định độ chính xác của mô hình Việc này giúp đánh giá khả năng ứng dụng của mô hình vào thực tế, đảm bảo tính hiệu quả và độ tin cậy trong các tình huống thực tế.
Quy mô nghiên cứu
- Địa điểm: Phạm vi nghiên cứu của đề tài này giới hạn ở khu vực Thành phố Hồ
Đối tượng nghiên cứu trong bài viết này là các công trình mạng lưới cấp nước tại khu đô thị thành phố Hồ Chí Minh, với mục tiêu thực hiện nghiên cứu trong giai đoạn lập dự án.
Đóng góp của nghiên cứu
Kết quả nghiên cứu của đề tài này có thể đóng góp :
Nghiên cứu này đóng vai trò quan trọng trong việc cung cấp cơ sở tham khảo và phân tích các yếu tố quyết định đến giá xây dựng chi phí thực hiện công trình mạng lưới cấp nước Nó cũng có thể hỗ trợ các nhà nghiên cứu trong việc đánh giá các công trình mạng lưới cấp 1, cấp 2 hoặc ở các khu vực khác.
Thành phố Hồ Chí Minh
Đề tài này hỗ trợ các công ty Cổ phần cấp nước xác định các yếu tố quyết định giá xây dựng công trình mạng lưới cấp nước, từ đó ước lượng chi phí trong giai đoạn đầu lập dự án Việc này giúp tiết kiệm thời gian và chi phí, đồng thời tạo điều kiện cho các nhà quản lý đánh giá tính khả thi của dự án Nhờ vậy, các Chủ đầu tư có thể đưa ra quyết định đầu tư và quản lý dự án một cách hiệu quả.
Các khái niệm, lý thuyết, kiến thức và mô hình sử dụng
Chi phí đầu tư xây dựng công trình được định nghĩa là tổng hợp toàn bộ chi phí cần thiết cho việc xây dựng mới, sửa chữa, cải tạo hoặc mở rộng các công trình xây dựng (TT05-BXD, 2007)
Chi phí đầu tư xây dựng công trình được xác định qua tổng mức đầu tư của dự án trong giai đoạn lập kế hoạch, dự toán xây dựng trong quá trình thực hiện, và giá trị thanh toán, quyết toán vốn đầu tư khi hoàn thành và đưa công trình vào khai thác.
Chi phí đầu tư xây dựng công trình được xác định dựa trên từng dự án cụ thể, phù hợp với giai đoạn đầu tư, các bước thiết kế và các quy định hiện hành.
* Hệ thống cấp nước: Hệ thống cấp nước được chia làm 3 loại, theo bậc tin cậy cấp nước, lấy theo bảng 2.1 (TCXDVN 33:2006, 2006)
Bảng 2.1 Bậc tin cậy cấp nước Đặc điểm hộ dùng nước Bậc tin cậy
Hệ thống cấp nước cho các khu dân cư có trên 50.000 người và các đối tượng sử dụng nước khác có thể giảm lưu lượng cấp nước tối đa 30% so với lưu lượng tính toán trong 3 ngày, đồng thời không được ngừng cấp nước quá 10 phút.
Hệ thống cấp nước sinh hoạt cho khu dân cư với quy mô lên đến 50.000 người và các đối tượng sử dụng nước khác có thể giảm lưu lượng cấp nước tối đa 30% trong vòng 10 ngày và ngừng cấp nước trong 6 giờ.
Hệ thống cấp nước sinh hoạt cho điểm dân cư với dân số lên đến 5000 người và các đối tượng sử dụng nước khác có thể giảm lưu lượng cấp nước tối đa 30% trong vòng 15 ngày, đồng thời có thể ngừng cấp nước trong 1 ngày.
*Mạng lưới cấp nước: là hệ thống đường ống dẫn nước và các công trình trên đường ống để đưa nước đến nơi sử dụng.(SAWACO, 2009)
Ống chuyển tải được thiết kế đặc biệt để vận chuyển một lượng nước lớn qua các khoảng cách dài, thường là giữa các công trình chính trong hệ thống cấp nước.
Các khách hàng đơn lẻ thường không được cung cấp nước trực tiếp từ tuyến ống chuyển tải Bao gồm :
+ Ống cấp 1: cỏc tuyến ống cú đường kớnh ỉ ≥ 600mm
+ Ống cấp 2: cỏc tuyến ống cú đường kớnh 350mm < ỉ < 600mm
Ống phân phối là loại ống trung gian dùng để chuyển nước đến tay khách hàng Đường kính của ống phân phối thường nhỏ hơn so với ống chuyển tải và được lắp đặt phù hợp với địa hình cũng như các tuyến đường giao thông trong thành phố.
+ Ống cấp 3: cỏc tuyến ống cú đường kớnh ỉ ≤ 350mm
Đường ống dịch vụ, hay còn gọi là ống ngánh, là hệ thống ống dẫn nước được kết nối từ ống phân phối đến đồng hồ nước, nhằm cung cấp nước cho khách hàng sử dụng.
Thường cú đường kớnh ỉ ≤ 50mm
Hệ thống cấp nước tại các khu vực đô thị được quản lý bởi các Công ty Cổ phần Cấp nước, bao gồm mạng lưới ống cấp nước phân phối, cung cấp nước trực tiếp cho người dân Đường kính ống cấp nước dao động từ 100 mm đến 350 mm.
Hình 2.1 Hệ thống mạng lưới cấp nước
Mẫu là tập hợp các đơn vị được chọn từ tổng thể theo một phương pháp lấy mẫu cụ thể Các đặc trưng của mẫu sẽ được sử dụng để suy rộng ra các đặc trưng của tổng thể.
* Các phương pháp thu thập dữ liệu sơ cấp:
- Khảo sát qua điện thoại
Phương pháp lấy mẫu thuận tiện là một kỹ thuật nghiên cứu thường được áp dụng trong các nghiên cứu khám phá nhằm nắm bắt thực tế và kiểm tra trước các câu hỏi khảo sát Phương pháp này giúp đảm bảo rằng các đặc điểm cần thu thập dữ liệu trong bảng câu hỏi được xác định rõ ràng, không gây lo lắng cho người trả lời Ngoài ra, mẫu thuận tiện còn hữu ích khi bạn cần ước lượng sơ bộ về kết quả mà không tốn quá nhiều thời gian và chi phí.
* Quy trình xây dựng bảng câu hỏi khảo sát :
Để tiến hành thu thập dữ liệu hiệu quả, bước đầu tiên là xác định rõ ràng thông tin cần thu thập và đối tượng khảo sát dựa trên mục tiêu nghiên cứu Cụ thể, chúng ta cần thông tin liên quan đến dự án mạng lưới cấp nước, và đối tượng khảo sát sẽ là những người đã từng tham gia thực hiện dự án cấp nước này.
Để đảm bảo tính chính xác trong thông tin, bước 2 là xác định phương pháp phỏng vấn, bao gồm phỏng vấn trực diện và qua điện thoại Việc lựa chọn hai hình thức này giúp chúng ta tương tác trực tiếp với các chuyên gia.
Bước 3: Xác định nội dung câu hỏi bao gồm việc đánh giá tính rõ ràng của câu hỏi, xác định sự cần thiết của nó đối với nghiên cứu và xem xét liệu các chuyên gia có sẵn sàng tham gia trả lời câu hỏi này hay không.
Các nghiên cứu tương tự đã công bố
2.2.1 Các nhân tố ảnh hưởng sự thành công của các dự án cấp nước tại khu vực
Gia Định.(Văn, L.T and Thái, N.Q., 2014)
Bài báo đánh giá các nhân tố quyết định sự thành công của các dự án cấp nước, dựa trên các nghiên cứu liên quan, phỏng vấn và bảng câu hỏi gửi đến các chuyên gia Kết quả cho thấy có 14 nhân tố thành công hàng đầu cần được chú ý.
- Năng lực tài chính của chủ đầu tư
- Năng lực tài chính của Nhà thầu thi công
- Năng lực, kinh nghiệm của đơn vị giám sát thi công tại công trình
- Sự ủng hộ của chính quyền địa phương
- Hồ sơ triển khai dự án thực hiện đầy đủ, đúng quy trình, đúng quy định pháp luật hiện hành
- Đảm bảo quy định về chất lượng thi công ngành nước, an toàn lao động, vệ sinh môi trường…
- Năng lực, kinh nghiệm quản lý dự án cấp nước của ban quản lý dự án
- Năng lực, kinh nghiệm quản lý dự án cấp nước của các thành viên chủ chốt chỉ huy tại công trình
- Năng lực chuyên môn của đơn vị thiết kế
- Chủ đầu tư thường xuyên giám sát, cập nhật tiến độ, chi phí dự án và phải có sự phản hồi kịp thời
- Qui trình kiểm tra chất lượng vật tư, thiết bị đưa vào thi công dự án cấp nước
- Độ tin cậy của hồ sơ khảo sát, cập nhật công trình ngầm
- Thực hiện đúng quy định về đấu thầu, lựa chọn nhà thầu
2.2.2 Nghiên cứu các yếu tố ảnh hưởng đến chi phí thực hiện các dự án khu dân cư vượt lũ trong giai đoạn lập dự án tại tỉnh An Giang.(Duy, L.T., 2015)
Nghiên cứu đã xác định 14 yếu tố ảnh hưởng đến chi phí xây dựng khu dân cư vượt lũ thông qua bảng câu hỏi khảo sát gửi đến các chuyên gia tư vấn và quản lý dự án tại tỉnh An Giang Bảng câu hỏi được phát đến 128 chuyên gia, và thu hồi được 49 phản hồi hợp lệ từ những người có ít nhất 3 năm kinh nghiệm trong lĩnh vực này.
Trong 14 yếu tố ảnh hưởng đến chi phí xây dựng khu dân cư vượt lũ có 03 yếu tố có mức tác động từ lớn đến rất lớn, 03 yếu tố có mức tác động từ trung bình đến lớn và 08 yếu tố tác động từ thấp đến trung bình
Nghiên cứu đã lập ra được 09 mô hình để dự báo chi phí xây dựng:
03 mô hình hồi quy tuyến tính, 06 mô hình ANN với 14 biến đầu vào
Mô hình hồi quy tuyến tính đạt sai số MAPE nhỏ nhất là 4,62%, được xây dựng bằng phương pháp chọn biến stepwise với 6 biến được giữ lại Trong khi đó, mô hình ANN có sai số thấp nhất với 14 biến đầu vào, 1 lớp ẩn và 9 neuron.
MAPE đạt 5,13%, cho thấy cả hai mô hình đều có sai số chấp nhận được và có thể áp dụng để dự báo chi phí xây dựng Trong đó, mô hình hồi quy tuyến tính mang lại kết quả dự báo chính xác hơn so với mô hình ANN.
2.2.3 Ước tính thời gian thi công của dự án xây dựng cầu đường bộ ở khu vực Đông Nam bộ và đồng bằng sông Cửu Long trong giai đoạn lập dự án.(Phúc,
Kết hợp hai phương pháp lấy thông tin theo đánh giá và theo hồ sơ, cùng với quy trình xử lý số liệu, nghiên cứu đã đạt được những kết quả đáng chú ý.
Nghiên cứu đã khảo sát ý kiến chuyên gia và xác định 12 yếu tố quan trọng có ảnh hưởng đáng kể đến thời gian thi công của các dự án Những yếu tố này có thể được sử dụng để dự đoán thời gian thi công trong giai đoạn ban đầu của dự án.
Mô hình dự đoán được xây dựng sẽ cung cấp cho các bên liên quan một công cụ hữu ích để xác định thời gian thi công cầu trong giai đoạn dự án mà chưa có thông tin chi tiết, dựa trên việc học hỏi từ kinh nghiệm của các dự án đã hoàn thành trước đó.
Với các kết quả đạt được, nghiên cứu này cũng đề xuất một vài ứng dụng trong thực tế như sau:
Thông qua mô hình tự động hóa, các nhà quản lý có thể điều chỉnh các phương án dự án như kết cấu, quản lý và nhà thầu, nhằm đạt được kết quả tối ưu Việc này giúp tránh thay đổi trong quá trình thực hiện, tạo điều kiện cho dự án hoạt động hiệu quả và nhanh chóng đưa vào khai thác, đáp ứng kịp thời nhu cầu giao thông phục vụ phát triển kinh tế - xã hội.
Dựa vào mô hình, có thể đánh giá mức độ ảnh hưởng của các yếu tố đến thời gian thi công của dự án
2.2.4 Ứng dụng mô hình hồi quy đa biến (MLR) để ước lượng chi phí xây dựng cho công trình trường học tại Long An.(Tòng, L.T., 2016) Để xác định được các nhân tố chính ảnh hưởng đến chi phí xây dựng công trình trường học sử dụng biểu đồ Scatterplot kiểm tra điều kiện khá thẳng của 14 biến độc lập và 1 biến phụ thuộc thu được 9 biến đầu vào thỏa mãn điều kiện khá thẳng
Phân tích hồi quy theo 3 phương pháp: phương pháp đưa vào dần
(Forward selection), phương pháp lựa chọn từng bước (Stepwise selection), phương pháp loại trừ dần (Backward elimination) Cả 3 phương pháp đều cho
Để so sánh các phương trình hồi quy có đơn vị khác nhau, cần phải chuẩn hóa mô hình hồi quy nhằm loại bỏ sự ảnh hưởng của các đơn vị đo lường khác nhau.
Mô hình hồi quy chuẩn hóa:
Mô hình hồi quy chuẩn hóa chỉ ra rằng chi phí xây dựng chịu ảnh hưởng lớn nhất từ sự thay đổi tổng diện tích hội trường, tiếp theo là tổng diện tích phòng học và phòng thực hành Trong khi đó, biến giải pháp móng có tác động ít nhất trong mô hình này.
R 2 adj = 0,978 cho biết 97,8% sự biến đổi của chi phí xây dựng có thể được giải thích bằng sự biến đổi của 4 biến X1, X2, X3, X5
Giá trị R² = 0,982 chỉ ra sự liên kết mạnh mẽ giữa biến phụ thuộc chi phí xây dựng và các biến độc lập X1, X2, X3, X5 Tuy nhiên, giá trị R² cao có thể dẫn đến nguy cơ vi phạm giả thuyết đa cộng tuyến.
Quy trình nghiên cứu
Hình 3.1 Quy trình nghiên cứu
Xác định đề tài nghiên cứu
Xác định các yếu tố quyết định đến giá xây dựng thực hiện công trình mạng lưới cấp nước
Thu thập số liệu các biến chính
Xử lý số liệu – Xây dựng mô hình hồi quy đa biến
Kiểm định và đánh giá mô hình
Kết luận, kiến nghị Đặt vấn đề
Tham khảo tạp chí, sách, các bài báo, các nghiên cứu tương tự
Tham khảo ý kiến chuyên gia qua phỏng vấn trực tiếp, email, bảng câu hỏi
Phân tích xác suất ước lượng giá xây dựng công trình mạng lưới cấp nước
Thu thập dữ liệu
- Tham khảo các bài báo, các nghiên cứu tương tự
- Tham khảo ý kiến nhóm người có tham gia công trình mạng lưới cấp nước qua bảng câu hỏi khảo sát, phỏng vấn trực tiếp, email
- Số lượng mẫu cho phân tích hồi quy là 100 mẫu
- Sử dụng phương pháp lấy mẫu thuận tiện để thu thập dữ liệu
- Kết hợp với dữ liệu từ dự toán chi tiết của từng công trình mạng lưới cấp nước trên địa bàn thành phố Hồ Chí Minh.
Công cụ nghiên cứu
Bảng 3.1 Công cụ nghiên cứu
Trình tự thực hiện Công cụ nghiên cứu
Xác định các yếu tố quyết định đến chi phí thực hiện công trình mạng lưới cấp nước
Thông qua các nghiên cứu trước đây, tạp chí, tài liệu, Internet, ý kiến của nhóm chuyên gia
Xác định các yếu tố chính
- Thông qua bảng câu hỏi
- Phân tích thống kê của phần mềm SPSS
Phân tích dữ liệu và kiểm định mô hình hồi quy
- Phân tích hồi quy bằng phần mềm SPSS
- Kiểm định mô hình bằng SPSS
- Đánh giá sai số mô hình bằng Excel
Thiết lập mô hình hồi quy đa biến
3.4.1 Các phương pháp chọn biến
Có nhiều phương pháp tính toán các phương trình khả năng, nhưng một số phương pháp ít được sử dụng Để xây dựng mô hình hồi quy đa biến hiệu quả, việc xác định các biến độc lập để dự đoán chính xác biến phụ thuộc là rất quan trọng Ba phương pháp lựa chọn biến phổ biến trong SPSS bao gồm: phương pháp đưa vào dần.
(forward selection), loại trừ dần (backward elimination), và hồi quy từng bước
* Phương pháp đưa vào dần (Forward selection):
Trong phương pháp đưa vào dần, biến đầu tiên được đưa vào phương trình là biến có tương quan mạnh nhất, dù là thuận hay nghịch, với biến phụ thuộc.
Sau khi kiểm định F, chương trình sẽ xác định giả thiết rằng hệ số của biến là bằng 0 Để quyết định biến nào được đưa vào mô hình, giá trị thống kê F sẽ được so sánh với một giá trị tiêu chuẩn đã được thiết lập trước.
Tiêu chuẩn thứ nhất là giá trị nhỏ nhất của thống kê F mà một biến phải đạt được để được đưa vào, gọi là FIN F ≥ FIN (F-to-enter)
Tiêu chuẩn thứ hai là xác suất tương ứng của thống kê F, gọi là PIN
Trong trường hợp này, một biến sẽ được đưa vào phương trình khi xác suất tương ứng với giá trị thống kê F nhỏ hơn hoặc bằng xác suất mặc định hoặc giá trị mà chúng ta chỉ định.
Khi biến đầu tiên được chọn và đáp ứng tiêu chuẩn vào, phương pháp đưa dần vào sẽ tiếp tục Sau khi có một biến trong phương trình, các thông số thống kê của các biến còn lại sẽ được xem xét để chọn biến tiếp theo Biến có tương quan riêng lớn nhất sẽ là ứng viên tiếp theo Nếu biến này thỏa mãn tiêu chuẩn, nó sẽ được đưa vào phương trình và quy trình sẽ lặp lại cho đến khi không còn biến nào khác đáp ứng tiêu chuẩn vào.
* Phương pháp loại trừ dần (Backward elimination):
Phương pháp đưa vào dần bắt đầu với phương trình không có biến và lần lượt thêm các biến theo tiêu chuẩn vào, trong khi phương pháp loại trừ dần bắt đầu với tất cả các biến có mặt trong phương trình và loại trừ chúng theo tiêu chuẩn loại trừ Có hai tiêu chuẩn loại trừ chính được áp dụng trong phương pháp này.
Tiêu chuẩn đầu tiên trong phân tích hồi quy là giá trị F tối thiểu mà thống kê F của biến độc lập cần đạt để duy trì trong phương trình, được gọi là FOUT Các biến độc lập có giá trị F thấp hơn FOUT (F-to-remove) sẽ bị loại bỏ khỏi phương trình.
Tiêu chuẩn thứ hai liên quan đến xác suất tối đa, ký hiệu là POUT, mà một biến không được vượt quá để có thể duy trì trong mô hình.
Trong quy trình loại bỏ biến F-to-remove, tất cả các biến độc lập được đưa vào mô hình ban đầu Biến có hệ số tương quan từng phần nhỏ nhất sẽ được kiểm tra trước tiên Nếu giá trị thống kê F của biến đó nhỏ hơn FOUT, biến sẽ bị loại khỏi mô hình và phương trình sẽ được tính toán lại mà không có biến vừa loại Quá trình này tiếp tục cho đến khi giá trị F của biến có hệ số tương quan từng phần nhỏ nhất lớn hơn FOUT, tại đó quy trình sẽ dừng lại (Trọng và Ngọc, 2008).
* Phương pháp chọn từng bước (Stepwise selection): Đây là phương pháp kết hợp của phương pháp đưa vào dần và loại trừ dần
Biến đầu tiên được lựa chọn theo cách chọn dần từng bước Nếu biến này không đáp ứng điều kiện vào (FIN hoặc PIN), quy trình sẽ dừng lại và không có biến độc lập nào được đưa vào phương trình Nếu biến đầu tiên thỏa mãn tiêu chí, biến thứ hai sẽ được chọn dựa trên tương quan riêng cao nhất Nếu biến thứ hai cũng đáp ứng tiêu chuẩn, nó sẽ được đưa vào phương trình.
Sau khi biến thứ nhất được đưa vào, quy trình chọn lựa các biến tiếp theo khác với phương pháp đưa dần, vì biến thứ nhất sẽ được xem xét để loại bỏ dựa trên tiêu chuẩn ra (FOUT hoặc POUT) Trong bước tiếp theo, các biến không có trong phương trình sẽ được xem xét để đưa vào Sau mỗi bước, các biến hiện tại trong phương trình sẽ được đánh giá để có thể loại trừ Quá trình này tiếp tục cho đến khi không còn biến nào thỏa mãn điều kiện loại trừ.
3.4.2 Kiểm định mô hình hồi quy
3.4.2.1 Kiểm định các giả thuyết của mô hình hồi quy a Kiểm định mức độ giải thích của mô hình:
Đánh giá độ phù hợp của mô hình hồi quy tuyến tính bội có thể được thực hiện thông qua hệ số xác định R² và R² điều chỉnh R² điều chỉnh được tính toán bằng công thức: R² điều chỉnh = 1 - [(1 - R²)(n - 1) / (n - p - 1)], trong đó n là số lượng quan sát và p là số biến độc lập trong mô hình.
(3.1) Trong đó p là số biến độc lập trong phương trình (trong mô hình hồi quy đơn biến thì p = 1).(Trọng và Ngọc, 2008)
Hệ số R² không giảm khi số biến độc lập trong mô hình tăng lên, dẫn đến việc R² thường tăng Tuy nhiên, điều này không có nghĩa là mô hình với nhiều biến độc lập sẽ phù hợp hơn với dữ liệu R² có xu hướng là một ước lượng lạc quan về sự phù hợp của mô hình, đặc biệt khi có hơn một biến giải thích Do đó, việc kiểm định độ phù hợp của mô hình là cần thiết để đánh giá chính xác hơn.
Kiểm định F được sử dụng để đánh giá sự phù hợp của mô hình hồi quy bằng cách xem xét mối quan hệ tuyến tính giữa biến phụ thuộc Y và các biến độc lập Xi Kiểm định này giúp xác định xem biến phụ thuộc có mối liên hệ tuyến tính với toàn bộ tập hợp các biến độc lập hay không.
Giả thuyết H0 cho rằng tất cả các hệ số hồi quy riêng phần β1, β2, β3, và β4 đều bằng 0 Nếu giả thuyết này bị bác bỏ, chúng ta có thể kết luận rằng sự kết hợp của các biến trong mô hình có thể giải thích được sự biến đổi của biến Y, cho thấy mô hình được xây dựng là phù hợp với tập dữ liệu (Trọng và Ngọc, 2008).
Xác định các yếu tố quyết định đến giá xây dựng công trình cấp nước
Để xác định các biến số tiềm năng cho mô hình dự đoán chi phí, một bộ dữ liệu đã được thu thập thông qua bảng câu hỏi khảo sát Do tính chất đặc thù của công trình mạng lưới cấp nước, dữ liệu được thu thập từ một nhóm chuyên gia có kinh nghiệm trong lĩnh vực này Tổng số bảng câu hỏi khảo sát được gửi đi là 20, và kết quả thu về đạt tỷ lệ 100%.
Sau khi xác định các biến số tiềm năng cho mô hình dự đoán, một bộ dữ liệu MLCN đã được tập hợp, bao gồm 100 bảng dự toán công trình.
MLCN được thu thập từ các công ty Cổ phần Cấp nước trên địa bàn Thành phố
Hồ Chí Minh thực hiện từ năm 2014 đến năm 2018 Trong đó tập hợp dữ liệu của
Bài viết đề cập đến 12 yếu tố quyết định giá xây dựng, được xác định từ khảo sát nhóm chuyên gia trong giai đoạn dữ liệu trước Những yếu tố này có thể được coi là 12 biến đầu vào, trong khi biến giá xây dựng là biến đầu ra của mô hình hồi quy đa biến.
Hình 4.1 Các yếu tố quyết định giá xây dựng
Xây dựng mô hình hồi quy đa biến
4.2.1 Mã hóa và phân loại các biến
Bảng 4.1 Mã hóa và phân loại các biến
Từ 12 biến đầu vào bao gồm nhiều biến định tính ta tách thành 15 biến độc lập để thuận tiện trong việc mã hóa định lượng trong phân tích hổi quy đa biến
Trong số 15 biến có khả năng làm biến đầu vào thì có 3 biến định lượng, 8 biến phân loại và 4 biến định tính
Mặc dù biến X14 và X15 đóng vai trò quan trọng trong việc xác định giá xây dựng công trình mạng lưới cấp nước, nhưng việc khảo sát và đánh giá công tác tư vấn, quản lý dự án của các công ty là rất khó khăn, và điều này sẽ được thể hiện rõ hơn khi kết thúc công trình.
STT Ký hiệu Tên biến Loại biến Đơn vị
1 Y Giá xây dựng Định lượng Triệu đồng
2 X1 Chiều dài ống cái Định lượng m
3 X2 Chiều dài ống ngánh Định lượng m
4 X3 Đường kính ống cái Định tính mm
5 X4 Vật liệu ống cái 1 Phân loại
6 X5 Vật liệu ống cái 2 Phân loại
7 X6 Vật liệu ống ngánh 1 Phân loại
8 X7 Vật liệu ống ngánh 2 Phân loại
9 X8 Số đấu nối vào ống cái Định lượng Bộ
10 X9 Kết cấu đường hẻm 1 Phân loại
11 X10 Kết cấu đường hẻm 2 Phân loại
12 X11 Kết cấu đường hẻm 3 Phân loại
13 X12 Bề rộng đường hẻm Phân loại
14 X13 Chủng loại vật tư Định tính
15 X14 Công tác tư vấn xây dựng Định tính
16 X15 Công tác quản lý dự án Định tính
Do đó, trong phạm vi nghiên cứu giá xây dựng công trình mạng lưới cấp nước trong giai đoạn lập dự án ta sẽ bỏ qua 2 biến X14, X15
Vậy số biến độc lập dùng để phân tích hồi quy đa biến là 13 (từ X1 tới X13)
* Các biến phân loại được mã hóa như sau:
Kí hiệu “uPVC” “gang” “HDPE” “không”
Kí hiệu “HDPE” “PE-AL-PE” “không”
Kí hiệu “Nhựa” “BTXM” “Nhựa+
* 2 biến định tính Đường kính ống cái (X3), Chủng loại phụ tùng (X13) theo thang đo thứ bậc được mã hóa như sau: Đường kính ống cái
Kớ hiệu “khụng” “ỉ100” “ỉ125” “ỉ150” “ỉ180” “ỉ200” “ỉ225” “ỉ300” Đường kính ống cái (X3) “0” “1” “2” “3” “4” “5” “6” “7”
Chủng loại vật tư cấp nước
Tiêu chuẩn vật tư “Bình thường” “Tốt” “Rất tốt”
Bảng 4.2 Tiêu chuẩn vật tư cấp nước
Tiêu chuẩn vật tư Đặc điểm
- Chịu áp lực tương đối tốt
- Có thể kết tủa rong rêu tại mối nối
- Bề mặt nhẵn, không bị rong rêu
- Chịu được tác động cường độ cao
- Bề mặt nhẵn, không bị rong rêu
- Giá thành cao Bảng dữ liệu sau khi đã mã hóa:
Bảng 4.3 Bảng dữ liệu với 100 mẫu quan sát
4.2.2 Phân tích tương quan giữa các biến Để xem xét mối quan hệ giữa các biến với nhau (biến phụ thuộc với các biến độc lập và các biến độc lập với nhau) Thủ thuật : Analyze >> Correlate >> Bivariate:
Hình 4.2 Hộp thoại phân tích tương quan giữa các biến
Bảng 4.4 Bảng phân tích tương quan giữa các biến
Chiều dài ON Đường kính
** Correlation is significant at the 0.01 level (2-tailed)
* Correlation is significant at the 0.05 level (2-tailed)
Theo bảng phân tích tương quan Pearson giữa các biến ở trên, kết quả cho thấy các biến độc lập X1, X2, X3, X6, X8, X10 có tương quan với biến phụ thuộc Y
Kiểm định giả thuyết ở mức ý nghĩa < 5% nên hệ số tương quan bằng 0 bị bác bỏ
Các biến độc lập trong phân tích hồi quy có hệ số tương quan tương đối cao, do đó cần chú ý đến hiện tượng đa cộng tuyến.
Phân tích hồi quy
4.3.1 Phân tích hồi quy với phương pháp Stepwise Selection
Thủ thuật : Analyze >> Regression >> Linear >>Stepwise
Hình 4.3 Hộp thoại phân tích hồi quy bằng phương pháp Stepwise
Hình 4.4 Hộp thoại chọn thể hiện các thông số sau phân tích hồi quy
Bảng 4.5 Bảng Model Summary theo phương pháp Stepwise
Std Error of the Estimate
The analysis presents various predictors influencing construction costs, with the dependent variable being "Construction Price." Key predictors include the length of the OC, the number of connections, and the diameter of the OC Additional factors such as the type of materials used (Material OC 1 and Material OC 2) also play a significant role in determining the overall construction costs.
Bảng 4.6 Bảng hệ số của mô hình hồi quy theo phương pháp Stepwise
B Std Error Beta Tolerance VIF
Số đấu nối 6.615.752 709.351 ,512 9,326 ,000 ,934 1,070 Đường kính
Số đấu nối 6.031.864 665.290 ,467 9,067 ,000 ,896 1,116 Đường kính
Số đấu nối 6.152.015 643.637 ,476 9,558 ,000 ,892 1,121 Đường kính
Số đấu nối 6.566.136 578.467 ,508 11,351 ,000 ,874 1,144 Đường kính
2.628.418.157 518.095.717 ,425 5,073 ,000 ,250 4,004 a Dependent Variable: Giá xây dựng
Kết quả từ bảng hệ số của mô hình hồi quy theo phương pháp Stepwise cho thấy tất cả các mức ý nghĩa của thống kê T đối với các tham số trong mô hình 6 đều nhỏ hơn.
Với giá trị p-value 0,05, các kiểm định T không bác bỏ mô hình Do đó, chúng ta có thể trình bày phương trình giải thích giá xây dựng cho công trình mạng lưới cấp nước như sau: công thức (4.1).
4.3.1 Kiểm định sơ bộ mô hình hồi quy
Theo Bảng 4.5, giá trị thống kê Durbin-Watson là d=1,474, nằm trong khoảng không đủ để kết luận về sự tồn tại của tự tương quan chuỗi bậc nhất Cụ thể, ta có dL=1,421 < d=1,474 < dU=1,670, cho thấy không có bằng chứng rõ ràng cho tự tương quan.
Do đó, có thể dẫn đến tự tương quan của các phần dư trong mô hình tổng thể dẫn đến sai lệch mô hình hồi quy.
Biểu đồ phân tán giữa giá trị dự đoán chuẩn hóa và phần dư chuẩn hóa cho thấy có 6 mẫu quan sát dị biệt (giá trị phần dư chuẩn hóa >2 và < -2) do thiếu dữ liệu cho các mẫu này, điều này có thể dẫn đến sự không chính xác của mô hình hồi quy tổng thể.
Hình 4.5 Hộp thoại chọn biểu đồ phân tán giữa phần dư và giá trị dự đoán
Hình 4.6 Biểu đồ phân tán giữa phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa
Dựa vào hai yếu tố đã đề cập, chúng ta sẽ loại bỏ 6 mẫu quan sát có giá trị phần dư chuẩn hóa lớn hơn 2 và nhỏ hơn -2, sau đó tiến hành phân tích lại mô hình hồi quy với bảng dữ liệu đã chỉnh sửa.
Bảng 4.7 Bảng dữ liệu với 94 mẫu quan sát
Phân tích hồi quy với phương pháp Stepwise, số mẫu quan sát là N = 94 và kiểm định các giả thuyết
và kiểm định các giả thuyết
4.4.1 Phân tích hồi quy với phương pháp Stepwise Selection (N)
Bảng 4.8 Bảng Model Summary theo phương pháp Stepwise (N)
Std Error of the Estimate Durbin-Watson
The analysis reveals that the length of the OC is a significant predictor across various models Additional factors such as the number of connections and OC diameter further enhance predictive accuracy When including the type of materials and OC material, the model's effectiveness increases, indicating a comprehensive understanding of these variables is essential for accurate predictions.
The construction cost is influenced by several predictors, including OC length, the number of connections, OC diameter, material type, and specific materials OC 1 and OC 2, along with ON length and the structure of alleyways.
Bảng 4.9 Bảng hệ số của mô hình hồi quy theo phương pháp Stepwise (N)
B Std Error Beta Tolerance VIF
-485.428.934 204.387.450 -,084 -2,375 ,020 ,819 1,221 a Dependent Variable: Giá xây dựng
Theo kết quả từ Bảng 4.9 bằng phương pháp Stepwise, tất cả các mức ý nghĩa của thống kê T đối với các tham số trong mô hình 8 đều nhỏ hơn 0,05, cho thấy các kiểm định đều có ý nghĩa thống kê đáng kể.
T không bác bỏ mô hình Do đó ta có thể viết phương trình giải thích giá xây dựng cho công trình mạng lưới cấp nước như sau:
4.4.2 Kiểm định mô hình hồi quy với phương pháp Stepwise (N)
4.4.2.1 Kiểm định mức độ giải thích của mô hình
Từ Bảng 4.8 ta thấy R 2 điều chỉnh của mô hình = 0,906 cho ta thấy 90,6% thay đổi của biến phụ thuộc Y được giải thích bởi 8 biến độc lập X1, X2, X3,
4.4.2.2 Kiểm định độ phù hợp của mô hình
Bảng 4.10 Bảng ANOVA theo phương pháp Stepwise (N)
The analysis reveals a total value of 7.647E+20, with the dependent variable being construction costs The predictors include the constant, OC length, the number of connections, OC diameter, and the type of materials used Each predictor contributes to understanding the factors influencing construction expenses.
Kết quả phân tích từ Bảng 4.10 cho thấy giá trị Sig = 0,000, nhỏ hơn 5%, cho phép bác bỏ giả thuyết H0 Vì vậy, mô hình hồi quy đa biến được coi là phù hợp với tập dữ liệu.
4.4.2.3 Kiểm định về ý nghĩa các hệ số hồi quy riêng phần βk
Phân tích từ Bảng 4.9 cho thấy giá trị Sig của 8 biến độc lập trong mô hình đều nhỏ hơn 5%, dẫn đến việc bác bỏ giả thuyết H0 Điều này chứng tỏ rằng các hệ số của mô hình hồi quy đều có ý nghĩa trong mô hình tổng thể.
4.4.2.4 Kiểm định giả định liên hệ tuyến tính
Dựa vào Hình 4.7, đồ thị phân tán giữa phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa cho thấy phần dư phân tán ngẫu nhiên xung quanh tọa độ 0 mà không tuân theo quy luật hay hình dạng cụ thể nào Điều này xác nhận rằng giả định về mối liên hệ tuyến tính đã được thỏa mãn.
Hình 4.7 Biểu đồ phân tán giữa phần dư chuẩn hóa và giá trị dự đoán chuẩn hóa
Vật liệu OC 1 g Predictors: (Constant), Chiều dài OC, Số đấu nối, Đường kính OC, Chủng loại vật tư,
Vật liệu OC 1, Vật liệu OC 2 h Predictors: (Constant), Chiều dài OC, Số đấu nối, Đường kính OC, Chủng loại vật tư,
Vật liệu OC 1, Vật liệu OC 2, Chiều dài ON i Predictors: (Constant), Chiều dài OC, Số đấu nối, Đường kính OC, Chủng loại vật tư,
Vật liệu OC 1, Vật liệu OC 2, Chiều dài ON, Kết cấu đường hẻm 2
4.4.2.5 Kiểm định giả định phương sai của sai số không đổi
- Giả thuyết H0 là hệ số tương quan hạng của tổng thể bằng 0
Kiểm định được thực hiện bằng cách phân tích hệ số tương quan giữa phần dư và các biến độc lập Để thực hiện điều này, cần tạo ra một biến mới là trị tuyệt đối của phần dư và các biến độc lập trong mô hình hồi quy.
- Thủ thuật là Save giá trị Unstandardized trong phần Residual khi phân tích hồi quy Sau đó lấy trị tuyệt đối của phần dư Transform >> Compute
- Tiến hành phân tích tương quan hạng (Spearman) của biến “PhanDu” và các biến độc lập X1, X2, X3, X4, X5, X8, X10, X13 trong mô hình
Hình 4.8 Hộp thoại sao lưu phần dư chưa chuẩn hóa và giá trị dự đoán
Hình 4.9 Hộp thoại lấy giá trị tuyệt đối phần dư chưa chuẩn hóa
Hình 4.10 Hộp thoại thực hiện kiểm định tương quan hạng
Bảng 4.11 Bảng kết quả kiểm định tương quan hạng giữa các biến phụ thuộc và phần dư
Chiều dài ON Đường kính OC
* Correlation is significant at the 0.05 level (2-tailed)
** Correlation is significant at the 0.01 level (2-tailed)
Kết quả phân tích từ Bảng 4.11 cho thấy hầu hết các giá trị Sig của 8 biến độc lập trong mô hình đều lớn hơn 5%, do đó giả thuyết H0 không bị bác bỏ Điều này cho thấy giả định về phương sai của sai số không đổi được thỏa mãn.
4.4.2.6 Kiểm định giả định về phân phối chuẩn của phần dư
Hình 4.11 Đồ thị tần suất phần dư chuẩn hóa
Hình 4.11 cho thấy đường phân phối chuẩn trên biểu đồ tần số, với phần dư xấp xỉ phân phối chuẩn (trung bình gần bằng 0 và độ lệch chuẩn khoảng 0,956, gần bằng 1) Kết quả này cho phép kết luận rằng giả thuyết về phân phối chuẩn không bị vi phạm.
Ngoài ra, ta có thể so sánh phân phối phần dư quan sát với phân phối chuẩn kỳ vọng
Hình 4.12 cho thấy các mẫu quan sát gần gũi với đường kỳ vọng, từ đó có thể kết luận rằng giả thuyết về phân phối chuẩn không bị vi phạm.
Hình 4.12 Đồ thị Normal P-P Plot
4.4.2.7 Kiểm định giả định về tính độc lập của sai số (không có tương quan giữa các phần dư)
Giả thuyết H0 là hệ số tương quan tổng thể của các phần dư bằng 0
Thông qua bảng Model ta thấy đại lượng thống kê Durbin-Watson d=2,085
Tra bảng thống kê Durbin-Watson với số quan sát = 94, số biến độc lập = 8 với mức ý nghĩa 0,01 (độ tin cậy 99%) ta được dL=1,358; dU=1,715
Vậy dU=1,715 < d=2,085 < 4-dU=2,285 nằm trong miền chấp nhận giả thuyết không có tự tương quan chuỗi bậc nhất
Bảng 4.12 Bảng tra cận trên cận dưới hệ số Durbin-Watson với độ tin cậy 99%
4.4.2.8 Kiểm định giả định không có mối tương quan giữa các biến độc lập (đo lường đa cộng tuyến)
Kết quả phân tích từ Bảng 4.9 cho thấy giá trị độ phóng đại phương sai VIF
(Varian Inflation Factor) của 8 biến độc lập đều < 10 Nên không xảy ra hiện tượng đa cộng tuyến trong mô hình
4.4.3 Kiểm tra sai số mô hình với phương pháp Stepwise Để đánh giá độ tin cậy của các mô hình chúng ta dùng các các tiêu chí sai số của các mô hình, mục tiêu là đo lường kích thước sai biệt giữa thực tế và mô hình dự đoán
Ta có các sai số dự báo được xác định như sau :
At = Giá trị thực ở thời điểm t (quan sát t)
Ft = Giá trị dự báo ở thời điểm t n = Số lượng quan sát sử dụng trong dự báo
Sai số phần trăm trung bình (Mean Percentage Error)
Sai số phần trăm trung bình tuyệt đối (Mean Absolute Percentage Error)
Sai số bình phương trung bình gốc (Root Mean Squared Error)
4.4.4 Phân tích thành tố chính (PCA)
Trong phân tích phương sai, hồi quy bội xác định một biến phụ thuộc và các biến độc lập, trong khi phân tích thành tố chính không phân biệt giữa hai loại biến này Phân tích thành tố chính là một kỹ thuật phụ thuộc lẫn nhau, nghiên cứu toàn bộ các mối liên hệ giữa các biến.
Hiện tượng đa cộng tuyến xảy ra khi các biến độc lập có sự tương quan mạnh mẽ với nhau, dẫn đến việc khó khăn trong việc xác định ảnh hưởng của từng biến Để xác định hiện tượng này, người ta thường sử dụng hệ số phóng đại.
Hệ số phóng đại VIF lớn hơn 10 cho thấy dấu hiệu của đa cộng tuyến, theo quy tắc của Trọng và Ngọc (2008) Thông thường, các biến có VIF cao sẽ được loại bỏ để tăng độ tin cậy của mô hình hồi quy Tuy nhiên, trong nghiên cứu này, các hệ số tương quan giữa các biến độc lập Xk và biến phụ thuộc Y đều rất lớn, cho thấy sự quan trọng của tất cả các biến độc lập trong mô hình Việc loại bỏ bất kỳ biến nào có thể ảnh hưởng đáng kể đến khả năng dự báo của mô hình hồi quy.