TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG HỆ HỖ TRỢ QUYẾT ĐỊNH DỰ ĐOÁN GIÁ TRỊ BẤT ĐỘNG SẢN HỖ TRỢ NHÀ QUẢN LÝ GIẢI PHÓNG MẶT BẰNG Chuy
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC
PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG
HỆ HỖ TRỢ QUYẾT ĐỊNH DỰ ĐOÁN GIÁ TRỊ BẤT ĐỘNG SẢN HỖ TRỢ NHÀ
QUẢN LÝ GIẢI PHÓNG MẶT BẰNG Chuyên ngành: TOÁN TIN
Giảng viên hướng dẫn: TS LÊ CHÍ NGỌC
Hà Nội – 2020
Trang 3MỤC LỤC 2
CHƯƠNG 2 PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG 7
CHƯƠNG 3 MÔ HÌNH GIẢI QUYẾT BÀI TOÁN 10
3.1 Mô hình hồi quy tuyến tính (Linear Regression) 10
Trang 4LỜI NÓI ĐẦU
Trong thời kì hiện nay, để phục vụ tốt công tác quy hoạch, quản lý tài nguyên trong các lĩnh vực thì việc xây dựng một bộ công cụ mô phỏng và hỗ trợ quản lý là vô cùng cần thiết Với sự phát triển của công nghệ máy tính, việc mô hình hóa và phân tích hệ thống phát triển nhanh chóng, hệ hỗ trợ quyết định ra đời và được áp dụng nhiều trong quy hoạch, quản lý Ở báo cáo này em xin trình bày về đề tài dự đoán giá trị bất động sản, hỗ trợ nhà quản lý giải phóng mặt bằng Báo cáo gồm 3 chương chính:
• Chương 1 Khảo sát đánh giá
• Chương 2 Phân tích thiết kế hệ thống
• Chương 3 Mô hình giải quyết bài toán
• Chương 4 Thiết kế chương trình
Em xin chân thành cảm ơn Thầy Lê Chí Ngọc đã tận tình giúp đỡ để em có thể hoàn thành báo cáo này
Do có nhiều hạn chế về mặt kiến thức nên báo cáo có thể không tránh khỏi một số sai sót về mặt chủ quan và khách quan Vì vậy em rất mong nhận được sự góp ý, đánh giá của Thầy và các bạn để báo cáo cũng như hệ thống được hoàn thiện hơn
Em xin chân thành cảm ơn!
Hà Nội, ngày 12 tháng 06 năm 2020
Sinh Viên thực hiện
Trang 5CHƯƠNG 1 KHẢO SÁT ĐÁNH GIÁ.
1.1 Khảo sát, đánh giá.
Trong những năm gần đây với việc phát triển không ngừng của kinh tế, xã hội Việc phát triển các thành phố lớn diễn ra không ngừng nghỉ, nhu cầu xây dựng ngày càng tăng Các dự án xây dựng khu công nghiệp, trung tâm thương mai, trung tâm văn phòng, khu chung cư … phát triển mạnh mẽ
Hình 1: Quy hoạch xây dựng một thành phố
Việc giải phóng mặt bằng là yêu cầu bắt buộc và tiên quyết để thực hiện được các
dự án Chiếm một tỉ lệ lớn trong tổng số tiền đâu tư của dự án lên việc xác định một mức giá cụ thể để triển khai dự án hết sức quan trọng.Do đất là tài nguyên có hạn, nhu cầu sử
Trang 6dụng đất tăng cao dẫn tới giá cả biến động liên tục tùy theo nhu cầu của thị trường và không có một mức giá cố định, tùy thuộc giữa thỏa thuận giữa người bán và người mua
Từ nhu cầu của thị trường thực tế, cần một công cụ dự đoán tương đối chính xác tổng số tiền cần giải phóng mặt bằng giúp người quản lý đưa ra quyết định phụ hợp với nguồn lực của doanh nghiệp
1.2 Mô hình nghiệp vụ.
Dữ liệu về các khu vực tiềm năng với các trường dữ liệu: với số phòng ngủ, số phòng ăn, diện tích đất ở, diện tích đất sử dụng sẽ dược thu thập vào hệ thống Thông qua các yếu tố về ngôi nhà khu vực cần giải phóng mặt bằng hệ thống sẽ đưa ra dự đoán gần chính xác về giá trị khu đất đó Nhà quản lý dựa vào mức giá dự đoán của hệ thống kết hợp với các dữ liệu khác về các khu vực cần giải phóng mặt bằng để đưa ra quyết định hợp lý
Hình 2: Mô hình hóa nghiệp vụ
1.3 Đặc tả yêu cầu phần mềm.
Hệ thống được xây dựng với mục đích dự đoán mức giá tiền giải phóng mặt bằng giúp người quản lý đưa ra quyết định phù hợp, chính xác tiết kiệm nguồn lực của doanh nghiệp
- Người quản lý được toàn quyền quản lý dữ liệu bên trong, sẽ nhìn thấy tất cả số liệu trong cơ sở dữ liệu
- Trang chủ sẽ hiển thị các biểu đồ thống kê giá nhà trung bình theo m2 của các quận trong thành phố và giá dự đoán m2, tổng giá trị của các khu vực tiềm năng thực hiện
dự án Người quản lý có thể xem dữ liệu đã quản lý của công ty và các yếu tố ảnh hưởng
Trang 7đến mức giá giải phóng mặt bằng trong năm trước, cũng như các đánh giá mức độ ảnh hưởng của các yểu tố trên và độ chính xác giữa các mức giá dự đoán và mức giá giải phóng mặt bằng hiện tại là gần như chính xác bằng nhau Hơn nữa, một phần quan trọng của hệ thống là nhà quản lý chọn file dữ liệu của các khu vực tiềm năng được lưu trữ trên cơ sở
dữ liệu của hệ thống và ấn dự đoán, hệ thống sẽ đưa ra mức giá dự đoán số tiền cần giải phóng mặt bằng của khu vực đó Từ đó nhà quản lý sẽ có quyết định đầu tư xây dựng dự
án ở khu vực hợp lý phù hợp với nguồn lực doanh nghiệp
1.4 Dữ liệu khảo sát.
Mô hình dự báo dựa trên tập dữ liệu nhà đất của quận (hạt) King Country USA thuộc bang Washington được thu thập từ tháng 6 năm 2014 tới tháng 6 năm 2015 trên trang web https://www.kaggle.com/harlfoxem/housesalesprediction
Hình 3: Dữ liệu thu thập
Dữ liệu bao gồm 21 trường dữ liệu và 21614 bản ghi:
• Id: Id của dữ liệu
• Date: Ngày nhập dữ liệu vào hệ thống
• Price: Giá của ăn nhà
• Bedrooms: Số phòng ngủ của ăn nhà
• Bathrooms: Số phòng tắm của căn nhà
• Sqft_living: Diện tích để ở của căn nhà
• Sqft_lot: Diện tích của mảnh đất
• Floors: Số mặt sàn của căn nhà
• Waterfront : Ví trí của căn nhà có gần sông hồ không
• View: Số người đã xem căn nhà
• Condition: Tình trạng căn nhà
• Grade: Hạng căn nhà được xây trên đất theo giấy phép của quận cấp
• Sqft_above: Diện tích để ở của căn nhà không tính tầng hầm
• Sqft_basement: Diện tích tầng hầm
Trang 8• Yr_build: Năm xây dựng của căn nhà.
• Yr_renovated: Năm cải tạo căn nhà
• Zipcode: Mã vùng của căn nhà
• Lat: Tọa độ kinh độ của căn nhà
• Long: Tọa độ vĩ dộ của căn nhà
• Sqft_living15: Diện tích để ở của căn nhà năm 2015
• Sqft_lot15: Diện tích của mảnh đất năm 2015
Trang 9CHƯƠNG 2 PHÂN TÍCH VÀ THIẾT KẾ HỆ
THỐNG
2.1 Biểu đồ phân cấp chức năng.
Hình 4: Biểu đồ phân cấp chức năng
2.2 Biểu đồ luồng dữ liệu.
2.2.1 Biểu đồ luồng dữ liệu mức ngữ cảnh.
Hình 5: Biểu đồ dữ liệu mức ngữ cảnh
Trang 102.2.2 Biểu đồ luồng dữ liệu mức đỉnh.
Hình 6: Biểu đồ dữ liệu mức đỉnh
Trang 11CHƯƠNG 3 MÔ HÌNH GIẢI QUYẾT BÀI
TOÁN
3.1 Mô hình hồi quy tuyến tính (Linear Regression).
Thuật toán sử dụng để giải quyết bài toán là một thuật toán máy học, hồi quy tuyến tính Đây là một trong những thuật toán Supervised learning hay còn gọi học
có giám sát
Mô hình của thuật toán hồi quy tuyến tính có dạng:
Hình 7: Ví dụ mô hình hồi quy tuyến tính
Trang 12Trong đó, x ∈ R k−1 là vector biến đầu vào, và θ ∈ R k là vector trọng số tương ứng Thường θ được gọi là tham số của mô hình Giá trị của tham số sẽ được ước lượng bằng
cách sử dụng các cặp giá trị (x, y) của tập huấn luyện θ0 được gọi là độ lệch (bias) nhằm giảm đi mức độ chênh lệch giữa mô hình và thực tế.Mục tiêu của thuật toán là cực tiểu giá trị của hàm mất mát giữa giá trị thực tế (y) và giá trị dự đoán (y̅)
Trang 13CHƯƠNG 4 THIẾT KẾ CHƯƠNG TRÌNH.
4.1 Xây dựng hệ thống về dữ liệu.
sqft_living15 Diện tích trung bình 15 căn nhà xung quanh float
sqft_lot15 Diện tích trung bình 15 khu đất xung quanh float
Hình 8: Kiểu dữ liệu.
4.2 Xây dựng mô hình hệ thống.
4.2.1 Server.
- Sử dụng framewokrs Flask của python, viết api xử lý yêu cầu dự đoán của nhà quản lý
4.2.2 Client (Giao diện người dùng).
- Sử dụng HTML và CSS xây dựng giao diện người dùng cùng với thư viện AdminLte Trong đó:
● HTML dùng để mô tả cấu trúc của website và tạo ra các loại tài liệu có thể xem được trong trình duyêt
Trang 14● CSS là một ngôn ngữ định dang được sử dụng để mô tả trình bày các trang web, bao gồm màu sắc, bố trí, phông chữ …
Hình 9: Mô hình hệ thống.
4.3 Xây dựng giao diện.
Giao diện của chương trình gồm 2 trang chính:
● Dự đoán, báo cáo thống kê
● Dự đoán giá một khu vực cụ thể
Trang 15Hình 10: Giao diện màn hình báo cáo thốn
Trang 16Hình 11: Giao diện chức năng dự đoán giá nhà một khu đất.