Kỹ thuật - DataSource Trong cửa sổ Solution Explorer nhấp phải chuột vào Data Source chọn New Data Wellcome to Data Source Wizard xuất hiện, nhấn Next... Màn hình Select Data Source xuất
Trang 1BIDS – Khách hàng tiềm năng
www.ntvx.com
Trang 3Giới thiệu
Dữ liệu được thu thập và lưu trữ trong các CSDL đã vượt ra ngoài khả năng của con người có thể hiểu được chúng nếu không có những công cụ hỗ trợ tốt
Điều này đã đặt chúng ta trong hoàn cảnh nhiều dữ liệu nhưng thiếu thông tin, thiếu tri thức
Chính vì vậy, có một kỹ thuật mới ra đời
đó là “Khai phá dữ liệu”
Trang 4Giới thiệu
Một số hệ thống khai phá dữ liệu:
Intelligent Miner (IBM)
Microsoft data mining tools (Microsoft SQL
Server 2000/2005/2008)
Oracle Data Mining (Oracle 9i/10g/11g)
Enterprise Miner (SAS Institute)
Weka (the University of Waikato, New Zealand, www.cs.waikato.ac.nz/ml/weka)
…
Trang 5Phan Thị Thu Thủy,
Nguyễn Minh Tường Vi,
Lê Anh Xuân
Đã chọn SQL server 2008 cùng với bộ công cụ của nó để mô tả cho ý tưởng của chúng tôi như sau:
Trang 6Giới thiệu
Công ty của chúng tôi là một công ty kinh doanh về địa ốc, chúng tôi đã có 1 lượng lớn khách hàng ( KH) đã từng mua sản phẩm đất nền phân lô trong các dự án trước đây của chúng tôi
Tuy nhiên, do tình hình thị trường bất động sản có nhiều chuyển biến trong thời gian gần đây, nên công ty của chúng tôi muốn tung ra sản loại phẩm mới đó là biệt thự xây dựng sẵn Công ty muốn tổ chức 1 hội nghị khách hàng để giới thiệu sản phẩm
Trang 7Giới thiệu
Vấn đề là, kinh phí để tổ chức cũng hạn hẹp, không đủ điều kiện để mời tất cả KH Do
đó bộ phận bán hàng, đề nghị chỉ mời các KH tiềm năng, nghĩa là KH có thể sẽ mua sản phẩm mới của công ty
Lúc này, gánh nặng xác định đâu là KH tiềm năng được trao cho bộ phận marketing của NTVX Và mọi chuyện bắt đầu
Trang 13Kỹ thuật – Tạo Project
Khởi động Microsoft Visual Studio -> chọn menu File ->New -> Project
Chọn Business Intelligence Projects -> Analysis Services Project
Tại mục Name ta đặt tên cho Project là KhachHangTiemNang, chọn thư mục lưu Rồi Nhấn OK Xem hình
Trang 14Kỹ thuật - DataSource
Trong cửa sổ Solution
Explorer nhấp phải chuột vào
Data Source chọn New Data
Wellcome to Data Source
Wizard xuất hiện, nhấn Next
Trang 15Quay lại màn hình Select how to define
the connection, chọn Next
Nhập user name và pasword cho connetion vừa tạo rồi nhấn Next
Đặt tên cho Data Source
Trang 16Kỹ thuật – DataSource View
Trong cửa sổ Solution
Explorer nhấp phải chuột và
Data Source Vies, chọn New
Data Source Vies
Màn hình Select Data Source xuất hiện Chọn Data Source đã tạo lúc trước ->Next
Màn hình Select Table and views xuất hiện Chọn table Dulieu_vao ->Next
Trang 17liệu Công việc
tiếp theo là tạo
mô hình huấn
luyện
Trang 18Kỹ thuật – Mining structures
Tại cửa sổ Solution Explorer
nhấp chuột phải vào Mining
Structures -> New Mining
Structure
Cửa sổ Wellcome to the
Data Mining Wizard xuất
hiện -> Next
Cửa sổ Select the Definiton Method xuất hiện, chọn phương thức thứ nhất -> Next
Trang 19Kỹ thuật – Mining structures
Cửa sổ Create the Data Mining Structure xuất hiện, chọn mô hình Microsoft Decision Trees -
> Next
Trang 20Kỹ thuật – Mining structures
Chọn DSV vừa tạo trước đó -> Next
Chọn bảng chính ( case ) và bảng phụ ( nested) Ở đây do dữ liệu của chúng ta chỉ lấy từ 1 bảng nên hệ thống đã chọn mặc định -> Next
Trang 21Kỹ thuật – Mining structures
Màn hình Specify the Training Data cho
chúng ta chỉ định trường dữ liệu nào là khóa, dữ liệu vào dùn để huấn luyện và trường dữ liệu dùng để dự báo (Nút Suggest cho phép hệ thống tự chọn các trường dữ liệu phù hợp) ->Next
Trang 22Kỹ thuật – Mining structures
Màn hình Specify Columns Content and
Data Type cho chúng ta chỉ định nội dung
của trường dữ liệu cấu trúc KPDL và kiểu dữ
liệu của chúng Nút Detect cho phép hệ
thống tự phát hiện dữ liệu liên tục hay theo
khoảng) -> Next
Trang 23Kỹ thuật – Mining structures
Màn hình Create Testing Set xuất hiện,
cho chúng ta chỉ định % dữ liệu được dùng
để kiểm tra độ chính xác của mô hình ( lúc này dữ liệu được chia thành 2 tập Tập HL và
tập KT) ->Next.
Trang 24Kỹ thuật – Mining structures
Đặt tên cho cấu trúc của mô hình và tên mô
hình -> Nhấn Finish.
Để chạy được mô hình vừa tạo, chúng ta cần thực thi nó: Nhấp chuột phải vào tên mô hinh vừa tạo ra trong mục Mining Structures
-> chọn process -> Run.
Cho đến khi có thông báo như hình sau:
Trang 25Kỹ thuật – Mining structures
Trang 27Kết luận từ mô hình
Xem mô hình vừa tạo: thẻ Mining Model
Viewer
Trang 28Kết luận từ mô hình
Đánh giá hiệu quả mô hình: thẻ Mining
Accuracy Chart
Trang 29Đường xanh lá: đồ thị biểu diễn của mô hình, có nghĩa là liên hệ với 3% KH thì sẽ có khoảng 62% trong đó có tiềm năng.
Trang 30Mining Legend ( chú thích):
Predict probability: gía trị ngưỡng của mô hình, có ý nghĩa là nếu dùng mô hình này để
dự đoán thì cần có Predict probability
>=27,74% mới đáng tin cậy
Kết luận từ mô hình
Trang 31Tạo dự đoán và kết quả: Vào thẻ Mining
Model Prediction, trải qua các bước chọn mô hình, bảng dữ liệu để ánh xạ các trường thông tin, ta sử dụng công cụ Prediction Query Builder Ta được hình sau:
Kết luận từ mô hình
Trang 32Nhấp chuột vào nút chuyển đổi chế độ (design / query / result ) Ta được kết quả như hình sau:
Trang 33www.NTVX.com
CẢM ƠN!