Giới Thiệu Về Cây Quyết Định Cây quyết định bao gồm bốn thành phần: nhánh, nút quyết định, nút biến cố và kết quả.. + Nút quyết định là một điểm trên cây được biểu diễn bằng hình vuông v
Trang 1ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
Đề tài:
CÀI ĐẶT CÂY QUYẾT ĐỊNH VÀ ỨNG DỤNG VÀO BÀI TOÁN RA QUYẾT ĐỊNH
GVHD: PGS.TS Đỗ Phúc HVTH: Mai Trung Thành – CH1401033
Trần Lệ Thủy – CH1401034
TP HCM, Tháng 08 năm 2015
Trang 2Nhận xét của GVGD
M C L C Ụ Ụ CÂY QUYẾT ĐỊNH VÀ ỨNG DỤNG 2
1 Giới Thiệu Về Cây Quyết Định 2
Trang 32 Suy Diễn Trên Cây Quyết Định và Ứng Dụng 4 TÀI LIỆU THAM KHẢO 8
Trang 4CÂY QUYẾT ĐỊNH VÀ ỨNG DỤNG
1 Giới Thiệu Về Cây Quyết Định
Cây quyết định bao gồm bốn thành phần: nhánh, nút quyết định, nút biến cố và kết quả
+ Nhánh là một biến cố hay chiến lược nối hai nút hay một nút và kết quả + Nút quyết định là một điểm trên cây được biểu diễn bằng hình vuông và từ đó
sẽ phát xuất nhiều nhánh Mỗi nhánh từ nút quyết định là một chiến lược khả dĩ sẽ được người ra quyết định xem xét
+ Nút biến cố là một điểm trên cây quyết định được biểu diễn bằng hình tròn và
từ đó sẽ phát xuất nhiều nhánh, mỗi nhánh là một biến cố có thể xảy ra
+ Kết quả là hậu quả của một chuỗi chiến lược và biến cố tạo thành một con đường duy nhất trên cây quyết định từ điểm đầu đến điểm cuối cùng
Trang 53 1
4
4
4
4
5
8 7
100 9
12 11
CP2 CP1
CP4 CP3
CP6 CP5
CP10 CP9
CP12 CP11
CP14 CP13
CP8 CP7
CP16 CP15
S2: chiến lược 2
S1: chiến lược 1
E2: biế nc ố 2 E1: biến cố 1
E2: biến cố 2 E1: biến cố 1
S3:
chiến lược 3 S4:
chiến lược 4
S3:
chiến lược 3
S4:
chiến lược 4
S3:
chiến lược 3
S4:
chiến lược 4
S3:
chiến lược 3
S4:
chiến lược 4
E3: biến cố 3
E4: biế ncố 4
E3: biến cố 3 E4: biến cố 4 E3: biến cố 3 E4: biến cố 4
E3: biến cố 3 E4: biến cố 4
E3: biến cố 3 E4: biến cố 4
E3: biến cố 3 E4: biến cố 4
E3: biến cố 3 E4: biến cố 4
E3: biến cố 3 E4: biến cố 4
Hình 1.1 cây quyết định tiêu biểu
Hình 1.1 bên trên là một cây quyết định tiêu biểu Nút đầu tiên của cây sẽ bắt đầu bằng quyết định thứ nhất, một sự chọn lựa giữa chiến lược 1 và chiến lược 2 sẽ xảy ra Theo sau sự lựa chọn chiến lược là một biến cố ngẫu nhiên: biến cố 1 hoặc biến cố 2 Lúc này người ra quyết định sẽ đứng ở 1 trong nút quyết định và phải
Trang 6thực hiện quyết định thứ 2 giữa chiến lược 3 và chiến lược 4 Theo sau quyết định này là một biến cố ngẫu nhiên thứ 2: Biến cố 3 và biến cố 4 Tùy theo con đường
đã chọn, 1 trong 16 kết quả sẽ được xem là kết quả ( từ Cp1 đến Cp16) VD: Con đường gồn chiến lược 1, biến cố 2, chiến lược 3, biến cố 4 sẽ dẫn đến Cp6
Quyết định tối ưu cho loại bài bài toán quyết định này là chọn một bộ chiến lược duy nhất cho giá trị kỳ vọng tốt nhất ứng với nút đầu tiên Lới giải này giả định có thể ấn địnhgiá trị kỳ vọng ở từng nút biến cố và người ra quyết định sẽ thực hiện một quyết định phức tạp dựa trên nhiều biến cố ngẫu nhiên
2 Suy Diễn Trên Cây Quyết Định và Ứng Dụng
Để trình bày cách giải các bài toán quyết định dựa trên sơ đồ cây, chúng ta hãy khảo sát bài toán sau:
Giả sử 1 công ty có trụ sở đặt tại TP Hồ Chí Minh muốn kinh doanh máy vi tính
ra miền Bắc hoặc miền Trung Nếu kinh doanh ra miền Trung, công ty sẽ không có đối thủ cạnh tranh và nhu cầu cho thị trường này có thể là 100,200,300 bộ/tháng Nếu kinh doanh ra miền Bắc thì có thể bị canh tranh và nhu cầu cho thị trường này chỉ có thể là 0, 100,200 bộ/tháng Hình 1.2 là sơ đồ cây quyết định của bài toán
Trang 7-100.000.000 -600.000.000
400.000.000 -100.000.000
400.000.000 400.000.000
400.000.000 400.000.000
S2: kinh doanh ra miề
nbắc
S1: kinh doanh ra miền trung
E2: không có đối thủ E1: có đối thủ
E3: nhu cầu 100
E3: nhu cầu 100
E5: nhu cầu 300
E3: nhu cầu 100 E4: nhu cầu 200
E5: nhu cầu 300
E4: nhu cầu 200
E4: nhu cầu 200 E5: nhu cầu 300
Hình 1.2 sơ đồ cây quyết định của bài toánk inh doanh máy vi tính.
Số lượng máy vi tính kinh doanh là 200 bộ/tháng Bước đầu tiên để giải bài toán
là ấn định kết quả thu được ứng với từng con đường trên cây Giả định giá mua 1
bộ máy vi tính là 3.000.000 đồng, tổng giá trị mua của 200 bộ là 600.000.000 đồng Giá bán dự kiến mỗi bộ là 5.000.000 đồng, chúng ta có:
CP1=100 bộ x 5.000.000 đồng -600.000.000 đồng = -100.000.000 đồng
CP1=200 bộ x 5.000.000 đồng -600.000.000 đồng = 400.000.000 đồng
Trang 8-100.000.000 -600.000.000
400.000.000 -100.000.000
400.000.000 400.000.000
400.000.000 400.000.000
S2: kinh doanh ra miề
nbắc
S1: kinh doanh ra miền trung
E2: không có đối thủ (0.7) (0.7) E1: có đối thủ (0.3)
E3: nhu cầu 100 (0.5)
E3: nhu cầu 100 (0.1)
E5: nhu cầu 300 (0.4)
E3: nhu cầu 100 (0.4) E4: nhu cầu 200 (0.5)
E5: nhu cầu 300 (0.1)
E4: nhu cầu 200 (0.4)
E4: nhu cầu 200 (0.5) E5: nhu cầu 300 (0.1)
Hình 1.3 Sơ đồ cây quyết định của bài toán kinh doanh máy tính
Giá trị kết quả sẽ nằm ở các điểm cuối của hình 1.3 Qua kinh nghiệm nhiều năm kinh doanh ở thị trường nầy, người ra quyết định sẽ ra một số xác suất cho từng biến cố khả dĩ Giá trị xác suất là con số được đặt trong cặp dấu ngoặc nằm phía trên các nhánh Xem hình 1.3
Người ra quyết định sẽ dùng giá trị kỳ vọng (EMV) làm tiêu chuẩn quyết định,
do vậy chúng ta cần tính giá trị kỳ vọng của hai chiến lược khả dĩ là kinh doanh máy tính ra miền Bắc hay ra miền Trung ta có:
EMV(S1: kinh doanh ra miền trung) = 0.5(-100.000.000) + 0.4(400.000.000) + 0.1(400.000.000) = 150.000.000đ
EMV: giá trị kỳ vọng
Đối với kinh doanh ra miền Bắc, đầu tiên chúng ta tính EMV của hai biến cố
“có đối thủ” và “không có đối thủ”
Trang 9Có đối thủ:
EMV(E1: có đối thủ) = 0.1(-600.000.000) + 0.5(-100.000.000) + 0.4(400.000.000) = 50.000.000đ
Vô đối:
EMV(E2: Không có đối thủ) = 0.4(100.000.000) + 0.5(400.000.000) + 0.1 (400.000.000) = 200.000.000đ
Do vậy:
EMV(S2: kinh doanh ra miền bắc) = 0.3(50.000.000) + 0.7(200.000.000) = 155.000.000đ
Quyết định tối ưu sẽ theo hướng S2 vì mang lại kết quả cao hơn S1.
Phương pháp phân tích sử dụng trong bài toán cây quyết định là phương pháp
“suy diễn lùi” Phương pháp nầy cho rằng để thẩm định một chieecns lược nhất thiết phải khảo sát tất cả chiến lược và biến cố đi sau và cùng xuất phát từ chiến lược đó Do vậy, các biến cố khả dĩ và nút quyết định sau cùng nhất sẽ được phân tích trước nhất Kế đó sẽ là lần ngược lên các nức trước để hướng về nút đầu tiên Dùng kỹ thuật nầy ta sẽ thiết lập các động tác tối ưu cho từng kết quả bằng cách duyệt trên sơ đồ cây
Trang 10TÀI LIỆU THAM KHẢO
[1] Hoàng V.Kiếm, Đỗ Phúc, Đỗ V.Nhơn, “các hệ cơ sở tri thức”, Đại Học Quốc
Gia TP.HCM, 2007
[2] Đỗ Phúc, Slide bài giảng“Decision Tree”, Đại Học CNTT, ĐHQG TP.HCM,
2015.
[3] Nguyễn D Hùng, luận văn Th.s “ứng dụng cây quyết định để phân loại khách
hàng, vay vốn ngân hàng”, Học Viện Bưu Chính Viễn Thông, 2012.
[4] Roman Slowinski, Handbook of applications and advance of the Rought Sets
Theory “Intelligent Decision Support”, Springer Science & Business Media, Aug
31, 1992
[5] Marek J Druzdzel and Roger R Flynn (2002) Decision Support Systems from http://www.pitt.edu/~druzdzel/psfiles/dss.pdf
[6] http://doc.edu.vn/tai-lieu/de-tai-nghien-cuu-cay-quyet-dinh-decision-tree-7608 / (ngày 28/7/2015)