1. Trang chủ
  2. » Công Nghệ Thông Tin

Thuyết trình tìm HIỂU PHÂN lớp dữ LIỆU và ỨNG DỤNG vào bài TOÁN dự báo tội PHẠM

14 395 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 737,1 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

HỆ HỖ TRỢ QUYẾT ĐỊNHNGUYỄN HOÀNG NGÂN NGUYỄN HỒ DUY TRI NGUYỄN HỒ DUY TRÍ TÌM HIỂU PHÂN LỚP DỮ LIỆU VÀ ỨNG DỤNG VÀO BÀI TOÁN DỰ BÁO TỘI PHẠM...  Bài toán dự báo tội phạm Các bước thực

Trang 1

HỆ HỖ TRỢ QUYẾT ĐỊNH

NGUYỄN HOÀNG NGÂN

NGUYỄN HỒ DUY TRI

NGUYỄN HỒ DUY TRÍ

TÌM HIỂU PHÂN LỚP DỮ LIỆU VÀ ỨNG DỤNG VÀO BÀI TOÁN DỰ BÁO

TỘI PHẠM

Trang 2

 Bài toán dự báo tội phạm

 Các bước thực hiện

 Phương pháp thực hiện

NỘI DUNG

2

Trang 3

Giới thiệu về Kaggle

BÀI TOÁN DỰ BÁO TỘI PHẠM

3

Trang 4

Giới thiệu về Kaggle

BÀI TOÁN DỰ BÁO TỘI PHẠM

4

Trang 5

Giới thiệu về Kaggle

BÀI TOÁN DỰ BÁO TỘI PHẠM

5

Nguồn: Sunday Morning Insight: Why Kaggle Changes Everything http://nuit-blanche.blogspot.com/2014/08/sunday-morning-insight-why-kaggle.html

Trang 6

Bài toán dự báo loại tội phạm tại thành phố San

Francisco

BÀI TOÁN DỰ BÁO TỘI PHẠM

6

Trang 7

Dữ liệu tội phạm tại thành phố San Francisco

 Dates: thời điểm xảy ra (timestamp)

 Category: loại tội phạm, là mục tiêu chúng ta muốn dự đoán.

 Descript: mô tả chi tiết phạm tội.

 DayOfWeek: thứ

 PdDistrict: tên của Văn phòng cảnh sát khu vực

 Resolution: giải pháp bắt tội phạm

 Address: địa chỉ nơi phạm tội

 X: kinh độ

 Y: vĩ độ

BÀI TOÁN DỰ BÁO TỘI PHẠM

7

Trang 8

Tiến trình ra quyết định của Simon

CÁC BƯỚC THỰC HIỆN

8

Trang 9

Các giải thuật phân lớp phổ biến:

SVM

NaiveBayes

Decision Table

…

PHƯƠNG PHÁP THỰC HIỆN

9

Trang 10

Cài đặt và thực hiện trên phần mềm Weka.

Kích thước dữ liệu:

Tập huấn luyện: 20000 dòng

Tập kiểm thử: 100 dòng

Kết quả (độ chính xác):

NaiveBayes: 30%

Decision Table: 27.73 %

PHƯƠNG PHÁP THỰC HIỆN

10

Trang 11

Kết luận:

 Nhĩm đã tìm hiểu các thuật tốn: Nạve Bayes,

Decision Table, Tree J48 (Cây C4.5)

 Ứng dụng vào bài tốn dự báo tội phạm đạt được một

số kết quả nhất định

Hướng phát triển:

 Xử lý tập dữ liệu lớn

 Sử dụng các cơng cụ xử lý dữ liệu lớn khác nhau

 Cải tiến thuật tốn để nâng cao độ tin cây của kết quả

dự báo

KẾT LUẬN VÀ HƯỚNG PHÁT

TRIỂN

11

Trang 12

1 Tom Mitchell, Machine Learning, McGraw-Hill

Education, 1997

2 https://www.kaggle.com/c/sf-crime - 06/08/2015

html

- 06/08/2015

4 Phuc Do, Unit_1_DSS_Introduction_handout, UIT,

2015

TÀI LIỆU THAM KHẢO

12

Trang 13

13

Trang 14

XIN CHÂN THÀNH CẢM ƠN

THẦY VÀ CÁC BẠN ĐÃ LẮNG NGHE!

14

Ngày đăng: 14/09/2015, 18:51

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w