1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài giảng Khai phá mẫu phổ biến và luật kết hợp

93 44 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 93
Dung lượng 15,72 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Phân tích tìm ngoại lệ outlier detection 6.. Ứng dụng trong các bài toán viễn thông vd: churn prediction 7.. Phân tích tìm ngoại lệ outlier detection 6.. Ứng dụng trong các bài toán viễn

Trang 1

Khai phá m ẫu phổ biến

và lu ật kết hợp

Phan Xuân Hi ếu

Bài giảng của DSLab Viện nghiên cứu cao cấp về Toán (VIASM)

Trang 2

Câu chuy ện “bỉm” và “bia”

2

Trang 4

Rakesh Agrawal

Trang 10

10

Trang 57

“Interestingness” và “Usefulness”

57

Trang 61

§ Conviction l ớn: luật có nhiều ý nghĩa

§ Nh ận xét: điều kiện quá chặt (strict)

Trang 62

62

§ P(B’ | A’) – P(B’ | not A’)

§ P(D | C) – P(D | not C)

Trang 64

Phân tích d ữ liệu hỗ trợ ra quyết định

64

Trang 65

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

65

Trang 66

Các ứng dụng thực tiễn

1 Phân l ớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

66

Trang 67

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích d ữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

67

Trang 69

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 T ư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

69

Trang 71

3 T ư vấn dựa trên nội dung

4 T ư vấn dựa trên patterns mua sắm (frequent patterns,

association rules)

71

Trang 74

Các mặt hàng thường được xem cùng nhau

74

Trang 75

Các mặt hàng thường được mua cùng nhau

Trang 76

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hi ểu người dùng trực tuyến (user

understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

76

Trang 78

Hiểu người dùng trực tuyến

78

Trang 79

79

Trang 83

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngo ại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

83

Trang 84

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích dữ liệu di truyền

8 Phân tích dữ cấu trúc mạng

84

Trang 85

Churn prediction

Trang 86

Các bài toán phân tích v ề v/đ “rời dịch vụ”

86

Trang 87

D ữ liệu viễn thông

1 Thông tin khách hàng (customer data)

1 Thông tin t ĩnh

2 Thông tin đ ộng

2 Thông tin thuê bao (contract/plan data)

3 Thông tin sử dụng dịch vụ (call/service detail data)

Trang 88

Highly imbalanced data

Trang 89

Nh ận biết vấn đề và giải pháp

1 Dữ liệu rất lớn

2 Quan tâm đặc biệt đến “True positive”

3 Khó khăn khi lấy mẫu (sampling)

4 Khó khăn khi xây dựng mô hình học (thống kê) cho

dữ liệu mất cân bằng (nghiêm trọng)

5 Có thể rời rạc hoá dữ liệu?

6 Khai phá lu ật hiếm và tin cậy xấp xỉ

1 T ừ tập mẫu (sau khi sampling)

2 Lu ật “xấp xỉ” cho lớp dương (positive)

3 L ọc với độ đo: Conviction

4 Whitebox: d ễ hiểu, dễ đánh giá, và điều chỉnh

Trang 90

Các ứng dụng thực tiễn

1 Phân lớp, phân loại (classification/decision rules)

2 Phân tích dữ liệu bán lẻ (market basket analysis)

3 Tư vấn trực tuyến (online recommendation)

4 Hiểu người dùng trực tuyến (user understanding)

5 Phân tích tìm ngoại lệ (outlier detection)

6 Ứng dụng trong các bài toán viễn thông

(vd: churn prediction)

7 Phân tích d ữ liệu di truyền.

8 Phân tích d ữ cấu trúc mạng.

90

Trang 91

Ứng dụng khai phá dữ liệu viễn thông

1 Dữ liệu

1 Customer data

2 Call detail data

3 Log and content data

4 Network data

2 Các bài toán khai phá dữ liệu

1 Spam filtering

2 Churn prediction

3 Fraud detection (subscription vs superimposition)

4 Customer profiling and segmentation (for marketing)

5 Network fault isolation and prediction

6 Service/content recommendation

91

Ngày đăng: 27/03/2020, 10:10

TỪ KHÓA LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w