1. Trang chủ
  2. » Giáo Dục - Đào Tạo

bài tập data mining gấm

4 322 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Data Mining (Khai Phá Dữ Liệu) Là Gì?
Trường học Trường Đại Học Khoa Học Tự Nhiên
Chuyên ngành Khoa Học Dữ Liệu
Thể loại Bài Tập
Thành phố Thành Phố Hồ Chí Minh
Định dạng
Số trang 4
Dung lượng 54,07 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Data Mining Khai phá dữ liệu là gì?Data Mining là một quá trình trích xuất thông tin có mối quan hệ hoặc có mối tương quan nhất định từ một kho dữ liệu lớn cực lớn nhằm mục đích dự đoán

Trang 1

Data Mining (Khai phá dữ liệu) là gì?

Data Mining là một quá trình trích xuất thông tin có mối quan hệ hoặc có mối tương quan nhất định từ một kho dữ liệu lớn (cực lớn) nhằm mục đích dự đoán các xu thế, các hành vi trong tương lai, hoặc tìm kiếm những tập thông tin hữu ích mà bình thường không thể nhận diện được Hay Data Mining còn được định

nghĩa là: quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các CSDL, kho dữ liệu…

Ứng dụng của nó rất đa dạng và rộng tới, từ marketing, chống gian lận, giảm giá thành sản xuất, tăng doanh thu, phân tích hành vi sử dung người dùng internet để target đúng nhu cầu, đúng đối tượng hay ứng dụng hỗ trợ ra quyết định, nghiên cứu khoa học đến việc chống khủng bố v.v

Các công cụ, kỹ thuật Data Mining có thể trả lời các câu hỏi mà các công cụ truyền thống đòi hỏi rất nhiều thời gian cần thiết để có thể giải đáp được (thậm chí các cách truyền thống không thể giải được) Nó có thể tìm thấy được những thông tin cực kỳ hữu ích mà rất dễ bị bỏ qua hoặc không xem xét đến để có thể

dự đoán những xu thế/hành động xảy ra trong tương lai.

Để có thể Data Mining một cách hiệu quả, điều đầu tiên cần phải thu thập dữ liệu và định nghĩa lại theo các tiêu chí cần phân tích Các kỹ thuật Data Mining

có thể cài đặt rất nhanh chóng trên các nền tảng phần mềm, phần cứng phổ thông mà không cần đòi hỏi quá phức tạp, tuy vậy Data Mining thường gắn liền

Trang 2

với việc phân tích một khối lượng dữ liệu cực lớn nên cần ứng dụng các công nghệ high performance client/server hoặc xử lý song song (parallel programming).

Công nghệ data mining là kết quả của quá trình lâu dài nghiên cứu và phát triển sản phẩm Quá trình này bắt đầu từ khi những dữ liệu đầu tiên lưu vào máy tính, tiếp đến là quá trình cải tiến, nâng câp cách thức truy xuất dữ liệu và dần dần cho phép người dùng có thể duyệt dữ liệu theo thời gian thực Kết quả của quá trình này cho phép truy xuất các nguồn dữ liệu quá khứ, tính toán và định vị lại việc truyền tải, cung cấp thông tin cho hiện tại, tương lai hay đưa ra các dự đoán tình huống có thể sắp diễn ra

Các kỹ thuật Data Mining:

1. Phân loại (Classification)

2. Hồi qui (Regression)

3. Phân nhóm (Clustering)

4. Dự đoán (Prediction)

5. Tổng hợp (Summarization)

6. Phân tích chuỗi thời gian (Time Series Analysis)

7. Mô hình ràng buộc (Dependency modeling)

8. Dò tìm biến đổi và độ lệch (Change and Deviation Dectection)

9. Phát hiện luật kết hợp (Association Rule Discovery)

10. Phát hiện mẫu K-optimal (K-optimal Pattern Discovery)

11. Cây quyết định: Decision tree (Classification Task)

12. Phân loại theo quy luật (Rule-based Classification)

13. Láng giềng gần nhất: Nearest Neighbor (Classification Task)

14. Mạng Neural: Neural Network (Classification and Clustering Task)

15. Luật qui nạp: Rule Induction (Classification Task)

16. Thuật toán K-Means: K-Means (Clustering Task)

17. Khai phá mẫu tuần tự (Sequential Pattern Mining)

18. Thuật toán phân loại Naive Bayes (The Naive Bayes Classification Algorithm)

19. Giải thuật di truyền (Generic Algorithms)

20. Phân loại bằng giải thuật lan truyền ngược (Classification by Backpropagation)

21. Kỹ thuật Máy Vector hỗ trợ (Support Vector Machines)

Trang 3

22. Tiếp cận tập thô (Rough Set Approach)

23. Tiếp cận tập mờ (Fuzzy Set Approach)

Vai trò của Data Mining trong marketing ngân hàng

Tiếp thị là một trong những lĩnh vực ứng dụng chủ yếu của Data Mining trong các ngành nói chung (Zhang và ctg, 2008) Ngân hàng cũng không phải là một ngoại lệ Việc giữ chân khách hàng cũ và tìm kiếm khách hàng mới đang ngày càng khó khăn

vì sự cạnh tranh khốc liệt hiện tại trong lĩnh vực này Cách duy nhất để duy trì khách hàng hiện tại hay thu hút khách hàng mới là phải chủ động điều tra những gì khách hàng mong muốn và cung cấp cho họ những điều đó Đây là lúc Data Mining phát huy tác dụng của nó (Chopra và ctg, 2011) Data Mining, được áp dụng cho các hệ thống quản trị quan hệ khách hàng, có thể phân tích dữ liệu khách hàng và khám phá các chỉ số quan trọng giúp trang bị cho các ngân hàng kiến thức về các yếu tố đã ảnh hưởng đến nhu cầu của khách hàng trong quá khứ cũng như trong tương lai (Ngai và ctg, 2009) Điều này cho phép các ngân hàng thực hiện mục tiêu marketing của mình Các mẫu tuần tự có thể được phân tích để điều tra sự thay đổi

sở thích của khách cũng như tiếp cận khách hàng một cách chủ động (Sundari và Thangadurai, 2010) Kỹ thuật Data Mining giúp phân loại khách hàng theo thuộc tính, hành vi, nhu cầu, sở thích, giá trị và các yếu tố khác (Ren và ctg., 2010) Hai mô hình tính điểm được sử dụng chủ yếu cho mục đích phân loại này, cụ thể là mô hình điểm tín dụng (credit scoring model) và mô hình tính điểm về hành vi (behavioral scoring model) Sự phân loại này là nguồn thông tin giá trị cho các chiến lược tiếp thị định hướng khách hàng phù hợp với các nhóm mục tiêu và cung cấp những dịch

vụ đa dạng đối với từng danh mục khách hàng (Ping và Liang, 2010) Ví dụ như nó

có thể xác định cách khách hàng phản ứng với một sự thay đổi lãi suất, những khách hàng nào có khả năng sẽ chấp nhận các sản phẩm mới, tài sản thế chấp nào

có thể đảm bảo cho một phân khúc khách hàng cụ thể nhằm giảm thiểu rủi ro khi cho vay Các cấp độ khác nhau của phân tích như phân tích RFM (Recency, Frequency and Monitory), LTV (Life Time Value) của khách hàng cùng với phân cụm

K -Means có thể được dùng để phân nhóm khách hàng một các hiệu quả, từ đó tăng cường việc tiếp thị mục tiêu (Varun và ctg, 2012) Data Mining cũng có thể bộc lộ

Trang 4

khả năng bán chéo như bán các khoản vay mua nhà cho khách hàng dùng thẻ tín dụng bằng cách phân tích các dữ liệu quá khứ kết hợp (Qiu và ctg, 2009) Nó cũng

có khả năng phát triển một mô hình khách hàng vay mua nhà hiện tại nhằm phân tích hồ sơ của họ, từ đó phát hiện ra các khách hàng tương tự trong những danh mục khác (như khách hàng có tiền gửi không kỳ hạn hoặc các sản phẩm bảo hiểm)

để tìm ra khách hàng tiềm năng cho các gói vay mua nhà (Shinde et al., 2012).

Ngày đăng: 08/06/2014, 11:22

TỪ KHÓA LIÊN QUAN

w