1. Trang chủ
  2. » Mầm non - Tiểu học

Ứng dụng lý thuyết tập tho trong khai phá dữ liệu kinh tế - tài chính

5 9 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 5
Dung lượng 157,86 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nắm vững cơ sở lý thuyết, các khái niệm cơ bản, khái quát về các phương pháp ứng dụng lý thuyết tập thô trong khai phá dữ liệu; nghiên cứu mô hình tập thô trong các bài toán kinh tế: [r]

Trang 1

Ứng dụng lý thuyết tập tho trong khai phá dữ

liệu kinh tế - tài chính

Nguyễn Việt Hà

Trường Đại học Công nghệ Luận văn ThS ngành: Công nghệ thông tin; Mã số: 1 01 10

Người hướng dẫn: PGS.TS Hồ Thuần

Năm bảo vệ: 2007

Abstract: Tổng quan về lý thuyết tập thô và ứng dụng trong phát hiện tri thức Trình bày

ứng dụng cách tiếp cận tập thô trong dự báo kinh tế - tài chính, bao gồm: rời rạc hoá dữ liệu số, chuyển chuỗi thời gian vào đối tượng tập thô, lựa chọn thuộc tính, phân lớp dựa trên quan hệ giá trị gần VCR, ứng dụng tập thô trong đánh giá công ty, đánh giá chính sách tín dụng của các ngân hàng và chiến lược thị trường Tìm hiểu phương pháp khai phá dữ liệu quan hệ dựa trên lập trình logic quy nạp Giới thiệu các thuật toán khai phá

dữ liệu quan hệ FOIL, FOCL, thuật toán MMDR để khám phá các yếu tố bất thường trong lĩnh vực kinh tế

Keywords: Cơ sở dữ liệu; Khai phá dữ liệu; Kinh tế; Lý thuyết tập thô; Tài chính

Content

MỞ ĐẦU

Trong những năm gần đây, mặc dù đã có nhiều công cụ hỗ trợ đắc lực cho việc thu thập, lưu trữ, khai thác dữ liệu, song với sự bùng nổ của thông tin thu thập được đã vượt ra ngoài khả năng của con người để nắm bắt và khai thác một cách hiệu quả, do vậy trong nhiều trường hợp các quyết định được đưa ra không dựa vào những thông tin hoặc dữ liệu thu thập được và chủ yếu dựa vào nhận thức, suy đoán của người ra quyết định Bên cạnh đó những khiếm khuyết của các công cụ hỗ trợ đem lại cho người dùng tình trạng các tri thức lấy ra từ lượng dữ liệu lớn lại thiếu thông tin Từ đó phát sinh yêu cầu tự nhiên là tìm kiếm một kỹ thuật mới có các đặc tính thông minh và khả năng tự động để hỗ trợ con người chắt lọc thông tin hữu ích trong một khối

dữ liệu lớn

Trang 2

Xuất phát từ những thực tiễn đó, mặc dù lý thuyết tập thô được khởi xướng từ thập niên tám mươi của thế kỷ trước, song ngày càng được ứng dụng một cách rộng rãi trong việc phát hiện tri thức, phân tích quyết định, quy luận quy nạp và nhận dạng mẫu Nó dường như cũng đặc biệt quan trọng cho các hệ thống trợ giúp quyết định và khai phá dữ liệu Thực tế đây là một cách tiếp cận mới cho việc phân tích dữ liệu

Từ những vấn đề đó, nội dung đề tài này tập trung vào những vấn đề cơ bản của lý thuyết tập thô và những ứng dụng của nó trong các bài toán kinh tế, trong cơ sở dữ liệu thị trường, và

trong việc tìm kiếm các yếu tố bất thường trong lĩnh vực tài chính ngân hàng

Mục tiêu nhiệm vụ và phạm vi nghiên cứu

Nắm vững cơ sở lý thuyết, các khái niệm cơ bản, khái quát về các phương pháp ứng dụng

lý thuyết tập thô trong khai phá dữ liệu; nghiên cứu mô hình tập thô trong các bài toán kinh tế: phương pháp, mô hình phân tích lượng dữ liệu lớn trên cơ sở lý thuyết tập thô, với các ví dụ điển hình của ứng dụng lý thuyết tập thô để giải quyết các vấn để hỗ trợ quyết định 3 lĩnh vực: đánh giá công ty, chính sách tài chính của ngân hàng, chiến lược thị trường

Tìm hiểu ứng dụng mô hình tập thô trong nghiên cứu thị trường qua cơ sở dữ liệu, khám phá các yếu tố, các điểm bất thường trong lĩnh vực tài chính sử dụng lập trình suy luận quy nạp

Bố cục luận văn

- Chương 1: Trình bày tổng quan về khai phá dữ liệu và phát hiện tri thức, giới thiệu khái niệm, nhiệm vụ chính của khai phá dữ liệu và phát hiện tri thức Trình bày chi tiết về lý thuyết tập thô bao gồm: hệ thống thông tin, quan hệ không phân biệt được, xấp xỉ tập, rút gọn và lõi của tập các thuộc tính, hàm thành viên thô, độ chính xác và chất lượng xấp xỉ Giới thiệu một số vấn

đề về khai phá dữ liệu - phát hiện tri thức trong lĩnh vực kinh tế tài chính

- Chương 2 : Trình bày ứng dụng cách tiếp cận tập thô trong dự báo kinh tế - tài chính, bao gồm: lựa chọn và rời rạc hoá các thuộc tính giá trị dạng số, hệ thống thông tin biểu thị thời gian, chuyển đổi chuỗi thời gian vào các đối tượng tập thô, chuỗi dẫn xuất, lựa chọn các thuộc tính để qui nạp luật quyết định dựa trên tập thô, quá trình phân lớp các đối tượng mới theo các luật quyết định dựa trên quan hệ giá trị gần – VCR, giới thiệu ứng dụng trong 3 bài toán kinh tế: đánh giá công ty, đánh giá chính sách tín dụng và chiến lược thị trường

- Chương 3 : Tập trung tìm hiểu phương pháp khai phá dữ liệu quan hệ dựa trên lập trình logic qui nạp (ILP) Giới thiệu mô hình khai phá dữ liệu quan hệ, luật và logic cấp 1, các thuật toán khai phá dữ liệu quan hệ FOIL, FOCL, và thuật toán MMDR để khám phá các yếu tố bất thường trong lĩnh vực kinh tế

Trang 3

References

Tiếng Việt

1 Hồ Thuần, Hồ Cẩm Hà (2004, 2005), Các hệ cơ sở dữ liệu: Lý thuyết và thực hành, NXB Giáo dục

2 Nguyễn Thanh Thuỷ (2003), Phát hiện trị thức và khai phá dữ liệu: Công cụ, phương pháp và ứng dụng

3 Nguyễn Trung Tuấn (2004), "Kỹ thuật phát hiện tri thức và khai phá dữ liệu, ứng dụng trong bài toán dự báo thông tin kinh tế - xã hội"; Tạp chí Bưu chính viễn thông

Tiếng Anh

4 Adam Mrozek, Krzysztof Skabek (1998), "Rough sets in Economic applications"

5 AI Dimitras, R.Slowinski, R.Susmaga, C Zopounidis (1999) "Business failure prediction using rough sets"

6 Andrzej Skowron (2001), "Rough sets in KDD"

7 Boris Kovalerchuk, Evgenii Vityaev (2004), Chapter 1 - Data Mining for Financial Applications

8 Boris Kovalerchuk, Evgenii Vityaev (1998), "Inductive logic programming for financial regularities"

9 Boris Kovalerchuk, Evgenii Vityaev (1998 ), “Symbolic Methodology in Numeric Data Mining: Relational Techniques for Financial Applications"

10 Boris Kovalerchuk, Evgenii Vityaev (2000), Data mining In Finance Advances in Relational and Hybrid Methods - Kluwer Academic Publishers

11 D.Poel (1998), "Rough sets for Database marketing"

12 Dimitri Pissarenko (2002), Neural networks for financial time series prediction

13 Francis E H, Lixiang Shen (2001), "Economic and Financial prediction using rough sets model"

14 Ho Tu Bao (1996) Introduction to Knowledge discovery and Data mining Institute of Information Technology, National Center for' Natural Science and Technology

15 Huan Liu and Rudy Setiono (1995), “Chi2: Feature selection and Discretization of Numeric Attributes"

Trang 4

16 Hung Son Nguyen, Sinh Hoa Nguyen (1998), "Discretization Methods in Data Mining"

17 Jan C.Bioch and Viara Popova (2001), "Bankrupcy Prediction with rough sets"

18 Jan Komorowski, Zdzislaw Pawlak, Lech Polkowski, Andrzej Skowron (1995),

“rough Sets : A Tutorial"

19 Jerzy W.Grzymala-busse (2004), "Three Approachs to missing attributes values - A rough set Perspective"

20 J.K Baterzen (1996), An attempt to predict stock market data : a rough sets approach, Diploma thesis

21 Jitender S Deogun, "Data mining : Research Trends, Challenges, and Applications"

22 Lixiang Shen (2001), data mining techniques based on rough set theory, Doctoral Thesis, national university of singapore

23 Lixiang Shen, Han Tong Loh (2003), "Applying Rough sets to Market timing decisions"

24 Maria C Femlandez-baizán - Emestina Menasalvas Ruiz - José M.Pena Sánchez , Integrating RDMS and Data mining capabilities using Rough sets

25 M.J Segovia, J.A Gil, A.Hera, J.L Vilar, A.Sanchis (2003), "Using Rough sets to Predict Insovenlcy of Spanish non-life insurance companies"

26 M Zhang, J.T Yao(2001) , "A rough sets based approach to feature selection"

27 Nada Lavrac (2001), "Relational data mining and subgroup discovery"

28 Ning Zhong, Juzhen Dong (2001), "Using rough sets with heuristic for feature

selection"

29 Ronald Braciman: "The Process of knowledge Discovery In Databases"

30 Stefan Zemke (2003), Data Mining for Prediction: Financial Series Case - Doctoral Thesis The Royal Institute of Technology Department of Computer and Systems Sciences -December 2003

31 Usima N Fayyad, Gregory Piatetsky Shapno, Padhraic Smyth: “From Data mining to

Knowledge Discovery : An Overview"

32 Vijay V Raghavan, "State of Rough sets for Database Mining Appplications"

33 Y.Y Yao (1996), “two views of theory of Rough sets in Finite Universes"

34 Zdzislaw Pawlak (1995), "Rough sets Present state and further Prospects"

Trang 5

35 [DL92]: Reduct System, Inc: DataLogic/R reference Manual, Regina, Canada (1992)

36 [Sijach 93]:Sierpinska, M, Jacha: The company evaluation according to international standard, Wydawnnictwo Naukowe, Warszawa (1993)

37.[Skabek 96] Skabek, K.: Computer supporting credit decision The Master thesis, silesian Technical University, Gliwice (1996)

38.[Debski94] Debski,W.: Bank risk Bank i Kredyt 10 (1994)

Ngày đăng: 14/05/2021, 11:48

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w