Nghiên cứu một số vấn đề về tích hợp dữ liệu Nguyễn Trí Hiển Trường Đại học Công nghệ Luận văn ThS chuyên ngành: Mạng và truyền thông; Mã số: 1 01 10 Người hướng dẫn: PGS.TS.. Đặng Văn
Trang 1Nghiên cứu một số vấn đề về tích hợp dữ liệu
Nguyễn Trí Hiển
Trường Đại học Công nghệ Luận văn ThS chuyên ngành: Mạng và truyền thông; Mã số: 1 01 10
Người hướng dẫn: PGS.TS Đặng Văn Đức
Năm bảo vệ: 2007
Abstract: Nêu định nghĩa về tích hợp dữ liệu, kiến trúc hệ thống tích hợp dữ liệu, truy
vấn trong tích hợp dữ liệu, và giới thiệu một số hệ tích hợp dữ liệu điển hình Nghiên cứu đưa ra một quy trình cơ bản để xây dựng hệ tích hợp dữ liệu
Keywords: Dữ liệu; Tin học; Tích hợp dữ liệu
Content
Một trong những vấn đề chính hiện nay là các dữ liệu quan trọng được nằm rải rác trên nhiều nguồn dữ liệu tách biệt nhau Trong cấu trúc một bức tranh lớn như vậy chúng ta khó có thể truy vấn, chiết xuất dữ liệu lấy ra các thông tin cần thiết Tích hợp dữ liệu đưa ra một khung nhìn ảo thống nhất tất cả các dữ liệu trong cùng phạm vi, cho phép người dùng có thể truy vấn
dữ liệu thông qua lược đồ tích hợp hoàn chỉnh
Việc xây dựng các hệ thống tích hợp dữ liệu rất quan trọng trong các ứng dụng thực tế Các ngân hàng ứng dụng tích hợp dữ liệu để lấy báo cáo số liệu của các chi nhánh con Trong an ninh chúng ta sử dụng tích hợp để điều tra tội phạm Các tổ chức lớn cần lấy thông tin từ các đơn
vị trực thuộc Hay là việc so sánh, kiểm định các thông tin từ nhiều hệ thống khác nhau
Trong thế giới thông tin, có rất nhiều loại nguồn dữ liệu, việc tích hợp dữ liệu trở nên ngày càng khó khăn hơn Một số loại nguồn dữ liệu điển hình đó là: dữ liệu văn bản, dữ liệu âm
Trang 2thanh, dữ liệu hình ảnh, dữ liệu video, các hệ quản trị dữ liệu tương ứng với các kiểu dữ liệu trên,
cơ sở dữ liệu không gian
Nội dung của bài viết này tập trung vào giới thiệu các vấn đề xung quanh tích hợp dữ liệu Các nội dung chính là: các khái niệm về tích hợp dữ liệu, kiến trúc hệ thống tích hợp dữ liệu, truy vấn trong tích hợp dữ liệu, giới thiệu một vài hệ tích hợp dữ liệu điển hình, phần cuối tác giả đưa ra một qui trình cơ bản để xây dựng hệ tích hợp dữ liệu
References
Tài liệu tiếng Việt
STT
1 Lê Minh Trung, Hoàng Thanh (2002), “XML cho người mới học”, Nhà xuất bản
thống kê, Hà nội
2 Ngô Trung Việt (2002), “Phương pháp luận quản lý dự án Công nghệ thông tin”,
Nhà xuất bản thống kê, Hà nội
3 Nguyễn Văn Vỵ (2002), “Phân tích thiết kế các hệ thống thông tin hiện đại”, Nhà
xuất bản thống kê, Hà nội
Tài liệu tiếng Anh
STT
4 Alon Y Levy (1999), “Logic-Based Techniques in Data Integration”, Workshop
on Logic-Based Artificial Intelligence, Washington, DC, June 14-16, 1999
5 Bob Hughes và Mike Cotterell (1999) “Software Project Management (Second
Edition)”, Mc-Graw-Hill Publishing Company, England
6 C Convey, O Karpenko, N Tatbul (2001), “Data Integration Services”,
http://citeseer.ist.psu.edu/convey01data.html
7 Center for Technology in Government (2003) “The Research Issues: Using
Integrated Multiple Data Sources”, www.ctg.albany.edu
8 Domenico Lembo, Maurizio Lenzerini, Riccardo Rosati (2002), “Review on
Trang 3models and systems for information integration”, Infomix Consortium
9 Eike Schallehn (2004), “Efficient Similarity-based Operations for Data
Integration”, thesis for grade doctor in Otto-von-Guericke university,
Magdeburg
10 IBM DB2 Information Integrator (2004), “Introduction to Replication and Event
Publishing”, Copyright IBM Corp
11 Jan Chomicki (2000), “Consistent query answering - Recent Developments and
Future Directions”, Department of Computer Science and Engineering
University at Buffalo, SUNY Buffalo
12 Livia Predoiu, Cristina Feier, … (2006), “D4.2.2 State-of-the-art survey on
Ontology Merging and Aligning V2”, Digital Enterprise Research Institute,
University of Innsbruck
13 Maurizio Lenzerini (2002), “Data integration: A theoretical perspective”, Tutorial
at PODS 2002 Madison, Wisconsin, USA
14 Michalis Petropoulos và Slawek Staworko (2006), “CSE 636: Data Integration”,
University at Buffalo, Website address at: http://www.cse.buffalo.edu/~mpetropo/CSE636-FA06/#project
15 Neil Canter, Erwin Ephron, Ephron, Papazian & Ephron and others (2003), “ARF
guidelines for data integration”, ARF 641 Lexington Avenue, New York,
NY 10022
16 Robin Cover (2001) “Tukwila Data Integration System (University of
Washington)”, http://xml.coverpages.org/tukwila.html
17 Rubén Tous (2006), “Data Integration with XML and Semantic Web
Technologies”, thesis for the degree of Doctor of Philosophy Doctorate in
Pompeu Fabra University, Barcelona
18 Zachary G Ives (2002), “Efficient Query Processing for Data Integration” A
dissertation submitted in partial fulfillment of the requirements for the degree of Doctor of Philosophy in University of Washington
19 Zachary G Ives, Daniela Florescu, Marc Friedman, Alon Levy, Daniel S Weld
(1999), “An Adaptive Query Execution System for Data Integration”, ACM
SIGMOD Conference on Management of Data, Philadelphia, PA, June 1 -3,
Trang 41999
20 www.blackboard.com - Blackboard Inc (2006), “Advanced Integration and Data
Management”, 1899 L Street, NW, 5th Floor Washington, DC 20036-3861
USA
21 www.ctg.albany.edu (2003), “Research and Practical Experiences in the Use of
Multiple Data Sources”, Center for Technology in Government
22 www.enterprise.prog.org (2002), “Road Weather Information Systems (RWIS)
Data Integration Guidelines”, Castle Rock Consultants, Inc 6222 SW
Virginia Avenue Suite 2Portland
23 www.stats.govt.nz (2006), “Data Integration Manual” Statistics New Zealand PO
Box 2922 Wellington