Thường được viết bằng tay, việc thu thập dữ liệu khó khănCồng kềnh, kém hiệu quảTốn thời gian và chi phí duy trì caoDữ liệu thường thiếu chính xác, thiếu cập nhật và khó khăn trong việc truy cập hay chia sẻ dữ liệu kịp thờiThiếu tính bảo mật
Trang 2MỞ ĐẦU
Trang 3PH ƯƠ NG P HÁ
P T IẾ
P C ẬN C
Ơ S
Ở D
Ữ L IỆ
U Đ
Ể Q UẢ
N L
Ý D
Ữ
LIỆ U
1 ) MS DB U ( IỆ Ữ L Ở D S CƠ RỊ N T UẢ Q NG HỐ T HỆ •
2 H IN T K UẤ U S IỆ N H IỆ TH ẢI Ể C U Đ IỆ Ữ L Ở D Ơ S G C ỤN D SỬ •
DO AN
H V
À R
A Q UY ẾT Đ ỊN H
3 U IỆ Ữ L D ÊN UY NG ÀI T ỒN GU Ý N L ẢN QU • 4
NỘI DUNG
Trang 4PHƯƠNG PHÁP TIẾP CẬN CƠ SỞ DỮ LIỆU ĐỂ QUẢN LÝ
CÁC KHÁI NIỆM
cách cụ thể về con người hay một nơi chốn Là một tập hợp thông tin có cấu trúc.
Trang 5PHƯƠNG PHÁP TIẾP CẬN CƠ SỞ DỮ LIỆU ĐỂ QUẢN LÝ
HẠN CHẾ CỦA CSDL TRUYỀN THỐNG
• Thường được viết bằng tay, việc thu thập dữ liệu khó khăn
• Cồng kềnh, kém hiệu quả
• Tốn thời gian và chi phí duy trì cao
• Dữ liệu thường thiếu chính xác, thiếu cập nhật và khó khăn trong việc truy cập hay chia sẻ dữ liệu kịp thời
• Thiếu tính bảo mật
Trang 6PHƯƠNG PHÁP TIẾP CẬN CƠ SỞ DỮ LIỆU ĐỂ QUẢN LÝ
CSDL QUAN HỆ (Relational Database)
• Tổ chức dữ liệu theo 2 chiều là dòng và cột dưới dạng bảng
• Mỗi bảng đại diện cho 1 Entity
Đặc điểm
Trang 7PHƯƠNG PHÁP TIẾP CẬN CƠ SỞ DỮ LIỆU ĐỂ QUẢN LÝ
CSDL QUAN HỆ (Relational Database)
Thành phần
Trang 8PHƯƠNG PHÁP TIẾP CẬN CƠ SỞ DỮ LIỆU ĐỂ QUẢN LÝ
CSDL QUAN HỆ (Relational Database)
Trang 9PHƯƠNG PHÁP TIẾP CẬN CƠ SỞ DỮ LIỆU ĐỂ QUẢN LÝ
CSDL QUAN HỆ (Relational Database)
Tạo liên kết
•Tiêu chuẩn hóa (Normalization)
Quá trình giảm bớt sự phức tạp, trùng lắp dữ liệu
Những thông tin được thiết kế 1 cách hợp lý và bình thường sẽ dễ dàng để duy trì với
tỷ lệ trùng lắp thông tin bé nhất
•Tính toàn vẹn (Referential Integrity)
Hệ thống quan hệ dữ liệu phải có tính liên quan, toàn vẹn để đảm bảo rằng mối quan hệ giữa 2 bảng phải thống nhất với nhau
Trang 10MINH H A O
FBI
Trang 11Việc sử dụng các danh sách riêng biệt, khiến cho việc thu thập và theo dõi của mỗi cơ quan thiếu tính thống nhất và không đầy đủ Sau sự kiện khủng bố 11/9…
Trước đây FBI có 2 danh sách theo dõi khủng bố: Trong nước , ngoài nước.Là Cơ quan trực thuộc Bộ Tư Pháp Hoa Kỳ, có nhiệm vụ thực hiện điều tra tội phạm ở cấp độ Liên bang và
tình báo nội địa FBI có quyền hạn điều tra về các vi phạm trong hơn 200 danh mục về tội ác liên bang
Danh sách theo dõi khủng bố ra đời dưới dạng một cơ sở dữ liệu hợp nhất giữa các cơ quan, giúp giảm bớt tình trạng dư thừa hay thiếu xót thông tin.
Trang 13•Là 1 phầm mềm đặc trưng cho việc: tạo lập , lưu trữ, tổ chức, truy cập dữ liệu từ cơ sở dữ liệu.
•Giải phóng người dùng khỏi phải suy nghĩ về việc: trình bày dữ liệu sao cho hợp lý (logical views) và cấu trúc , lưu trữ dữ liệu sao cho hiệu quả (physical views)
1 ĐỊNH NGHĨA dbms
HÊÊ THỐNG QUẢN LÝ CSDL (DBMS)
Trang 141 ĐỊNH NGHĨA dbms
Minh họa DBMS bằng Cơ sở dữ liệu của phòng Nhân sự
Trang 15Lựa chọn (Select)
Kết nối (Join)
Xuất (Project)
2 Hoạt đôÊng của dbms
Gồm có 3 hoạt động chính là:
Trang 163 Chức năng của dbms
Data Definition (Định nghĩa dữ liệu)
Chỉ ra cấu trúc của cơ sở dữ liệu Cụ thể là, tạo bảng cơ sở dữ liệu rồi xác định các đặc tính của từng cột
Data Dictionary (Từ điển dữ liệu)
Đây là nơi lưu trữ các thông tin dữ liệu bao gồm thành phần và đặc điểm của dữ liệu đó
Data Manipulation Language (Ngôn ngữ sửa đổi DL) Mỗi DBMS có 1 ngôn ngữ riêng được
dùng để thêm, thay đổi, xóa, tìm kiếm hay giải nén dữ liệu từ cơ sở dữ liệu
Ngôn ngữ thông dụng hiện nay là SQL (Structured query language – Ngôn ngữ truy vấn có cấu trúc)
Trang 173 Chức năng của dbms
Từ điển dữ liệu & Truy vấn dữ liệu trên Microsoft Access
Trang 184, csdl hướng đối tượng
• Lưu trữ, tìm kiếm được dữ liệu dạng liên kết (relational database) và dữ liệu dạng đa
phương tiện (multimedia, drawing, video, voice…)
• Lưu trữ dữ liệu và quá trình dưới dạng 1 đôi tượng (bao gồm: biến và hàm thực hiện) có thể được tự động tìm kiếm và chia sẻ
Object-orient DBMS
Trang 19MINH H A O
FBI
Trang 20Các cơ quan chính phủ đã phổ biến danh sách của họ bằng việc quét rộng thông tin được thu thập Điều này dẫn đến việc có những người không nằm trong danh sách nhưng vẫn bị nghi ngờ.
Các bước cần làm để khắc phục những hạn chế là:
• Thiết lập lại phần mềm xử lí.
• Đào tạo lại nhân viên.
• Tăng cường kiểm tra xác minh lại.
Trang 21KHO DỮ LIÊÊU (DATA WAREHOUSES)
BUSINESS INTELLIGENT (BI)
KHAI THÁC DỮ LIÊÊU
DỮ LIÊÊU VÀ WEB
CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
Trang 22KHO DỮ LIÊÊU (DATA WAREHOUSES)
Trang 23CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
Cách hoạt đôÊng
• Thông tin trong kho dữ liệu sẽ được tổng hợp và chuẩn hóa dựa trên cơ sở dữ liệu từ nhiều nguồn khác nhau
Trang 24CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
Data Sources
End User (HR, SD,
MM …)
Trang 25CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
• Thông tin trong kho dữ liệu sẽ được tổng hợp và chuẩn hóa dựa trên cơ sở dữ liệu từ nhiều nguồn khác nhau Data Warehouse
• Thông tin này sẽ được rút trích (extract), chuyển đổi (transform và nạp (load) ở DW
• Sau đó, các dữ liệu ở đây sẽ được khai thác sử dụng nhằm phục vụ cho việc ra quyết định cho quản
lý cấp trung, từ đó mới đưa lên cấp trên cao hơn.
Trang 26CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
Hệ thống OLAP (Online Analytical Processing)
• OLAP (Xử lý phân tích trực tuyến) là một kỹ thuật sử dụng cách thể hiện dữ liệu đa chiều gọi là các khối (cube) nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu
• Gồm các tác vụ: Slice (cắt lát), Drill-Down (Khoan xuống) và cuôÊn lên (Roll-Up)
Trang 27CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
Hệ thống OLAP (Online Analytical Processing)
• Bản chất cốt lõi của OLAP là dữ liệu được lấy ra từ Kho dữ liệu hoặc từ DataMart (kho dữ
liệu chủ đề - DM); sau đó được chuyển thành mô hình đa chiều và được lưu trữ trong một kho dữ liệu đa chiều
Trang 28CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
Trang 29Lợi ích
• Dễ dàng lựa chọn, định hướng và khám phá dữ liệu
• Cung cấp sức mạnh để khám phá các mối quan hệ trong dữ liệu kinh doanh phức tạp
• Thời gian trả lời rất nhanh đối với các truy vấn đặc biệt
Hệ thống OLAP (Online Analytical Processing)
Trang 30CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
BUSINESS INTELLIGENT (BI)
Khái niệm
BI là một chuỗi các công cụ làm cho người dùng có
thể phân tích những dữ liệu này để thấy những mô
hình, mối quan hệ, và sự hiểu biết rất có ích cho việc
hướng dẫn ra quyết định
Trang 31CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
BUSINESS INTELLIGENT (BI)
Cách thức hoạt đôÊng
Trang 32CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
BUSINESS INTELLIGENT (BI)
dữ liệu đa phương tiện hay khai thác dữ liệu
• Cung cấp cho công ty khả năng tích lũy thông tin, phát triển khả năng hiểu biết về khách
hàng, đối thủ, và hoạt động trong nội bộ tổ chức
Cách hoạt đôÊng
Trang 33CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
KHAI THÁC DỮ LIÊÊU
Là một tập hợp các kỹ thuật được sử dụng để tự động khai thác và tìm ra các mối quan hệ lẫn nhau của dữ liệu trong một tập hợp dữ liệu khổng lồ và phức tạp, đồng thời cũng tìm ra các mẫu tiềm ẩn trong tập dữ liệu đó
Trang 34CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
KHAI THÁC DỮ LIÊÊU
Ứng dụng
• Text Mining (Khai phá dữ liệu văn bản)
• Web Mining (Khai phá dữ liệu Web)
Trang 35CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
DỮ LIÊÊU VÀ WEB
Trang 36CẢI THIÊÊN HIÊÊU SUẤT KD VÀ RA QUYẾT ĐỊNH
DỮ LIÊÊU VÀ WEB
Lợi ích
Thứ nhất, yêu cầu đào tạo nhân viên sử dụng Web đơn giản hơn, dễ dàng hơn
Thứ hai, giao diện web đòi hỏi ít hoặc không thay đổi đối với cơ sở dữ liệu nội bộ
Thứ ba, truy cập cơ sở dữ liệu của công ty thông qua Web tạo ra những cơ hội và hiệu quả
mới, trong một vài trường hợp, nó thậm chí đang thay đổi cách thức kinh doanh
Trang 37QUẢN LÝ NGUỒN
TÀI NGUYÊN DỮ LIÊÊU
QUẢN LÝ NGUỒN
TÀI NGUYÊN DỮ LIÊÊU
THIẾT LÂÊP CHÍNH SÁCH THÔNG TIN
ĐẢM BẢO CHẤT LƯỢNG NGUỒN DỮ LIÊÊU
Trang 38Chính sách thông tin (Information Policy)
• Chỉ rõ những quy định của tổ chức về việc chia sẻ, phổ biến, tiếp nhận, tiêu chuẩn hóa, phân loại và kiểm kê thông tin.
• Vạch ra những thủ tục và trách nhiệm giải trình, nhận dạng người dùng hay đơn vị tổ chức nào
có thể chia sẻ thông tin, nơi nào thông tin được gửi đến, ai là người chịu trách nhiệm cập nhật
và lưu giữ thông tin
THIẾT LÂÊP CHÍNH SÁCH THÔNG TIN
Trang 39Quản lý dữ liệu (Data Administration)
• Bao gồm việc đề ra những chính sách, thủ tục cụ thể mà thông qua đó, dữ liệu được quản
lý như 1 nguồn tài nguyên có cấu trúc
• Gồm có: phát triển chính sách thông tin, sắp xếp dữ liệu, theo dõi thiết kế logic của dữ liệu,
sự phát triển của danh mục dữ liệu và giám sát việc sử dụng dữ liệu của các chuyên gia hệ thống thông tin và nhóm người dùng cuối.
Trang 40THIẾT LÂÊP CHÍNH SÁCH THÔNG TIN
Quản lý cơ sở dữ liệu
Trang 41• Tính thiếu chính xác: Dữ liệu không chính xác,
không đúng lúc hay mâu thuẫn
được tạo ra từ nhiều hệ thống
là sai tên, sai số, hay sai mã
ĐẢM BẢO CHẤT LƯỢNG NGUỒN DL
Các vấn đề gặp phải về CSDL
Trang 42ĐẢM BẢO CHẤT LƯỢNG NGUỒN DL
Cách khắc phục
Kiểm tra chất lượng dL (Data Quality Audit)
• Phân tích chất lượng dữ liệu bắt đầu từ việc kiểm tra chất lượng dữ liệu
• Điều tra toàn bộ hồ sơ dữ liệu, mẫu dữ liệu, hay khảo sát người dùng cuối những cảm nhận của họ về chất lượng dịch vụ
Trang 43ĐẢM BẢO CHẤT LƯỢNG NGUỒN DL
Cách khắc phục
Làm sạch dL (Cleansing/Scrubbing data)
• Gồm các hoạt động dò tìm và sửa đổi các dữ liệu không đúng, không hoàn chỉnh, không
đúng định dạng hay thừa thải
• Thống nhất giữa những nhóm dữ liệu khác nhau bắt nguồn từ nhiều hệ thống thông tin
tách rời
• Sử dụng phần mềm chuyên về làm sạch dữ liệu để điều tra dữ liệu tự động, sửa lỗi dữ liệu,
và tích hợp dữ liệu trong một dạng thống nhất của DN
Trang 44CẢM ƠN THẦY VÀ CÁC BẠN ĐÃ LẮNG
NGHE