Tài liệu tham khảo về Quản lý nguồn dữ liệu
Trang 1Chương Chương 33
Quản Quản lý lý nguồn nguồn dữ dữ liệu liệu
3.1 Thông tin và cách phân loại thông tin 3.2 Cơ sở dữ liệu và các khái niệm liên quan 3.3 Bảo vệ nguồn dữ liệu
ýý g g ệệ
1
3.4 Nguyên tắc quản lý nguồn dữ liệu 3.5 Quy trình quản lý nguồn dữ liệu
Mục đích
Thông tin và ý nghĩa của thông tin tốt, kịp thời đối với các hoạt động của doanh nghiệp
Các nguồn gây tác động xấu tới chất lượng thông tin là gì?
Thông tin nên được lưu trữ như thế nào?
Hệ thống quản trị cơ sở dữ liệu là gì? Được sử dụng để làm gì?
2
22
© 2008, TS Phạm Thị Thanh Hồng
MIS
Những chú ý để khai thác thông tin tốt là gì?
3.1
3.1 Thông Thông tin tin và và các các dạng dạng thông thông tin tin
■ Thông tin có ở mọi nơi trong và ngoài doanh nghiệp
■ Nhân viên cần phải nhận được và xử lý nhiều dạng dữ liệu và thông tin ở những mức độ, dạng thức, và tính chi tiết khác nhau để đưa ra các quyết định
■ Thu thập xử lý sắp xêp và phân tích thông tin
3
33
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Thu thập, xử lý, sắp xêp, và phân tích thông tin thành công có thể giúp nhận diện rõ về những hoạt động của doanh nghiệp
Dạng thông tin Phạm vi Ví dụ
Cấp thông tin Cá nhân Tri thức của cá nhân, mục tiêu, và chiến lược của cá nhân
Phòng ban Mục tiêu của phòng ban, doanh thu, chi phí, quy trình, và
chiến lược của phòng ban Doanh nghiệp Doanh thu, chi phí, quy trình và chiến lược của DN
Các Các dạng dạng thông thông tin tin
oa g ệp oa u, c p , quy à c ế ược của Kiểu thông tin Văn bản Thư, bản ghi nhớ, fax, e-mail, báo cáo, tài liệu Marketing, và
tài liệu đào tạo Trình diễn Trình bày về SP, chiến lược, quy trình, tài chính, khách hàng,
và đối thủ cạnh tranh Bảng tính Bảng dữ liệu về doanh thu, đối thủ cạnh tranh, tình hình tài
chính, tình hình đặt hàng.
CSDL CSDL về khách hàng, nhân viên, doanh thu, đơn đặt hàng,
nhà cung cấp và nhà sản xuất
4
44
© 2008, TS Phạm Thị Thanh Hồng
MIS
nhà cung cấp, và nhà sản xuất Mức độ chi tiết Chi tiết Báo cáo doanh thu của mỗi nhân viên bán hàng, mỗi sản
phẩm, và mỗi bộ phận Tóm lược Báo cáo doanh thu của toàn bộ phòng bán hàng, toàn bộ sản
phẩm, và tất cả các bộ phận Tổng hợp Báo cáo trong các phòng ban, các tổ chức
Trang 2Thông Thông tin tin giao giao dịch dịch và và thông thông tin tin phân phân tích tích
■ Thông tin giao dịch – Thông tin chứa trong một
quy trình nghiệp vụ đơn lẻ hoặc một đơn vị công tác, và mục đích của nó là hỗ trợ việc thực hiện , ụ ợ ệ ự ệ các nhiệm vụ tác nghiệp hàng ngày
■ Thông tin phân tích – mọi thông tin của tổ chức
được hình thành với mục đích trước nhất là để hỗ trợ việc thực hiện nhiệm vụ phân tích cho các nhà quản lý
5
55
© 2008, TS Phạm Thị Thanh Hồng
MIS
quản lý
Giá Giá trị trị thời thời gian gian của của thông thông tin tin
■ Tính kịp thời phản ánh tình huống sử dụng thông tin
■ Thông tin thời gian thực – thông tin cập nhật, có ngay tức thì
■ Hệ thống thời gian thực – cung cấp những thông tin thời gian
thực theo yêu cầu
■ Hệ thống thời gian thực có thể giúp doanh nghiệp ra những quyết định kịp thời
■ Mọi hệ thống có cần thiết kế thành hệ thống thời gian thực không?
6
66
© 2008, TS Phạm Thị Thanh Hồng
MIS
Giá Giá trị trị của của chất chất lượng lượng thông thông tin tin
■ Các quyết định kinh doanh tốt hay không phụ thuộc vào chất lượng thông tin sử dụng cho việc
ra quyết định đó q y ị
■ Năm thuộc tính của thông tin có chất lượng tốt là:
■ Chính xác
■ Đầy đủ
■ Thống nhất
7
77
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Tính đơn nhất
■ Kịp thời
Giá Giá trị trị của của chất chất lượng lượng thông thông tin tin
Các đặc tính của thông tin có chất lượng
Chính xác Mọi giá trị có chính xác không?
Đầy đủ Có giá trị nào bị mất không? VD, địa chỉ có đầy đủ tên đường
phố, quận/huyện, thành phố/tỉnh không?
Thống nhất Các thông tin tổng hợp có thống nhất với các thông tin chi tiết
không? Ví dụ tổng số tiền có đúng bằng tổng của các khoản tiền chi tiết cộng lại không?
Đơn nhất Mỗi giao dịch, thực thể, và sự kiện có được biểu diễn bởi một
thông tin không? VD, một khách hàng có được ghi cho 2 mã
số KH không?
8
88
© 2008, TS Phạm Thị Thanh Hồng
MIS
số KH không?
Kịp thời Thông tin có phản ánh được nhu cầu hiện tại của doanh
nghiệp không? VD, thông tin được cập nhật hàng tuần, hàng ngày, hay hàng giờ không?
Trang 3Thông Thông tin tin chất chất lượng lượng kém kém? ?
1 Mất thông tin (không có tên KH)
2 Thông tin không đầy
đủ (không có tên phố)
5 Thông tin không chính xác (sai địa chỉ e-mail)
3 Thông tin bị lặp (trùng tên địa chỉ, tên KH, số điện 4 Thông tin có thể bị sai (số điện thoại và số fax
6 Thông tin không đầy đủ (thiếu mã vùng)
9
99
© 2008, TS Phạm Thị Thanh Hồng
MIS
tên địa chỉ, tên KH, số điện thoại) (số điện thoại và số fax trùng nhau hay nhập sai?)
(thiếu mã vùng)
Giá Giá trị trị của của chất chất lượng lượng thông thông tin tin
■ Nguyên nhân gây ra thông tin có chất lượng kém:
1 Khách hàng trực tuyến có xu hướng nhập thông tin
1 Khách hàng trực tuyến có xu hướng nhập thông tin không chính xác để bảo vệ quyền riêng tư của họ
2 Thông tin từ các hệ thống khác nhau có các dạng nhập và chuẩn nhập thông tin khác nhau
3 Những người điều hành trung tâm dịch vụ khách hàng
bị phân tán và nhập những thông tin sai
10
10
© 2008, TS Phạm Thị Thanh Hồng
MIS
bị phân tán và nhập những thông tin sai
4 Thông tin bên ngoài và thông tin từ các đối tác khác thường không phù hợp, thiếu chính xác và có lỗi
Chi Chi phí phí cho cho thông thông tin tin có có chất chất lượng lượng kém kém
■ Những ảnh hưởng xấu đối với doanh nghiệp có những thông tin chất lượng kém
■ Không có khả năng bám sát khách hàng
■ Khó xác định những khách hàng có giá trị
■ Không có khả năng xác định các cơ hội bán hàng
■ Marketing tới những khách hàng không tồn tại
■ Khó giám sát doanh thu do các đơn đặt hàng không
11
11
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Khó giám sát doanh thu do các đơn đặt hàng không chính xác
■ Không có khả năng xây dựng quan hệ chặt chẽ với khách hàng => tăng áp lực của khách hàng
Ở
Ở Ữ Ữ Ệ À À Á Á
12
12
© 2008, TS Phạm Thị Thanh Hồng
MIS
3.2
3.2 CƠ CƠ SỞ SỞ DỮ DỮ LIỆU LIỆU VÀ VÀ CÁC CÁC KHÁI
KHÁI NIỆM NIỆM LIÊN LIÊN QUAN QUAN
Trang 4Ta
Ta có có thể thể lưu lưu trữ trữ và và tổ tổ chức chức thông thông tin tin
như như thế thế nào nào? ?
■ Thông tin ở khắp mọi nơi trong doanh nghiệp
■ Thông tin được lưu trữ trong những cơ sở dữ liệu (CSDL)
■ CSDL – tập hợp dữ liệu có tổ chức được sử dụng phục vụ cho
nhiều trình ứng dụng trong cùng một thời điểm
13
13
© 2008, TS Phạm Thị Thanh Hồng
MIS
Cấu Cấu trúc trúc dữ dữ liệu liệu
■ Bit: 1 hoặc 0
■ Byte
■ 8 bits (số ký tự tín hiệu)
■ Trường/ thuộc tính
■ Nhóm các ký tự được tổ chức nhằm mục đích lưu trữ và xử lý
■ Biểu ghi/ Thực thể
■ Nhóm các trường có liên quan tới nhau
■ Tập DL/ Tập thực thể
14
14
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Tập DL/ Tập thực thể
■ Một nhóm các biểu ghi có cấu trúc giống nhau
■ Cơ sở dữ liệu (CSDL)
■ Một nhóm các tập dữ liệu có liên quan
Các Các mô mô hình hình dữ dữ liệu liệu
■ Mô hình cơ sở dữ liệu phân cấp
■ Mô hình cơ sở dữ liệu mạng ệ ạ g
■ Mô hình cơ sở dữ liệu quan hệ
16
16
© 2008, TS Phạm Thị Thanh Hồng
MIS
Trường Trường khóa khóa và và các các mối mối quan quan hệ hệ
■ Trường khóa và trường khóa ngoại xác định một thực thể trong một tập thực thể
■ Trường khóa – một trường (hoặc một nhóm trường) có giá trị
duy nhất cho mỗi thực thể trong một tập thực thể
■ Trường khóa ngoại – trường khóa của một tập thực thể xuất
hiện như một thuộc tính trong một tập thực thể khác và giúp tạo quan hệ logic giữa hai tập thực thể
20
20
© 2008, TS Phạm Thị Thanh Hồng
MIS
Trang 5Ưu điểm điểm của của CSDL CSDL quan quan hệ hệ
■ Tăng tính linh hoạt
■ Tăng khả năng thực hiện
■ Giảm sự lặp lại của thông tin
■ Tăng chất lượng thông tin
■ Tăng độ an toàn cho thông tin
22
22
© 2008, TS Phạm Thị Thanh Hồng
MIS
Hệ
Hệ quản quản trị trị cơ cơ sở sở dữ dữ liệu liệu
■ Hệ quản trị CSDL (Database Management System)
■ Tập hợp các chương trình cho phép người sử dụng tạo ra và duy trì CSDL y
■ Một phần mềm hệ thống cho phép định nghĩa, xây dựng và xử lý
dữ liệu
■ Định nghĩa – khai báo bộ khung dữ liệu cùng với các mô tả chi tiết về dữ liệu
■ Xây dựng – lưu trữ dữ liệu lên bộ nhớ phụ
■ Xử lý truy vấn cập nhật và phát sinh báo cáo
23
23
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Xử lý – truy vấn, cập nhật và phát sinh báo cáo
trúc của CSDL và xác định từng thành phần dữ liệu
• Từ điển dữ liệu: Lưu các định nghĩa về các thành phần dữ liệu và các đặc tính của dữ liệu
Thành Thành phần phần của của DBMS DBMS
■ Có những bảng dữ liệu nào?
■ Có những trường nào?
■ Số, ký tự, văn bản, hình ảnh, …?
■ Độ dài của một trường?
■ Có thể có số 0 hay không?
■ Hay chỉ có giá trị đúng/sai
25
25
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Trường khóa?
xóa, sửa chữa, sắp xếp dữ liệu trong CSDL
Thành Thành phần phần của của DBMS ( DBMS (tt tt))
■ Tạo ứng dụng – gồm các công cụ cho phép tạo
ứng dụng một cách dễ dàng và hiển thị
■ Quản trị dữ liệu – cung cấp những công cụ quản
lý dữ liệu nói chung
■ Các chuyên gia CNTT thường là người làm việc
29
29
© 2008, TS Phạm Thị Thanh Hồng
MIS
với những thành phần này.
Trang 6Tích Tích hợp hợp thông thông tin tin giữa giữa nhiều nhiều CSDL CSDL
■ Các tổ chức thường có nhiều hệ thống, mỗi hệ thống lại có CSDL riêng của nó
■ Tích hợp – cho phép các hệ thống riêng rẽ có thể trao đổi
với các hệ thống khác
30
30
© 2008, TS Phạm Thị Thanh Hồng
MIS
Tích Tích hợp hợp thông thông tin tin giữa giữa các các CSDL CSDL
■ Xây dựng một hệ thống xử lý trung tâm để tích hợp dữ liệu
31
31
© 2008, TS Phạm Thị Thanh Hồng
MIS
Cấu trúc
■ Tập trung – tất cả các file có liên quan ở cùng một vị trí
■ Phân tán – toàn bộ hoặc từng phần của CSDL được lưu trữ ở nhiều vị
3.3
3.3 Tổ Tổ chức chức CSDL CSDL
g p trí
■ Lặp – toàn bộ CSDL được lưu ở nhiều vị trí
■ Phi tập trung – những phần khác nhau của CSDL được lưu trữ ở nhiều
vị trí
32
32
© 2008, TS Phạm Thị Thanh Hồng
MIS
Cơ sở dữ liệu phân tán
Hai Hai xu xu hướng hướng chính chính: : tập tập trung trung và và phân phân tán tán
Máy tính
Máy tính
Máy tính
33
33
© 2008, TS Phạm Thị Thanh Hồng
MIS
Máy tính Các cơ sở dữ liệu tương tự
Cơ sở dữ liệu tập trung
Trang 7■ Kho dữ liệu (Data Warehouse) và kỹ thuật khai thác dữ liệu (Datamining)
Siêu CSDL liên kết mạng
Các Các xu xu hướng hướng xây xây dựng dựng CSDL CSDL mới mới
■ Siêu CSDL liên kết mạng
34
34
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Kho dữ liệu – một tập hợp logic của thông tin – được
sinh ra từ nhiều CSDL điều hành khác nhau – được sử dụng để tạo ra trí tuệ doanh nghiệp hỗ trợ cho việc phân
Kho Kho dữ dữ liệu liệu
tích kinh doanh và các hoạt động ra quyết định
■ Mô hình dữ liệu đa hướng
■ OLAP
■ Data Marts – một phần nhỏ của kho dữ liệu Khai thác dữ liệu (Data Mining) tìm kiếm những xu
35
35
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Khai thác dữ liệu (Data Mining) – tìm kiếm những xu hướng hoặc kiểu dữ liệu còn chưa lộ rõ
Phân Phân tích tích đa đa hướng hướng
■ CSDL chứa các thông tin với nhiều hướng
■ Trong một kho dữ liệu và khối dữ liệu, thông tin có nhiều hướng, nó bao gồm những lớp cột và hàng
■ Hướng – một thuộc tính của thông tin
37
37
© 2008, TS Phạm Thị Thanh Hồng
MIS
Khai Khai thác thác dữ dữ liệu liệu (data mining) (data mining)
■ Được sử dụng bởi các hãng lớn
■ Cho phép đi từ dữ liệu khái quát đến các dữ liệu chi tiết, sắp xếp hoặc trích lọc dữ liệu theo một tiêu chuẩn nào đó và thực hiện nhiều phương
án phân tích thống kê như phân tích xu thế, phân tích tương quan, dự p g p p g q ự báo, và phân tích phương sai
■ Các hoạt động chính
■ Trực tiếp
■ Phân loại
■ Ước tính
■ Dự báo
39
39
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Gián tiếp
■ Xâu chuỗi
■ Luật liên hệ
■ Mô tả và minh họa
Trang 8■ Có thể truy vấn và lập báo cáo mà không cần sử dụng hệ thống xử lý giao dịch (TPS)
■ Có thể làm tăng tốc độ truy vấn và lập báo cáo bằng cách
Tại Tại sao sao phải phải sử sử dụng dụng kho kho dữ dữ liệu liệu? ?
sử dụng lược đồ sao
■ Những người không phải là chuyên gia về CNTT cũng vẫn
có thể viết được những đoạn truy vấn đơn giản
■ Có thể xóa dữ liệu mà không cần phải can thiệp vào TPS
42
42
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Khi TPS có thể lưu toàn bộ dữ liệu và thực hiện truy vấn một cách nhanh chóng
■ Một số các tổ chức không muốn người sử dụng tự tạo các ấ
Tại Tại sao sao không không sử sử dụng dụng kho kho dữ dữ liệu liệu? ?
truy vấn riêng
■ Một kho dữ liệu có thể đòi hỏi:
■ Bảo trì tốt
■ Có một số giới hạn chuyên gia tham gia vào toàn bộ chu trình thành lập kho dữ liệu đầy đủ
43
43
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Nhiều ứng dụng chiến lược có thời gian sử dụng ngắn hoặc hoàn taòn không có tác dụng đối với người sử dụng HTTT dẫn tới việc tạo ra các hệ thống không thực hiệu quả
Tại Tại sao sao không không sử sử dụng dụng kho kho dữ dữ liệu liệu ((tt tt)? )?
■ Quy trình xử lý và các báo cáo có thể nhanh chóng thêm một clutter vào quá trình điều hành kinh doanh
■ Giá trị của nhiều dữ liệu có thể bị giới hạn
■ Chi phí có thể vượt quá lợi ích
44
44
© 2008, TS Phạm Thị Thanh Hồng
MIS
Siêu Siêu cơ cơ sở sở dữ dữ liệu liệu
■ Liên kết ứng dụng website với các siêu CSDL
■ Siêu CSDL là một CSDL sử dụng các liên kết siêu văn bản để tổ chức
■ Các tệp tài liệu
■ Các tệp thực hiện
Internet
M¸y chñ øng dông (Application server) C¸c ch−¬ng tr×nh tïy chØnh
M¸y chñ WEB (WEB Server) HTML
M¸y chñ c¬ së d÷ liÖu (Database Server)
C¬ së d÷ liÖu (Databases)
Tr×nh duyÖt WEB
45
45
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Các chỉ dẫn và cơ cấu tìm kiếm
■ Các chỉ dẫn (directories): một danh sách có cấu trúc xác định vị trí các trang văn bản ở trên mạng có liên quan đến một vấn đề xác định
■ Cơ cấu tìm kiếm (search engine): các chương trình giúp xác định vị trí các trang mạng phù hợp với từ khóa tìm kiếm của người sử dụng
Trang 9CSDL CSDL nào nào phù phù hợp hợp? ?
■ Lựa chọn phụ thuộc vào:
■ Tầm cỡ của ứng dụng
■ Hệ thống phần cứng và hệ điều hành sử dụng cho CSDL
■ Trình độ nhân viên
■ Hỗ trợ về chương trình
■ Chi phí/ tính linh hoạt trong vận hành
■ Ngân sách
System (producer)Platform SQL ODBC Scaling Price
Access (Microsoft) W indows Yes Yes SQL Server ~$200
46
46
© 2008, TS Phạm Thị Thanh Hồng
MIS
FoxPro (Microsoft) W indows, Mac Yes Yes SQL Server ~$200 FileMaker (FileMaker) W indows, Mac No No FileMaker Server ~$200 Excel (Microsoft) W indows, Mac No Yes Convert to Acces ~$200 Files (owner) W indows, Mac No No Import into DB ?
3.4
3.4 Bảo Bảo vệ vệ dữ dữ liệu liệu
■ Các tổ chức phải bảo vệ nguồn dữ liệu của họ chống lại
sự xâm nhập bất hợp pháp và sự phá hỏng dữ liệu
■ Ba bước chính mà một tổ chức có thể thực hiện để bảo
vệ dữ liệu là:
1 Phát triển chiến lược phục hồi và sao lưu dữ liệu thích hợp
2 Lập kế hoạch khắc phục sự cố
3 Xây dựng hệ thống kinh doanh có khả năng thích ứng
47
47
© 2008, TS Phạm Thị Thanh Hồng
MIS
3 Xây dựng hệ thống kinh doanh có khả năng thích ứng
Chiến Chiến lược lược sao sao lưu lưu và và phục phục hồi hồi dữ dữ liệu liệu
■ Sao lưu – Tạo một bản sao chính xác của toàn bộ hệ
thống thông tin
■ Phục hồi – khả năng đưa hệ thống trở về hoạt động lại
khi hệ thống bị xâm nhập hoặc bị phá hỏng
48
48
© 2008, TS Phạm Thị Thanh Hồng
MIS
Kế
Kế hoạch hoạch khắc khắc phục phục sự sự cố cố
■ Kế hoạch khắc phục sự cố – một quy trình
chi tiết để phục hồi thông tin hoặc một hệ thống ứng dụng CNTT trong trường hợp xẩy
ra sự cố
■ Vùng nóng (hot site) – một vùng phương tiện
riêng được trang bị đầy đủ mà công ty có thể ngay lập tức đưa vào sử dụng sau sự cố
49
49
© 2008, TS Phạm Thị Thanh Hồng
MIS
lập tức đưa vào sử dụng sau sự cố
■ Vùng lạnh (Cold site) – một vùng tách biệt không
trang bị sẵn các thiết bị máy tính, nhưng là nơi mà nhân viên có thể chuyển tới sau khi xẩy ra sự cố
Trang 10Kế hoạch hoạch khắc khắc phục phục sự sự cố cố
■ Biểu đồ chi phí khắc phục sự cố:
1 Chi phí mà tổ chức phải chịu nếu không có thông tin
và những công nghệ cần thiết
2 Chi phí mà tổ chức phải chịu để khắc phục thảm họa
Chi phí mà tổ chức phải chịu nếu không có thông tin
và công nghệ cần thiết
Kế hoạch khắc phục
sự cố tối ưu về chi phí và thời gian
50
50
© 2008, TS Phạm Thị Thanh Hồng
MIS
Thời gian từ khi sự cố xẩy ra cho tới khi khắc phục được
Chi phí mà tổ chức phải chịu để khắc phục sự cố
Các Các hệ hệ thống thống có có khả khả năng năng thích thích ứng ứng
1 Linh hoạt – Hệ thống phải đáp ứng được những thay
đổi trong kinh doanh
2 Đo lường được – hệ thống có thể thích ứng với nhu cầu
2 Đo lường được hệ thống có thể thích ứng với nhu cầu
tăng lên tới mức nào
3 Đáng tin cậy – đảm bảo mọi hệ thống đều thực hiện
đúng chức năng và cung cấp thông tin chính xác
4 Sẵn sàng – các điểm mà nhân viên, khách hàng, và đối
tác có thể tiếp cận hệ thống
51
51
© 2008, TS Phạm Thị Thanh Hồng
MIS
5 Vận hành – xác định xem hệ thống có thể thực hiện một
quy trình hoặc giao dịch cụ thể nhanh tới mức nào
3.4
3.4 Các Các nguyên nguyên tắc tắc quản quản lý lý CSDL CSDL
■ Nhu cầu quản lý dữ liệu luôn tồn tại
■ Dữ liệu có thể được trích xuất ở nhiều cấp
■ Phần mềm ứng dụng phải được tách riêng khỏi cơ sở dữ g ụ g p ợ g liệu
■ Phần mềm ứng dụng nên được phân loại theo cách mà
nó xử lý dữ liệu
■ Phần mềm ứng dụng nên được thiết kế độc lập
■ Dữ liệu nên được nhập vào hệ thống chỉ một lần
52
52
© 2008, TS Phạm Thị Thanh Hồng
MIS
■ Cần có chuẩn dữ liệu