M ô hình vật lý được thể hiện dưới dạng hệ quản trị c ơ sờ dữ liệ u (D B M S ).
C húng ta chắc chán rằng m ỗi đốt tượng lưu trữ (bảng) như là nơi lưu trữ thích hợp cho các nội dung v à các c h ỉ m ục để tối ưu hóa thực hiện. N goài ra còn một điều đáng quan tâm kh á c như: phân đoạn dữ liệu (data p artitio nin g ), phản đ o ạn ...và ước lượng trước ràng buộc nghiệp vụ và yêu cầu người dùng. N gôn ngữ định nghĩa dữ
57
liệu ( D D L ) được sinh ra để x a y dụng và phát triển , k iể m thử v à tạo dựng c á c đối tượng cùa kh o d ữ liệu.
M ô hình vật lý được chu yển đổi từ mò hình D im e n sio n , điểu kh ác biệt c ơ bản giữa hai mô h ình này ià : m ô hình vật lý có m ức độ ch i tiết hơn về các đặc tính của cơ sở dữ liệ u như: k iể u , độ đ à i, k íc h thước dữ liệ u và c á c ch iế n lược tạo c h ỉ m ục, phân đoạn đữ liệ u (p artitio n in g ).
1. Kẻ hoạch thực hỉện
Đ ể lập k ế hoạch ch iế n lược có tính thực th i c a o , k h i thiết k ế kiế n trúc phần cứng và m ôi trường cho kho dữ liệ u , chúng ta phải quan tâm tới một sổ vấn đề:
- K h ả o sát m ôi trường kiến trúc k ỷ thuật thực hiện kh o dữ liệu - C h u ẩn bị k ế hoạch có tính k h ả thi củ a trong m ô i trường hiện tại
- T à i liệ u giao đ iện kh o dữ liệ u đã tồn tạ i, v à tài liê u g iao diện kh o đữ liệ u yêu cẩu .
- T à i liệ u hộ thống tác nghiệp m à kho đ ữ liệu yêu cầu . - C h iế n lược dự phòng và k h ô i phục.
- C h iế n lược kiể m soát, đảm bảo an ninh.
- T ạ o k iế n trúc dữ liệ u củ a k h o đữ liệu - ước iượng, đánh giá rủ ro.
2. Môi trường thực hiện (vừa tập trung vừa phân tán)
K h i thiết k ế kho dữ liệ u ợ m ức vật lý , chúng ta phải quan tâm c á c yếu tố trong cấu trú c củ a tổ chức sẽ q u yế t định m ôi trường thực th i củ a k h o dữ ỉiệ u đó là:
Cấu trúc v ề m ặt đ ịa lý v à cấu trúc về m ặt báo cáo c ủ a tổ c h ứ c , c á c cấu trúc n ày x á c định nguổn dữ liệu và n ơ i chúng được sử dụng. K h o đữ liệ u c ó thể được thực hiện trên các m ôi trường: tập trung, phân tán, và hỗn hợp,
T h iế t k ế lo g ic c ủ a kiế n trú c dữ liệu ba tầng đưa chú ng ta đến m ột tập m ểm dẻo và m ạnh m ẽ các lựa chọn c h o thiết k ế vật lý c ủ a kho d ữ liệ u . C á c lự a chọn này
bao gổm từ việ c thiết k ế dựa trên sự thực hiện tập truníỉ hóa cho đến sự tiếp cận phân tán h ay hỏn hợp.
. OLAP System
5 H
H ìn h số 13: M ò i trường vừa táp trung vừ a phân tán
T ù y ih u ộ c vào cấu trúc về m ật đ ịa ỉý và cấu trúc về m ật báo cáo của tổ chức m à lự a chọn m ỏi trường thực thi kh o dữ liệu tập trung, phàn tán h a y hỗn hợp. T ììồ n g thường m ôi trường hỗn hợp được sử dụng như một g iả i pháp điểu h òa, nó phát h uy hỗ trợ cho nhau củ a h a i m ô h ìn h . V à được hình thành từ thực tế:
C ó rất nhiều nguổn dữ liệu ờ nhiều v ị tr í đ ịa lý khác nhau (phân tán ),
K h o dữ liệ u nghiệp vụ ( D B W ) nẻn được tập trung hóa cao độ v ì đ ây là nơi tập trung đ a phần dữ liệu và năng lực x ử lý . M ộ t trong những yếu tố quan trọng nhất nhưng thường ít được b iết đến, trong quyết đ ịnh n ày là sự thừa nhận rằng tầng D L điều hòa n ày đòi hỏi sự kiểm soát và quản lý m ộỉ cẩ ch nghiêm ngặt. Sự toàn vẹn đữ liệ u c h ỉ được đảm bảo kh i đữ liệu nhập vùo B D W được thẩm định k ỹ lưỡng. C ò n m ặt an ninh chặt ch ẽ v ì B D W là tài sản thòng tin toàn điện nhất của tổ chứ c.
59
D ữ liệu dần xu ấ t ( B I W ) tổn tại ở rất nhiểu n ơ i, nhiều cấp : công ty , phòng ban, cá nhân tương ứng với nhu cầu tru y cập cục bộ và quản lý d ữ ỉiệu của người dùng.
3 . L ự a ch ọ n h ạ tầ n g
Sự lựa chọn kiến trúc phần cứng là điểu kiện hạ tầng (in fra stru ctu re ) có tính chất sống còn (c r it ic a l) cho v iệ c thực hiện thành công kh o dữ liệ u . K h o đữ liệu yêu cầu phần cứng phải đủ m ạnh (ro b u st) và các khả năng: ốẩn sàng (a v a ila b le ), tin cậy (re lia b le ), m ềm dẻo (fle x ib le ), m ờ rộng (e x te n sib le ), cân bằng (s c a la b le ), v à hỗ trợ (supportable), kh ô i phục (re co vera b le) và c h ạ y song song (p a ra lle l).
Ngoài ra cẩn phải tính đến đội ngũ làm tin học ( I T team ), quàn trị dữ liệ u củ a hệ thống tác nghiệp, Nlhững chu yên g ia có k in h nghiệm thực hiện v à d uy trì c á c hệ thống hiện tạ i, có kh ả năng cung cấp các thông tin hữu đụng về các hệ thống hiện tại. Đ ảm bảo m ôi trường m ạng thục thi c á c tiến trìn h trích ch ọ n , chu yển đổi và chu yển tải dữ liệ u ( E T T ) .
60
C hương m có tiêu dề ’‘T h iế t kế kho dữ liệ u ” , nộị dung chương này trình bày các bước x á c định để thiết k ế mô hình nghiệp vụ , mô hình lo g ic , và m ỏ hình vật lý cùa K h o dữ liệ u .
Xác định mô hình nghiệp vụ.
T ro n g pha đầu tiên, m ô hình nghiệp vụ , bao gồm ít nhất b a phần ỉiên quan chặt chẽ tới nhau: phân tích ch iến lư ợ c, tạo mô hình nghiệp v ụ , tạo siêu dữ liệu .
Phân tích ch iế n lược (S trateg ic A n a ly s is ):
Đ ư ợ c thực hiện ở m ức doanh nghiệp, phân tích chiến lược tìm ra c á c quá trình nghiệp vụ c h ín h (m a jo r) h ay vùng chủ đề, chúng đóng v a i trò quan trọng trên phạm v i toàn tổ ch ứ c. C á c tiến trình nghiệp vụ ch ín h đự kiế n được thực hiện trong kho đữ liệu .
T ạ o mô h ìn h nghiệp vụ (B u sin e ss M odel C rea tio n )
M ô h ìn h nghiệp vụ được tạo ra từ các yêu cầu nghiệp vụ c h í tiết* quá trình nghiệp vụ trên những nguồn đ ữ ỉiệ u sẵn có để hỗ trợ phân tích yêu cầu nghiệp v ụ
T ạ o siêu dữ liệ u (M etadata C reatio n )
S iêu dữ liệ u được tạo ngay trong pha đẩu tiên củ a quá trìn h thiết kế , kết quả củ a mô hình nghiệp vụ được thể h iện trên các công cụ siêu dữ ĩiệ u và đây ỉà nguồn chủ yếu c h o các pha thiết k ế tiếp theo.
C ũ n g trong phần n ày, trìn h b à y c á c c h ỉ đẫn k ỹ thuật phỏng v á h , phân tích và rút ra mô h ìn h nghiệp vụ ,
Xác định mô hình logic
C ó nhiều phương pháp x á c đ ịnh m ô h ìn h lo g ic, nhưng phổ biến nhất vẫn là sừ dụng theo hướng m ô h ìn h thực thể liê n kết (e n tũ y-rela tio n sh ip ). M ô hình E R có đặc đ iểm : cá ch tiếp cận từ dưới lên (B o tto m -u p ), thiết k ế cho c á c hệ thống giao đ ịch và thường tuân theo chu ẩn ba (3 N F ).