Vì thế hệ thống quản trị thông minh cho doanh nghiệp là giải pháp toàn diện giúp tổ chức chuẩn hóa hệ thống cơ sở dữ liệu quan hệ ở tầng ứng dụng trên nhiều nền tảng, tích hợp dữ liệu và
Trang 1Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Ngô Thế Anh Hào
GIẢI PHÁP HỖ TRỢ BÁO CÁO
TRONG HỆ THỐNG BI
LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH
Thái Nguyên - 2012
Trang 2Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
Ngô Thế Anh Hào
GIẢI PHÁP HỖ TRỢ BÁO CÁO
Trang 3Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn chân thành tới Trường Đại học Công nghệ thông tin
và truyền thông – Đại học Thái Nguyên, Viện Công nghệ Thông tin thuộc Viện Khoa học và Công nghệ Việt Nam, nơi các thầy, các cô đã tận tình truyền đạt các kiến thức quý báu cho tôi trong suốt quá trình học tập Xin cảm ơn Ban chủ nhiệm khoa và các cán bộ khoa đã tạo điều kiện tốt nhất cho tôi học tập và hoàn thành đề tài tốt nghiệp của mình
Đặc biệt, tôi xin gửi lời cảm ơn tới TS Hoàng Đỗ Thanh Tùng, thầy đã tận tình chỉ bảo tôi trong suốt quá trình thực hiện luận văn tốt nghiệp
Tôi xin bày tỏ lòng biết ơn tới gia đình, bạn bè, đồng nghiệp và những người thân đã động viên khích lệ tinh thần và giúp đỡ tôi hoàn thành luận văn này
Thái Nguyên, ngày 10 tháng 10 năm 2012
Ngô Thế Anh Hào
Trang 4Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này do tôi tự tìm hiểu và tổng hợp từ nhiều nguồn tài liệu khác nhau Luận văn tốt nghiệp là kết quả của quá trình học tập,
và thực hiện hoàn toàn nghiêm túc, trung thực của bản thân Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích dẫn hợp pháp
Phần mã nguồn của chương trình do tôi thiết kế và xây dựng, trong đó
có sử dụng một số thư viện chuẩn và các thuật toán được các tác giả xuất bản công khai và miễn phí trên mạng Internet
Tôi xin hoàn toàn chịu trách nhiệm về nội dung và sự trung thực trong luận văn tốt nghiệp Thạc sĩ của mình
Người cam đoan
Ngô Thế Anh Hào
Trang 5Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỤC LỤC
MỤC LỤC i
DANH MỤC CÁC TỪ VIẾT TẮT iii
DANH MỤC CÁC BẢNG iv
DANH MỤC CÁC HÌNH v
MỞ ĐẦU 1
CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG BI 2
1.1 BI nhu cầu và thực trạng 2
1.2 Khảo sát hệ thống BI triển khai ở Việt Nam 5
1.3 Lịch sử và xu hướng phát triển của BI 7
1.4 BI và các vấn đề trọng tâm 13
CHƯƠNG 2 CÔNG NGHỆ VÀ BÁO CÁO CHO HỆ THỐNG BI 17
2.1 Nền tảng công nghệ cho BI 17
2.2 Data Warehouse cho BI 20
2.3 An ninh và Internet với BI 24
2.4 Giải pháp thúc đẩy phát triển BI thời gian thực 27
2.4.1 Hiệu quả hoạt động đáp ứng thời gian thực 27
2.4.2 Kiến trúc và công nghệ của RTBI 28
2.5 Tổ chức các dạng báo cáo trong hệ thống BI 33
CHƯƠNG 3 CÀI ĐẶT VÀ TRIỂN KHAI THUẬT TOÁN TRUY VẤN LIÊN TỤC HỖ TRỢ CHO BÁO CÁO TRONG HỆ THỐNG BI 40
3.1 Thuật toán truy vấn liên tục hỗ trợ báo cáo trong hệ thống BI 40
3.1.1 Động cơ thúc đẩy 40
3.1.2 Tìm hiểu luồng dữ liệu và báo cáo liên tục 41
3.1.3 Thuật toán truy vấn liên tục 42
3.1.4 Các tình huống xử lý truy vấn 46
3.1.5 Ý tưởng của đề tài 46
3.2 Microsoft StreamInsight và báo cáo trong BI 48
3.2.1 Mục tiêu và lợi ích của StreamInsight với báo cáo BI 49
Trang 63.2.2 Mô tả cấu trúc dữ liệu trong StreamInsight 51
3.2.3 Thành phần hoạt động của máy chủ StreamInsight 55
3.3 Cài đặt và thử nghiệm báo cáo Dashboard với StreamInsight 59
3.3.1 Cấu trúc của chương trình 59
3.3.2 Cấu trúc và giao diện báo cáo 60
3.3.3 Kết quả thử nghiệm 62
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 65
TÀI LIỆU THAM KHẢO 66
Trang 7DANH MỤC CÁC TỪ VIẾT TẮT
BAM Bacteriological Analytical Manual CEP Centre for Economic Performance CRM Customer relationship management
ERP Enterprise resource planning
SDK Software Development Kits
Trang 8DANH MỤC CÁC BẢNG
Bảng 3.1: Cấu trúc sự kiện Insert 53
Bảng 3.2: Sự kiện khoảng thời gian 54
Bảng 3.3: Mô hình điểm sự kiện 54
Bảng 3.4: Sự kiện cạnh 55
Trang 9DANH MỤC CÁC HÌNH
Hình 1.1: Truyền thông giữa hệ thống giao dịch và ứng dụng phân tích 8
Hình 1.2: Mô hình phát triển của BI 9
Hình 2.1: Nền tảng công nghệ BI 17
Hình 2.2: Mô hình BI đơn giản 20
Hình 2.3: Data Warehouse trong mô hình BI 23
Hình 2.4: Tầm nhìn cho RTBI 29
Hình 2.5: Ba lớp RTBI 30
Hình 2.6: Các lớp báo cáo của BI 33
Hình 2.7: Ví dụ báo cáo tĩnh - Doanh thu theo khách hàng 34
Hình 2.8: Ví dụ báo cáo động 35
Hình 2.9: Ví dụ dạng báo cáo Drill-down 36
Hinh 2.10: Ví dụ dạng báo cáo drill-through 36
Hình 2.11: Ví dụ của báo cáo Dashboard 37
Hình 2.12: Ví dụ dạng báo cáo Ad-hoc Dashboard 38
Hình 3.1: Báo cáo thời gian thực của Google Analystic 40
Hình 3.2: Kiến trúc truy vấn liên tục trong luồng dữ liệu 43
Hình 3.3: Mô hình kiến trúc xử lý truy vấn liên tục 44
Hình 3.4: Kiến trúc tạo báo cáo BI sử dụng thuật toán truy vấn liên tục 47
Hình 3.5: Nền tảng ứng dụng StreamInsight 48
Hình 3.6: Truy vấn ràng buộc 59
Hình 3.7: Cấu trúc chương trình 60
Hình 3.8: Lớp dự án DataPublisher 60
Hình 3.9: Lớp dự án WebOutputAdapter 61
Hình 3.10: Lớp dự án EventReceiver.WinUI 61
Hình 3.11: Mẫu báo cáo Dashboard 62
Hình 3.12: Báo cáo theo dòng 63
Hình 3.13: Báo cáo Dashboard qua biểu đồ 63
Trang 10Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên http://www.lrc-tnu.edu.vn
MỞ ĐẦU
BI (Business Intelligence) đã được sử dụng rộng rãi trên thế giới, đặc biệt là ở châu Âu từ nhiều năm nay Ở Việt Nam hiện nay vẫn còn đang ở dạng sơ khai, mặc dù thị trường này cũng đã có sự góp mặt của nhiều “đại gia” như Microsoft, Oracle, Cognos, Business Objects, Sap nhưng các tổ chức doanh nghiệp tại Việt Nam vẫn đang trong giai đoạn chuẩn hóa hệ thống thông tin, bao gồm nhiều vấn đề dưới nhiều góc độ khác nhau trong hệ thống quản trị tổ chức Vì thế hệ thống quản trị thông minh cho doanh nghiệp là giải pháp toàn diện giúp tổ chức chuẩn hóa hệ thống cơ sở dữ liệu quan hệ ở tầng ứng dụng trên nhiều nền tảng, tích hợp dữ liệu vào Data Warehouse, phân tích
và tích hợp tri thức nghiệp vụ để khai thác thông tin kinh doanh, thể hiện trên
hệ thống báo cáo đa tương tác, nhằm giúp đội ngũ nhân viên kinh doanh, ban giám đốc có thể tính chính xác, kịp thời khai thác và quyết đoán, tập hợp và phân tích thông tin khách hàng hiệu quả, ra quyết định và triển khai các giải pháp kinh doanh kịp thời, hỗ trợ nâng cao tầm nhìn của nhà quản trị cả về bề rộng và chiều sâu trong môi trường kinh doanh đầy cạnh tranh ngày nay Trong thời đại thông tin bùng nổ, thông tin có nhiều vô số, thị trường cạnh tranh khốc liệt, các đối thủ cạnh tranh nhau ở từng sản phẩm, từng khách hàng Vấn đề sống còn ở đây không những đưa ra được giai đoạn hợp lý mà còn phải kịp thời và tốn ít thời gian, nguồn lực và chi phí Tuy nhiên giải pháp
xử lý luồng dữ liệu liên tục cũng như giải pháp dành cho báo cáo thời gian thực trong kinh doanh chưa được nghiên cứu nhiều ở Việt Nam Đó cũng là lý
do mà tôi chọn đề tài “Giải pháp hỗ trợ báo cáo trong hệ thống BI ” với hi vọng góp phần nâng cao khả năng cạnh tranh và phát triển mạnh mẽ, bền vững hơn cho các doanh nghiệp thương mại Việt Nam
Trang 11CHƯƠNG 1 TỔNG QUAN VỀ HỆ THỐNG BI 1.1 BI nhu cầu và thực trạng
Thông thường, khi ban lãnh đạo của tổ chức cần các thông tin để thống
kê, phân tích đưa ra những quyết định trong quản lý doanh nghiệp của mình, phương pháp truyền thống là họ sẽ yêu cầu các bộ phận hỗ trợ (thường là các phòng, ban tài chính) để đưa ra các báo cáo Công việc này thường sẽ mất rất nhiều thời gian để tạo lập báo cáo, đôi khi các số liệu được cung cấp cũng chỉ
có tính chất tin tưởng một cách tương đối bởi lẽ, công việc này hầu như được làm một cách thủ công với sự hỗ trợ của các công cụ tin học văn phòng Thế nhưng các tổ chức lại đang hoạt động trong thời đại bùng nổ thông tin, thông tin có nhiều vô số, thị trường cạnh tranh khốc liệt, các đối thủ cạnh tranh nhau
ở từng sản phẩm, từng khách hàng Vấn đề sống còn trong kinh doanh ở đây không những đưa ra được chiến lược hợp lý cho từng giai đoạn mà còn phải kịp thời, không tốn quá nhiều thời gian, nguồn lực và chi phí
Trong hoàn cảnh đó hệ thống Business Inteligence (BI) được ra đời như một sự đáp ứng lại kỳ vọng của các tổ chức, trong thực tế hệ thống BI cũng đã thể hiện được tầm quan trọng trong các ứng dụng để nâng cao tầm nhìn của nhà quản trị cả về bề rộng và chiều sâu Tính chính xác, quyết đoán và kịp thời là một kết quả rõ nhất mà hệ thống BI cung cấp Doanh nghiệp sẽ dễ dàng có được ngay lập tức các thông tin phân tích quản lý, để trả lời các câu hỏi như: “Đối tượng khách hàng tiềm năng nhất hiện nay là ai?” hoặc “Thị trường nào đang mang lại lợi nhuận cao nhất?” hoặc “Doanh thu của ngày hôm qua được bao nhiêu tiền?”, …
BI (có thể hiểu là giải pháp quản trị doanh nghiệp thông minh) là một hệ thống báo cáo cho phép tổ chức khai thác dữ liệu từ nhiều nguồn khác nhau
về khách hàng, thị trường, nhà cung cấp, đối tác, nhân sự, và phân tích/sử dụng các dữ liệu đó thành các nguồn thông tin có ý nghĩa nhằm hỗ trợ việc ra
Trang 12quyết định Thông thường cấu trúc một bộ giải pháp BI đầy đủ gồm một kho
dữ liệu tổng hợp (datawarehouse) và các bộ báo cáo, bộ chỉ tiêu quản lý hiệu năng (Key Perfomance Indicators – KPIs), các dự báo và phân tích giả lập (Balance Scorecards, Simulation and Forecasting, )
Xét về mặt công nghệ, BI được tạm định nghĩa là “Một hệ thống cho phép tổ chức sử dụng dữ liệu từ nhiều nguồn khác nhau để thu được thông tin
và các phân tích có ý nghĩa về khách hàng, thị trường, đối tác, nhà cung cấp, nhân sự, … từ đó có tác động hiệu quả cho việc đưa ra quyết định” [5]
Khi được khai thác hiệu quả, BI giúp doanh nghiệp có những điều chỉnh phù hợp, nhanh chóng với những thay đổi trong kinh doanh thực, bên cạnh
đó, giúp nâng cao sự kết dính trong hoạt động giữa các phòng, ban của doanh nghiệp Khi có được những thông tin từ khách hàng một cách nhanh chóng, doanh nghiệp sẽ có cơ hội nâng cao lợi thế cạnh tranh của mình so với các đối thủ, tuy nhiên, doanh nghiệp cần phải đảm bảo về độ “sạch”, độ hoàn hảo của những dữ liệu thu thập được Chính độ “sạch”, độ hoàn hảo của dữ liệu sẽ quyết định đến mức độ chính xác, mức độ thành công của doanh nghiệp trong việc đưa ra các quyết định kinh doanh, dự đoán xu hướng thị trường, nhờ đó nâng cao, cải tiến sản phẩm, chất lượng dịch vụ để phục vụ khách hàng tốt hơn Bên cạnh đó, doanh nghiệp cũng cần phải chú ý đến yếu tố thời gian trong quá trình khai thác thông tin khách hàng cũng như thăm dò đối thủ, mọi
sự chậm trễ có thể làm giảm khả năng cạnh tranh của doanh nghiệp Với tính chất là một hệ thống khai thác thông tin cho doanh nghiệp, BI còn là một trong những lý do khiến cho trung tâm liên lạc của doanh nghiệp, từ chỗ là một trung tâm chủ yếu nhận và trả lời các cuộc điện thoại của khách hàng, nay đã phát triển thành một trung tâm thông tin đa kênh, tức là khai thác thông tin của khách hàng từ nhiều kênh thông tin đa dạng, chẳng hạn như Internet, Web chat Những thông tin này sẽ được chia sẻ tới nhiều bộ phận
Trang 13trong doanh nghiệp Chính vì vậy, doanh nghiệp sẽ luôn đảm bảo được phương châm kinh doanh “lấy khách hàng làm trọng tâm” của mình
Các lợi ích chính giữ vai trò thúc đẩy mà một hệ thống BI mang lại cho
tổ chức / doanh nghiệp bao gồm:
- Thu thập thông tin từ nhiều nguồn một cách nhanh chóng, chính xác và chuyển những dữ liệu thô thành các số liệu trực quan, các thông tin giá trị;
- Hỗ trợ hiệu quả các hoạt động quản lý thông qua việc đánh giá các hoạt động của khách hàng, xu hướng thị trường, các chuỗi hoạt động hiệu quả và
Với những giá trị to lớn có thể mang lại cho doanh nghiệp như nêu trên, thị trường BI trên thế giới trong những năm gần đây đang rất sôi động và đã
có nhiều tiến bộ, luôn đứng trong nhóm những công nghệ ưu tiên của năm BI đang trở nên đơn giản hơn, dễ sử dụng hơn cho các doanh nghiệp “Năm
2011, theo đánh giá của Gartner, thị trường các trang thiết bị BI của thế giới
đã tăng trưởng 10% và đạt tới 10,8 tỷ USD (~220.408 tỷ đồng) Các nhà phân tích lưu ý rằng, thị trường BI đang phát triển năng động với sự khai phá công nghệ của các nhà phát triển phần mềm độc lập như TIBCO, Sportfire và QlikTech Các đối thủ chính của thị trường BI đang đáp lại sự bành trướng
Trang 14của các nhà sản xuất thiết bị khai thác dữ liệu bằng việc đưa ra các giải pháp
dễ sử dụng Chẳng hạn, đó là các hãng Microsoft PowerPivot, SAP BusinessObject Explorer, IBM Cognos Express và Information Builders WebFocus Visual Discovery ” [8]
1.2 Khảo sát hệ thống BI triển khai ở Việt Nam
Trong những lĩnh vực kinh doanh có tính cạnh tranh cao, hàng hoá luôn
đi kèm với dịch vụ hoàn hảo, BI thực sự đem lại những thông tin có giá trị, luôn cập nhật, phù hợp cho hoạt động của doanh nghiệp mà lại không mất quá nhiều chi phí Các doanh nghiệp có thể sử dụng BI như một trung tâm khai thác thông tin doanh nghiệp (Business intelligence center) nhằm thu thập thông tin từ khách hàng, từ đó triển khai những phương thức kinh doanh, như cách thức tiếp thị, phong cách phục vụ, … phù hợp với các đối tượng khác nhau Như vậy doanh nghiệp có thể tăng doanh số bán hàng, lòng tin của khách hàng và quan trọng hơn là củng cố, nâng cao hiệu quả kinh doanh
BI cần cho mọi tổ chức có nhu cầu tích hợp dữ liệu và phân tích thông tin Đối với nhà quản lý, đây là hệ thống phân tích hoạt động doanh nghiệp chính xác và toàn diện nhất do thông tin được tổng hợp từ nhiều nguồn trong doanh nghiệp Trong nhiều trường hợp, nếu không sử dụng BI, tổ chức/doanh nghiệp sẽ không có được kết quả ngay, thậm chí có thể tốn kém một khoản chi phí cho việc khảo sát, nghiên cứu, tìm tòi mới có được kết quả Với BI, doanh nghiệp dễ dàng có ngay thông tin phân tích quản lý, để trả lời các câu hỏi như: “Khách hàng quan trọng nhất của doanh nghiệp hiện nay là ai?”;
“Thị trường nào đang mang lại tỷ trọng lợi nhuận chính?”, …
Ở Việt Nam, các tổ chức/doanh nghiệp đang trong giai đoạn chuẩn hóa
hệ thống thông tin Hầu hết các tổ chức, doanh nghiệp rơi vào tình trạng bùng
nổ dữ liệu các hệ thống dữ liệu của tổ chức bị manh mún, phân tán và không quản lí được nên BI có thể là giải pháp toàn diện giúp tổ chức/doanh nghiệp
Trang 15chuẩn hóa hệ thống cơ sở dữ liệu quan hệ ở tầng ứng dụng trên nhiều nền tảng khác nhau, tích hợp dữ liệu vào DataWarehouse kết hợp với phân tích và tích hợp tri thức nghiệp vụ để khai thác thông tin kinh doanh, thể hiện trên hệ thống báo cáo đa tương tác
Đứng trên quan điểm triển khai, BI có thể triển khai trên những dữ liệu phi cấu trúc được tồn tại ở nhiều loại như tờ trình, báo cáo tổng kết của một
cá nhân, một bộ phận, các email chào hàng hay phản hồi của khách hàng, … tích hợp chúng lại và gộp với dữ liệu có cấu trúc để phân tích Đây là khả năng có thể đứng độc lập của BI, mà một số doanh nghiệp vừa và nhỏ, những doanh nghiệp chưa có điều kiện sử dụng hệ thống ERP ở Việt Nam đang áp dụng Họ chỉ sử dụng Excel, Access và công cụ của Microsoft đã có thể thỏa mãn nhu cầu phân tích cho giải pháp BI tối ưu
Với các doanh nghiệp đã triển khai ERP và các hệ thống quản lý thông tin tác nghiệp đặc thù như ngân hàng, bảo hiểm, bệnh viện, chứng khoán… thì
BI sẽ tự động móc nối vào các hệ quản lý tác nghiệp nói trên để tự động thống
kê, phân tích, báo cáo phục vụ quá trình quản lý và ra quyết định tức thời
BI vừa là đầu ra cuối cùng của hệ thống ERP, CRM, … vừa là đầu vào cho chính các hệ thống này Vì nếu xây dựng doanh nghiệp từ các kết quả đánh giá của BI, tức là từ các chỉ số đánh giá hiệu năng doanh nghiệp thì doanh nghiệp sẽ có thông tin đầu vào phản ánh chính xác kết quả đầu ra đó Khi một doanh nghiệp ứng dụng ERP thì việc áp dụng BI là phần nên phát triển và tận dụng Điều đó sẽ giúp tổ chức hoàn thiện hệ thống ứng dụng công nghệ thông tin của mình, thúc đẩy phát triển và nâng cao khả năng cạnh tranh Thị trường cung cấp giải pháp BI ở Việt Nam còn khá sơ khai nhưng cũng đã quy tụ khá nhiều tên tuổi như: Business Objects, Cognos, Hyperion, SAP, Oracle và gần đây, Microsoft cũng đã tham gia vào thị trường của giải pháp BI [7], Mỗi giải pháp đều có sự khác nhau về tính năng, khả năng
Trang 16tích hợp, phân tích và xử lý thông tin Nhiều doanh nghiệp quan tâm tới các giải pháp BI nhưng chưa hiểu thấu đáo về chúng nên đây là một lĩnh vực rất triển vọng trong tương lai
có kiến trúc, cấu trúc và logic cứng
Giai đoạn thứ hai là thời điểm khi các ứng dụng phân tích xuất hiện Các ứng dụng sẽ cung cấp thông tin phân tích về hoạt động của tổ chức Chúng phỏng theo mô hình kinh doanh của doanh nghiệp, mô hình hoạt động của tổ chức, trả lời các vấn đề về kinh doanh, thiết kế tối ưu hóa các truy vấn và trả lời truy vấn của người sử dụng [6]
Kinh doanh thông minh đề cập đến công nghệ, ứng dụng và thực tiễn của việc thu thập, tích hợp, phân tích và trình bày thông tin kinh doanh Kinh doanh thông minh sử dụng các chỉ số hiệu suất (KPIs) để đánh giá hiện trạng của doanh nghiệp và quyết định kế hoạch hoạt động Ví dụ về các KPIS như: Doanh số bán hàng, doanh số hàng tồn kho,… Trước khi máy tính và các ứng dụng web được áp dụng rộng rãi, thông tin được nhập và tính toán thủ công,
dữ liệu thường được khai thác trong thời gian ngắn Khi máy tính được sử dụng rộng rãi hơn, hệ thống giao dịch và hệ thống phân tích phát triển mạnh Theo cách tiếp cận truyền thống, các thông tin liên lạc giữa hai loại hệ thống (hệ thống giao dịch và hệ thống phân tích) theo một hướng, bởi vì hệ thống phân tích được đồng bộ hóa với dữ liệu từ các hệ thống giao dịch Hệ thống phân tích cung cấp thông tin phản hồi về các quy trình kinh doanh và giúp
Trang 17đưa ra các quyết định trong quản lý nhưng chúng có hạn chế lớn là chúng không thay đổi hoặc tác động đến các hệ thống giao dịch
Giai đoạn thứ ba: Môi trường kinh doanh cạnh tranh và rất năng động gây áp lực cho các doanh nghiệp Để thành công, các công ty buộc phải phản ứng nhanh hơn để thay đổi điều kiện kinh doanh và đáp ứng yêu cầu của khách hàng Điều này làm phát sinh nhu cầu các hệ thống phân tích phải ảnh hưởng đến hệ thống hoạt động Thời điểm này thị trường sinh ra nhiều hoạt động BI Hoạt động BI cho phép giao tiếp hai chiều giữa các hệ thống hoạt động và các ứng dụng phân tích Các thông tin và kiến thức thu được từ hệ thống phân tích được sử dụng cho việc ra quyết định, cải thiện các quá trình kinh doanh và thích ứng với các hệ thống hoạt động để đáp ứng tốt hơn với điều kiện thay đổi trên thị trường [6]
Quá trình phát triển của BI được thể hiện qua mô hình 1.2
Ứng dụng phân tích
Hệ thống giao dịch
Cách tiếp cận truyền thống Cách tiếp cận mới
Hệ thống giao dịch Ứng dụng phân tích
Hình 1.1: Truyền thông giữa hệ thống giao dịch và ứng dụng phân tích
Trang 18Mô hình này dựa trên các khái niệm về độ trễ: là khoảng thời gian giữa các thời điểm của một sự kiện và thời điểm của sự kiện hiển thị
+ Đường màu đỏ trong mô hình hiển thị quá trình làm mới dữ liệu
+ Độ trễ dữ liệu: Khoảng thời gian cần thiết để thu thập các dữ liệu từ các hệ thống nguồn cấp dữ liệu, chuẩn bị để phân tích và lưu nó vào kho dữ liệu hoặc trung tâm dữ liệu, báo cáo thời gian thực, hoặc ra quyết định
Làm bằng tay
Thói quen Quyết định độ trễ
Mô hình trưởng thành của BI – Báo cáo
Sơ Khai Thời kì
đầu
Thời kì thứ 3
Thời kỳ thứ 4
Thời kỳ thứ 5 Hoàn thiện
Truy vấn đặc biệt
Bảng tính
Làm bằng tay
Tham số hóa báo cáo Olap
Hàng loạt ETL
điều khiển điểm
Phân tích trực quan
Hàng loạt CDC
Dự báo
kế hoạch,
mô hình
Đoán trước mô hình
Theo yêu cầu (EII)
Báo cáo diện rộng
Mô hình thời gian thực
Tổ chức điều khiển
Hình 1.2: Mô hình phát triển của BI
Trang 19Trong mô hình Eckerson Wayne, kinh doanh truyền thống tương ứng với thời kỳ sơ khai, thời kỳ đầu, thời kỳ 3 Đây là những giai đoạn đặc trưng bởi
độ trễ cao trong quá trình ra quyết định và làm mới dữ liệu thấp
Thời kỳ 4 và thời kỳ 5 tương ứng với hoạt động kinh doanh thông minh Những giai đoạn được đặc trưng bởi độ trễ trong quá trình ra quyết định thấp
và tần suất làm tươi dữ liệu cao
- Tình hình hiện nay:
Một thời gian dài, giải pháp BI được định hướng chủ yếu vào phục vụ các tổ chức lớn có đủ nguồn lực tài chính và con người thực việc phân tích dữ liệu một cách có hệ thống Chỉ có những phân tích viên và các nhà quản lý cấp cao mới tiếp cận được hệ thống này
Gần đây, đã xuất hiện các giải pháp định hướng đến người dùng doanh nghiệp, đặc biệt là các nhà quản lý trung và cao cấp Nhờ những giải pháp này
mà họ đã có được các công cụ cho phép tự nhận báo cáo không cần qua các phân tích viên hay chuyên gia công nghệ thông tin Họ tự do lựa chọn các báo cáo, kể cả cách trình bày các báo cáo đó (theo đồ thị, biểu đồ, )
Khảo sát của Gartner trong ba năm trở lại đây cho thấy giải pháp BI luôn đứng đầu trong thứ tự ưu tiên về nhu cầu đầu tư công nghệ của doanh nghiệp Trải qua hai mươi năm phát triển, ngày nay hệ thống BI đã dần trở nên hoàn thiện và có xu hướng đáp ứng bốn nhu cầu quan trọng mà người quản trị luôn mong đợi đó là [7]:
Data Warehouse - Khai thác dữ liệu tập trung
Analysis -Báo cáo phân tích cao cấp
Monitoring - Giám sát và cảnh báo tự động
Planning and Forecasting - Dự đoán và lên kế hoạch
Bên cạnh đó, diện ứng dụng của BI cũng thường xuyên được mở rộng sang nhiều lĩnh vực như hỗ trợ việc ra quyết định chiến lược, phân tích hoạt
Trang 20động kinh doanh và quản lý hiệu suất, phân tích quản lý quan hệ khách hàng (trước hết dùng cho khối ngân hàng thương mại và các đơn vị bán lẻ), quản lý rủi ro trong kinh doanh (chủ yếu trong mảng tài chính), phân tích thông tin doanh nghiệp trên các mạng xã hội, BI di động, nhúng các hệ thống BI vào các trung tâm xử lý tình huống v.v
Những giải pháp BI hiện đại ngày càng hướng đến đáp ứng nhu cầu sử dụng đại trà trong việc phân tích tác nghiệp, phục vụ lãnh đạo và chuyên gia ở nhiều cấp độ khác nhau Đặc điểm chính của những giải pháp này là dễ sử dụng, có nhiều chức năng hướng tới các ứng dụng kinh doanh cụ thể cùng khả năng triển khai trên cả máy tính có cấu hình phổ thông
- Xu thế BI tương lai:
Khuynh hướng phát triển các hệ thống BI phần lớn được xác định không chỉ bởi nhu cầu của các doanh nghiệp đặt hàng mà còn ở khả năng của kiến trúc điện toán mà các hệ thống BI xây dựng trên đó Trong vòng mười năm gần đây, các nhà phát triển BI đã cố gắng nối kết chúng với những đổi mới về công nghệ và kiến trúc, từ SOA, kiến trúc cổng thông tin và công nghệ ảo hoá, các giải pháp di động, Nay các nhà sản xuất hệ thống BI đang cố gắng tích hợp chúng vào môi trường và kiến trúc đám mây Tuy nhiên, những giải pháp đó sẽ chiếm vị trí nào trên “đám mây” thì mọi người chưa hình dung hết Hoạt động BI luôn đòi hỏi những lượng dữ liệu lớn nên việc truyền tải dữ liệu trên các “đám mây” sẽ khiến cho các nhà cung cấp dịch vụ gặp không ít khó khăn Tổ chức hoạt động của các ứng dụng điện toán đám mây dựa trên tính toán của bộ nhớ chính sẽ đơn giản hơn Chính SAP là công ty đang chuẩn bị phát hành phiên bản đám mây của sản phẩm HANA theo hướng này Trong bất kỳ trường hợp nào, có nhiều cơ sở để hy vọng rằng các hệ thống BI trên đám mây ít nhất cũng làm cho BI dễ tiếp cận hơn về chi phí, mở rộng đối tượng người dùng do kết nạp được nhóm doanh nghiệp vừa và nhỏ
Trang 21Có thể coi việc sử dụng tích cực năng lực tính toán trên bộ nhớ chính (in-memory) là phát hiện thành công của các nhà phát triển hệ thống BI Việc
xử lý dữ liệu trong bộ nhớ phân tích cho phép nâng cao năng suất của hệ thống BI rất nhiều, tới hàng trăm lần, nhờ giảm tối đa số lần kết nối với dữ liệu được triển khai trên các ổ cứng (việc trao đổi dữ liệu với các đĩa cứng chậm hơn rất nhiều so với trao đổi dữ liệu nằm trên bộ nhớ) Những giải pháp
BI như thế (không cần đến các đĩa lưu trữ dữ liệu) đang tỏ ra rẻ hơn nhiều lần
so với các hệ thống BI được xây dựng theo các sơ đồ cũ với kho lưu trữ dữ liệu Nhờ có tổng chi phí sở hữu thấp, làm cho chúng trở nên dễ tiếp cận hơn
và vì thế dễ triển khai đại trà hơn Việc triển khai BI dựa trên tính toán của bộ nhớ chính cho đến nay đã có trong sản phẩm của các hãng chính trên thị trường như IBM, Oracle, Microsoft, SAP
Sử dụng các cấu trúc công nghệ tổ hợp thiết bị - phần mềm đóng gói Ở những tổ hợp đó, phần cứng và phần mềm được thiết kế tối ưu cho mục tiêu
BI Theo số liệu của các nhà sản xuất những giải pháp này đảm bảo tốt hơn từ
10 - 20 lần so với các tổ hợp không tối ưu Dĩ nhiên, những hệ thống như thế
sẽ không rẻ nhưng ứng dụng chúng sẽ hợp lý hơn trong việc giải quyết hàng loạt nhiệm vụ phân tích đặc thù tại các tổ chức lớn Ví dụ cho giải pháp này là dòng sản phẩm Oracle Exadata
BI đang hướng tới đa dạng khách hàng Các giải pháp BI trước đây thường hướng vào các tổ chức doanh nghiệp nhưng gần đây đã có những định hướng đến các đối tượng khách hàng mới như đối tượng khách hàng di động, doanh nghiệp vừa và nhỏ Có lẽ thành công nhất trong lĩnh vực này đang thuộc về SAP Các hãng phần mềm khác trên thị trường cũng đang bắt tay vào tạo các giải pháp BI di động như thế
Trang 221.4 BI và các vấn đề trọng tâm
Khai thác dữ liệu tập trung: Khi doanh nghiệp hoạt động hiệu quả thì
việc mở rộng phạm vi trên nhiều tỉnh, thành hay nhiều quốc gia là nhu cầu tất yếu Song song với việc phát triển như thế, ban quản trị cũng vấp phải rất nhiều khó khăn trong quản lý Dữ liệu của công ty, tập đoàn nằm rải rác ở nhiều nơi và dưới nhiều hình thức khác nhau Do đó, bất cứ nhu cầu truy vấn, phân tích hay so sánh giữa các vùng với nhau đều tiêu tốn rất nhiều thời gian
và công sức Với Data Warehouse của BI, những dữ liệu quan trọng nằm rải rác nhiều nơi, dưới nhiều định dạng khác nhau của doanh nghiệp sẽ được trích xuất đều đặn và được tập hợp lại thành một cấu trúc thống nhất Qua đó, những báo cáo từ chi tiết đến tổng quát của toàn doanh nghiệp luôn đảm bảo được tính chính xác và kịp thời Data Warehouse đã được nhiều tập đoàn lớn nhìn nhận là một phần quan trọng trên bước đường toàn cầu hóa của họ
Báo cáo phân tích cao cấp: Một trong những nỗi sợ hãi lớn nhất của
quản trị doanh nghiệp là bị chìm ngập trong một rừng dữ liệu Sắp xếp quản
lý rừng dữ liệu đó đã là quá khó khăn nói chi đến việc khai thác giá trị từ đó Nhưng thực tế trong quá trình đưa ra quyết định vẫn luôn đòi hỏi những nhu cầu truy vấn phức tạp Hiện nay giải pháp báo cáo phân tích cao cấp của BI đã tương đối hoàn thiện với những tính năng nổi bật như:
- Đào sâu dữ liệu đến mức tối đa: Giúp ta có thể giải quyết những yêu
cầu phức tạp như “cung cấp thông tin về doanh thu và số lượng mặt hàng bán được của ba năm gần nhất, theo tất cả các vùng, ứng với tất cả các nhóm sản phẩm, từng sản phẩm và nhân viên thực hiện giao dịch” [5] Với những dạng câu hỏi như trên, người quản trị chỉ mất vài giây tương tác với hệ thống OLAP là đã có được câu trả lời
- Khả năng tùy biến chiều thông tin: Song song với tính năng đào sâu dữ
liệu là khả năng tùy chỉnh thứ tự của các chiều thông tin Ví dụ cũng với
Trang 23những chiều thông tin như yêu cầu trên ta có góc nhìn khác như cung cấp thông tin về doanh thu và số lượng mặt hàng bán được ứng với các nhân viên bán hàng của toàn bộ các vùng, trên tất cả các nhóm sản phẩm và từng sản phẩm trong 3 năm gần nhất
Giám sát và cảnh báo tự động: Để khẳng định tên tuổi của mình hơn
nữa trên thị phần BI, các nhà cung cấp giải pháp lớn như BusinessObjects, Cognos, Hyperion, liên tục đầu tư vào phần giao diện người dùng Các khái niệm về Dashboards - bảng điều khiển, Scorecards - bảng chỉ số, đã được
áp dụng vào quản lý doanh nghiệp Nhờ vào bảng điều khiển mà các chỉ số thể hiện tình trạng phát triển của công ty (KPIs) luôn được tự động tổng hợp
và cập nhật thường xuyên Ngoài chức năng cảnh báo tự động qua màu sắc, hình ảnh, hệ thống BI còn có chức năng tự động gửi email thông báo đến người có thẩm quyền, giúp người quản lý có được thông tin về những gì đang xảy ra trong hệ thống
BI thời gian thực: Hiệu suất báo cáo là một phần quan trọng khi kiểm
tra các công cụ BI Các mối quan tâm không chỉ làm thế nào nhanh chóng tác động tới bản ghi trong một cơ sở dữ liệu (được cập nhật hoặc lấy ra), mà thể hiện trong hai lĩnh vực chính là tốc độ lọc dữ liệu và cấu trúc lại sau khi một chu kỳ tính toán kết thúc và hiệu suất báo cáo cho người sử dụng
Tốc độ lọc dữ liệu và cấu trúc lại sau một chu kỳ tính toán được xác định bởi các chức năng trong quá trình kinh doanh Thực tế có nhiều yếu tố sẽ ảnh hưởng đến quá trình này trong doanh nghiệp và tốc độ thường ít bị giới hạn bởi công nghệ nhưng lại bị giới hạn bởi quá trình hoạt động trong tổ chức Hiệu suất báo cáo cho người sử dụng bị ảnh hưởng trực tiếp bởi công nghệ và các công cụ sử dụng trong tổ chức Hiệu suất cũng bị ảnh hưởng bởi
cơ chế truyền thông tin
Trang 24Trong BI thời gian thực, dữ liệu được phân tích và báo cáo ngay sau khi
nó đi vào tổ chức Thời gian thực có nghĩa là thông tin cung cấp trong một mili giây đến vài giây sau khi các sự kiện phát sinh Độ trễ về báo cáo sau khi phát sinh sự kiện trong trường hợp này giảm tối đa gần như bằng không Ví dụ: Người quản lý doanh nghiệp có thể theo dõi mức độ biến động chứng khoán để đảm bảo các chiến dịch tiếp thị trực tuyến sẽ không thất bại vì các tình huống chứng khoán không mong muốn Một hệ thống BI thời gian thực hoạt động dựa trên kho dữ liệu thời gian thực và liên tục cập nhật dữ liệu hoặc tăng chu kỳ cập nhật các dữ liệu thường xuyên hơn Những hệ thống này cập nhật dữ liệu có thể đạt được gần với thời gian thực, nơi mà độ trễ dữ liệu thường là trong khoảng vài giây
Dự đoán và lên kế hoạch: Trong môi trường thực tế, để tổng hợp được
một bảng kế hoạch cho quý tới, năm tới hay phương hướng của công ty trong nhiều năm tới sẽ rất phức tạp Hầu như các bảng kế hoạch và dự báo của doanh nghiệp đều phụ thuộc vào nhận định chủ quan của một số người có kinh nghiệm Tất cả những người quản lý chắc hẳn ai cũng muốn có được sự
hỗ trợ đáng tin cậy và mang tính khoa học nhằm giúp họ đưa ra được những
dự báo vững chắc hơn Nắm bắt nhu cầu này, các tên tuổi hàng đầu về hệ thống BI như: Business Objects, Cognos, SAP Business Intelligence, BI đều
hỗ trợ khá tốt khả năng dự báo và lên kế hoạch của doanh nghiệp Kết hợp với kinh nghiệm của người sử dụng, những bảng kế hoạch cho tương lai được tổng hợp khá nhanh và có độ chính xác cao Ngoài hai tính năng trên, hệ thống BI còn giúp cho người sử dụng khả năng phân tích và giả định Chức năng này giúp cho người sử dụng có thể giả lập một số biến cố, qua đó đánh giá được xu thế thay đổi của các chỉ số KPIs mà họ quan tâm
Tuy là một giải pháp cao cấp nhưng BI không chỉ dành riêng cho các tập đoàn lớn mà là giải pháp hỗ trợ quyết định cho tất cả các doanh nghiệp ở mọi
Trang 25quy mô và nhiều lĩnh vực hoạt động khác nhau Trong thực tế, BI mang lại lợi ích rõ nét nhất cho các doanh nghiệp ngành hàng tiêu dùng, giải khát, thực phẩm khi mà yếu tố về thời gian được đặt lên hàng đầu Trên thế giới, BI đã trở thành công cụ quản trị quen thuộc của nhiều tên tuổi lớn như: BMW, Coca-Cola, Unilever, Còn tại Việt Nam, một số công ty lớn đã và đang triển khai BI và coi như vũ khí bí mật của mình Hy vọng trong thời gian tới
có thêm nhiều doanh nghiệp Việt Nam sẽ sát cánh với giải pháp BI
Trang 26
CHƯƠNG 2 CÔNG NGHỆ VÀ BÁO CÁO CHO HỆ THỐNG BI 2.1 Nền tảng công nghệ cho BI
Tất cả giải pháp BI bất kể hãng nào đều phải tuân theo nguyên lí tổng quan gồm có 5 tầng chính, ngắm đến mục đích cuối cùng là ra quyết định Tùy vào hiện trạng của doanh nghiệp mà giải pháp sẽ được tùy biến sao cho phù hợp để đáp ứng được yêu cầu 05 tầng chính của một giải pháp BI gồm:
Hình 2.1: Nền tảng công nghệ BI
Data Source: Hệ thống nguồn cung cấp cơ sở dữ liệu cho hệ thống, hầu
hết là cơ sở dữ liệu quan hệ vận hành chung với hệ thống ứng dụng kinh doanh như HRM, CRM, Point of Sales [5]
Data Warehouses: Hệ thống kho dữ liệu của doanh nghiệp Được triển
khai nhằm lưu trữ hệ thống dữ liệu xuyên suốt cơ cấu tổ chức của doanh nghiệp, nó được cấu thành từ nhiều Data Marts và mỗi Data Marts được xác định bởi một hoặc nhiều Dimension Table và 01 Fact Table Hệ thống dữ liệu tại Data Warehouse là dữ liệu chỉ đọc đối với người dùng, việc cập nhật dữ
Data Sources
Bản tin, tệp tin, tin nhà cung ứng, hệ CSDL
Data warehouse / Data Marts
Xử lý dữ liệu trục tuyến (OLAP)
Trang 27liệu chỉ được thực hiện duy nhất thông qua các gói ETL (Extract, Transform, Load) thực thi chuyển đổi dữ liệu từ Data Sources vào Data Warehouses[5] Đây là phần quan trọng nhất của quá trình làm báo cáo BI Để thực hiện được bước này bắt buộc người làm phải hiểu rất rõ cơ cấu tổ chức, cách thức quản lý của doanh nghiệp, hiểu rõ nghiệp vụ phân hệ và nghiệp vụ của báo cáo sẽ thực hiện Phần này sẽ tiến hành đồng bộ, phân tích và tổng hợp dữ liệu từ các nguồn khác nhau Tùy theo các phần mềm sử dụng để xây dựng Data Warehouse như Oracle Warehouse Builder, SAP Data Warehouse, SAP Rapid Marts và một số ứng dụng để xây dựng Data Warehouse của các hãng khác nhưng với Data Warehouse Builder của hãng nào thì cũng cần xác định các vấn đề sau:
Các chiều phân tích (Dimensions): Số chiều phân tích phụ thuộc vào cơ
cấu tổ chức của công ty, hình thức quản lý kinh doanh và nghiệp vụ của báo cáo đang xây dựng như: Chiều phân tích thời gian, chiều phân tích theo công
ty, chiều phân tích theo vùng miền, chiều phân tích theo sản phẩm và mỗi chiều phân tích sẽ có bao nhiêu cấp Ví dụ như chiều phân tích thời gian thường có 5 cấp cơ bản: Năm → Quý → Tháng → Tuần → Ngày
Phần tính toán số liệu: Theo từng nghiệp vụ cụ thể sẽ tiến hành tính toán
theo công thức cụ thể và kết quả cuối cùng được lưu ở một bảng trung tâm được gọi là Fact table, dữ liệu này sẽ được sử dụng để hiển thị lên báo cáo sau này Dữ liệu này thuộc dạng dữ liệu giao dịch chi tiết nhất còn việc tổng hợp lên theo các chiều phân tích sẽ dựa vào các mối liên kết với các Dimensions
để tự tổng hợp Xác định có lưu lịch sử hay không? Lưu lịch sử với các chiều phân tích, với dữ liệu hay cả hai, … Khi một nghiệp vụ cần hiển thị cả dữ liệu lịch sử thì phải thiết kế Fact table để đáp ứng được việc này và mỗi công cụ sẽ
có cách xác định cụ thể hơn
Trang 28Xác định cách thức tổng hợp dữ liệu: Phụ thuộc vào yêu cầu cụ thể sẽ
tiến hành các phương pháp tổng hợp khác nhau như: Tổng hợp dữ liệu online hay đặt lịch để tổng hợp vào cuối ngày, cuối tuần, cuối tháng, hay năm, … Xác định mối quan hệ giữa nguồn dữ liệu và các chiều phân tích để tiến hành mapping, để dữ liệu khi lên báo cáo có thể xoay và tự tổng hợp được khi Drilldown hay Drillup theo các chiều khác nhau
Xác định và xây dựng KPI: Với những ngành nghề khác nhau thì thường
có bộ KPI khác nhau được xây dựng tương đối giống nhau, ngoài ra mỗi doanh nghiệp lại tự xây dựng thêm một số KPI riêng phù hợp với đặc điểm của tổ chức nhằm trợ giúp cho lãnh đạo có những quyết định tốt hơn
Data Exploration: Ở mức này, hệ thống nghiệp vụ của doanh nghiệp
được triển khai, tri thức doanh nghiệp được khai thác thông qua việc phát triển các Cube, được cấu thành từ các Dimensions, Measures, Perspectives, Partitions, Calculations, …
Data Mining: Mục tiêu của mức này hướng đến việc khai thác các quy
luật kinh doanh đặc trưng của doanh nghiệp kết hợp tri thức doanh nghiệp giúp doanh nghiệp xây dựng được hệ thống các quyết định cụ thể và có hướng
đi đúng đắn, phù hợp
Data Presentation: Ở giai đoạn này, hệ thống dữ liệu của doanh nghiệp
đã được xử lí thông qua tầng Data Exploration và Mining; trực quan hóa thông qua hệ thống biểu đồ và đặc tả thông qua các Metadata để chuyển đổi thành thông tin có ích để giúp người dùng ra các quyết định kinh doanh
Tuy nhiên một hệ thống BI đơn giản có thể được xem là sự kết hợp của
ba thành phần chính liên kết chặt chẽ với nhau là “Kho dữ liệu”, “Khai phá dữ liệu” và “Phân tích kinh doanh” Thể hiện trong hình 2.2
Trang 29Hình 2.2: Mô hình BI đơn giản
Data Warehouse (Kho dữ liệu): Là kho lưu trữ dữ liệu trung tâm được
tổng hợp từ nhiều nguồn của doanh nghiệp
Data Mining (Khai phá dữ liệu): Các kỹ thuật dùng để khai phá dữ liệu
và phát hiện tri thức như phân loại (Classification), phân nhóm (clustering), phát hiện luật kết hợp (Association Rule), dự đoán (Predcition),
Business Analyst (Phân tích kinh doanh): Các tiêu chí dùng để hỗ trợ
nhà lãnh đạo doanh nghiệp đưa ra những quyết định chiến lược đối với hoạt động kinh doanh của doanh nghiệp
2.2 Data Warehouse cho BI
Nhu cầu mở rộng và phát triển các giải pháp Data Warehouse và Business Intelligence sẽ ngày càng lớn mạnh, nhất là trong bối cảnh kinh tế xã hội như hiện tại sẽ buộc các tổ chức phải tối ưu hóa các hoạt động của mình
và đưa ra quyết định nhanh chóng, chính xác
Giải pháp Kho dữ liệu - Data Warehouse (DW) và BI thường đi chung với nhau như là giải pháp tổng thể phục vụ cho quá trình xây dựng một doanh
DataWarehouse (Kho dữ liệu)
Business Analyst
(Phân tích kinh Doanh)
Data Mining ( Khai phá dữ liệu)
Business Intelligence
Trang 30nghiệp thông minh, thông qua việc tập hợp và xử lý dữ liệu, đưa ra các báo cáo, phân tích và dự đoán theo các góc nhìn đa chiều phục vụ cho các hoạt động theo dõi và đưa ra quyết định của doanh nghiệp
Mục đích chính của giải pháp là thông qua công nghệ thông tin để thống
kê, phân tích dữ liệu, xác định mục tiêu kinh doanh nhằm đưa ra các báo cáo
về hoạt động của doanh nghiệp trong quá khứ và hiện tại, cũng như các dự báo tương lai nhằm hỗ trợ cải thiện hiệu suất kinh doanh, mang lại lợi nhuận
và phát triển bền vững cho doanh nghiệp
Trong đó, DW chỉ đơn giản là việc hợp nhất dữ liệu từ nhiều nguồn, được chuẩn hóa để có thể khai thác tốt, hỗ trợ trong việc đưa ra các quyết định mang tính chiến lược và chiến thuật Mục đích chính của DW là luôn cung cấp một hình ảnh thống nhất và chính xác nhất về doanh nghiệp tại bất
kỳ thời điểm nào Sử dụng một trong các giải pháp quản lý kho dữ liệu, doanh nghiệp có thể khai thác toàn bộ dữ liệu của doanh nghiệp mình thay vì trước đây thường mất rất nhiều công sức
Trong nhiều tổ chức, business user ban đầu thường không hề có chút ý niệm về DW hoặc thậm chí hoài nghi về nó Nhưng một khi người dùng đã quen với nó, người ta sẽ thích nó và muốn ngày càng có nhiều dữ liệu hơn trong data warehouse đơn giản bởi vì nó cung cấp rất nhiều lựa chọn và hỗ trợ
ra quyết định khá tốt
BI là giải pháp sử dụng các kỹ năng, quy trình, công nghệ, ứng dụng để
hỗ trợ ra quyết định, các công cụ BI nâng cao khả năng trợ giúp để đưa ra các quyết định mang tính chiến lược, chiến thuật và đem lại hiệu quả trong kinh doanh BI cho phép doanh nghiệp hiểu biết về quá khứ và dự đoán tương lai thông qua ứng dụng công nghệ thông tin để có thể dễ dàng kiểm soát khối lượng dữ liệu khổng lồ, khai phá tri thức sẵn có theo nhiều góc nhìn đầy đủ
Trang 31của một doanh nghiệp Mục đích chính của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt hơn
Về cơ bản các doanh nghiệp đã, đang sử dụng BI để trợ giúp vận hành tổng thể Bản thân các nhà lãnh đạo, nhà quản lý đều thường xuyên phải xây dựng hoặc xem xét các báo cáo phân tích tổng hợp về tình hình sản xuất, tình hình tài chính, từ các hệ thống quản lý ERP, CRM, … để có thể đưa ra các nhận định và quyết định ngắn hạn và dài hạn đúng đắn cho doanh nghiệp Tuy nhiên, nếu thông qua các bản báo cáo dài, các file Excel và các số liệu tổng hợp từ nhiều nguồn thì việc xây dựng báo cáo sẽ thường mất rất nhiều thời gian và không hiệu quả, quan trọng hơn là số liệu căn cứ có thể không chính xác, dẫn tới kết quả phân tích, dự báo có thể bị sai lệch
Khi doanh nghiệp ngày càng phát triển và mở rộng sản xuất kinh doanh thì dữ liệu ngày càng nhiều, cũng như lãnh đạo sẽ càng có ít thời gian hơn trong việc xây dựng quản lý, do đó họ cần một giải pháp để giúp đưa ra các báo cáo số liệu một cách nhanh chóng thuận tiện Đó là một trong những lý
do khiến cho nhu cầu đầu tư lớn vào hệ thống thông tin doanh nghiệp, đặc biệt là đầu tư vào DW và BI
Giải pháp tổng thể: Một giải pháp DW và BI tổng thể thường bao gồm
các quá trình sau:
Tổng hợp và lưu trữ dữ liệu thô: Là việc tổng hợp dữ liệu thô từ nhiều
nguồn vào một nơi lưu trữ chung phục vụ cho việc khai thác dữ liệu sau này
Sàng lọc dữ liệu: Dữ liệu thô chưa xử lý thường lớn và có thể trùng lặp
không cần thiết, sàng lọc dữ liệu khiến cho chất lượng dữ liệu đầu vào chính xác và phù hợp với nhu cầu sử dụng hơn
Lưu trữ dữ liệu: Thông qua việc nghiên cứu các hoạt động của doanh
nghiệp và nhu cầu của doanh nghiệp, dữ liệu được sàng lọc và lưu trữ vào
DW để tái sử dụng sau này
Trang 32Phân tích dữ liệu: Sử dụng các nguồn dữ liệu từ DW, xây dựng các cấu
trúc dữ liệu tạo thành các Data Marts Data Marts là lớp đưa các dữ liệu từ
DW tới người dùng Mỗi một tổ chức/doanh nghiệp có thể có rất nhiều Data Marts phục vụ một hay nhiều đối tượng trong tổ chức, đơn vị kinh doanh tùy theo mô hình được thiết kế xây dựng
Tạo báo cáo (Reporting): Các báo cáo, thống kê, phân tích được xây
dựng sử dụng cấu trúc từ Data Marts, phục vụ cho việc hiển thị dữ liệu báo cáo tới người sử dụng
Hình 2.3: Data Warehouse trong mô hình BI
Giải pháp Kho dữ liệu Data Warehouse: Có nhiều phương thức để
đánh giá các giải pháp DW hiện tại trên thế giới Các hãng phân tích lớn và uy tín sử dụng các phân tích đa chiều Tuy nhiên, theo nhận định chung thì có 4 yếu tố chính ảnh hưởng đến việc lựa chọn một nền tảng công nghệ DW thích
Trang 33hợp là giao diện, tính năng, hỗ trợ và nền tảng hệ thống Các yếu tố này ảnh hưởng trực tiếp đến thành công của một dự án triển khai và áp dụng DW vào trong tổ chức Các tổ chức nên thông qua một đơn vị tư vấn chuyên nghiệp có nhiều kinh nghiệm để đánh giá chính xác nhu cầu, thời gian, chi phí, hiệu quả
có thể mang lại mà lựa chọn giải pháp DW hợp lý nhất
Các giải pháp DW lớn trên thế giới đang theo xu hướng thay đổi để thích hợp với xu hướng phát triển của BI cũng như yêu cầu càng ngày càng phức tạp hơn trong việc phân tích dữ liệu
DW và BI ngày càng chứng tỏ là một giải pháp hỗ trợ quyết định đắc lực cho các tổ chức/doanh nghiệp Số liệu thống kê gần đây cho thấy, trong các năm tới nhu cầu mở rộng và phát triển các giải pháp DW và BI sẽ ngày càng lớn mạnh, nhất là trong bối cảnh kinh tế xã hội như hiện tại sẽ bắt buộc các tổ chức/doanh nghiệp cần tối ưu hóa các hoạt động của mình và đưa ra các quyết định nhanh chóng, chính xác
2.3 An ninh và Internet với BI
An ninh: Các cấu trúc thông tin trong phân tích xử lý trực tuyến (OLAP)
thường rất nhạy cảm Các thông tin nhạy cảm có thể là dữ liệu nội bộ tuyệt mật hoặc thông tin phân tích chiến lược
Một ví dụ về dữ liệu nội bộ tuyệt mật là hồ sơ tổng hợp thông tin về lịch
sử hoạt động chung của công ty Còn ví dụ về thông tin phân tích chiến lược chẳng hạn như dữ liệu được thu thập từ các cửa hàng tạp hóa bán lẻ qua phân tích và ra quyết định sản phẩm tạp hóa nào được sản xuất
An ninh là một vấn đề quan trọng mà một OLAP hoàn thiện phải giải quyết những gì liên quan đến mức độ nhạy cảm đối với thông tin đó Hai lĩnh vực cần tập trung để đảm bảo an ninh là đối tượng truy cập và an ninh mạng
Đối tƣợng truy cập: Đối tượng truy cập dựa trên phân quyền có nghĩa
là liên kết một người dùng ID với một nhóm phân quyền nào đó
Trang 34Ví dụ, chúng ta có thể xác định một phân quyền có tên là “Midwest Managers” Phân quyền này được truy cập vào doanh thu và chi phí trên toàn khối OLAP Ta thiết lập “quản lý Midwest” để xem các chi tiết của khu vực Midwest, nhưng chỉ có thông tin sơ lược cho các vùng khác Sau đó ta có các phân quyền tương ứng cho các vùng khác cùng với khu vực của chúng Sau khi các phân quyền được thiết lập, ta sẽ thêm người dùng ID vào phân quyền tương ứng với trách nhiệm ở khu vực của họ
Truy cập dựa trên cơ sở phân quyền không bị giới hạn bởi phân vùng Một phân quyền có thể được định nghĩa với khả năng hiển thị hạn chế đến các vùng cụ thể trên tất cả các vùng trong một khối OLAP Một cách phân quyền điển hình trong hệ thống dựa trên vai trò, chức năng, mức độ chịu trách nhiệm khác nhau của từng bộ phận trong tổ chức Cá nhân rơi vào bộ phận nào thì sẽ trở thành thành viên của nhóm phân quyền đó Khi chức năng, vị trí của họ thay đổi, phân quyền cho cá nhân đó cũng thay đổi hoặc trở thành thành viên của nhóm phân quyền khác
An ninh mạng Internet: Thông tin BI trên Internet có thể là một lợi thế
lớn cho một doanh nghiệp Để truyền tin trong doanh nghiệp, một kết nối an toàn sẽ được thiết lập từ nhân viên đến khách hàng cụ thể thông qua mạng Internet Lợi thế của việc sử dụng Internet là tận dụng các cơ sở hạ tầng của tổ chức quản lý và cung cấp Internet Điều này có thể tiết kiệm đáng kể
Nhược điểm của việc sử dụng Internet là khả năng bị trộm cắp hoặc phá hoại rất lớn Một khi thông tin được truyền trên Internet, nó sẽ bị tiếp xúc với tin tặc và có thể bị chúng ăn cắp hoặc làm gián đoạn quá trình truyền tin của bạn Cơ chế bảo mật trên Internet phát triển và thay đổi mỗi ngày Luận văn không đi sâu nội dung này Tuy nhiên bảo mật thông tin cho hệ thống BI rất quan trọng và có rất nhiều lựa chọn (công cụ và con người) trên thị trường Hãy thực hiện đầu tư an toàn cho kế hoạch bảo mật thông tin BI trên Internet
Trang 35và chắc chắn nó được hoạt động liên tục Thời gian và công sức dùng để đảm bảo truy cập thông tin an toàn trên Internet chính là đầu tư có giá trị
Các tác động của Internet đối với BI: Hai vấn đề quan trọng trong
cung cấp thông tin trên Internet với BI là khả năng truy cập thông tin ở bất cứ đâu với chi phí thấp khi có nhu cầu, các nhà cung cấp giải pháp BI và các công cụ BI phải cung cấp cơ chế thông tin thực trên mạng Internet
Trước khi Internet được sử dụng rộng rãi, các nhà cung cấp giải pháp BI
có thể lựa chọn cơ chế truyền thông tin phù hợp với thế mạnh của mình Ngày nay, Internet như là một cơ chế truyền thông tin chính, nhà cung cấp phải tích hợp giao thức internet như là một phần của giải pháp của họ Nếu không có giải pháp cho Internet, họ thậm chí không thể bước vào lĩnh vực này hoặc sớm muộn cũng sẽ bị đào thải bởi sự canh tranh từ các đối thủ Một số yếu tố cần phải xem xét trước khi truyền thông tin BI trên Internet là:
Xác định lợi ích kinh doanh: Trả lời câu hỏi: “Tác động gì đến doanh
nghiệp của tôi và lợi tức đầu tư là gì?" Truy cập thông tin trong nội bộ hệ thống qua Internet phải luôn sẵn sàng và nhanh hơn, dễ dàng hơn Tốc độ thông tin sẽ tạo ra lợi thế cạnh tranh trên thị trường [5] Tốc độ này có thể cung cấp cho nhân viên thị trường nhiều thông tin hơn, thực hiện các giao dịch tốt hơn so với đối thủ cạnh tranh
Giải quyết vấn đề an ninh: Đầu tiên, phải đảm bảo rằng truy cập thông
tin trên mạng có thể chấp nhận được Tức là tốc độ truy cập phải luôn đảm bảo quá trình trao đổi thông tin giữa các bộ phận trong doanh nghiệp phải được thông suốt Thứ hai, sử dụng các biện pháp an ninh để giảm thiểu rủi ro, ngăn chặn các cuộc tấn công bất hợp pháp vào hệ thống[5]
Xem xét các chi phí bổ sung: Xem chi tiết cơ sở hạ tầng, thời gian và
chi phí nhân sự phải chịu Vạch kế hoạch cho các chi phí và đảm bảo có thể
có được lợi nhuận qua việc đầu tư này
Trang 362.4 Giải pháp thúc đẩy phát triển BI thời gian thực
Để tìm ra giải pháp thúc đẩy sự phát triển các hệ thống BI, ta phải căn cứ trên nhiều yếu tố nhằm khắc phục nhược điểm của hệ thống hiện tại đồng thời hướng tới thỏa mãn tối đa nhu cầu khách hàng Có thể tập trung vào xu hướng kinh doanh, công nghệ và kiến trúc thông tin, định hướng tới nhiều đối tượng khách hàng Nhưng có lẽ vấn đề trọng tâm hiện nay là đưa ra giải pháp giải quyết thực trạng đáp ứng thời gian thực trong kinh doanh
2.4.1 Hiệu quả hoạt động đáp ứng thời gian thực
Trong môi trường cạnh tranh ngày nay, phân tích dữ liệu để dự đoán xu hướng thị trường của sản phẩm và cải thiện hiệu suất của hệ thống doanh nghiệp là một việc quan trọng mang tính chất sống còn Do vậy, kinh doanh thành công đòi hỏi dữ liệu phải được phân tích, xử lý trong thời gian thực để đáp ứng nhu cầu khác nhau của khách hàng cũng như nhu cầu quản lý của lãnh đạo một cách nhanh nhất Kinh doanh thông minh thời gian thực (RTBI) trong một doanh nghiệp chủ yếu phụ thuộc vào sự nhận biết “thời gian thực cái gì?” Thời gian thực ở đây có thể hiểu theo nghĩa là yêu cầu để không có
độ trễ trong quá trình hoạt động; có thể truy cập thông tin bất cứ khi nào có nhu cầu; cung cấp thông tin chính xác và ngay lập tức khi người quản lý yêu cầu; khả năng để lấy được các khóa quan trọng liên quan đến tình hình hoạt động theo thời gian thực [1]
RTBI cung cấp các chức năng tương tự như kinh doanh thông minh truyền thống nhưng hoạt động trên dữ liệu lấy từ các nguồn cung cấp thực với
độ trễ rất thấp và cung cấp trở lại dữ liệu sau khi xử lý để tham gia vào các quá trình kinh doanh trong thời gian thực Cụ thể, RTBI có thể bao gồm: cung cấp thông tin thời gian thực; mô hình hóa dữ liệu thời gian thực; phân tích dữ liệu thời gian thực; hành động thời gian thực
Trang 37Với RTBI, dữ liệu mang thông tin hoạt động thời gian thực phải được chuyển đổi liên tục vào hành động Tuy nhiên hiện nay hệ thống BI vẫn bị hạn chế trong việc này Thứ nhất, việc chuyển đổi từ dữ liệu trong thông tin bị cản trở vì thiếu các nhà phân tích và các chuyên gia - những người cấu hình
và chạy phần mềm phân tích Sự hạn chế thứ hai là các giải pháp BI hiện tại
về cơ bản không xa rời các báo cáo Vì thế RTBI đã chú trọng phát triển chức năng tự động phân tích dữ liệu và tái cấu trúc các quá trình hoạt động trên nền tảng sử dụng các phương pháp tính toán mềm như logic mờ Tập trung vào ứng dụng cung cấp khả năng phân tích, báo cáo, truy cập dữ liệu đang hoạt động, tối ưu hóa quá trình, liên kết các quá trình tự động và thông số quá trình điều khiển, chuyển đổi các thông tin thành hành động tạo ra sự thích nghi với môi trường kinh doanh thực
2.4.2 Kiến trúc và công nghệ của RTBI
RTBI sẽ có một vai trò quan trọng trong việc định hướng các mục tiêu chiến lược với hoạt động kinh doanh và cung cấp cách thức tổ chức để giảm
độ trễ giữa các đơn vị hoạt động Cách tổ chức sắp xếp truyền thống các mục tiêu chiến lược với mối liên quan trong kinh doanh được mô tả trong hình 2.4
Trang 38Theo mô hình các mục tiêu chiến lược định hướng quá trình hoạt động kinh doanh của công ty thông qua các chỉ số thực hiện chính và các phép đo tác nghiệp nhưng cũng chịu tác động từ hoạt động kinh doanh thực thông qua kết quả nhận được từ các phép đo và từ các đánh giá chỉ số thực hiện chính
Để đạt mục tiêu chiến lược của công ty đòi hỏi dữ liệu phải được phân tích,
xử lý nhanh và chính xác dựa trên các tiêu chuẩn kinh doanh của công ty
RTBI đòi hỏi nhiều kỹ thuật và công nghệ tương thích với nhiều hệ thống và ứng dụng doanh nghiệp Trên khía cạnh công nghệ, ta có thể nhóm lại thành ba lớp [6] với mối quan hệ được thể hiện trong hình 2.5
SO KPI
OPM
Mô hình phổ biến
SO: Mục tiêu chiến lược KPI : Chỉ số thực hiện chính OPM: Thực hiện phép đo tác nghiệp
Nhu cầu kho dữ liệu
Dữ liệu tích hợp thông minh
Bán lẻ Bán
buôn Khu vực
sản phẩm Yêu cầu hạ tầng
Hình 2.4: Tầm nhìn cho RTBI