Tìm hiểu business intelligence và áp dụng trong bài toán quản lý kho dược phẩm Tìm hiểu business intelligence và áp dụng trong bài toán quản lý kho dược phẩm Tìm hiểu business intelligence và áp dụng trong bài toán quản lý kho dược phẩm luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
-
TRẦN QUỐC TUẤN
TÌM HIỂU BUSINESS INTELLIGENCE VÀ ÁP DỤNG TRONG BÀI TOÁN QUẢN LÝ KHO DƯỢC PHẨM
Chuyên ngành: Công nghệ thông tin
LUẬN VĂN THẠC SỸ KỸ THUẬT CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS NGUYỄN THỊ THU HƯƠNG
Trang 3MỤC LỤC
LỜI CAM ĐOAN 3
KÍ HIỆU, THUẬT NGỮ VÀ VIẾT TẮT 4
DANH MỤC CÁC BẢNG, BẢNG BIỂU 5
DANH MỤC CÁC HÌNH, HÌNH VẼ 6
LỜI MỞ ĐẦU 8
CHƯƠNG I: KINH DOANH THÔNG MINH 10
1.1 Khái niệm 10
1.2 Các nhiệm vụ chính của kinh doanh thông minh 10
1.2.1 Báo cáo 10
1.2.2 Phân tích 14
1.2.3 Đo lường, đánh giá 18
1.2.4 Kết luận 19
1.3 Kiến trúc kinh doanh thông minh 20
1.4 Các kỹ thuật xây dựng giải pháp kinh doanh thông minh 21
1.4.1 Xử lý dữ liệu trực tuyến (Online Analysis Processing - OLAP)[3] 21
1.4.2 Khai phá dữ liệu 26
1.4.3 Kết luận 32
1.5 Động cơ, mục tiêu và nhiệm vụ của luận văn 33
1.6 Kết luận 35
CHƯƠNG II: ỨNG DỤNG KINH DOANH THÔNG MINH TRONG KHO THUỐC BỆNH VIỆN 36
2.1 Bài toán quản lý kho thuốc bệnh viện 36
2.1.1 Bối cảnh hiện nay 36
2.1.2 Các yêu cầu chính của quản lý kho thuốc bệnh viện 39
2.1.3 Các giải pháp hiện có 41
2.1.4 Các vấn đề còn tồn tại 45
Trang 42.2 Ứng dụng kinh doanh thông minh vào lĩnh vực quản lý kho thuốc 45
2.2.1 Cách tiếp cận 45
2.2.2 Mô hình ứng dụng kinh doanh thông minh trong kho thuốc 46
2.2.3 Ứng dụng OLAP giải quyết bài toán phân tích dữ liệu 50
2.2.4 Ứng dụng Times Newseries giải quyết bài toán dự đoán số lượng 54
2.3 Kết luận 56
CHƯƠNG III: GIỚI THIỆU PHẦN MỀM VÀ KẾT QUẢ ĐẠT ĐƯỢC 58
3.1 Phân tích yêu cầu 58
3.2 Thiết kế chức năng của phần mềm 59
3.2.1 Quản lý tài khoản 60
3.2.2 Thiết lập cấu hình 61
3.2.3 Thống kê - Phân tích 62
3.2.4 Khai phá dữ liệu 64
3.3 Thiết kế cơ sở dữ liệu 65
3.4 Minh họa kết quả 69
3.4.1 Quản lý tài khoản 69
3.4.2 Thiết lập cấu hình 70
3.4.3 Thống kê - Phân tích 72
3.4.4 Khai phá dữ liệu 77
3.5 Đánh giá kết quả đạt được và kiến nghị 79
TÀI LIỆU THAM KHẢO 83
Trang 5LỜI CAM ĐOAN
Tôi xin cam đoan rằng toàn bộ nội dung đề tài " Tìm hiểu Business
Intelligence và áp dụng trong bài toán quản lý kho dược phẩm " là kết quả nghiên cứu của tôi, ngoại trừ các phần được trích dẫn
Người cam đoan
Trần Quốc Tuấn
Trang 6KÍ HIỆU, THUẬT NGỮ VÀ VIẾT TẮT
BI Business Intelligence
DSS Decision support system
CNTT Công nghệ thông tin
OLAP Online Analysis Processing
MOLAP Multidimensional OLAP
ROLAP Relational OLAP
HOLAP Hybird OLAP
OLTP On-Line Transaction Processing
ARIMA Abtoregresive integrated- moving- average
Trang 7Bảng 1.2 So sánh các phần mềm phân tích dữ liệu với khả năng phân
tích dữ liệu của kinh doanh thông minh
15
Bảng 1.3 So sánh các mô hình lưu trữ dữ liệu trong OLAP 27
Bảng 2.1 Bảng tìm tham số của thuật toán Time New Series 55
Trang 8DANH MỤC CÁC HÌNH
Hình 1.1: Kiến trúc của một hệ thống BI 20 Hình 1.2 : Mô hình các khối (cube) 22 Hình 1.3: Phân tích dữ liệu đa chiều 25 Hình 1.4: Quy trình khai phá dữ liệu 27 Hình 2.1 : Quy trình đối với bệnh nhân ngoại trú 40 Hình 2.2 : Quy trình đối với bệnh nhân nội trú 40 Hình 2.3 : Giao diện phần mềm quản lý bệnh viện (1) 42 Hình 2.4 : Giao diện phần mềm quản lý bệnh viện (2) 42 Hình 2.5 : Giao diện phần mềm quản lý bệnh viện (3) 43 Hình 2.6 : Báo cáo tồn kho (1) 43 Hình 2.7: Quy trình ứng dụng kinh doanh thông minh 47 Hình 2.8: Phân cấp dữ liệu bất đối xứng 52 Hình 2.9: Phân cấp dữ liệu đối xứng 52 Hình 2.10: Cuộn lên hay khoan sâu xuống theo chiều phân cấp 53 Hình 3.1: Các chức năng chính của phần mềm 60 Hình 3.2 : Chức năng quản lý tài khoản 61 Hình 3.3 : Chức năng thiết lập cấu hình 62
Hình 3.4: Chức năng thống kê phân tích 63 Hình 3.5 : Cơ sở dữ liệu của phần mềm 65 Hình 3.6 : Giao diện đăng nhập 69 Hình 3.7 : Giao diện quản lý nhóm người dùng 70 Hình 3.8 : Giao diện quản lý người dùng 71 Hình 3.9 : Backup và khôi phục dữ liệu 71 Hình 3.10 : Phiếu nhập kho 74 Hình 3.11 : Quản lý danh mục 74 Hình 3.12 : Thống kê chức năng nhập kho 75 Hình 3.13 : Phiếu xuất kho 75
Trang 9Hình 3.14 : Thống kê xuất kho dạng đồ thị cột 76 Hình 3.15 : Thống kê tồn kho dạng đồ thị tròn 76 Hình 3.16 : Dự đoán nhập xuất kho trong 3 tháng cuối năm 2017 77
Trang 10
LỜI MỞ ĐẦU
Trong kinh doanh và quản lý, ra quyết định là công việc chính mà các lãnh đạo và quản lý cần phải thực hiện Nhưng việc thiếu thông tin làm cho việc ra quyết định gặp phải nhiều rủi ro Theo cách truyển thống, các thư ký, trợ lý, phòng IT và các phòng ban liên quan mất nhiều công sức để tập hợp dữ liệu từ nhiều hệ thống khác nhau, cách làm này tồn nhiều thời gian, thông tin không kịp thời và tính chính xác phụ thuộc nhiều vào người thực hiện, đặc biệt trong các tổ chức, doanh nghiệp lớn nơi thông tin bị phân tán trên nhiều ứng dụng khác nhau tại các phòng ban Chính vì vậy giải pháp BI (Business Intelligence) đã ra đời trợ giúp nhà lãnh đạo làm quyết định chính xác và kịp thời hơn Giải pháp BI thực hiện các báo cáo và phân tích có chiều sâu dựa trên thông tin chi tiết về hoạt động trên qui mô toàn doanh nghiệp với dữ liệu đến từ nhiều nguồn khác nhau và với thời gian ngắn hơn
BI là một trong những cánh tay nối dài của ERP thể hiện rõ sự hoàn thiện và phát triển ưu việt của giải pháp ứng dụng công nghệ này Hiện tại, các giải pháp BI gồm có những nhà cung cấp như sau : Oracle Hyperion, IBM Cognos, Business Objects (an SAP company), SAP NW,…Với sự phong phú về tính năng và khả năng tích hợp, phân tích và xử lý thông tin doanh nghiệp nhanh nhạy, chính xác và tối ưu, BI xứng đáng với vai trò là nhà quân sư cao cấp bậc nhất cho doanh nghiệp Qua đó cho thấy sự phát triển diệu kỳ của công nghệ thông tin nói chung và các phần mềm quản lý doanh nghiệp nói riêng Trong đó, ERP giữ vị trí quán quân Cùng với sự phát triển của các giải pháp BI, bài toán khó nhất trên con đường phát triển hội nhập của doanh nghiệp cũng sẽ được giải quyết nhanh chóng khi doanh nghiệp ứng dụng và tận dụng các tính năng ưu việt của BI
Lĩnh vực quản trị kinh doanh luôn là một lĩnh vực thú vị, hấp dẫn đối với con người, nhưng ẩn chứa bên trong đó là rất nhiều sự rủi ro, nguy hiểm Để cho một hệ thống kinh doanh có thể tồn tại và phát triển, rất cần thiết có một chiến lược kinh doanh hợp lý và hiệu quả Những chiến lược này đến từ những người quản lý, những người có thẩm quyền hoặc chức năng Chất lượng của những chiến lược kinh
Trang 11doanh này sẽ phụ thuộc rất nhiều vào khả năng, năng lực, chuyên môn cũng như kinh nghiệm của người làm ra nó Vì vậy, yếu tố chủ quan sẽ tồn tại rất rõ trong những mảng này, và đương nhiên, những chiến lược này sẽ có những rủi ro, lỗ hổng nhất định mà chưa thể hoặc khó có thể nhận ra và khắc phục Vậy thì làm sao để những rủi ro vừa được đề cập ở bên trên là thấp nhất? Làm sao để có một chiến lược kinh doanh hợp lý và hiệu quả? Rất cần những kênh thông tin có độ chuẩn xác cao,
có thể hỗ trợ người ra quyết định một cách thật hiệu quả Từ những yêu cầu trên, trong đồ án này, tôi sẽ nghiên cứu và đưa ra "Giải pháp quản trị kinh doanh thông minh và ứng dụng" Tôi mong muốn rằng phần mềm của tôi xây dựng nên sẽ là một kênh thông tin quan trọng, nhằm có thể hỗ trợ một cách tốt nhất cho những người
có chức năng ra quyết định, hoạch định chiến lược trong lĩnh vực kinh doanh và quản lý
Về mặt nội dung, đồ án chia làm ba chương, gồm có:
- CHƯƠNG 1 KINH DOANH THÔNG MINH
Chương này sẽ đưa ra cho người đọc những kiến thức và khái niệm cơ bản, tổng quan về kinh doanh thông minh và các công nghệ liên quan
- CHƯƠNG 2 QUẢN LÝ KHO THUỐC THÔNG MINH
Chương này được phát triển dựa trên cơ sở và nền tảng của chương đầu tiên Chương này sẽ đi cụ thể hơn, về mảng kinh doanh trong lĩnh vực kho thuốc và đề xuất giải pháp ứng dụng kinh doanh thông minh trong kho thuốc
- CHƯƠNG 3 GIỚI THIỆU PHẦN MỀM VÀ KẾT QUẢ ĐẠT ĐƯỢC
Chương này sẽ giới thiệu cho người đọc về kết quả nghiên cứu và xây dựng phần mềm hỗ trợ người dùng đưa ra những quyết định có độ chính xác cao trong lĩnh vực quản lý kho thuốc
Cuối cùng, em xin gửi lời cảm ơn chân thành tới TS.Nguyễn Thị Thu Hương
- viện CNTT & Truyền Thông, người đã hướng dẫn em tận tình trong quá trình nghiên cứu, tìm hiểu và thực hiện đồ án này Em cũng xin được gửi lời cảm ơn đến các thầy, các cô trong viện CNTT & Truyền Thông - trường đại học Bách Khoa Hà Nội, đã truyền đạt cho em những kiến thức quý báu trong suốt khoảng thời gian em học tập và nghiên cứu Xin chân thành cảm ơn
Trang 12CHƯƠNG I: KINH DOANH THÔNG MINH
Chương này sẽ mang tới cho người đọc một cái nhìn tổng quan, những kiến thức cơ bản về kinh doanh thông minh và các công nghệ có liên quan Chương này cũng sẽ chỉ rõ mục tiêu và nhiệm vụ của luận văn
1.1 Khái niệm
Hiện nay, khái niệm về kinh doanh thông minh (Business Intelligence - BI)
ở Việt Nam còn khá mới mẻ và các doanh nghiệp lớn ở Việt Nam vẫn chưa triển khai kinh doanh thông minh vì rất nhiều lý do Phần lý thuyết này nhằm cung cấp một cái nhìn chung về kinh doanh thông minh cho người đọc Kinh doanh thông minh là giải pháp đề cập đến khả năng trợ giúp ra quyết định hiệu quả trong kinh doanh Dưới đây là định nghĩa về kinh doanh thông minh:
Giải pháp kinh doanh thông minh - Business Intelligence đề cập đến các kỹ năng, qui trình, công nghệ, ứng dụng được sử dụng để hỗ trợ ra quyết định.[6]
Kinh doanh thông minh là qui trình và công nghệ mà các doanh nghiệp dùng
để kiểm soát khối lượng dữ liệu khổng lồ, khai phá tri thức giúp cho các doanh nghiệp có thể đưa các các quyết định hiệu quả hơn trong hoạt động kinh doanh của mình Kinh doanh thông minh cung cấp một cách nhìn toàn cảnh hoạt động của doanh nghiệp từ quá khứ, hiện tại và các dự đoán tương lai Mục đích của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt hơn Vì vậy một hệ thống kinh doanh thông minh còn được gọi là hệ thống hỗ trợ quyết định (Decision Support System -DSS)
1.2 Các nhiệm vụ chính của kinh doanh thông minh
Trong phần này đề cập đến một số nhiệm vụ của giải pháp kinh doanh thông
minh gồm có báo cáo, phân tích và quản lý hệ thống
1.2.1 Báo cáo
Về cấu trúc
Các chương trình phần mềm thường được đóng gói, từ đó sản sinh ra nhiều loại báo cáo khác nhau Khi khởi động phần mềm có thể cung cấp nhiều khả năng lựa chọn, từ những mục thông dụng như chọn ngày, chọn khách hàng cụ thể hay các
Trang 13vấn đề về quản lý hệ thống Nhưng thực tế, việc thiết kế và bản chất của báo cáo vẫn được "mã hóa cứng" vào hệ thống và việc thay đổi hoàn toàn báo cáo cần phải
có yêu cầu tùy chỉnh từ một trong hai bên là công ty hoặc từ nhà cung cấp dịch vụ bên ngoài
Trong khi đó giải pháp kinh doanh thông minh là tùy biến để bạn dễ dàng lựa chọn "chính xác những gì bạn muốn" trong một "định dạng chính xác mà bạn muốn nhìn thấy trong báo cáo" Người dùng chỉ cần kích chuột trên các thông tin liên quan trên mỗi cột, mỗi hàng và hệ thống xây dựng câu truy vấn và điều tra SQL trong vòng vài giây Tất nhiên các báo cáo này có thể được lưu lại để làm thư viện hoặc tùy chỉnh theo ý muốn của bạn Giải pháp kinh doanh thông minh không
"đóng gói" dữ liệu của bạn trong hệ thống mà có thể gọi dữ liệu bất kỳ lúc nào để tạo báo cáo Giải pháp kinh doanh thông minh cung cấp một tính linh hoạt tuyệt vời
để bạn tạo ra được những báo cáo như bạn muốn khi cần Nó bao gồm:
- Báo cáo sản xuất hoàn chỉnh tới từng chi tiết (Báo cáo sản lượng sản xuất )
- Báo cáo phục vụ công tác quản trị (Báo cáo kế toán, báo cáo tài chính )
- Truy vấn theo yêu cầu (Báo cáo thông tin khách hàng, báo cáo thông tin nhân viên )
- Kiểm soát hiện trạng hoạt động (Báo cáo tình trạng dây chuyền sản xuất, báo cáo lượng hàng tồn kho )
- Tạo và chỉnh sửa báo cáo với cách trình bày linh hoạt chia theo từng khu vực Các khu vực này có thể được điều chỉnh cho phù hợp với các thành phần và đối tượng khác nhau của báo cáo
- Tạo và thực hiện một báo cáo đơn có khả năng chạy trên nhiều ngôn ngữ và định dạng đầu ra khác nhau như HTML, PDF và Excel
- Xây dựng các mẫu báo cáo gồm các đối tượng, truy vấn và mẫu trình bày chuẩn
Về bảng dữ liệu
Trang 14Các báo cáo thông thường được thiết kế chủ yếu để xử lý các giao dịch trong các bảng dữ liệu quan hệ Điều này là lý tưởng cho việc lưu trữ và xử lý các giao dịch, nhưng rất nghèo để phân tích các thông tin Mỗi khi một báo cáo đóng gói đơn giản chạy thì nó phải đi tìm các bảng chính xác, xây dựng dữ liệu tham gia, quét qua mỗi bảng tìm kiếm các tiêu chí phù hợp với mỗi yêu cầu và sau đó lấy các dữ liệu chi tiết Các dữ liệu chi tiết sau đó phải được tóm tắt bằng cách lựa chọn một dạng báo cáo đóng gói phù hợp Nhiều khi dữ liệu chi tiết báo cáo lại thông qua quá trình chạy vòng lặp nhiều lần dẫn đến tốn thời gian ngay cả với những hệ thống máy tính xử lý mạnh mẽ nhất
Trong giải pháp kinh doanh thông minh, các nhà cung cấp dịch vụ cung cấp một kho dữ liệu được thiết kế tốt, còn được gọi là một khối dữ liệu Nó được xây dựng để đạt được độ chính xác hơn và tốc độ phân tích dữ liệu cao Cứ sau một khoảng thời gian các giao dịch chi tiết từ hệ thống lại được đưa vào các khối dữ liệu với nhãn thời gian và ngày tháng Một quá trình được gọi là "chuyển đổi" xảy ra, theo đó các giao dịch chi tiết này sau đó được kết hợp thành một lựa chọn lớn của các dữ liệu lựa chọn để báo cáo Mỗi báo cáo lại có thể được tham chiếu bởi hàng chục mẩu báo cáo khác nhau Vì vậy, khi bạn cần một thông tin từ khối dữ liệu, nó không phải tính toán tất cả các thành phần từ các bảng giao dịch cá nhân chi tiết, nó chỉ lấy câu trả lời từ một địa điểm duy nhất Do đó khối dữ liệu được tối ưu hóa cao, cập nhật thông tin hàng ngày vì vậy chỉ mất một vài phút là có thể có được bản báo cáo như mong muốn
Trang 15minh thì bạn chỉ cần khoảng 30 giây để thiết kế và một phút để xuất chúng ra định dạng báo cáo của Microsoft Excel
Với giải pháp kinh doanh thông minh, người dùng có thể dễ dàng lựa chọn một thiết kế đầu ra báo cáo để phân tích, một bảng tính Microsoft Excel là định dạng phổ biến nhất Bản báo cáo này sau đó được xây dựng trong bảng tính và phân tích cú pháp ra khá độc đáo và được đưa vào các cột kích thước chính xác với tất cả các phụ số và tổng số yêu cầu Một số báo cáo BI được thể hiện tốt nhất trong một bảng xoay, nơi người dùng có thể dễ dàng kéo xung quanh các mục báo cáo thay đổi quan điểm của thông tin mà không cần xây dựng lại báo cáo cho mỗi tuỳ chọn Đôi khi nhà cung cấp sẽ cung cấp thẻ tính điểm số với cấu hình trước quan điểm của các thông tin thiết kế đặc biệt cho người được ủy quyền hoặc các đối tác trong công ty Các thẻ tính điểm có thể cung cấp các thông tin như phân tích dòng chảy tiền mặt hàng ngày, thanh toán và thông tin cho người ủy quyền riêng Bảng 1.1 sẽ
so sánh báo cáo của giải pháp kinh doanh thông minh được tích hợp trong phần mềm Microsoft SQL Server 2008 với các báo cáo khác
Bảng 1.1: So sánh báo cáo thông thường và báo cáo của kinh doanh thông minh được tích hợp trong Microsoft SQL Server 2008
Các báo cáo thông thường SQL Server
Dựa vào nhà cung cấp để thiết kế trước
mỗi báo cáo đóng gói
Tùy biến linh hoạt, người dùng có thể chọn bất kỳ phần tử dữ liệu thành một danh sách của các dữ liệu có sẵn
Mỗi báo cáo có một số cố định các lựa
chọn tùy chọn
Không giới hạn số tùy chọn, kiểm soát hoàn toàn bao gồm bao gồm và loại trừ Không có khả năng thêm dữ liệu,các yếu
tố trên báo cáo
Chỉ cần nhấp vào một yếu tố dữ liệu và thêm nó vào một báo cáo
Dữ liệu này được đưa ra từ các bảng
giao dịch
Dữ liệu đến từ một khối dữ liệu được xây dựng đặc biệt để phân tích và báo cáo
Chậm thực hiện, các bảng truy cập chậm Phân chia thứ hai báo cáo, 1.000 trang
Trang 16hơn nhiều báo cáo phân tích chi tiết trong vòng chưa đầy 30
giây
Một vài tóm tắt có sẵn Khối dữ liệu tự động xây dựng tóm tắt
các cấp và họ được độ tin cậy cao Một khối dữ liệu mới có thể dễ dàng được xây dựng lại từ thời gian chi tiết và giao dịch thanh toán
Lập trình tùy chỉnh đắt tiền để làm cho
ngay cả những thay đổi đơn giản
Thay đổi các báo cáo trong vài giây và phát triển một thư viện các báo cáo của bạn Tự động gửi báo cáo theo một lịch trình thường xuyên như file đính kèm email cho luật sư chính
Không linh hoạt, cứng sao chép định
dạng
Chọn định dạng từ nhiều tùy chọn bao gồm cả Microsoft Excel ® Spreadsheets, Pivotables, và đồ thị
Từ bảng so sánh trên, có thể thấy rằng khác biệt chính mà báo cáo kinh doanh thông minh mang lại cho người dùng là sự linh hoạt trong việc tạo báo cáo, dễ sử dụng và tốc độ tạo báo cáo nhanh hơn việc sử dụng các phần mềm tích hợp công cụ báo cáo
1.2.2 Phân tích
Trong phần này, sẽ so sánh chức năng phân tích dữ liệu của giải pháp kinh doanh thông minh tích hợp trong phần mềm Microsoft SQL Server 2008 với 3 phần mềm đang được sử dụng khá phổ biến trong ngành kinh tế là phần mềm STATA [13] ( Sta -tistics/Data Analysis) của công ty Stata, phần mềm SAS [13] ( Statistical Analysis soft - ware ) của công ty SAS và phần mềm SPSS [15] ( Statistical
Package for the Social Sciences ) của SPSS Inc Bảng 1.2 dưới đây sẽ chỉ ra những
ưu nhược điểm của từng phần mềm trong việc phân tích dữ liệu theo 4 quan điểm
về sử dụng, quản lý dữ liệu, phân tích thống kê và vẽ đồ thị
Trang 17Bảng 1.2: So sánh các phần mềm phân tích dữ liệu với khả năng phân tích dữ liệu của kinh doanh thông minh trong SQL
Server 2008 Phần mềm
Phương diện
SAS SPSS STATA SQL Server 2008
Sử dụng - Phải viết chương trình
để thao tác dữ liệu và thực hiện các phân tích
dữ liệu của mình
-Khó nhận biết lỗi và khó sửa
- Dễ sử dụng
- Giao diện giữa người
và máy cho phép sử dụng các menu thả xuống để chọn các lệnh thực hiện
- Dễ học và có nhiều khả năng
- Sử dụng các lệnh trực tiếp
- Nhận biết lỗi và sửa
dễ dàng
- Giao diện người và máy thân thiện,trực quan
- Phân tích dữ liệu bằng lệnh có từ gợi nhớ
- Dễ dò lỗi và sửa lại dễ dàng
Quản lý dữ liệu - Quản lý dữ liệu mạnh,
người sử dụng thao tác
dữ liệu theo nhiều cách
- Mất nhiều thời gian để học và hiểu được cách quản lý dữ liệu
- Làm việc với nhiều file dữ liệu cùng một
- Có bộ soạn thảo dữ liệu, vào dữ liệu và mô tả các thuộc tính của chúng
- Các lệnh quản lý dữ liệu mạnh và đơn giản
- Mỗi thời điểm chỉ làm việc được với một file dữ liệu
- Quản lý dữ liệu rất mạnh
- Lệnh xử lý dữ liệu đơn giản
- Quản lý dữ liệu đa chiều
- Một thời điểm sẽ thực hiện được với nhiều nguồn dữ liệu giúp khai
Trang 18lúc - Số bản ghi giới hạn thác tối đa giá trị dữ liệu Phân tích thống kê - Phân tích mô hình hỗn
hợp và phân tích nhiều chiều
- Yếu với hồi qui logistic kiểu thứ tự và kiểu phạm trù và các phương pháp ước lượng mạnh
- Hỗ trợ một ít cho phân tích dữ liệu theo lược đồ mẫu
- Phân tích thống kê đa dạng và linh hoạt với nhiều chiều phân tổ khác nhau và dễ thực hiện
Các bảng biểu, các báo cáo được trình bày đẹp, chất lượng cao
- Mạnh trong phân tích phương sai và phân tích nhiều chiều
- Có khả năng phân tích các mô hình hỗn hợp
- Yếu trong ước lượng sai số trong ước lượng phức
- Không hỗ trợ các công
cụ phân tích dữ liệu theo lược đồ mẫu
- Mạnh trong phân tích hồi quy, hồi quy logistic
- Có nhiều phương pháp ước lượng mạnh rất dễ sử dụng
- Trội hơn về lĩnh vực phân tích dữ liệu theo lược đồ mẫu
- Yếu trong phân tích phương sai và phân tích nhiều chiều truyền thống
- Đưa ra các phân tích từ những thống kê dựa trên các dữ liệu đầu vào Thống kê và phân tích đạt được độ chính xác cao Ngoài ra, tính đa chiều cũng là một đặc tính nổi bật rất đáng được nhắc tới của phần mềm Các chiều thống kê, các chiều phân tích có thể được thay đổi một cách dễ dàng, nhằm thỏa mãn những yêu cầu của những người sử dụng khắt khe nhất, giúp cho người sử dụng có cái đánh giá một cách tổng quan, đơn giản nhất về số liệu
Trang 19Vẽ đồ thị - Có các công cụ vẽ đồ
thị mạnh nhất so với các
bộ chương trình còn lại
- Để sử dụng phải yêu cầu có chuyên môn và không đơn giản
- Tạo ra các đồ thị đa dạng bằng cú pháp, tuy nhiên có giao diện giữa người và máy để tạo ra các đồ thị, nhưng không
dễ sử dụng
- Có một giao diện giữa người và máy rất đơn giản để tạo ra các đồ thị
- Có thể tuỳ ý hiệu chỉnh
đồ thị cũng như hoàn thiện chúng Các đồ thị
có chất lượng rất cao và
có thể dán vào các tài liệu khác, thí dụ như Word hoặc Powerpoint
Có ngôn ngữ cú pháp để tạo ra các đồ thị, nhưng nhiều điểm trong giao diện tạo đồ thị lại không sẵn sàng trong ngôn ngữ
cú pháp
- Có thể tạo ra bằng sử dụng lệnh hoặc giao diện giữa người sử dụng và máy
- Không thể hiệu đính bằng bộ hiệu đính đồ thị Các đồ thị có chất lượng cao và chất lượng xuất bản cũng cao
- Có chức năng bổ sung cho phân tích thống kê
- Cho phép người sử dụng
có thể sử dụng rất nhiều loại đồ thị, nhằm làm cho người sử dụng có thể tìm thấy loại đồ thị trực quan
và phù hợp với khả năng của mình
- Cách sử dụng đồ thị trong phần mềm cũng vô cùng đơn giản và ít phức tạp Chất lượng đồ thị cũng rất tốt, đảm bảo cho phép việc ghép đồ thị vào những văn bản, bản thảo, slide… khi cần thiết
Trang 201.2.3 Đo lường, đánh giá
Thực tế cho thấy đo lường đánh giá là một phương pháp hiệu quả để thực hiện việc trao đổi thông tin, đo lường đánh giá và quản lí hiệu quả hoạt động kinh doanh ở cấp điều hành, mang tính sách lược, chiến lược Xét ở mức sách lược, nhân viên và người quản lí sử dụng tính năng đo lường đánh giá để kiểm soát hiệu quả hoạt động dựa trên các mục tiêu cho từng dự án cụ thể Về mặt chiến lược, đo lường đánh giá là một phần của hệ thống quản trị hiệu quả hoạt động tổng thể được các cán bộ sử dụng
để vạch ra chiến lược tổng thể và truyền đạt chiến lược này tới mọi thành viên và bộ phận trong tổ chức
Bạn có thể sử dụng công cụ đo lường đánh giá của BI để quản lí toàn bộ các quy trình của hoạt động kinh doanh:
- Các dự án riêng biệt ở cấp độ sách lược hoặc các chiến lược quản trị hiệu quả hoạt động tổng thể
- Xuyên suốt các phòng ban, bộ phận hoặc các khu vực địa lí khác nhau
- Dễ dàng xây dựng các chỉ số đánh giá: Các chỉ số đánh giá có thể tích hợp đủ
loại dữ liệu có chức năng đan xen lẫn nhau Các công cụ wizard trược quan sẽ hướng dẫn người quản trị thực hiện các thao tác trong quy trình thiết kế chỉ số đánh giá người quản trị có thể xây dựng chỉ số đánh giá sử dụng dữ liệu từ bất cứ nguồn nào, bao gồm
cả OLAP và các dữ liệu quan hệ nhận diện theo nhiều chiều, các hệ thống ERP và
CRM, các bảng tính, tệp phẳng và các giá trị được người dùng nhập vào
- Linh hoạt trong việc chọn lựa cách xem thông tin: Tính năng đo lường đánh
giá của BI cho phép người dùng tổ chức và xem các thẻ điểm theo nhiều cách để đảm bảo rằng họ tập trung sự chú ý vào đúng các vấn đề then chốt Người dùng có thể nhóm
các chỉ số đánh giá theo :
+ Trạng thái - để có thể nhanh chóng xác định các khu vực có vấn đề
+ Người phụ trách - để biết được ai là người có trách nhiệm giải trình
Trang 21+ Bản đồ chiến lược - để xem các quy trình và chỉ số đánh giá hỗ trợ cho chiến lược tổng thể như thế nào
- Nhận diện vấn đề tức thời: Người dùng có thể đặt chế độ thông báo khi một
chỉ số đánh giá thay đổi trạng thái Sử dụng các tính năng khác của BI, bạn có thể tạo
và gửi đi các cảnh báo qua thư điện tử tới màn hình desktop, PDA của người dùng hoặc những vị trí từ xa
- Các tính năng phân tích báo cáo thông tin kinh doanh được nhúng sẵn: Truy
cập các báo cáo, phân tích, kiểm soát hiện trạng hoạt động và các nội dung khác trong môi trường đo lường đánh giá để lấy các thông tin chi tiết và thấu hiểu những nhân tố
có ảnh hưởng tới các chỉ số Bạn cũng có thể truy cập vào các tài liệu dạng văn bản, website và các thông tin khác mà không cần phải thoát ra ngoài ứng dụng đo lường đánh giá
1.2.4 Kết luận
Kinh doanh thông minh là giải pháp cung cấp hoàn chỉnh các chức năng hỗ trợ
ra quyết định chỉ trong một sản phẩm và trên một kiến trúc duy nhất đã được công nhận trong thực tế Nó cho phép người dùng thực hiện chuỗi thao tác báo cáo, phân tích, đo lường đánh giá kết quả, kiểm tra hiện trạng và quản trị sự kiện Điều này giúp môi trường CNTT của bạn cũng như cách mọi người làm việc với thông tin trở nên đơn giản hơn rất nhiều Kết quả là người dùng làm quen với sản phẩm dễ dàng hơn, các quyết định được đưa ra kịp thời và đúng đắn hơn, hoạt động trong toàn tổ chức được thực hiện trôi chảy và thuận lợi hơn Kinh doanh thông minh xứng đáng được xem là chuẩn mực về nền tảng để các tổ chức, doanh nghiệp nâng cao chất lượng của việc quản lí hiệu quả hoạt động kinh doanh
Từ những nhiệm vụ mà kinh doanh thông minh làm được, có thể thấy kinh doanh thông minh mang lại nhiều ưu điểm hơn so với các phần mềm, công cụ báo cáo, phân tích đang được sử dụng Vậy làm thế nào để xây dựng được giải pháp kinh doanh
Trang 22thông minh? Kiến trúc và các bước để có được giải pháp kinh doanh thông minh là gì? Phần tiếp theo sẽ giới thiệu về kiến trúc để xây dựng giải pháp kinh doanh thông minh
1.3 Kiến trúc kinh doanh thông minh
Vấn đề cốt lõi trong kinh doanh thông minh là phân tích dữ liệu trực tuyến (OLAP) và khai phá dữ liệu (Data Mining) trong kho dữ liệu (Data Warehouse) vì dữ liệu dùng trong BI là dữ liệu tổng hợp (Nhiều nguồn, nhiều định dạng, phân tán và có tính lịch sử) Đồng thời việc phân tích dữ liệu trong BI không phải là những phân tích đơn giản như truy vấn dữ liệu, lọc dữ liệu mà là những kỹ thuật trong khai phá dữ liệu (Data Mining) dùng để phân loại (classification), phân cụm (clustering), hay dự đoán (Prediction) Vì vậy BI có mối quan hệ rất chặt chẽ với Data Warehouse[8][14],OLAP[4] và Data mining[2]
Hình 1.1: Kiến trúc của một hệ thống BI
Hệ thống kinh doanh thông minh đơn giản có thể được xem là sự kết hợp của 3
kỹ thuật chính như sau:
- Data Warehouse (Kho dữ liệu): Chứa dữ liệu tổng hợp của doanh nghiệp
- Data Mining (Khai phá dữ liệu): Các kỹ thuật dùng để khai phá dữ liệu và phát hiện tri thức như phân loại (Classification), phân nhóm (clustering), phát hiện luật kết hợp (Association Rule), Dự đoán (Predcition), …
- Business Analyst (Phân tích kinh doanh): Các nhà lãnh đạo doanh nghiệp đưa
ra những quyết định chiến lược đối với hoạt động kinh doanh của doanh nghiệp
Trang 23Hệ thống kinh doanh thông minh được thực hiện thông qua quy trình được minh họa trong hình 1.1 gồm các bước sau:
Bước 1: Lấy thông tin từ các nguồn dữ liệu khác nhau đưa vào kho dữ liệu thông qua quá trình trích rút dữ liệu từ các nguồn dữ liệu này
Bước 2: Sử dụng công cụ phân tích dữ liệu trực tuyến (OLAP) để phân tích dữ liệu từ đó xây dựng lên các mô hình khai phá dữ liệu và có cái nhìn trực quan để hỗ trợ
1.4 Các kỹ thuật xây dựng giải pháp kinh doanh thông minh
Phần này sẽ đề cập đến các công nghệ liên quan để xây dựng lên một giải pháp kinh doanh thông minh: xử lý dữ liệu trực tuyến và khai phá dữ liệu
1.4.1 Xử lý dữ liệu trực tuyến (Online Analysis Processing - OLAP)[3]
1.4.1.1 Khái niệm
OLAP là một kỹ thuật sử dụng các biểu diễn dữ liệu đa chiều gọi là các khối (cube) nhằm cung cấp khả năng truy xuất nhanh đến dữ liệu của kho dữ liệu Tạo khối (cube) cho dữ liệu trong các bảng chiều (dimension table) và bảng sự kiện (fact table) trong kho dữ liệu và cung cấp khả năng thực hiện các truy vấn tinh vi và phân tích cho các ứng dụng client Mô hình của một khối (cube) được minh họa như trong hình 1.2:
Trang 24Hình 1.2 : Mô hình các khối (cube) Mỗi một khối lập phương trong hình được gọi là một cube, có thể thấy các yếu
tố cấu thành lên cube là các chiều dữ liệu được lưu trong các bảng chiều Chiều dữ liệu
ở đây có thể là thời gian, địa điểm, sản phẩm Một yếu tố cấu thành lên cube nữa đó chính là các sự kiện được lưu trong bảng sự kiện ví dụ như: số lượng hàng hóa tiêu thụ được trích rút ra theo các chiều dữ liệu
1.4.1.2 Các phương pháp lưu trữ dữ liệu
a Mô hình Multidimensional OLAP (MOLAP)[3]
Mô hình OLAP đa chiều (MOLAP) lưu trữ dữ liệu cơ sở (là dữ liệu từ các bảng của kho dữ liệu hoặc data mart) và thông tin tổng hợp (là các độ đo được tính toán từ các bảng) trong các cấu trúc đa chiều gọi là các khối (cube) Các cấu trúc này được lưu bên ngoài cơ sở dữ liệu data mart hoặc kho dữ liệu
Lưu trữ các khối (cube) trong cấu trúc MOLAP là tốt nhất cho các truy vấn tổng hợp dữ liệu thường xuyên mà cần thời gian hồi đáp nhanh Ví dụ, tổng sản phẩm bán
được của tất cả các vùng theo quý
Mô hình MOLAP cho phép thực hiện các truy vấn phân tích dữ liệu tốt nhất vì các đặc điểm sau:
Thông tin tổng hợp và dữ liệu cơ sở được lưu trữ trong cấu trúc đa chiều
Trang 25Các thao tác kết nối (join), là một trong những thao tác tốn chi phí nhất của mô hình quan hệ, thì không cần thiết
MOLAP sử dụng các thuật toán nén dữ liệu cho phép lưu trữ với ít không gian hơn
MOLAP sử dụng chỉ mục bitmap cho hiệu quả thực thi tốt hơn
MOLAP lấy dữ liệu trong khối (cube) rất nhanh bằng cách sử dụng các xử lý truy vấn tốc độ cao và cache dữ liệu (data cache) Thông tin nhận được từ khối (cube)
và các bảng OLAP cơ sở chỉ được truy xuất thông tin chi tiết
MOLAP không xử dụng cơ chế khoá vì dữ liệu là chỉ đọc
MOLAP có thể được nạp trước vào bộ nhớ cache
Dữ liệu có thể dễ dàng sao chép đến client cho phân tích không trực tuyến
b Mô hình Relational OLAP (ROLAP) [3]
Lưu trữ các khối trong cấu trúc ROLAP là tốt nhất cho các truy vấn dữ liệu không thường xuyên Ví dụ như nếu 80% người dùng truy vấn chỉ dữ liệu trong vòng
một năm trở lại đây, các dữ liệu cũ hơn một năm sẽ được đưa vào một cấu trúc ROLAP
để giảm không gian đĩa bị chiếm dụng, hơn nữa còn để loại trừ dữ liệu trùng lặp Lưu
trữ dữ liệu trong cấu trúc ROLAP cung cấp các lợi ích sau:
ROLAP cho phép Cube Builder tự động tạo chỉ mục
ROLAP ánh xạ các tổng hợp có sẵn từ data mart hoặc kho dữ liệu OLAP Manager được phép xử dụng các tổng hợp có sẵn để tổng hợp mà không cần tính toán lại cho mỗi truy vấn
ROLAP tạo đòn bẩy cho hệ quản trị cơ sở dữ liệu quan hệ nhằm cho các nhà quản trị hệ thống duy trì nó hiệu quả hơn
ROLAP hỗ trợ Microsoft SQL Server, Oracle, Access và Open Database Connectivity (ODBC)
c Mô hình Hybird OLAP (HOLAP) [3]
Mô hình OLAP lai (HOLAP) là sự kết hợp giữa MOLAP và ROLAP
Trang 26Lưu trữ các khối (cube) trong cấu trúc HOLAP là tốt nhất cho các truy vấn tổng hợp dữ liệu thường xuyên dựa trên một lượng lớn dữ liệu cơ sở Ví dụ, chúng ta sẽ lưu trữ dữ liệu theo hàng quý, hàng năm trong cấu trong MOLAP và dữ liệu hàng tháng, hàng tuần và hàng ngày trong cấu trúc ROLAP
Lợi ích của việc lưu trữ trong cấu trúc HOLAP là: Lấy dữ liệu trong khối (cube) nhanh hơn bằng cách sử dụng xử lý truy vấn tốc độ cao của MOLAP
Tiêu thụ ít không gian lưu trữ hơn MOLAP Tránh trùng lặp dữ liệu
d So sánh các mô hình
MOLAP ROLAP HOLAP Lưu trữ dữ liệu cơ sở Khối Bảng quan hệ Bảng quan hệ Lưu trữ thông tin tổng hợp Khối Bảng quan hệ Khối
Hiệu suất thực hiện truy vấn Nhanh nhất Chậm nhất Nhanh
Tiêu thụ không gian lưu trữ Nhiều Thấp Trung bình
Chi phí bảo trì Cao Thấp Trung bình
Bảng 1.3: So sánh các mô hình lưu trữ dữ liệu trong OLAP
f Lợi ích của OLAP
OLAP là kỹ thuật cho phép các ứng dụng client truy xuất hiệu quả dữ liệu này OLAP cung cấp nhiều lợi ích cho người phân tích như:
- Cung cấp mô hình dữ liệu đa chiều trực quan cho phép dễ dàng lựa chọn, định hướng và khám phá dữ liệu
- Cung cấp một ngôn ngữ truy vấn phân tích, cung cấp sức mạnh để khám phá các mối quan hệ trong dữ liệu kinh doanh phức tạp
- Dữ liệu được tính toán trước đối với các truy vấn thường xuyên nhằm làm cho thời gian trả lời rất nhanh đối với các truy vấn đặc biệt
- Cung cấp các công cụ mạnh giúp người dùng tạo các khung nhìn mới của dữ liệu dựa trên một tập các hàm tính toán đặc biệt
Trang 27OLAP được đặt ra để xử lý các truy vấn liên quan đến lượng dữ liệu rất lớn mà nếu cho thực thi các truy vấn này trong hệ thống OLTP sẽ không thể cho kết quả hoặc
sẽ mất rất nhiều thời gian
OLAP đã trở thành phương pháp phân tích hỗ trợ ra quyết định phổ biến nhất, cho phép những người kinh doanh bình thường khai thác dữ liệu trực tuyến nhằm mục đích tập trung vào những dữ liệu chi tiết ở mức thấp hơn của hệ thống cấp bậc dữ liệu
1.4.1.3 Phân tích đa chiều
Tất cả những dữ liệu có quan hệ với nhau đều cần được phân tích Trong xử lý phân tích thì trọng tâm là phân tích dữ liệu, đặc biệt là phân tích đa chiều Trong phân tích đa chiều, dữ liệu được miêu tả thành các chiều (Dimensions) chẳng hạn như ‘Sản phẩm’, ‘Khu vực’ và ‘Khách hàng’ Các chiều thường liên quan tới những sự phân cấp
ví dụ như ‘Thành phố’, ‘Vùng’ và ‘Nước’ Chiều thời gian là một chiều chuẩn với sự phân cấp của riêng nó là ‘Ngày’, ‘Tuần’, ‘Tháng’, ‘Quý’ và ‘Năm’
Hình 1.3: Phân tích dữ liệu đa chiều
Để giải quyết sự phân tích phức tạp, phân tích nhiều chiều thể hiện một khung nhìn dữ liệu gần gũi với người sử dụng Chẳng hạn, một người sử dụng có thể truy nhập tới khu vực theo từng sản phẩm và lưu trữ 4 quý cuối cho một tập các sản phẩm Kết quả có thể được xoay để thay đổi vị trí các trục và khung nhìn Thêm nữa người sử
Trang 28dụng có thể xem các chiều bằng cách khoan sâu (Drill-down) hay cuốn lên (Roll-up) theo các thành phần của mỗi chiều Việc khoan sâu trên các chiều có thể tạo ra các khung nhìn khác Phạm vi của xử lý thông tin thường đơn giản hơn (chỉ gồm 2 chiều) Phân tích những dữ liệu lịch sử để hiểu được quá khứ là sự phân tích tĩnh Xử lý phân tích có thể được dùng cho những phân tích lịch sử phức tạp với thao tác mở rộng hay gọi là sự phân tích động: lên kế hoạch và dự báo tiếp quá khứ như là phần mở đầu cho tương lai
Các thao tác phân tích trên dữ liệu đa chiều:
Cuộn lên (Roll up): Dựa vào quan hệ cấp bậc của chiều ta có thể cuộn lên mức
độ tổng quát hơn để xem dữ liệu ở mức tổng hợp
Truy xuống (Drilldown): Ngược lại với cuộn lên, từ mức độ tổng quát của quan
hệ cấp bậc của chiều ta có thể truy xuống để xem được chi tiết của dữ liệu
Chọn và chiếu (Slide and Dice): Chọn là thực hiện một phép chọn trên một chiều của khối trung tâm để có được một khối con Chiếu là thao tác thực hiện chọn
trên hai chiều hay nhiều hơn để tìm ra một khối con
Xoay chiều (Pivot): Thực hiện việc xoay khối dữ liệu để có thể xem dữ liệu ở
nhiều chiều khác nhau
1.4.2 Khai phá dữ liệu
Khai phá dữ liệu được định nghĩa là: quá trình trích xuất các thông tin có giá trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các cơ sở dữ liệu, kho dữ liệu… Nhiều người coi khai phá dữ liệu và một thuật ngữ thông dụng khác là khám phá tri
thức trong cơ sở dữ liệu là như nhau
1.4.2.1 Quy trình
Trên thực tế, khai phá dữ liệu chỉ là một bước thiết yếu trong quá trình Khám phá tri thức trong cơ sở dữ liệu Quy trình này bao gồm các bước sau:
Trang 29Hình 1.4: Quy trình khai phá dữ liệu
Bước 1) Làm sạch dữ liệu (data cleaning): loại bỏ nhiễu hoặc các dữ liệu không thích
hợp
Bước 2) Tích hợp dữ liệu (data integration): tích hợp dữ liệu từ các nguồn khác nhau
như: Cơ sở dữ liệu, Kho dữ liệu, file text
Bước 3) Chọn dữ liệu (data selection): ở bước này, những dữ liệu liên quan trực tiếp
đến nhiệm vụ sẽ được thu thập từ các nguồn dữ liệu ban đầu
Bước 4) Chuyển đổi dữ liệu (data transformation): trong bước này, dữ liệu sẽ được
chuyển đổi về dạng phù hợp cho việc khai phá bằng cách thực hiện các thao tác nhóm hoặc tập hợp
Bước 5) Khai phá dữ liệu (data mining): là giai đoạn thiết yếu, trong đó các phương
pháp thông minh sẽ được áp dụng để trích xuất ra các mẫu dữ liệu
Bước 6) Đánh giá mẫu (pattern evaluation): đánh giá sự hữu ích của các mẫu biểu
diễn tri thức dựa vào một số phép đo
Bước 7) Trình diễn dữ liệu (knowlegde presentation): sử dụng các kĩ thuật trình diễn
và trực quan hoá dữ liệu để biểu diễn tri thức khai phá được cho người sử dụng
1.4.2.2 Các thuật toán khai phá dữ liệu
a Times New Series [2]:
Trang 30Thuật toán này được xây dựng dựa trên mô hình ARIMA[7][10]
ARIMA (p, d, q) là tên viết tắt của các từ tiếng Anh (abtoregresive integrated- moving- average) có thể hiểu là tổng hợp chuỗi thời gian theo hai thành phần (tự tương quan AR(P)[7][10]- trung bình trượt MA(q)[7][10] và theo d bậc sai phân Tác giả của
mô hình ARIMA là Box và Jenkin và công bố đầu tiên về nó vào năm 1970 Đây là dạng tổng quát nhất, mà các mô hình tự hồi quy (AR), trung bình trượt (MA) chỉ là các dạng đặc biệt của nó ARIMA không chỉ mô phỏng tốt các thành phần quan tính mà nó còn mô phỏng được cả các thành phần mang tính, chu kỳ và mùa
Theo Box- Jenkin mọi quá trình ngẫu nhiên có tính dừng đều có thể biểu diễn
bằng mô hình Tự Hồi Qui Kết Hợp Trung Bình Trượt ARIMA
• Mô Hình Tự Hồi Qui Bậc p - AR(p)
Trong mô hình tự hồi qui quá trình phụ thuộc vào tổng có trọng số của các giá trị quá khứ và số hạng nhiều ngẫu nhiên
Mô hình này cho biết giá trị phụ thuộc vào giá trị trước đó của chính chuỗi thời gian đó Ví dụ như số lượng thuốc xuất đi trong tháng tới sẽ được dự đoán từ số lượng thuốc xuất đi từ các tháng trước thời điểm dự đoán
• Mô Hình Trung Bình Trượt Bậc q – MA(q)
Trong mô hình trung bình trượt, quá trình được mô tả hoàn toàn bằng tổng có trọng số của các ngẫu nhiên hiện hành có độ trễ
Mô hình này cho biết giá trị phụ thuộc vào giá trị của sai số hiện tại và sai số trong quá khứ, tức tại thời điểm t và t-1 Ví dụ như số lượng thuốc xuất đi trong tháng tới sẽ được dự đoán từ sai số giữa dự đoán số lượng thuốc xuất đi và số lượng thuốc xuất đi thực tế từ các tháng trước đó
• Mô Hình Hồi Quy Kết Hợp Trung Bình Trượt - ARIMA(p,d,q)
Trang 31Do các chuỗi thời gian thường là các chuỗi không dừng nên để áp dụng được
mô hình ARIMA thì phải biến các chuỗi thời gian về thành chuỗi dừng, vì vậy phải khử yếu tố xu thế trong các chuỗi dữ liệu gốc thông qua quy trình lấy sai phân bậc d
Phương trình tổng quát của mô hình ARIMA là:
Mô hình này cho biết giá trị phụ thuộc không chỉ giá trị quá khứ của chính chuỗi thời gian đó mà còn phụ thuộc vào cả giá trị sai số trong quá khứ
b Luật kết hợp [2]
Itemset: Một itemset là một tập hợp những (item) danh mục Mỗi item là một giá trị thuộc tính Trong cái giỏ hàng chẳng hạn, một itemset chứa một tập hợp (set)
của những sản phẩm như bánh ngọt, nước ngọt, và sữa Chẳng hạn khảo sát tỉ mỉ nhân
khẩu khách hàng, một itemset chứa một tập hợp của những giá trị thuộc tính như { Giới tính = ‘ nam’, trình độ học vấn = ‘cử nhân’} Mỗi itemset có một kích thước, là số lượng item được chứa trong 1 itemset Kích thước của itemset { bánh ngọt, nước ngọt, sữa} là 3
Frequent itemsets là các tập hợp mục chọn tương đối phổ biến trong dataset Giới hạn thông thường dành cho một itemset được định nghĩa là sử dụng support, được
nhắc lại trong phần kế tiếp
Support: Sử dụng Support để đánh giá mức độ phổ biến của một itemset Support của một itemset {A, B} được tạo thành dựa trên tổng số lượng giao dịch của cả
Trang 32Probability-xác suất là một đặc tính của một quy tắc kết hợp Xác suất của quy tắc A=>B được tính toán sử dụng support của itemset {A, B} bị chia bởi support của {A} Xác suất này cũng được gọi là confidence-độ tin cậy trong cùng những nghiên cứu của data mining Nó được miêu tả như sau :
Probability (A => B) = Probability (B|A) = Support (A, B)/ Support (A)
Minimum_Probability xác suất tối thiểu là một tham số giới hạn mà ta cần chỉ
định trước khi tiến hành chạy thuật toán Nghĩa là chỉ vì người dùng thích thú với những quy tắc mà nó có một xác suất cao hơn xác suất tối thiểu Xác suất tối thiểu
không có tác động trên itemsets, nhưng nó có ảnh hưởng đến qui tắc
Tầm quan trọng (importance): Importance cũng được coi là một điểm đáng quan tâm hoặc phần nâng cao trong một vài tài liệu Importance có thể dùng để xử lý những itemset và những quy tắc Importance của một itemset được thể hiện qua công thức sau :
Importance ({A,B}) = Probability (A, B)/(Probability (A)* Probability(B))
Nếu importance = 1, A và B là các item độc lập Có nghĩa là lượng bán của sản phẩm A và lượng bán của sản phẩm B là 2 trường hợp độc lập Nếu importance < 1, thì
A và B không tương quan Nghĩa là nếu một khách hàng mua A, thì không chắc anh ấy
sẽ mua B Nếu importance >1, thì A và B chắc chắn tương quan với nhau Điều này có
nghĩa là một khách hàng mua A, thì chắc chắn anh ấy cũng sẽ mua B
Importance (A => B) = log (p(B|A)/p(B|not A)) Một importance = 0 nghĩa là ở đây không có sự kết hợp giữa A và B Một điểm Importance xác thực có nghĩa là xác suất của B tăng lên khi A là true Điểm importance không xác thực nghĩa là xác suất của B giảm khi A là true
c Cây quyết định [2]
Thuật toán Microsoft Decision Tree hỗ trợ cả việc phân loại và hồi quy, và tạo rất tốt các mô hình dự đoán Sử dụng thuật toán này có thể dự đoán cả các thuộc tính rời rạc và liên tục
Trang 33Trong việc xây dựng mô hình, thuật toán này sẽ khảo sát sự ảnh hưởng của mỗi thuộc tính trong tập dữ liệu và kết quả của thuộc tính dự đoán Và tiếp đến nó sử dụng các thuộc tính input (với các quan hệ rõ ràng) để tạo thành 1 nhóm phân hoá gọi là các node Khi 1 node mới được thêm vào mô hình, 1 cấu trúc cây sẽ được thiết lập Node đỉnh của cấy sẽ miêu tả sự phân tích (bằng thống kê) của các thuộc tính dự đoán thông qua các mẫu Mỗi node thêm vào sẽ được tạo ra dựa trên sự sắp xếp các trường của thuộc tính dự đoán, để so sánh với dữ liệu input Nếu 1 thuộc tính input đựơc coi là nguyên nhân của thuộc tính dự đoán (to favour one state over another), 1 node mới sẽ thêm vào mô hình Mô hình tiếp tục phát triển cho đến lúc không còn thuộc tính nào, tạo thành 1 sự phân tách(split) để cung cấp một dự báo hoàn chỉnh thông qua các node
đã tồn tại Mô hình đòi hỏi tìm kiếm một sự kết hợp giữa các thuộc tính và trường của
nó, nhằm thiết lập một sự phân phối không cân xứng giữa các trường trong thuộc tình
dự đoán Vì thế cho phép dự đoán kết quả của thuộc tính dự đoán một cách tốt nhất
d Phân cụm [2]
Thuật toán này sử dụng kỹ thuật lặp để nhóm các bản ghi từ 1 tập hợp dữ liệu vào một liên cung cùng có đặc điểm giống nhau Sử dụng liên cung này có thể khám phá dữ liệu, tìm hiểu về các quan hệ đã tồn tại, mà các quan hệ này không dễ dàng tìm được một cách hợp lý thông qua quan sát ngẫu nhiên Thêm nữa, có thể dự đoán từ các
mô hình liên cung đã được tạo bởi thuật toán
e Naive Bayes [2]
Thuật toán này xây dựng mô hình khai thác nhanh hơn các thuật toán khác, phuc
vụ việc phân loại và dự đoán Nó tính toán khả năng có thể xảy ra trong mỗi trường hợp lệ của thuộc tính input, gán cho mỗi trường 1 thuộc tính có thể dự đoán Mỗi trường này có thể sau đó được sử dụng để dự đoán kết quả của thuộc tính dự đoán dựa vào những thuộc tính input đã biết Các khả năng sử dụng để sinh ra các mô hình được tính toán và lưu trữ trong suốt quá trình xử lý của khối lập phương (cube: các mô hình được dựng lên từ các khối lập phương) Thuật toán này chỉ hỗ trợ các thuộc tính hoặc
Trang 34là rời rạc hoặc liên tục, và nó xem xét tất cả các thuộc tính input độc lập Thuật toán này cho ta 1 mô hình khai thác đơn giản (có thể được coi là điểm xuất phát của DataMining), bởi vì hầu như tất cả các tính toán sử dụng trong khi thiết lập mô hình, được sinh ra trong xử lí của cube (mô hình kích thước hợp nhất), kết quả được trả về nhanh chóng Điều này tạo cho mô hình 1 lựa chọn tốt để khai phá dữ liệu khám phá các thuộc tính input được phân bố trong các trường khác nhau của thuộc tính dự đoán như thế nào?
f Neural Network [2]
Thuật toán này tạo các mô hình khai thác hồi quy và phân loại bằng cách xây dựng đa lớp perceptron của các neuron Giống như thuật toán cây quyết định, đưa ra mỗi tình trạng của thuộc tính có thể dự đoán Thuật toán này tính toán khả năng có thể của mỗi trang thái có thể của thuộc tính input Thuật toán sẽ xử lý toàn thể các trường hợp Sự lặp đi lặp lai so sánh các dự đoán phân loại của các trường với sự phân loại của các trường đã biết Sai số từ sự phân loại ban đầu (của phép lặp ban đầu) của toàn bộ các trường hợp được trả về network và được sử dụng để thay đổi sự thực thi của network cho các phép lặp kế theo,v.v Có thể sau đó sử dụng những khả năng này để
dự đoán kết quả cảu các thuộc tính dự đoán, dựa trên thuộc tính input 1 sự khác biệt chính giữa thuật toán này và thuật toán Cây quyết định là các kiến thức xử lí là những tham số network tối ưu nhằm làm nhỏ nhất các lỗi có thể trong khi cây quyết định tách các luật, mục đích để cực đại hoá thông tin có lợi Thuật toán này hỗ trợ cả các thuộc
tính rời rạc và liên tục
1.4.3 Kết luận
Dựa vào hai kĩ thuật được đề cập trong giải pháp kinh doanh thông minh được nêu ở trên là xử lý dữ liệu trực tuyến và khai phá dữ liệu, ta đã hiểu được phần nào về những kĩ thuật làm nền tảng cho việc xây dựng giải pháp thông minh BI Công nghệ OLAP mang lại khả năng hỗ trợ ra quyết định cho giải pháp BI bằng khả năng phân tích đa chiều trên nền tảng là mô hình cơ sở dữ liệu đa chiều Công nghệ khai phá dữ
Trang 35liệu bao gồm rất nhiều thuật toán cho người dùng nhiều lựa chọn để khám phá tri thức trong kho dữ liệu lớn của mình Dựa vào những công nghệ được nêu trên, có thể nói, giải pháp kinh doanh thông minh BI đã đạt được những yêu cầu nhất định về mặt khoa học công nghệ để giải quyết hiệu quả việc hỗ trợ ra quyết định trong các bài toán về kinh tế nói riêng và những bài toán yêu cầu về hỗ trợ ra quyết định nói chung Tính khoa học và hiệu quả của hai công nghệ này nói riêng và giải pháp BI nói chung, sẽ được trình bày rõ hơn trong phần "động cơ, mục tiêu và nhiệm vụ của luận văn" ở dưới đây
1.5 Động cơ, mục tiêu và nhiệm vụ của luận văn
Từ những kiến thức đã tìm hiểu, có thể thấy kinh doanh thông minh là một giải pháp mang lại nhiều lợi ích cho các doanh nghiệp Bên cạnh đó, kinh doanh thông minh cũng có thể áp dụng trong một số lĩnh vực khác như y tế, giáo dục và rất nhiều đối tượng sử dụng
Những giải pháp BI hiện đại ngày càng hướng đến đáp ứng nhu cầu sử dụng đại trà trong việc phân tích tác nghiệp, phục vụ lãnh đạo và chuyên gia ở nhiều cấp độ khác nhau và phạm vi hoạt động rất rộng lớn Đặc điểm chính của những giải pháp này
là dễ sử dụng, có hàng loạt chức năng hướng tới các ứng dụng kinh doanh cụ thể cũng như hiệu suất cao, cùng khả năng triển khai trên các cấu hình máy tính không được cao cho lắm của người dùng phổ thông
Khuynh hướng phát triển các hệ thống BI phần lớn được xác định không chỉ bởi nhu cầu của các doanh nghiệp đặt hàng mà cả ở các khả năng của kiến trúc điện toán
mà các hệ thống BI xây dựng trên đó Trong vòng mười năm gần đây, các nhà phát triển BI đã cố gắng nối kết chúng với những sáng tạo lớn về công nghệ và kiến trúc, từ SOA, kiến trúc cổng thông tin và công nghệ ảo hoá, các giải pháp di động Nay, các nhà sản xuất các hệ thống BI đang cố gắng tích hợp chúng vào môi trường điện toán đám mây
Trang 36Có thể coi việc sử dụng tích cực năng lực tính toán trên bộ nhớ chính memory) là phát hiện thành công của các nhà phát triển hệ thống BI Việc xử lý dữ liệu trong bộ nhớ phân tích cho phép nâng cao năng suất của hệ thống BI rất nhiều, tới hàng trăm lần, nhờ giảm đến tối thiểu nhu cầu kết nối với dữ liệu được triển khai trên các ổ cứng (việc trao đổi dữ liệu với các đĩa cứng chậm hơn rất nhiều so với trao đổi dữ liệu nằm trên bộ nhớ)
(in-Những giải pháp BI như thế (không cần đến các đĩa lưu trữ dữ liệu) đang tỏ ra
rẻ hơn nhiều lần so với các hệ thống BI được xây dựng theo các sơ đồ cũ với kho lưu trữ dữ liệu Nhờ có chi phí tổng sở hữu thấp, chúng đang trở nên dễ tiếp cận hơn và vì thế dễ triển khai đại trà hơn
So với các sản phẩm đi trước, giải pháp Business Intelligence đã có những tiến
bộ nhất định:
- Chia sẻ thông tin trong công ty : thông tin không còn bị lưu giữ dạng dữ liệu
giấy mà trở nên dễ tiếp cận hơn đối với tất cả nhân viên
- Quản lý dữ liệu : các dữ liệu sẽ được quản lý trước khi truyền đi, tập hợp theo
lĩnh vực chức năng, mỗi dữ liệu chỉ mang một ý nghĩa chức năng duy nhất
- Nâng cao năng lực sản xuất : những người lập báo cáo không còn phải tìm
kiếm hay xử lý lại thông tin Tất cả mọi dữ liệu đều nằm trong một kho lưu trữ duy nhất
Do đó, việc tìm hiểu về kinh doanh thông minh và ứng dụng kinh doanh thông minh trong các lĩnh vực ở Việt Nam đang là một nhu cầu cấp thiết Từ đó, tác giả đã lựa chọn mục tiêu nghiên cứu là đề xuất giải pháp để ứng dụng kinh doanh thông minh trong kho dược phẩm, qua đó có được công cụ hỗ trợ ra quyết định cho những nhà quản lý kho dược phẩm giúp cho việc ra quyết định được chính xác hơn Với mục tiêu
đó thì luận văn phải hoàn thành được những nhiệm vụ sau:
- Tìm hiểu khái niệm kinh doanh thông minh và các công nghệ liên quan
Trang 37- Đề xuất tích hợp các công nghệ liên quan thành một giải pháp kinh doanh thông minh ứng dụng trong việc quản lý kho thuốc trong bệnh viện
- Áp dụng giải pháp ở trên để xây dựng một phần mềm ứng dụng kinh doanh thông minh trong việc quản lý kho thuốc
1.6 Kết luận
Trong chương này, người viết đã tìm hiểu được một số các lý thuyết, các kĩ thuật được sử dụng trong kinh doanh thông minh như OLAP, khai phá dữ liệu Người viết cũng đã đưa ra được những so sánh nhất định trên một số phương diện như báo cáo, phân tích (sử dụng, quản lý dữ liệu, phân tích thống kê, vẽ đồ thị), quản lý các hoạt động Chương này, cũng chỉ ra những mục tiêu và nhiệm vụ mà tác giả phải đạt được trong luận văn Đọc xong chương này, người đọc đã có thể có một cái nhìn tổng quan có tính hệ thống về đề tài đang được thực hiện Chương tiếp theo sẽ đề xuất xây dựng giải pháp ứng dụng kinh doanh thông minh trong kho thuốc
Trang 38CHƯƠNG II: ỨNG DỤNG KINH DOANH THÔNG MINH TRONG KHO
THUỐC BỆNH VIỆN
Trong chương này, tác giả sẽ phân tích, đánh giá những phần mềm đang được
sử dụng nhiều trong các kho thuốc ở Việt Nam nhằm từ đó rút ra những điểm còn hạn chế đang còn tồn tại Từ đó, tác giả sẽ đề xuất, xây dựng giải pháp ứng dụng kinh doanh thông minh trong hoạt động của kho thuốc
2.1 Bài toán quản lý kho thuốc bệnh viện
2.1.1 Bối cảnh hiện nay
Phía sau sự vận hành phức tạp của mỗi bệnh viện là một hệ thống máy tính chạy các phần mềm hỗ trợ các y bác sĩ, nhân viên phòng chức năng theo dõi, quản lý các hoạt động của bệnh viện Đó là quản lý khám bệnh, quản lý dược, quản lý vật tư Tuy nhiên, việc ứng dụng công nghệ thông tin (CNTT) để điều hành, quản lý bệnh viện ở mỗi nơi mỗi khác (thậm chí ở nhiều nơi trên cả nước còn chưa được ứng dụng, vẫn quản lý theo kiểu cũ là dùng sổ sách) và có những đánh giá khác nhau về tính hiệu quả, còn tùy thuộc vào cơ chế và cách quản lý của từng bệnh viện Và trong những vấn đề
ấy, quản lý kho dược là một vấn đề còn gặp nhiều khó khăn đối với mỗi bệnh viện
CNTT- nền tảng cho việc tăng hiệu suất công việc trong bệnh viện
Thế giới luôn luôn phát triển không ngừng, luôn hướng tới những cái mới, ngày càng tạo ra nhiều tri thức mới để phục vụ cho cuộc sống con người Tri thức Khoa học Công nghệ là một tri thức khoa học mà sản phẩm của nó là các thành tựu khoa học vô cùng quý giá Việc tạo ra các tri thức Khoa học, công nghệ như là một bước đột phá của sự phát triển trong xã hội loài người, nó thể hiện những gì tinh túy nhất của tri thức con người Giờ đây khoa học công nghệ (KHCN) đã không thể thiếu trong cuộc sống con người, nó đã đi sâu vào mọi mặt mọi lĩnh vực của cuộc sống trong xã hội Nhờ có
nó mà cuộc sống con người đã hoàn toàn thay đổi Từ việc con người phải dùng tay tính toán các phép tính đơn giản thì ngày nay có phát minh của máy vi tính mà việc tính
Trang 39toán hàng tỷ phép tính chỉ trong vài giây đã trở nên hết sức đơn giản phục vụ cho các nghiên cứu và dự đoán Từ việc liên lạc với nhau bằng những bức thư viết tay thì giờ đây nhờ có hệ thống Internet toàn cầu thì con người có thể trực tiếp nói chuyện với nhau ở bất cứ nơi đâu trên trái đất Trong các doanh nghiệp, trường học, bệnh viện…thì việc quản lý đã trở nên dễ dàng hơn rất nhiều nhờ các phần mềm quản lý do con người tạo ra Cũng như trong y học thì việc khám và chữa bệnh nhờ các kĩ thuật hiện đại đã thực sự không thể thiếu, nhờ có nó mà một số căn bệnh trươc đây y học phải bó tay mà giờ đây đã trở nên hết sức dễ dàng… Ta có thể thấy vai trò không thể thiếu của các tri thức khoa học công nghệ trong tất cả các lĩnh vực đời sống xã hội hiện đại Với sự phát triển của các lĩnh vực đó thì nó càng thể hiện rõ được vai trò của nó Tri thức khoa học, công nghệ luôn khẳng định được vai trò chủ đạo của nó với sự phát triển đi lên của các lĩnh vực trong xã hội hiện đại ngày nay Việc ứng dụng các thành tựu của khoa học vào mục tiêu phát triển là một điều tất yếu không thể thiếu vì những
gì mà KHCN đem lại là hết sức to lớn, góp phần cho sự phát triển nhanh chóng và hiệu quả Cụ thể ta có thể thấy được hiệu quả của việc áp dụng Công nghệ thông tin (CNTT) vào lĩnh vực Y tế như thế nào Vai trò của CNTT với sự phát triển của ngành
Y tế là hết sức to lớn và cần thiết CNTT đã dần trở thành một yếu tố không thể thiếu trong sự nghiệp phát triển ngành Y tế của một quốc gia, nó nắm giữ một vai trò chủ đạo Công nghệ thông tin (CNTT) đang dần chứng tỏ tầm ảnh hưởng rất lớn đến mọi mặt của đời sống xã hội Đối với hoạt động của ngành y tế, có thể thấy rằng, CNTT ngày càng đóng vai trò quan trọng, không chỉ là mũi nhọn cho quá trình cải cách hành chính trong công tác quản lý, điều hành của cơ quan quản lý mà còn “đỡ đầu” cho việc triển khai và ứng dụng thành công các kỹ thuật cao trong KCB như chụp cắt lớp, mổ nội soi thăm khám cho bệnh nhân qua hệ thống điện tử Ta có thể thấy được những hiệu quả vô cùng to lớn mà Công nghệ thông tin đem lại trong việc khám chữa bệnh ở các Bệnh viện như bệnh viện Bạch Mai, bệnh viện Hữu Nghị, bệnh viện Nhi Thụy Điển Việc áp dụng CNTT vào việc quản lý khám bệnh đã làm giảm thời gian khám
Trang 40bệnh, giúp cho bệnh nhân không phải chờ đợi lâu so với trước kia, tối ưu hóa thời gian làm việc cho đội ngũ y bác sĩ, cán bộ phòng ban chức năng, vì vậy đã giúp ích rất tốt cho công tác khám chữa bệnh ngày nay Ở những bệnh viện đã sử dụng phần mềm quản lý bệnh viện, đã không còn những cảnh bác sỹ, điều dưỡng phải mang kết quả khám chữa bệnh hay xét nghiệm theo bệnh nhân để chuyển sang khoa khác, đã không còn nhiều những sự bất hợp lý trong quy trình khám chữa bệnh Đội ngũ y bác sỹ và cán bộ đã có thể làm việc hiệu quả hơn, tránh những hao phí không cần thiết về mặt thời gian và thể chất
Thực trạng sử dụng hệ thống thông tin quản lý bệnh viện
Như đã nói ở trên, các bệnh viện đều ít nhiều sử dụng các hệ thống máy tính, nhưng mức độ đầu tư cho CNTT không phải là đồng đều và được chú trọng như nhau Ứng dụng CNTT mà các bệnh viện bắt buộc phải dùng chỉ có phần mềm kế toán và phần mềm bảo hiểm, theo yêu cầu của Bộ và các Sở Y Tế Vẫn có những bệnh viện sử dụng sổ sách để quản lý khám chữa bệnh, quản lý dược và vật tư, ví dụ như bệnh viện Thể Thao Việt Nam
Theo số liệu của Bộ Y tế, Việt Nam hiện có 13.600 cơ sở y tế, trong đó gồm 1.263 bệnh biện; 1.0916 trung tâm y tế dự phòng; 11.104 trạm y tế xã Con số này tiếp tục tăng lên [12] Theo báo cáo mới nhất của Viện Công nghệ thông tin – Bộ Y tế về tình hình ứng dụng CNTT, công tác tin học quản lý Bệnh viện trong thời gian qua đã đạt được một số tiến bộ đáng kể: Một số Bệnh viện có tiềm năng về tài chính và công nghệ thông tin đã vươn lên bằng nội lực của chính mình xây dựng hệ thống phần mềm quản lý Bệnh viện đồng bộ và ứng dụng thành công tin học hóa quản lý Bệnh viện (Bệnh viện Phụ sản Hà Nội; Bệnh viện Nhi Trung ương, Bệnh viện Bưu Điện Hà Nội
…) Đây là những mô hình tốt cho các Bệnh viện khác học tập và là bằng chứng vô cùng thuyết phục về hiệu quả của ứng dụng tin học trong quản lý Bệnh viện trong việc nâng cao chất lượng công tác khám chữa bệnh Qua thực tế tại các bệnh viện này cho thấy, việc ứng dụng công nghệ thông tin tổng thể đã giúp các nhà quản lý và sử dụng