BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC ĐÀ NẴNG VÕ PHI THANH ỨNG DỤNG ĐIỆN TOÁN ĐÁM MÂY XÂY DỰNG KHO DỮ LIỆU PHỤC VỤ ĐÀO TẠO TẠI TRƯỜNG TRUNG CẤP... Không nằm ngoài xu thế chung của thế giới, V
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG
VÕ PHI THANH
ỨNG DỤNG ĐIỆN TOÁN ĐÁM MÂY XÂY DỰNG KHO DỮ LIỆU PHỤC VỤ ĐÀO TẠO TẠI TRƯỜNG TRUNG CẤP
Trang 2Công trình được hoàn thành tại
ĐẠI HỌC ĐÀ NẴNG
Người hướng dẫn khoa học: PGS.TS PHAN HUY KHÁNH
Phản biện 1: TS NGUYỄN TRẦN QUỐC VINH
Phản biện 2: TS NGUYỄN QUANG THANH
Luận văn được bảo vệ tại Hội đồng chấm luận văn tốt nghiệp Thạc
sĩ kỹ thuật họp tại Đại học Đà Nẵng vào ngày 28 tháng 12 năm
2013
* Có thể tìm hiểu luận văn tại:
- Trung tâm Thông tin - Học liệu, Đại học Đà Nẵng
DaiHocDaNang
Trang 3MỞ ĐẦU
1 Lý do chọn đề tài
Ngày nay, sự bùng nổ thông tin, truyền thông đã có những bước phát triển vượt bậc Sự phát triển công nghệ của các thiết bị tính toán: Siêu máy tính, máy chủ, máy tính cá nhân, các thiết bị di động thông minh,… được kết nối và sự bùng nổ ứng dụng Web Với
sự phát triển nhanh chóng của công nghệ thông tin đòi hỏi sự đầu tư trang thiết bị cơ sở hạ tầng CNTT ngày càng lớn, chi phí sử dụng các phần mềm, quản lý hệ thống cũng tăng Trong khi nhu cầu lưu trữ,
xử lý thông tin nhanh chóng, chính xác nên các doanh nghiệp, các tổ chức tăng cường ứng dụng CNTT Do áp lực cạnh tranh, mong muốn ứng dụng CNTT hiệu quả nhưng lại giảm chi phí luôn đặt ra
Trong thời gian gần đây, chủ đề ĐTĐM được nhắc đến nhiều nhất trong các sự kiện công nghệ, bất kỳ tạp chí công nghệ, các trang Web, blog về IT đều đề cập đến ĐTĐM Theo khảo sát mới đây của hãng nghiên cứu Gartner, tốc độ phát triển ĐTĐM trên toàn thế giới
đã đạt mức 17% hàng năm trong khi hơn 50% doanh nghiệp, tổ chức tham gia đều triển khai điện toán đám mây dưới hình thức này hay hình thức khác [25]
Hiện nay, ĐTĐM được dự đoán là “cơn sóng thần công nghệ” Không nằm ngoài xu thế chung của thế giới, Việt Nam dần tiếp cần ĐTĐM thông qua các nhà cung cấp như Google, IBM, Microsoft,… Nhiều công ty tại Việt Nam đã triển khai ĐTĐM như FPT, Sacombank, Misa,…
Để giảm thiểu chi phí và tăng cường ứng dụng CNTT trong quản lý đào tạo nhằm tăng hiệu quả đào tạo thì việc ứng dựng điện toán đám mây mang lại nhiều lợi ích
DaiHocDaNang
Trang 4Mặt khác, quản lý dữ liệu đào tạo gồm nhiều dữ liệu không tương thích với nhau, khi dữ liệu ngày càng khổng lồ thì việc truy xuất, thống kê, phân loại càng khó khăn Nhà quản lý còn mong muốn phân tích dữ liệu có khả năng hỗ trợ các quyết định thì xây dựng kho dữ liệu giúp ích được điều đó
Trong khi đó nhu cầu đào tạo của Trường Trung cấp Kinh tế Quảng Bình ngày càng mở rộng, với chủ trương nhà trường mở nhiều mã ngành mới nhằm đa dạng hóa ngành nghề đào tạo và đáp ứng nhu cầu xã hội Hiện trạng quản lý dữ liệu chưa đồng bộ, tính hệ thống chưa cao, việc tiếp cận nguồn dữ liệu cần thiết đối với cán bộ, giáo viên, học sinh, người quản lý còn hạn chế Công tác lưu trữ dữ liệu chưa đảm bảo, chủ yếu lưu trữ trên từng máy do từng cá nhân phụ trách Chưa tiến hành phân tích dữ liệu để hỗ trợ các quyết định của nhà quản lý Thông qua mối quan hệ chương trình đào tạo, các khâu quản lý, chất lượng giáo viên,… ảnh hưởng đến chất lượng đào tạo để phân tích, so sánh, đối chiếu hỗ trợ quá trình lãnh đạo
Việc ứng dụng điện toán đám mây để xây dựng kho dữ liệu là cần thiết, do đó tôi chọn đề tài “Ứng dụng điện toán đám mây xây dựng kho dữ liệu phục vụ đào tạo tại trường Trung cấp Kinh tế Quảng Bình”
2 Mục tiêu và nhiệm vụ
Trên cơ sở phân tích hiện trạng và nhu cầu phát triển hiệu quả đào tạo tại trường Trung cấp Kinh tế Quảng Bình, đề tài tìm hiểu lĩnh vực ĐTĐM, các công cụ phát triển khai thác ĐTĐM, xây dựng kho
dữ liệu phục vụ đào tạo, trợ giúp, phân tích, báo cáo, dự báo hoạt động đào tạo tại trường trong bối cảnh phát triển kinh tế địa phương Quảng Bình và hội nhập quốc tế
DaiHocDaNang
Trang 5Từ thực trạng, sẽ đánh giá được ưu điểm, hạn chế của việc sử dụng mô hình này Từ đó đề xuất các giải pháp nhằm nâng cao hiệu quả đào tạo tại trường
3 Đối tượng và phạm vi nghiên cứu
Nghiên cứu nguồn dữ liệu phục vụ đào tạo tại trường Trung cấp Kinh tế Quảng Bình
Tìm hiểu kho dữ liệu, ĐTĐM, các công cụ phát triển, khai thác Kho dữ liệu và ĐTĐM
4 Phương pháp nghiên cứu
- Phân tích hiện trạng và nhu cầu đào tạo tại trường Trung cấp Kinh tế Quảng Bình
- Tìm hiểu ĐTĐM để đề xuất giải pháp
- Lựa chọn mô típ công cụ, ngôn ngữ lập trình để xây dựng ứng dụng và đánh giá kết quả thử nghiệm
5 Ý nghĩa khoa học và thực tiễn của đề tài
Về khoa học, đề tài tìm hiểu, nghiên cứu ứng dụng điện toán đám mây, xây dựng kho dữ liệu, trên cơ sở đó có cách nhìn tổng quan để đề xuất giải pháp xây dựng ứng dụng
Về thực tiễn, đề tài xây dựng ứng dụng nhằm giảm chi phí nguồn lực CNTT, quản lý dữ liệu đào tạo khoa học, hỗ trợ nhà quản
lý đưa ra quyết định kịp thời góp phần nâng cao hiệu quả đào tạo của nhà trường
6 Bố cục của luận văn
Luận văn gồm có 3 chương:
Chương 1 Tìm hiểu kho dữ liệu và điện toán đám mây
Tìm hiểu, nghiên cứu về kho dữ liệu (Data Warehouse), một
số khái niệm cơ bản, đặc điểm, phân loại, sử dụng
DaiHocDaNang
Trang 6Tìm hiểu, nghiên cứu tổng quan về điện toán đám mây (Cloud Computing), một số khái niệm cơ bản, tìm hiểu về kiến trúc, mô hình chung của điện toán đám mây, tìm hiểu một số sản phẩm ứng dụng công nghệ này
Chương 2 Phân tích và thiết kế hệ thống
Phân tích hiện trạng công tác đào tạo tại trường Trung cấp Kinh tế Quảng Bình, nhu cầu cầu xây dựng kho dữ liệu và đề xuất giải pháp ứng dụng ĐTĐM xây dựng kho dữ liệu
Chương 3 Xây dựng ứng dụng
Thiết kế kho dữ liệu, thiết kế báo cáo, phân tích dữ liệu Xây dựng và triển khai kho dữ liệu trên nền tảng đám mây của Google
DaiHocDaNang
Trang 7CHƯƠNG 1 TÌM H IỂU K H O DỮ LIỆ U
VÀ ĐIỆN TOÁN ĐÁM MÂY
1.1 KHO DỮ LIỆU
1.1.1 Khái niệm về Kho dữ liệu
Có nhiều cách định nghĩa về Kho dữ liệu (Data Warehouse): Kho dữ liệu là kho lưu trữ dữ liệu lưu trữ bằng thiết bị điện tử của một tổ chức Các kho dữ liệu được thiết kế để hỗ trợ việc phân tích dữ liệu và lập báo cáo [12]
Kho dữ liệu là tập hợp các CSDL tích hợp, hướng chủ đề, ổn định, gắn với thời gian, được thiết kế để hỗ trợ cho chức năng ra quyết định trong công tác quản lý
1.1.2 Đặc điểm và phân loại
a Đặc điểm
Tính tích hợp (integrated); Hướng chủ đề (subject-oriented); Biến thời gian (time-variant); Dữ liệu ổn định (non-volatile)
b Phân loại
Tùy thuộc vào quy mô tổ chức, cách tổ chức và vị trí của kho
dữ liệu mà người ta chia Kho dữ liệu thành hai loại là: Enterprise Data Warehouse và Data Mart
1.1.3 Kiến trúc kho dữ liệu
a Kiến trúc kho dữ liệu
Mô hình kiến trúc của kho dữ liệu cơ bản gồm có ba thành phần: Nguồn dữ liệu, khu vực xử lý và kho dữ liệu
DaiHocDaNang
Trang 8Hình 1.1 Mô hình kiến trúc kho dữ liệu
b Dòng dữ liệu trong kho
Dòng dữ liệu trong kho được thể hiện theo hình sau:
Hình 1.2 Dòng dữ liệu trong kho 1.1.4 Phương pháp xây dựng kho dữ liệu
a Phương pháp xây dựng kho dữ liệu
Thiết kế CSDL cho kho dữ liệu theo các phương pháp:
- Lược đồ hình sao (Start schema): Lược đồ hình sao cho phép
một hệ thống đối tượng có thể kết nối với nhiều đối tượng khác
Quy trình tích hợp dữ liệu
Kho dữ liệu ETL
CSDL Dữ liệu nguồn
Bảng điểm Dữ liệu nguồn
Vùng xử lí
đầu cuối
Kho dữ liệu
Phân tích
Báo biểu
DaiHocDaNang
Trang 9Hình 1.3 Mô hình hình sao
- Lược đồ hình tuyết rơi (Snowflake): Lược đồ này là mở
rộng của lược đồ hình sao
Hình 1.4 Mô hình bông tuyết
- Mô hình dữ liệu nhiều chiều (lược đồ kết hợp: Là kết hợp
giữa sơ đồ hình sao dựa trên bảng sự kiện và những bảng chiều
Hình 1.5 Mô hình lược đồ nhiều chiều
b Quy trình xây dựng Kho dữ liệu
Để xây dựng kho dữ liệu gồm các bước sau:
HOC SINH
THOI GIAN NGAY THANG
MON HOC TRUY CAP
Các bảng chiều
Bảng dữ kiện
CAC MON HOC
Trang 10- Lập kế hoạch
- Phân tích các yêu cầu hệ thống
- Thiết kế và xây dựng kho dữ liệu
- Duy trì và triển khai kho dữ liệu
1.2 ĐIỆN TOÁN ĐÁM MÂY
1.2.1 Khái niệm về điện toán đám mây
a Lịch sử phát triển
Thuật ngữ điện toán đám mây xuất hiện bắt nguồn từ ứng
dụng điện toán lưới (grid computing) trong thập niên 1980, tiếp theo
là điện toán theo nhu cầu (utility computing) và phần mềm dịch
vụ (SaaS)
b Khái niệm
Điện toán đám mây (tiếng Anh: cloud computing), còn gọi là điện toán máy chủ ảo, là mô hình điện toán sử dụng các công nghệ máy tính và phát triển dựa vào mạng Internet [17]
Điện toán đám mây là mô hình diện toán cho phép truy cập qua mạng để lựa chọn và sử dụng tài nguyên tính toán (ví dụ: mạng, máy chủ, lưu trữ, ứng dụng và dịch vụ) theo nhu cầu một cách thuận tiện và nhanh chóng, đồng thời cho phép kết thúc sử dụng dịch vụ, giải phóng tài nguyên dễ dàng, giảm thiểu các giao tiếp với nhà cung cấp [10]
Như vậy, hiểu một cách đơn giản mô hình ĐTĐM cung cấp cho người sử dụng, các tổ chức, doanh nghiệp sử dụng tài nguyên CNTT dưới dạng các dịch vụ Cho phép người sử dụng lựa chọn các dịch vụ linh hoạt, theo yêu cầu, giảm thiểu chi phí đầu tư cơ sở hạ tầng
1.2.2 Kiến trúc điện toán đám mây
Kiến trúc mô hình ĐTĐM gồm bốn tầng như sau:
DaiHocDaNang
Trang 11Tầng ứng dụng (Aplication Layer)
Tầng nền tảng (Platform Layer)
Tầng tài nguyên hợp nhất (Unified Resource Layer)
Tầng thiết bị (Fabric Layer)
Hình 1.8 Kiến trúc ĐTĐM [5]
1.2.3 Mô hình điện toán đám mây
a Mô hình dịch vụ (Service Models)
Mô hình dịch vụ điện toán đám mây chia thành ba nhóm: Dịch
vụ phần mềm (Software as a Service - SaaS); Dịch vụ nền tảng (Platform as a Service - PaaS); Dịch vụ hạ tầng (Infrastructure as a Service - IaaS)
b Mô hình triển khai (Deployment of cloud services)
Triển khai các dịch vụ đám mây thông qua một trong các mô hình cơ bản: Đám mây riêng (private cloud), đám mây cộng đồng (community cloud), đám mây công cộng (public cloud) hoặc đám mây lai (hybrid cloud)
1.2.4 Các nhà cung cấp dịch vụ điện toán đám mây
Trang 121.2.5 Google App Engine (GAE)
a Giới thiệu
GAE là một nền tảng hosting cho phép lưu trữ nhiều Web Server CSDL BigTable và kho lưu trữ bởi file GFS GAE cho phép chạy các ứng dụng web trên cơ sở hạ tầng của Google Ứng dụng App Engine rất dễ xây dựng, dễ bảo trì, và dễ dàng để mở rộng quy
mô như lưu lượng truy cập và nhu cầu lưu trữ dữ liệu lớn Với App Engine, không có máy chủ để duy trì: Chỉ cần tải ứng dụng, và nó sẵn sàng để phục vụ người dùng [15]
b Một số tính năng đặc trưng của GAE
Lưu trữ dữ liệu (Data store); Tìm kiếm (Search); Viết code một lần và triển khai cung cấp và cấu hình nhiều máy tính cho trang web dịch vụ và lưu trữ dữ liệu; Cân bằng tải; Dể dàng tích hợp với các dịch vụ khác của Google
c Google Web Tookit (GWT)
d Xây dựng ứng dụng Google trên GWT
e Google Gears R.I.P
f Google Apps Script (GAS)
1.2.6 Lợi ích và thách thức của điện toán đám mây
a Lợi ích
Linh động; Kiểm soát chi phí; Giảm thiểu kỹ năng CNTT
b Khó khăn thách thức của điện toán đám mây
Vấn đề bảo mật; Vấn đề kiểm soát dữ liệu
1.2.7 Xu hướng phát triển điện toán đám mây
Xu thế về công nghệ ĐTĐM sẽ được ngày càng hoàn thiện và phát triển mạnh về sau Các dịch vụ và mô hình ĐTĐM hướng tới nhằm mang lại những sản phẩm dịch vụ tốt nhất cho người dùng
DaiHocDaNang
Trang 13CHƯƠNG 2 PHÂN TÍCH VÀ THIẾT KẾ HỆ THỐNG
2.1 GIỚI THIỆU
2.1.1 Mở đầu
a Tổng quan về tình hình kinh tế - xã hội tỉnh Quảng Bình
Tình hình kinh tế - xã hội tỉnh Quảng Bình có chuyển biến tích cực, kinh tế phát triển đạt tốc độ tăng trưởng khá và tạo lập được các yếu tố đảm bảo phát triển bền vững Mở ra nhiều cơ hội việc làm, đồng thời đòi hỏi năng lực người lao động mới phải có chuyên môn
trong độ tuổi lao động [23]
c Tổng quan về các trường Trung cấp chuyên nghiệp trên địa bàn tỉnh Quảng Bình
Trên địa bàn tỉnh hiện có ba trường TCCN Hiệu quả đào tạo nghề chưa cao Nếu so sánh chỉ tiêu số HS trúng tuyển được gọi vào nhập học với số HS được ĐT đạt chuẩn thì kết quả quá chênh lệch, quá thấp
DaiHocDaNang
Trang 14Với kết quả trên vấn đề cấp thiết đặt ra là: Các cơ sở GD chuyên nghiệp tỉnh Quảng Bình cần có biện pháp cụ thể cho đơn vị mình, từng bước nâng cao chất lượng đào tạo
2.1.2 Giới thiệu về vai trò đào tạo tại trường Trung cấp Kinh tế Quảng Bình
Trường Trung cấp kinh tế Quảng Bình, tiền thân là Trường Trung học Kinh tế Bình Trị Thiên được thành lập năm 1977 có chức năng đào tạo, bồi dưỡng, liên kết đào tạo nhằm cung cấp nguồn nhân lực cho địa phương Nghiên cứu, ứng dụng khoa học góp phân phát triển kinh tế xã hội địa phương
2.2 PHÂN TÍCH THỰC TRẠNG CÔNG TÁC ĐÀO TẠO TẠI TRƯỜNG TRUNG CẤP KINH TẾ QUẢNG BÌNH
2.2.1 Mở đầu
Hiện nay, nhà trường đang ĐT với 5 chuyên ngành trung cấp
cụ thể như sau: Kế toán doanh nghiệp, Kế toán hành chính sự nghiệp, Kinh doanh thương mại dịch vụ, Thống kê, Tin học ứng dụng Bên cạnh đó, nhà trường còn liên kết đào tạo đại học: Liên kết ĐT đại
học liên thông từ trung cấp lên đại học; Liên kết ĐT đại học văn
bằng hai Ngoài ra, nhà trường còn mở các lớp ngắn hạn bồi dưỡng Tin học, ngoại ngữ, kế toán máy, kế toán thuế, kế toán hành chính sự nghiệp, kỹ năng bán hàng, đàm phán trong kinh doanh
2.2.2 Nhu cầu xây dựng chương trình và kế hoạch đào tạo
Được nhà trường quan tâm, đã chỉ đạo biên soạn hoàn thành chương trình, chuẩn đầu ra, giáo trình, tài liệu giảng dạy 5 ngành nghề đào tạo (Kế toán doanh nghiệp, Kế toán hành chính sự nghiệp, Kinh doanh thương mại dịch vụ, Thống kê, Tin học ứng dụng) Hàng năm các tác giả xem xét lại giáo trình, tài liệu, bài tập thực hành để chỉnh sửa, bổ sung cập nhật nội dung phù hợp với yêu cầu đào tạo
DaiHocDaNang
Trang 15sau đó thông qua Hội đồng thẩm định nhà trường để phản biện, phê duyệt Ngoài ra, giáo viên bộ môn soạn một số lượng lớn bài giảng, bài tập, bài thực hành thông qua Khoa phê duyệt
2.2.3 Vấn đề quản lý dữ liệu đào tạo
Việc quản lý dữ liệu đào tạo chủ yếu sử dụng các phần mềm quản lý, các phần mềm trong bộ Microsoft Office được cài đặt trên các máy tính cá nhân
2.2.4 Đánh giá hiện trạng
Quản lý dữ liệu chưa đồng bộ, tính hệ thống chưa cao.Tiếp cận nguồn dữ liệu cần thiết đối với cán bộ, giáo viên, học sinh, người quản lý còn hạn chế Công tác lưu trữ dữ liệu chưa đảm bảo, chủ yếu lưu trữ trên từng máy do từng cá nhân phụ trách
2.3 PHÂN TÍCH NHU CẦU XÂY DỰNG KHO DỮ LIỆU
Từ phân tích thực trạng công tác đào, hạn chế và bất cập quản
lý dữ liệu đào tạo tại trường Trung cấp Kinh tế Quảng Bình Việc cần thiết của thông tin, tra cứu thông tin của CBGV, HS là rất lớn Công việc lưu trữ các dữ liệu liên quan đến đào tạo rất lớn Những
dữ liệu này nếu quản lý không khoa học sẽ thất lạc và mất mát, xử lý thông tin gặp nhiều khó khăn
Để có được dữ liệu thống nhất, nội dung được cập nhật thường xuyên, lưu trữ lâu dài Mặt khác từ dữ liệu tiềm ẩn các năm để phân tích, báo cáo, tổng hợp, dự báo nhu cầu đào tạo, phân bổ ngành nghề hợp lý, thay đổi chương trình đào tạo phù với nhu cầu xã hội Do đó, việc xây dựng kho dữ liệu là cần thiết để nâng cao hiệu quả đào tạo
DaiHocDaNang