Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)Nghiên Cứu Xây Dựng Hệ Thống Thông Tin Hỗ Trợ Định Biên Nhân Sự Trong Trường Đại Học (tt)
Trang 1HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
-
NGUYỄN MINH TRÍ
NGHIÊN CỨU XÂY DỰNG
HỆ THỐNG THÔNG TIN HỖ TRỢ ĐỊNH BIÊN NHÂN SỰ TRONG TRƯỜNG ĐẠI HỌC
CHUYÊN NGÀNH : HỆ THỐNG THÔNG TIN
Trang 2HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS Tân Hạnh
Phản biện 1: ………
Phản biện 2: ………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc
sĩ tại Học viện Công nghệ Bưu chính Viễn thông
Vào lúc: giờ ngày tháng năm …
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 3Chương 1 - TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU
1.1 Tính cấp thiết của đề tài
Ngày nay, trong bất kỳ tổ chức nào trên thế giới cũng như ở Việt Nam, nguồn nhân lực đang trở thành nguồn lực tối quan trọng đối với sự thành bại của một tổ chức Để tạo ra năng lực cạnh tranh của một tổ chức thì lợi thế thông qua con người luôn được xem là lợi thế hàng đầu Con người luôn là nguồn lực căn bản, có tính quyết định và không thể thiếu của mọi thời đại
Phát triển và nâng cao chất lượng nguồn nhân lực càng đặc biệt quan trọng trong các trường đại học cũng đồng nghĩa với việc đem đến cho các trường đại học một thách thức không nhỏ đó là làm sao để xác định được một cơ cấu, số lượng nhân sự tối ưu trong điều kiện nguồn lực tài chính là có hạn Điều này không thể thiếu vai trò của công nghệ thông tin trong việc cung cấp dữ liệu để nhà quản lý có thể phân tích, đánh giá cũng như đưa ra kết quả định biên tốt nhất
Tuy nhiên, do nhiều yếu tố khách quan, việc ứng dụng công nghệ thông tin của một
số tổ chức tại đơn vị vẫn chưa được khai thác thật sự có hiệu quả do phần mềm sử dụng không thống nhất tại các bộ phận trong cùng một tổ chức Dữ liệu thường được quản lý bởi những hệ quản trị cơ sở dữ liệu khác nhau (MySQL, SQL Server, Visual Foxpro, Access,…) hoặc chỉ là những tập tin định dạng khác (TXT, CSV, XML, excel,…)
Điều này dẫn đến việc dữ liệu không đồng nhất, thông tin trùng lắp, không nhất quán nên khó để theo dõi, quản lý một cách tổng quát các hoạt động, các lĩnh vực trong cùng một
tổ chức mà cụ thể trong công tác định biên càng gặp nhiều khó khăn khi mà việc thu thập,
xử lý dữ liệu trên excel lại tốn rất nhiều thời gian nhưng lại dễ sai sót Càng khó khăn hơn khi nội dung định biên cần phân tích trên nhiều yếu tố, dữ liệu lịch sử
Vấn đề đặt ra là làm sao để có được một hệ thống thông tin về nhân sự giúp nhà quản
lý khai thác, sử dụng và phân tích thông tin một cách có hiệu quả Do vậy, tôi chọn đề tài
“Xây dựng hệ thống thông tin hỗ trợ định biên trong Trường Đại học Kinh tế TP Hồ Chí Minh” làm đề tài nghiên cứu
Trang 4Tổng quan về vấn đề nghiên cứu:
Hình 1.1: Sơ đồ tổng quan về đề tài nghiên cứu
Tìm hiểu nhu cầu dữ liệu cũng như những yếu tố cần thiết để phân tích, đánh giá và đưa đến kết quả định biên nhân sự tại Trường Đại học Kinh tế TP Hồ Chí Minh Từ đó thu thập những nguồn dữ liệu tại các lĩnh vực có liên quan
Tổng hợp và lưu trữ dữ liệu thô: Là việc tổng hợp dữ liệu thô từ những nguồn đã thu
thập vào một nơi lưu trữ chung phục vụ cho việc khai thác dữ liệu
Sàng lọc dữ liệu: Dữ liệu thô chưa xử lý thường lớn và có thể trùng lặp, không cần
thiết, sàng lọc dữ liệu khiến cho chất lượng dữ liệu đầu vào chính xác và phù hợp với nhu cầu sử dụng hơn
Lưu trữ dữ liệu: Thông qua việc tìm hiểu nhu cầu của công tác định biên, dữ liệu
được sàng lọc và lưu trữ vào kho dữ liệu
Phân tích dữ liệu: Sử dụng các nguồn dữ liệu từ kho dữ liệu, xây dựng các cấu trúc
dữ liệu tạo thành các Data Marts Data Marts là lớp đưa các dữ liệu từ kho dữ liệu tới người dùng cuối
Tạo báo cáo (Reporting): Các báo cáo, thống kê, phân tích được xây dựng sử dụng
cấu trúc từ
Tìm hiểu về Business Intelligence (BI):
- Truy vấn và báo cáo (query and reporting)
- Phân tích xử lý trực tuyến (OLAP - Online analytical processing)
- Phân tích thống kê (statistical analysis)
Trang 51.2 Mục tiêu nghiên cứu
Xây dựng một hệ thống hỗ trợ định biên nhân sự dựa trên Data Warehouse và Business Intelligence
Hệ thống đáp ứng được yêu cầu:
- Tích hợp dữ liệu đa nguồn
- Phân tích dữ liệu phục vụ việc định biên nhân sự
- Báo cáo và thống kê dữ liệu theo thời điểm cần thiết
Hệ thống thông tin quản lý trong các trường đại học là hệ thống lớn gồm nhiều đơn vị và
có nhiều đối tượng sử dụng Khi khai thác dữ liệu phục vụ cho việc định biên thường gặp không ít khó khăn, tốn thời gian và dễ sai sót Vì vậy, đề tài luận văn nghiên cứu thu thập những nguồn dữ liệu là yếu tố liên quan đến vấn đề định biên, xây dựng kho dữ liệu phục vụ tốt nhất cho việc hỗ trợ nhà quản lý phân tích, xác định cơ cấu, số lượng nhân sự tối ưu, giúp nhà quản lý lập kế hoạch tuyển dụng cho tương lai
Mong muốn đề tài sẽ áp dụng rộng ra các nhiều lĩnh vực khác trong trường từ nhiều nguồn dữ liệu khác
Đối tượng và phạm vi nghiên cứu:
Đối tượng nghiên cứu:
Kho dữ liệu (Data Warehouse)
Business Intelligence (BI)
SQL Server hoặc Oracle
Phạm vi nghiên cứu:
Định biên nhân sự trong Trường Đại học Kinh tế TP Hồ Chí Minh, theo quy định của Nhà nước
Từ những nguồn dữ liệu có cấu trúc:
Dữ liệu nhân sự (NHANSU)
Dữ liệu tài chính (TAICHINH)
Dữ liệu về giảng dạy (DAOTAO)
Dữ liệu về nghiên cứu khoa học (NCKH)
Phương pháp nghiên cứu: Thu thập dữ liệu liên quan đến việc định biên như thông tin
nhân sự, khối lượng giảng dạy, hoạt động chuyên môn, nghiên cứu khoa học của từng nhân
sự, kế hoạch thực hiện các đầu việc và phân công công việc
Tìm hiểu về Data Warehouse
Trang 6Tìm hiểu về Tiến trình ETL
Tìm hiểu về Business Intelligence (BI):
- Truy vấn và báo cáo (query and reporting)
- Phân tích xử lý trực tuyến (online analytical processing (OLAP))
- Phân tích thống kê (statistical analysis)
Dựa trên lý thuyết đã tìm hiểu, xây dựng hệ thống giúp phân tích, đánh giá và đưa ra kết quả định biên nhân sự
1.3 Cấu trúc của luận văn
Luận văn gồm 3 chương với các nội dung:
Chương 1: Khảo sát nhu cầu về thông tin cần thiết cho việc định biên, từ đó thu thập
những nguồn dữ liệu có liên quan Tìm hiểu những công trình nghiên cứu có liên quan qua
đó nêu ra những vấn đề, đối tượng nghiên cứu mà đề tài quan tâm Nêu làm rõ sự cấp thiết của vấn đề cần nghiên cứu và tổng quan vấn đề nghiên cứu để người đọc có một cái nhìn
tổng quát ban đầu
Chương 2: Mô tả lý thuyết về Data Warehouse và tiến trình ETL Phân tích vai trò của
ETL trong việc xây dựng hệ thống tích hợp Tìm hiểu về cách thức thu thập, xử lý và trích chọn dữ liệu Tìm hiểu về business intelligenge (BI) và những hoạt động của BI có liên quan đến vấn đề nghiên cứu
Chương 3: Tìm hiểu về nguyên tắc định biên để từ đó xác định nguồn dữ liệu cũng như
mô tả tổng quát hệ thống thông tin cần xử lý để giúp nhà quản lý phân tích, đánh giá và đưa
ra kết quả định biên Tiến hành xây dựng hệ thống thông tin dựa trên lý thuyết đã tìm hiểu
từ những chương trước Thử nghiệm hệ thống và đánh giá kết quả
Trang 7Chương 2 - TỔNG QUAN VỀ KHO DỮ LIỆU (DATA WAREHOUSE) VÀ BUSINESS INTELLIGENCE (BI)
2.1 Kho dữ liệu
2.1.1 Khái niệm
Data Warehouse (DW) - Kho dữ liệu là thuật ngữ được William H Inmon đưa ra trong những năm 1970 Kho dữ liệu là hệ thống tập trung dữ liệu từ các nguồn khác nhau nhằm mục đích khai thác, phân tích thông tin và hỗ trợ quyết định [2], các đặc trưng về mặt
dữ liệu là: Tích hợp, hướng chủ đề, tích lũy theo thời gian và bất biến
2.1.2 Các đặc trưng
Hình 2.1: Đặc trưng của DW [2]
- Tích hợp (Integrated): Dữ liệu của DW được tập hợp về từ các nguồn khác nhau như
các CSDL của các hệ thống tác nghiệp, các file tài liệu (text, word, excel,…) của một tổ chức
- Hướng chủ đề (Subject-Oriented): Dữ liệu của DW được tổ chức và lưu trữ theo
các chủ đề nghiệp vụ mà người khai thác quan tâm
- Tích lũy theo thời gian (Time-Variant): Dữ liệu lưu trữ có tính chất lịch sử, theo
dòng thời gian tính từ một thời điểm trong quá khứ cho đến hiện tại và các dữ liệu sẽ phát sinh trong tương lai Tất cả các thay đổi trên dữ liệu được theo dõi để thể hiện sự biến đổi theo thời gian
Trang 8- Bất biến (Non-Volatile): Dữ liệu đã đưa vào trong DW nói chung ở dạng chỉ đọc
(read-only) và rất hiếm khi thay đổi (không sửa, không xóa) DW là những CSDL được thiết
kế cho mục đích khai thác và phân tích thông tin (query - truy vấn) chứ không phải mục đích cập nhật (update - cập nhật, delete - xóa) như trong CSDL của các ứng dụng tác nghiệp
2.1.3 Mục tiêu
Hình 2.2: Lợi ích của DW trong hỗ trợ ra quyết định [9]
Kiến trúc DW
Hình 2.3: Kiến trúc kho dữ liệu dạng DDS đơn [6, tr.34]
Việc tổ chức dữ liệu trong cơ sở dữ liệu của DW được tiếp cận theo 2 hướng sau:
- Giản đồ hình sao (Star Schema) - Phương pháp mô hình hoá đa chiều của Ralph Kimball: Là cơ sở dữ liệu quan hệ được thiết kế logic dạng hình sao bao gồm một bảng dữ
liệu chi tiết ở vị trí trung tâm quan hệ với các bảng dữ liệu danh mục xung quanh (kiểu N:1)
Trang 9- Giản đồ hình bông tuyết (Snowflake Schema) - Phương pháp mô hình hoá dạng chuẩn hoá của Bill Inmon: Là cơ sở dữ liệu hình sao nhưng được chuẩn hóa theo một dạng chuẩn khác (dạng chuẩn 3), mỗi bảng danh mục được tách thành các bảng danh mục phân cấp nếu
có để đảm bảo không dư thừa dữ liệu Trong ví dụ Hình 2.10, nhánh Nhân sự được tách thành
Khối(quản lý hoặc giảng viên) và Loại (Cơ hữu, thỉnh giảng hoặc lao động ngắn hạn)
Để đưa ra thiết kế chính xác cho kho dữ liệu, người ta sử dụng ma trận kiến buýt (bus
matrix) [1] Đây là một bảng mô tả mối liên hệ giữa các nghiệp vụ với các đối tượng liên quan
Hình 2.11: Ma trận kiến trúc buýt [1, tr.386]
2.2 Xây dựng luồng ETL (Extract - Transform - Load)
2.2.1 Khái niệm ETL
Là nền tảng của kho dữ liệu Một tiến trình được thiết kế cho việc lấy dữ liệu từ nhiều nguồn dữ liệu khác nhau, chuyển đổi dữ liệu nhằm tích hợp những nguồn dữ liệu này Dữ liệu sau chuyển đổi được đưa vào kho dữ liệu phục vụ mục đích phát triển ứng dụng hay phục vụ các mục đích kho dữ liệu [1, tr.xii]
Trang 102.2.2 Kiến trúc ETL
Hình 2.14: Các thành phần của ETL [6]
Trích xuất (Extract): Dữ liệu từ rất nhiều nguồn khác nhau và có thể có rất nhiều cấu
trúc dữ liệu khác nhau như nhiều loại cơ sở dữ liệu, từ tệp dữ liệu excel hay từ tệp dữ liệu
thô Vì thế nhiệm vụ chính của bước này là trích xuất dữ liệu từ hệ thống nguồn để xử lý
Đây là công đoạn khai thác và đưa dữ liệu từ các nguồn vào cơ sở dữ liệu trung chuyển (các
DSA nguồn), chưa xử lý gì đối với dữ liệu
Chuyển đổi (Transform): Là quá trình rất phức tạp dùng để chuyển đổi dữ liệu nguồn
một mô hình khác phù hợp và chuyển vào cơ sở dữ liệu đích
Tải dữ liệu (Load): Đây là quá trình đưa dữ liệu sau khi đã được chuyển đổi vào kho dữ
liệu Dữ liệu sau khi đã được chuyển đổi sẽ được tải vào kho dữ liệu Là công đoạn tải dữ liệu đã được xử lý: từ DSA đích sang EM và từ EM sang các DM
2.2.3 Vai trò của ETL trong việc xây dựng hệ thống tích hợp [1, tr.28]
2.2.4 Các yếu tố quan trọng đối với ETL
2.2.5 Những khó khăn khi xây dựng tiến trình ETL
2.3 Khái niệm Business Intelligence (BI)
BI là một quy trình có tích hợp công nghệ mà các doanh nghiệp dùng để kiểm soát khối lượng dữ liệu khổng lồ đến từ nhiều nguồn khác nhau và khai thác nguồn dữ liệu đó nhằm phân tích để hỗ trợ việc ra quyết định [14]
Công nghệ BI cung cấp một cách nhìn toàn cảnh về hoạt động của doanh nghiệp từ quá khứ, hiện tại và các dự đoán tương lai Mục đích của BI là hỗ trợ cho doanh nghiệp ra quyết định tốt hơn Vì vậy, một hệ thống BI còn có thể được coi là hệ thống hỗ trợ quyết định
Trang 11Hình 2.16: Thành phần của Business Intelligence [14]
2.4 Các công nghệ hỗ trợ BI (Technologies supporting for BI) [13] 2.5 Những hoạt động của BI liên quan đến vấn đề nghiên cứu [13]
2.5.1 Truy vấn và báo cáo (query and reporting)
2.5.2 Phân tích xử lý trực tuyến (OLAP - Online Analitical Proccessing) 2.5.3 Phân tích thống kê (statistical analysis)
Trang 12Chương 3 - XÂY DỰNG HỆ THỐNG THÔNG TIN
3.1.3 Thu thập dữ liệu
Đối với khối quản lý: Hàng năm, Phòng Tổ chức - Hành chính tiến hành thu thập dữ
liệu về từng đầu việc của các đơn vị bao gồm đã thực hiện và sẽ thực hiện, mỗi đầu việc có
số giờ thực hiện và những công việc cụ thể Những công việc sẽ được các đơn vị phân công cho các nhân sự hoàn thành trong bao nhiêu giờ Khi gửi báo cáo về Phòng Tổ chức - Hành chính, mọi thông tin về đầu việc, công việc, giờ thực hiện, % hiệu quả công việc do đơn vị đánh giá có qua thẩm định của hội đồng xét duyệt Từ đó Phòng Tổ chức - Hành chính phân tích, mô tả và định mức thời gian hoàn thành cho mỗi đầu việc cụ thể; sau đó tính tổng hợp thời gian hao phí để thực hiện hết tất cả công việc trong năm và tính số lượng định biên theo công thức ở 3.1.1
Đối với khối giảng viên: Từ vấn đề nêu ở 3.1.2, chúng tôi thu thập những dữ liệu
liên quan đến 03 vấn đề chính là: Quy mô đào tạo, hoạt động nghiên cứu khoa học và những hoạt động chuyên môn khác (như đã nêu ở 3.1.1) Trong đó, quy mô đào tạo bao gồm kế hoạch đào tạo và phân giảng hiện tại
Trang 133.2 Phân tích, thiết kế hệ thống thông tin phục vụ định biên
3.2.1 Tổng quan về hệ thống thông tin định biên
Hình 3.1: Sơ đồ tổng quan về hệ thống thông tin phục vụ định biên
3.2.2 Thiết kế kho dữ liệu
3.2.2.1 Thiết kế kho dữ liệu chủ đề dành cho khối quản lý (DM_KhoiQuanly)
Hình 3.4: Lược đồ quan hệ DM_KhoiQuanly
Trang 14Append Append Append Append
Chuyển đổi Chuyển đổi Chuyển đổi
Chuyển đổi
3.2.2.2 Thiết kế kho dữ liệu chủ đề dành cho khối giảng dạy (DM_KhoiGiangday)
Hình 3.5: Lược đồ quan hệ DM_KhoiGiangday
3.2.3 Thiết kế tiến trình ETL
3.2.3.1 Chuẩn bị dữ liệu
3.2.3.2 Sử dụng SSIS để thực hiện ETL
ETL các bảng chuyển đổi dữ liệu và ánh xạ vào những bảng nguồn tương ứng
D_Donvi
D_Dauviec.xls
Ánh xạ 1:1
D_Dauviec
D_Congviec.xls
Ánh xạ 1:1
D_Congviec
Trang 15Hình 3.6: ETL các bảng chiều
Lần lượt thực hiện cho các bảng chiều: D_Nhansu, D_Nganh, D_Chuyennganh, D_Khoa, D_Bomon, D_Hocphan, D_Giangvien
ETL các bảng sự kiện
Hình 3.7: ETL bảng sự kiện kế hoạch công tác
Lần lược thực hiện tương tự cho các bảng sự kiện F_Phancong, F_Kehoachdaotao, F_Phangiang, F_Nghiencuukhoahoc, F_Hoatdongchuyenmon
Mô tả thực hiện SSIS như sau:
Hình 3.8: Minh hoạ module ETL các bảng chiều
F_Kehoachcongtac.xls
Tích hợp gom nhóm Mathoigian,Madauviec,Madonvi để tính tổng giờ thực hiện Ánh xạ 1:1
F_Kehoachcongtac
Trang 16Hình 3.9: Minh họa module ETL các bảng sự kiện
3.2.4 Sử dụng SSAS để xây dựng cube cho cơ sở dữ liệu 02 khối
3.2.4.1 Xây dựng cube kho dữ liệu chủ đề khối quản lý
3.2.4.2 Xây dựng cube kho dữ liệu chủ đề khối giảng dạy
Hình 3.11: Sơ đồ các bảng chiều và sự kiện trong cube khối giảng dạy
Trang 17Hình 3.12: Các độ đo trong cube khối giảng dạy
3.2.5 Thử nghiệm kết quả bằng câu truy vấn MDX [7] và sử dụng phần mềm Power BI Desktop của Microsoft để làm báo cáo [18]
3.2.5.1 Các truy vấn đa chiều (MDX)
a Lấy dữ liệu mức độ hiệu quả của việc nhân sự thực hiện công việc được phân công vào năm 2015
([D_Thoigian].[Nam].[Nam].ALLMEMBERS*[D_Nhansu].[Hoten].[Hoten].ALLMEMBERS*[D_Co ngviec].[Tencongviec].[Tencongviec].ALLMEMBERS ) } ON ROWS FROM ( SELECT ( { [D_Thoigian].[Nam].&[2015] } ) ON COLUMNS FROM [Cube Khoi Quanly])
Kết quả
Hình 3.13: Kết quả truy vấn số giờ thực hiện công việc và mức độ hiệu quả
tương ứng của các nhân sự