Thủ tướng Chính phủ cũng thể hiện rõ quyết tâm của Việt Nam trongviệc tận dụng cuộc cách mạng công nghệ lần thứ tư trong việc khai thác và sửdụng hiệu quả dữ liệu và số liệu để phát triể
Trang 1VIỆN HÀN LÂM KHOA HỌC XÃ HỘI VIỆT NAM
HỌC VIỆN KHOA HỌC XÃ HỘI
-
-NGUYỄN THỊ MINH HẬU
QUẢN TRỊ QUY TRÌNH THU THẬP VÀ KHAI THÁC THÔNG TIN THỐNG KÊ TẠI TRUNG TÂM TƯ VẤN VÀ DỊCH VỤ THỐNG KÊ -
TỔNG CỤC THỐNG KÊ
LUẬN VĂN THẠC SĨ QUẢN TRỊ KINH DOANH
HÀ NỘI - 2021
Trang 2VIỆN HÀN LÂM KHOA HỌC XÃ HỘI VIỆT NAM
HỌC VIỆN KHOA HỌC XÃ HỘI
-
-NGUYỄN THỊ MINH HẬU
QUẢN TRỊ QUY TRÌNH THU THẬP VÀ KHAI THÁC THÔNG TIN THỐNG KÊ TẠI TRUNG TÂM TƯ VẤN VÀ DỊCH VỤ THỐNG KÊ -
Trang 3LỜI CAM ĐOAN
Tôi – Nguyễn Thị Minh Hậu, xin cam đoan đây là công trình nghiêncứu khoa học độc lập của riêng tôi Đề tài là một kết quả mà tôi đã nỗ lựcnghiên cứu trong quá trình học tập tại trường cũng như làm việc tại Trung tâm
Tư vấn và Dịch vụ thống kê (Tổng cục Thống kê, Bộ Kế hoạch và Đầu tư).Trong quá trình viết bài có trích dẫn và tham khảo từ nhiều tài liệu có nguồngốc rõ ràng Kết quả nghiên cứu trong luận văn là trung thực và chưa đượccông bố trong bất kỳ công trình nào khác
Học viên
(Ký tên và ghi rõ họ tên)
Nguyễn Thị Minh Hậu
Trang 4LỜI CẢM ƠN
Trước hết, tôi xin chân thành cảm ơn tất cả các thầy cô Học viện Khoahọc Xã hội, Viện Hàn lâm Khoa học Xã hội Việt Nam đã truyền đạt rất nhiềukiến thức và tạo điều kiện thuận lợi cho tôi trong quá trình học tập và nghiêncứu tại Học viện Đặc biệt, tôi xin bày tỏ lòng biết ơn đến TS Đặng ThuThuỷ, người đã tận tình chỉ bảo, hướng dẫn giúp đỡ tôi thực hiện và hoànthành đề tài này
Để hoàn thành Luận văn này, ngoài sự cố gắng, sự nỗ lực nghiên cứu,học tập của bản thân còn có sự giúp đỡ tận tình của nhiều cá nhân và tập thể
Tôi xin cảm ơn sự đoàn kết và giúp đỡ nhau của Tập thể lớp Quản trịkinh doanh Khoá X Đợt 2 đã gắn bó cùng nhau cả trong học tập, nghiên cứucũng như trong cuộc sống hàng ngày
Tôi xin chân thành cảm ơn sự hỗ trợ, giúp đỡ nhiệt tình của Lãnh đạoTrung tâm Tư vấn và Dịch vụ thống kê, Cục Thu thập Dữ liệu, các đồngnghiệp, các bạn ở Tổng cục Thống kê, Bộ Kế hoạch và Đầu tư trong việccung cấp những tài liệu vô cùng hữu ích để viết Luận văn này
Cuối cùng như quan trọng là sự động viên, chia sẻ, hỗ trợ, giúp đỡ củaanh chị em trong gia đình, các con của tôi đã chia sẻ những khó khăn trongsuốt quá trình học tập, nghiên cứu; Nếu không có họ, chắc chắn tôi sẽ khôngthể thực hiện được Luận văn tốt nghiệp này
Tôi xin bày tỏ sự cảm ơn sâu sắc đối với mọi sự giúp đỡ quý báu đó!
Hà Nội, ngày 02 tháng 11 năm 2021
Học viên
(Ký tên và ghi rõ họ tên)
Nguyễn Thị Minh Hậu
Trang 5MỤC LỤC
MỞ ĐẦU 1
Chương 1: CƠ SỞ LÝ LUẬN CHUNG VỀ QUẢN TRỊ, QUY TRÌNH THU THẬP VÀ KHAI THÁC THÔNG TIN THỐNG KÊ 7
1.1 Cơ sở lý luận về quản trị, quy trình thu thập và khai thác thông tin thống kê 7
1.2 Quản trị Quy trình thu thập và khai thác thông tin thống kê 21
1.3 Một số văn bản quy phạm pháp luật trong lĩnh vực thống kê 29
Chương 2: THỰC TRẠNG QUẢN TRỊ QUY TRÌNH THU THẬP VÀ KHAI THÁC THÔNG TIN THỐNG KÊ TẠI TRUNG TÂM TƯ VẤN VÀ DỊCH VỤ THỐNG KÊ 32
2.1 Giới thiệu tổng quan về Tổng cục Thống kê và Trung tâm Tư vấn và dịch vụ thống kê 32
2.2 Thực trạng quản trị quy trình thu thập, khai thác thông tin thống kê tại Trung tâm Tư vấn và dịch vụ thống kê 37
2.3 Thực trạng công tác quản trị quy trình thu thập, khai thác thông tin thống kê tại Trung tâm tư vấn và dịch vụ thống kê 49
Chương 3: GIẢI PHÁP NÂNG CAO HIỆU QUẢ QUẢN TRỊ QUY TRÌNH THU THẬP KHAI THÁC THÔNG TIN THỐNG KÊ 60
3.1 Chiến lược quản trị quy trình thu thập và khai thác thông tin thống kê của Chính phủ Việt Nam và của Tổng cục Thống kê 60
3.2 Tồn tại, hạn chế của công tác quản trị quy trình thu thập và khai thác thông tin thống kê hiện nay 65
3.3 Giải pháp nhằm nâng cao quản trị quy trình thu thập và khai thác thông tin thống kê tại Trung tâm Tư vấn và Dịch vụ thống kê 69
KẾT LUẬN 75
TÀI LIỆU THAM KHẢO 77
PHỤ LỤC 81
Trang 6DANH MỤC TỪ VIẾT TẮT
DLHC Administrative data Dữ liệu hành chính
GSO General Statistics Office Tổng cục Thống kê
HTTT Information System Hệ thống thông tin
MDG Millenium Development Goal Mục tiêu Phát triển Thiên niên kỷNSO National Statistical Office Cơ quan Thống kê Quốc giaSDG Substainable Development Mục tiêu Phát triển Bền vững
GoalTCTK General Statistics Office Tổng cục Thống kê
TVDV Statistical Services and Trung tâm tư vấn và Dịch vụ
UNECE The United Nations Economic Uỷ ban Kinh tế Liên hiệp quốc về
Commission for Europe Châu ÂuUNSD United State Statistics Division Cơ quan Thống kê Liên hiệp quốc
Trang 7DANH MỤC CÁC BẢNG BIỂU
Hình 1.1 Các thành tố chính của một quy trình 12
Hình 1.2 Mười lĩnh vực kiến thức thuộc quản trị dữ liệu 14
Hình 1.3 Sơ đồ từ thông tin đến CSDL 16
Hình 1.4 Quy trình quản lý số liệu/thông tin thống kê 21
Hình 1.5 Quy trình sản xuất thông tin thống kê 22
Bảng 1.1 Một số văn bản quy phạm pháp luật về số liệu, dữ liệu thống kê, hệ thống chỉ tiêu thống kê 29
Hình 2.1 Hệ thống CSDL thị trường lao động Việt Nam 48
Hình 3.1 Quy trình xây dựng CSDL quốc gia về Công dân 72
Hình 3.2 Quy trình thu thập thông tin từ Dữ liệu hành chính 73
Trang 8MỞ ĐẦU
1. Tính cấp thiết của đề tài
Việt Nam đã và đang trong quá trình hội nhập sâu rộng với quốc tế trên mọilĩnh vực kinh tế, chính trị, xã hội… Ở góc độ thống kê, với tư cách là một quốcgia thành viên của Uỷ ban Thống kê Liên hiệp quốc (UNSD), Tổng cục Thống
kê đã và đang tích cực thực hiện những cam kết quốc tế về công tác thống kê và
số liệu thống kê Ngoài những yêu cầu truyền thống về số liệu thống kê là đầy
đủ, chính xác, trung thực, kịp thời, ngày nay, trong bối cảnh hội nhập toàn cầu cả
ở chiều sâu và chiều rộng cùng với các cam kết quốc tế về trao đổi dữ liệu và
số liệu thống kê giữa Tổng cục Thống kê và các cơ quan thống kê trong khu vựcASEAN cũng như trên toàn thế giới, các số liệu thống kê phải mang tính so sánhquốc tế và các phương pháp thu thập và xử lý, phân tích các số liệu thống kê cũngphải đảm bảo theo các quy trình, quy chuẩn, tiêu chuẩn của khu vực và quốc tế Hệthống thống kê trên toàn thế giới nói chung và Tổng cục Thống kê Việt Nam nóiriêng phải đối mặt với một loạt các yêu cầu mới để có thể đóng góp cho hệ thốngchính trị các số liệu đáng tin cậy nhằm phản ánh tình hình thực tế liên quan đến sựphát triển và bức tranh toàn cảnh các lĩnh vực đời sống kinh tế xã hội đằng sau cácchỉ tiêu phản ánh các mục tiêu phát triển bền vững (SDG) và các mục tiêu pháttriển thiên niên kỷ (MDG) Điều này đã đặt ra một loạt các yêu cầu mới về số liệu
và dữ liệu đầu vào cho cộng đồng thống kê toàn cầu nói chung và thống kê ViệtNam nói riêng
Nghị quyết Đại hội Đảng lần thứ XIII năm 2021 đề cập đến việc tăngcường quản trị đất nước và ra quyết định dựa trên bằng chứng phải căn cứ trên
số liệu Thủ tướng Chính phủ cũng thể hiện rõ quyết tâm của Việt Nam trongviệc tận dụng cuộc cách mạng công nghệ lần thứ tư trong việc khai thác và sửdụng hiệu quả dữ liệu và số liệu để phát triển nhanh và bền vững đất nước.Việc tối ưu hoá quản trị quy trình thu thập và khai thác thông tin sẽ tậptrung vào việc chia sẻ và sử dụng nguồn dữ liệu hiện có của các cơ quanTrung ương và địa phương để phục vụ tốt yêu cầu về số liệu, dữ liệu củaĐảng, Nhà nước, Chính phủ, các bộ, ngành cũng như người dùng tin một cách
Trang 9hiệu quả và kinh tế nhất.
Tối ưu hóa quản trị quy trình sẽ thay thế các quy trình sản xuất đắt tiền
và cồng kềnh bằng quy trình sản xuất tích hợp thống kê tiết kiệm chi phí, kếthợp với việc sử dụng mới và mở rộng các nguồn dữ liệu hiện có, dựa nhiềuhơn vào các dữ liệu hành chính từ cơ quan chính phủ khác Việc hợp nhất cácnguồn dữ liệu mới (như Big Data, điện toán đám mây, công nghệ nhân tạo(AI), Internet vạn vật (Internet of thing) và tối ưu hóa khai thác việc sử dụngcác nguồn số liệu hiện có và dựa nhiều hơn vào dữ liệu hành chính từ cơ quanchính phủ, các tổ chức phi chính phủ… khác là một giải pháp khả thi để giảiquyết được các thách thức này
Trung tâm Tư vấn và dịch vụ Thống kê (TVDV) (thuộc Cục Thu thập dữliệu và ứng dụng CNTT thống kê – Tổng cục Thống kê) là đơn vị thực hiệnphần lớn các nội dung trong quy trình xử lý thông tin thống kê bao gồm: thuthập, lưu trữ, xử lý, khai thác, phân tích số liệu Bên cạnh đó TVDV là đơn vịduy nhất của Tổng cục Thống kê thực hiện chức năng “dịch vụ thống kê” theoyêu cầu của các tổ chức, đơn vị và cá nhân (người dùng tin) TVDV cũngđang trong quá trình hoàn thiện và phát triển toàn diện theo hướng hiện đạihoá và tối ưu hoá quy trình thu thập, khai thác thông tin thống kê nhằm nângcao hiệu quả sử dụng dữ liệu nhằm đáp ứng nhu cầu ngày càng cao của Chínhphủ và người dùng tin (end-users) Để làm được điều này cần nhìn nhận toàn
bộ quy trình sản xuất thông tin thống kê trên góc độ quản trị
Do đó, Luận văn nghiên cứu đề tài “Quản trị quy trình thu thập và khai thác thông tin thống kê tại Trung tâm Tư vấn và Dịch vụ Thống kê – Tổng cục Thống kê” là vấn đề thiết thực, có ý nghĩa cả về lý luận và thực
tiễn không chỉ cho Trung tâm Tư vấn và dịch vụ Thống kê, Tổng cục Thống
kê mà còn giúp Chính phủ, Nhà nước và các Bộ ban ngành khác nắm bắtđược đầy đủ số liệu liên quan
2 Tình hình nghiên cứu liên quan đến đề tài
Hiện nay trên thế giới, việc quản trị quy trình thu thập và khai thác thôngtin thống kê (sử dụng số liệu điều tra, báo cáo thống kê và đặc biệt là ứngdụng khai thác dữ liệu hành chính trong sản xuất số liệu thống kê) đã được
Trang 10chú trọng, có nhiều nghiên cứu và mô hình đã được áp dụng thành công ở một
số nước Châu Á (Singapore, Hàn Quốc) cũng như một số nước Châu Âu (ĐanMạch, Na-uy, Đức, Anh…) và Châu Úc (Australia)
Tại Việt Nam, chưa có nhiều nghiên cứu liên quan đến quản trị quy trìnhthu thập và khai thác thông tin thống kê một cách chính thống và đầy đủ.Hoàng Tuấn Long và Phạm Thu Thuỷ (2020) trong nghiên cứu về quytrình quản lý dữ liệu cho các nghiên cứu xã hội đã nhận định “việc xây dựngmột quy trình chuẩn từ thu thập, làm sạch, lưu trữ và quản lý số liệu là rất cầnthiết” Trong nghiên cứu này có đề cập đến các nội dung về quản lý dữ liệu,xác định mục tiêu và đưa ra quy trình lập kế hoạch, thiết kế, thu thập và quản
lý số liệu cho các nghiên cứu xã hội học; nghiên cứu này không chỉ đưa ra cácnguyên tắc và các yếu tố cần xem xét mà còn cung cấp các ví dụ thực tiễn đểgiúp các nhà nghiên cứu và các nhà quản lý dự án tránh khỏi các sai lầm trongquá trình thu thập, quản lý và xử lý số liệu Tuy nhiên nghiên cứu này khôngkhái quát về một quy trình tiêu chuẩn mà chỉ mô tả một số bước thu thậpthông tin như ;xác định số liệu cần thu thập, xây dựng phương pháp thu thập,
xử lý làm sạch, bảo quản, quản lý và chia sẻ dữ liệu…
Trần Tuấn Hưng và cộng sự (2019) nhận định, cần phải tiêu chuẩn hoáquy trình thu thập và khai thác thông tin thống kê, không chỉ toàn bộ quy trình
mà cần chuẩn hoá từng nội dung, từng hoạt động của mỗi bước trong quytrình Thống kê Việt Nam chưa xây dựng được một quy trình thu thập và xử
lý thông tin một cách bài bản, khoa học, theo tiêu chuẩn của khu vực và trênthế giới Việc xây dựng quy trình cần đảm bảo nguyên tắc thống nhất các tiêuchuẩn, định nghĩa về các chỉ tiêu thống kê cần thu thập và nội hàm các bước.Tuy nhiên, trong nghiên cứu này, tác giả chưa đề xuất đến vai trò quan trọngcủa dữ liệu hành chính trong việc thay thế cho các nguồn số liệu truyền thống,điều này tạo nên khoảng trống lớn trong việc xây dựng các tiêu chuẩn chonguồn dữ liệu hành chính để phục vụ cho mục đích sản xuất số liệu thống kê.Nguyễn Thanh Ngọc và cộng sự (2020) đã nhận định vai trò quan trọngcủa việc sử dụng dữ liệu hành chính trong sản xuất thông tin thống kê chínhthức, đặc biệt là trong việc biên soạn tính toán các chỉ tiêu phát triển bền vững
Trang 11(SDG) Nghiên cứu này đề xuất việc áp dụng nguồn dữ liệu hành chính thaythế cho nguồn số liệu từ điều tra, khảo sát trong một số lĩnh vực như: dân số,giáo dục, y tế, đăng ký hộ tịch… Nghiên cứu đã đề xuất một quy trình thửnghiệm sử dụng dữ liệu hành chính giáo dục (thuộc CSDL Bộ Giáo dục Đàotạo) để tính toán thử nghiệm hai chỉ tiêu phát triển bền vững của Việt Namtrong lĩnh vực giáo dục Từ đó, đề xuất việc ứng dụng quy trình đó vào việctính toán, trao đổi, chia sẻ dữ liệu giữa Tổng cục Thống kê và Bộ Giáo dụcĐào tạo thay cho việc Bộ Giáo dục Đào tạo phải gửi các báo cáo giấy choTCTK tổng hợp, tính toán một cách thủ công.
Ngoài ra còn một số nghiên cứu khác nhưng hầu hết chỉ tập trung vàomột trong các bước của quy trình thu thập thông tin để sản xuất số liệu chứchưa khái quát được cũng như mô hình hoá quy trình toàn bộ quy trình
Những công trình nghiên cứu trên đã hệ thống hoá những vấn đề về mặt
lý luận và thực tiễn có liên quan đến quản trị quy trình thu thập, khai thácthông tin, xử lý thông tin, phân tích, tổng hợp, công bố và lưu trữ số liệu Các
đề tài đã có những đóng góp nhất định trong việc làm rõ nội hàm từng bướctrong quy đình đó Các tác giả trên đã trình bày các quan điểm, phân tích vàđánh giá một cách khách quan nhất về các đề tài nghiên cứu tuy nhiên vẫn cònnhững hạn chế như: chỉ nêu được một hoặc một bài bước trong quy trình, chỉnêu được thực trạng tại cơ quan, đơn vị nghiên cứu chứ không hệ thống hoáđược toàn bộ quy trình
Tác giả thực hiện nghiên cứu của mình không trùng lặp với các nghiêncứu trước đây với mục tiêu là đưa ra các giải pháp có tính khái quát hoá, hệthống hoá toàn bộ quy trình sản xuất số liệu thống kê; các giải pháp mang tínhkhả thi cao, có thể áp dụng thực tiễn và hiệu quả cao nhất cho ngành thống kêcũng như các đơn vị, cơ quan, tổ chức có nhu cầu thu thập, tính toán số liệuthống kê khác
3 Mục đích và nhiệm vụ nghiên cứu
3.1 Mục tiêu chung
Đánh giá thực trạng quản trị quy trình thu thập, khai thác, sử dụng thôngtin thống kê tại Trung tâm Tư vấn và Dịch vụ Thống kê - Tổng cục Thống kê
Trang 12và đề xuất một số nhóm giải pháp nhằm tối ưu hóa quy trình thu thập, khaithác các nguồn dữ liệu, đặc biệt là nguồn dữ liệu hành chính cho mục đích sảnxuất số liệu thống kê và cung cấp các dịch vụ thống kê tại Trung tâm Tư vấn
và Dịch vụ Thống kê - Tổng cục Thống kê
3.2 Mục tiêu cụ thể
Căn cứ vào mục tiêu chung, đề tài đưa ra một số mục tiêu cụ thể:
- Hệ thống hóa cơ sở lý luận về quản trị, quản trị quy trình thu thập và khai thác thông tin thống kê
- Đánh giá các nội dung của quản trị quy trình thu thập, khai thác thông tin thống kê tại Trung tâm Tư vấn và dịch vụ thống kê - Tổng cục Thống kê
- Đề xuất giải pháp một số giải phấp nhằm tối ưu hóa công tác quản trịquy trình thu thập và khai thác thông tin thống kê tại Trung tâm Tư vấn và dịch vụthống kê - Tổng cục Thống kê
4 Đối tượng và phạm vi nghiên cứu
4.1 Đối tượng nghiên cứu
Quản trị quy trình thu thập và khai thác thông tin thống kê tại Trung tâm
Tư vấn và Dịch vụ thống kê - Tổng cục Thống kê
4.2 Không gian nghiên cứu
Đề tài được thực hiện tại Trung tâm Tư vấn và Dịch vụ Thống kê, Tổngcục Thống kê, Bộ Kế hoạch và Đầu tư
4.3 Thời gian nghiên cứu
Luận văn sử dụng rất nhiều số liệu và kết quả nghiên cứu trong giai đoạn
từ năm 2010 đến tháng 4 năm 2021
4.4 Nội dung nghiên cứu
Đánh giá việc quản trị quy trình thu thập và khai thác thông tin thống kêtại Trung tâm Tư vấn và dịch vụ thống kê và qua đó đề xuất giải pháp nhằmgia tăng hiệu quả quản trị thu thập và khai thác thông tin thống kế tại Trungtâm trong thời gian tiếp theo
5 Phương pháp nghiên cứu
5.1 Phương pháp thu thập số liệu
Đề tài nghiên cứu từ nguồn tài liệu trong nước và quốc tế về quy trình
Trang 13thu thập, khai thác, sử dụng dữ liệu hành chính trong thu thập và sản xuất sốliệu thống kê.
Ngoài ra, đề tài còn sử dụng nguồn thông tin từ giáo trình, tạp chí nghiêncứu chuyên sâu, các báo cáo khoa học và các trang tin điện tử liên quan
5.2 Phương pháp phân tích số liệu, thống kê, mô tả.
Các phương pháp đề tài sử dụng: phương pháp thống kê mô tả, phươngpháp phân tích số liệu để làm nổi bật lên hoạt động quản trị quy trình thuthập và khai thác thông tin thống kê tại Trung tâm Tư vấn và Dịch vụ thống
kê - Tổng cục Thống kê
6 Ý nghĩa lý luận và thực tiễn của luận văn
6.1 Ý nghĩa lý luận
Hệ thống hóa cơ sở lý luận tiêu chuẩn hóa quy trình thu thập, khai thác,
xử lý, tổng hợp, phân tích các thông tin thống kê
6.2 Ý nghĩa thực tiễn
Luận văn trên cơ sở đánh giá thực trạng quy trình thu thập, khai tháccác nguồn thông tin để sản xuất số liệu thống kê sẽ đề xuất một số giải phápnhằm tối ưu hóa công tác quản trị quy trình khai thác và sử dụng các nguồnthông tin trong biên soạn và tính toán các số liệu thống kê tại Việt Nam
7 Kết cấu của đề tài
Chương 1: Cơ sở lý luận chung về quản trị, quy trình thu thập và khai thác thông tin thống kê
Chương 2: Đánh giá thực trạng quản trị quy trình thu thập và khai thác
sử dụng thông tin thống kê tại Trung tâm Tư vấn và Dịch vụ thống kê
Chương 3: Đề xuất giải pháp nhằm nâng cao quản trị quy trình thu thập
và khai thác thông tin thống kê tại Trung tâm Tư vấn và Dịch vụ thống kê
Trang 14Chương 1
CƠ SỞ LÝ LUẬN CHUNG VỀ QUẢN TRỊ, QUY TRÌNH THU THẬP
VÀ KHAI THÁC THÔNG TIN THỐNG KÊ 1.1 Cơ sở lý luận về quản trị, quy trình thu thập và khai thác thông tin thống kê
Tác giả Koontz và O’Donnell (1955) cho rằng “Có lẽ không có lĩnh vựchoạt động nào của con người quan trọng hơn là công việc quản lý, bởi vì mọinhà quản trị ở mọi cấp độ và trong mọi cơ sở đều có một nhiệm vụ cơ bản làthiết kế và duy trì một môi trường mà trong đó các cá nhân làm việc với nhautrong các nhóm có thể hoàn thành các nhiệm vụ và các mục tiêu đã định.”Robert Albanese (1988) cho rằng “Quản trị là một quá trình kỹ thuật và xã hộinhằm sử dụng các nguồn, tác động tới hoạt động của con người và tạo điềukiện thay đổi để đạt được mục tiêu của tổ chức” James Stoner và StephenRobbins (2012) đã định nghĩa “Quản trị là tiến trình hoạch định, tổ chức, lãnhđạo và kiểm soát những hoạt động của các thành viên trong tổ chức và sửdụng tất cả các nguồn lực khác của tổ chức nhằm đạt được mục tiêu đã đề ra”
Từ tiến trình trong định nghĩa này nói lên rằng các công việc hoạch định, tổchức, lãnh đạo và kiểm soát phải được thực hiện theo một trình tự nhất địnhhay nói cách khác phải cần có một quy trình cụ thể được tổ
Trang 15chức/doanh nghiệp đề ra thành các phương thức để tiến hành triển khai cáccông việc cụ thể một cách hiệu quả nhất.
Theo tác giả Trương Quang Dũng (2017) thì cho rằng “Quản trị là sựtác động của chủ thể quản trị đến đối tượng quản trị nhằm thực hiện các mụctiêu đã vạch ra một cách tối ưu trong điều kiện biến động của môi trường”.Với cách hiểu này, quản trị là một quá trình, trong đó chủ thể quản trị là tácnhân tạo ra các tác động quản trị; đối tượng quản trị tiếp nhận các tác độngcủa chủ thể quản trị tạo ra; mục tiêu của quản trị phải được đặt ra cho cả chủthể quản trị và đối tượng quản trị, được xác định trước khi thực hiện sự tácđộng quản trị
Tóm lược lại có thể thấy, quản trị sự là phối hợp hiệu quả các hoạt độngcủa người cùng chung trong tổ chức trong tiến trình thực hiện các hoạt độngnhằm đảm bảo sự hoàn thành công việc Quản trị là quá trình các nhà quản trịhoạch định, tổ chức, lãnh đạo và kiểm tra nhằm đạt được mục tiêu đã đề rabằng việc phối hợp các nguồn lực của tổ chức”
Bản chất của quản trị
Có thể có nhiều khái niệm khác nhau về quản trị nhưng bản chất củaquản trị chỉ có một Bản chất của “quản trị” là tìm ra phương thức phù hợpnhất để công việc đạt hiệu quả cao nhất (kết quả tốt nhất với chi phí nhâncông, thời gian, tài chính ít nhất)
Các yếu tố của quản trị
Quản trị cần ba yếu tố điều kiện cơ bản
- Chủ thể quản trị: Là nhân tố tạo ra các tác động tới quản trị và đốitượng quản trị Đối tượng quản trị sẽ phải chịu tác động từ chủ thể quản trị, có thểdiễn ra một lần hoặc nhiều lần liên tục Chủ thể quản trị gồm một hoặc nhiềungười Đối tượng là một tổ chức, một tập thể hoặc thiết bị, máy móc
- Mục tiêu đặt ra cho chủ thể quản trị và đối tượng: Cần phải có mụctiêu đối với chủ thể quản trị và đối tượng quản trị Đây được coi là căn cứ để chủthể đưa ra các tác động đến đối tượng quản trị Đối tượng quản trị có thể là tập thể,
tổ chức hay các thiết bị máy móc
Trang 16- Nguồn lực: Nguồn lực ở đây chính là nhân lực, vật lực và các yếu tốkhác Việc chuẩn bị đày đủ các nguồn lực sẽ giúp chủ thể quản trị khai thác, vậnhành doanh nghiệp tốt hơn.
Chức năng & vai trò của quản trị
Đây là những nhóm công việc chung, tổng quát mà nhà quản trị ở cấpbậc nào cũng thực hiện Nói cụ thể hơn, chức năng quản trị được hiểu là mộtloại hoạt động quản trị, được tách riêng trong quá trình phân công và chuyênmôn hóa lao động quản trị, thể hiện phương hướng hay giai đoạn tiến hànhcác tác động quản trị nhằm hoàn thành mục tiêu chung của tổ chức Hiện nay
có nhiều cách phân loại các chức năng quản trị, nhưng nhìn chung, các nhàkhoa học đã tương đối có sự thống nhất về bốn chức năng quản trị là: (i)hoạch định, (ii) tổ chức, (iii) điều khiển và (iv) kiểm soát (Trương QuangDũng, 2017)
Chức năng hoạch định: là chức năng đầu tiên trong quá trình quản trị.
Hoạt động này bao gồm việc xác định rõ hệ thống mục tiêu của tổ chức, xây dựng
và lựa chọn chiến lược tổng thể để thực hiện các mục tiêu này và thiết lập một hệthống các kế hoạch để phối hợp các hoạt động của tổ chức Đồng thời đưa ra cácbiện pháp để thực hiện các mục tiêu, các kế hoạch của tổ chức và cải tiến, pháttriển tổ chức Chức năng hoạch định giúp phối hợp hoạt động giữa các nhân viên,giúp tổ chức hoạt động hiệu quả
Hoạch định bao gồm:
Xác định rõ các phương hướng, mục tiêu
Dự thảo chương trình hành động
Tạo ra các lịch trình hành động
Đề ra các biện pháp kiểm soát
Cải tiến và phát triển tổ chức
Chức năng tổ chức: chủ yếu là thiết kế cơ cấu của tổ chức, bao gồm xác định những việc phải làm, những ai sẽ làm những việc đó, những bộ phận nào cần
được thành lập, quan hệ phân công phối hợp và trách nhiệm giữa các bộ phận và xáclập hệ thống quyền hành trong tổ chức. Chức năng quản trị này sẽ xác lập ra sơ đồ tổchức; Mô tả nhiệm vụ của các bộ phận; Xây dựng tiêu
Trang 17chuẩn cho từng công việc Công việc này yêu cầu cần sự phân bổ và sắp xếpnguồn nhân lực một cách hợp lý. Bên cạnh việc bố trí nhân lực, quản trị còn cóchức năng sắp xếp máy móc, kinh phí cho tổ chức.
Chức năng điều khiển (lãnh đạo): Quản trị bao gồm hoạt động lãnh đạo tổ
chức Đó là tác động của các nhà quản trị với cấp dưới của mình Lãnh đạo bao gồm:Động viên các nhân viên; Lãnh đạo và chỉ huy; Thiết lập quan hệ giữa nhân viên vàngười quản trị Thiết lập quan hệ giữa người quản trị với các tổ chức khác Nhà quản trịgiao việc cho nhân viên để đạt được mục đích chung Bằng các phương pháp quản lýriêng, nhà quản trị giám sát, giúp nhân viên làm việc hiệu quả Đây là chức năng thựchiện sự kích thích, động viên, chỉ huy, phối hợp con người, thực hiện các mục tiêuquản trị và giải quyết các xung đột trong tập thể nhằm đưa tổ chức đi theo đúng quỹđạo dự kiến của tổ chức
Chức năng kiểm soát: Quản trị là hoạt động kiểm soát Hoạt động kiểm
soát thường là việc thu thập thông tin về kết quả thực hiện thực tế, so sánh kết quảthực hiện thực tế với các mục tiêu đã đặt ra và tiến hành các điều chỉnh nếu có sailệch, nhằm đưa tổ chức đi đúng quỹ đạo đến mục tiêu Quản trị phải cố gắng đảm bảo
tổ chức đang vận hành đúng theo mục tiêu, phương hướng đề ra Quản trị cần đưa rađược điều chỉnh cần thiết ngay khi có sự cố, sai sót xảy ra Kiểm soát gồm: Xác địnhđược các tiêu chuẩn kiểm tra; Lên lịch trình để đi kiểm tra; có công cụ để kiểm tra,đánh giá tình hình, đề ra các biện pháp hoàn thiện nếu có. Chức năng này để đảm bảocông việc thực hiện như kế hoạch dự kiến thông qua việc theo dõi toàn bộ hoạt động
của các thành viên, bộ phận và cả tổ chức
1.1.1.2 Khái niệm và đặc trưng của quy trình
Thuật ngữ “quy trình” như là “một phương pháp cụ thể để thực hiệnmột quá trình hay công việc Quy trình thường được thể hiện bằng văn bản.Như vậy, thông thường các đơn vị phát triển các “quy trình” nhằm thực hiện
và kiểm soát các “quá trình” của mình Một quy trình có thể nhằm kiểm soát
Trang 18nhiều quá trình, và ngược lại, một quá trình có thể được kiểm soát bằng nhiềuquy trình (Trương Quang Dũng, 2017).
Theo Trương Quang Dũng (2017) thì quy trình được hiểu là cách thứchay phương thức để thực hiện hoạt động hay quá trình Khi nói đến một quytrình tức là nói đến trình tự hoạt động của công việc trong chuỗi các côngviệc Bên cạnh đó, quy trình có những đặc điểm cụ thể sau: (i) một phươngpháp cụ thể để tiến hành một hoạt động hoặc một quá trình; (ii) quy trìnhthường được thể hiện trên văn bản; (iii) quy trình là công cụ của quản lý vàmột quy trình có thể quản lý nhiều quá trình: (iv) có tính bó buộc tuân thủ và(v) quy trình xác định và đặt ra đầu vào, đầu ra cho quá trình và (vi) quy trình thường không thay đổi và được thực hiện theo một thứ tự nhất định
Quy trình có những đặc trưng cơ bản sau: Thứ nhất, một quy trình có
thể dưới dạng sơ đồ hoặc vật mẫu, một chương trình máy tính hoặc tập hợpcác công thức toán học phức tạp… Quy trình không cần thiết phải phản ánhhoàn toàn 100% bản chất sự vật, hiện tượng và quá trình nhưng phải phản ánh
được những nét cơ bản của đối tượng cần được thể hiện; Thứ hai, quy trình
giúp người sáng tạo ra quy trình trình bày những điều muốn nói, muốn truyềnđạt, bỏ qua các mặt thứ yếu để tập trung vào phương diện chủ yếu có ý nghĩaquan trọng đối với vấn đề nghiên cứu Một quy trình thường sẽ chỉ thể hiệnđược một vài khía cạnh của hiện tượng khách quan, vì vậy nên việc 2 quytrình cùng thể hiện một hiện tượng nhưng lại khác nhau hoàn toàn là điềuhoàn toàn có thể xẩy ra Sự khác biệt này là do yêu cầu khác nhau về mụcđích ban đầu xây dựng quy trình, đối tượng sử dụng quy trình…
Một cách tổng quát, tất cả các quy trình phải có ba thành tố chính:
(1) Thông tin vào: bao gồm các dạng CSDL đưa vào để quy trình xử lý(2) Tiến trình xử lý thông tin: bao gồm quá trình tiếp nhận dữ liệu vào, tính toán, phân tích, đánh giá và xuất dữ liệu
(3) Thông tin ra: thể hiện dạng đồ thị, biểu bảng, báo cáo đánh giá kếtquả
Trang 19Hình 1.1 Các thành tố chính của một quy trình
Nguồn: Trần Văn Thắng (2015)
1.1.2 Dữ liệu thống kê
1.1.2.1 Khái niệm
Một số khái niệm khác sẽ được sử dụng trong Luận văn được quy định
cụ thể trong Luật Thống kê (2015)
Thông tin thống kê là dữ liệu thống kê được xử lý, tổng hợp và phân tích
theo phương pháp, quy trình, chuyên môn, nghiệp vụ thống kê để phản
ánh đặc trưng, thuộc tính của hiện tượng nghiên cứu Thông tin thống kê gồm số liệu thống kê và bản phân tích số liệu đó
Thông tin thống kê nhà nước là thông tin thống kê do hoạt động thống kê
nhà nước tạo ra, có giá trị pháp lý, được cơ quan nhà nước có thẩm quyền công bố
Hoạt động thống kê là hoạt động xác định nhu cầu thông tin cần thu
thập; chuẩn bị thu thập; thu thập; xử lý và tổng hợp; phân tích và dự báo; công bố,phổ biến và lưu trữ thông tin thống kê về hiện tượng nghiên cứu trong điều kiệnkhông gian và thời gian cụ thể
Hoạt động thống kê ngoài thống kê nhà nước là hoạt động thống kê do tổ
chức, cá nhân thực hiện ngoài chương trình thống kê
Hoạt động thống kê nhà nước là hoạt động thống kê trong chương trình
thống kê do hệ thống tổ chức thống kê nhà nước, cơ quan nhà nước có thẩm quyềnthực hiện hoặc ủy thác cho tổ chức khác thực hiện
Báo cáo thống kê là mẫu biểu và hướng dẫn ghi chép mẫu biểu để thu
thập dữ liệu, thông tin thống kê về đối tượng nghiên cứu cụ thể theo phương phápkhoa học, thống nhất được quy định trong chế độ báo cáo thống kê trong một thời
kỳ nhất định
Trang 20 Chế độ báo cáo thống kê là những quy định và hướng dẫn do cơ quan
nhà nước có thẩm quyền ban hành về việc thực hiện một tập hợp những báo cáothống kê có liên quan với nhau để tổng hợp các chỉ tiêu thống kê thuộc một hệthống chỉ tiêu thống kê và tổng hợp thông tin thống kê khác phục vụ quản lý nhànước
Chỉ tiêu thống kê phản ánh đặc điểm về quy mô, tốc độ phát triển, cơ
cấu, trình độ phổ biến, quan hệ tỷ lệ của bộ phận hoặc toàn bộ hiện tượng kinh tế
-xã hội trong điều kiện không gian và thời gian cụ thể Chỉ tiêu thống kê gồm tênchỉ tiêu và trị số của chỉ tiêu
Dữ liệu hành chính là dữ liệu của cơ quan nhà nước được ghi chép, lưu
giữ, cập nhật trong các hồ sơ hành chính dạng giấy hoặc dạng điện tử
Dữ liệu thống kê gồm dữ liệu định lượng và dữ liệu định tính để hình
thành thông tin thống kê về hiện tượng nghiên cứu
Điều tra thống kê là hình thức thu thập dữ liệu, thông tin thống kê về đối
tượng nghiên cứu cụ thể theo phương pháp khoa học, thống nhất được xác địnhtrong phương án điều tra thống kê cho mỗi lần điều tra
Hệ thống chỉ tiêu thống kê là tập hợp những chỉ tiêu thống kê phản ánh
các đặc điểm của hiện tượng kinh tế - xã hội Hệ thống chỉ tiêu thống kê gồm danhmục và nội dung chỉ tiêu thống kê Danh mục chỉ tiêu thống kê gồm mã số, nhóm,tên chỉ tiêu Nội dung chỉ tiêu thống kê gồm khái niệm, phương pháp tính, phân tổchủ yếu, kỳ công bố, nguồn số liệu của chỉ tiêu thống kê và cơ quan chịu tráchnhiệm thu thập, tổng hợp
Sử dụng dữ liệu hành chính cho hoạt động thống kê nhà nước là hình
thức thu thập dữ liệu, thông tin thống kê về đối tượng nghiên cứu cụ thể từ dữ liệuhành chính Nội dung sử dụng dữ liệu hành chính trong hoạt động thống kê nhànước gồm: (i) Tổng hợp số liệu thống kê, biên soạn các chỉ tiêu thống kê và lậpbáo cáo theo chế độ báo cáo thống kê; (ii)
Lập hoặc cập nhật dàn mẫu cho điều tra thống kê và (iii) Xây dựng, cập nhật cơ sở dữ liệu thống kê
1.1.2.2 Quản trị dữ liệu thống kế
Theo Cổng dữ liệu quốc gia (2020a) thì quản trị dữ liệu là một hệ thống
Trang 21các quy định để xác định ai trong tổ chức có quyền và quyền kiểm soát đốivới các tài sản dữ liệu và cách các tài sản dữ liệu đó có thể được sử dụng Nóbao gồm con người, quy trình và công nghệ cần thiết để quản lý và bảo vệ tàisản dữ liệu Quản trị dữ liệu tốt nhất có thể được coi là một chức năng hỗ trợchiến lược quản lý dữ liệu tổng thể của tổ chức Khung quản trị dữ liệu cungcấp cho tổ chức một cách tiếp cận toàn diện để thu thập, quản lý, bảo mật vàlưu trữ dữ liệu.
Hình 1.2 Mười lĩnh vực kiến thức thuộc quản trị dữ liệu
Nguồn: Cổng dữ liệu quốc gia (2020)
Kiến trúc dữ liệu: Cấu trúc tổng thể của dữ liệu và các tài nguyên liên
quan đến dữ liệu như một phần không thể thiếu của kiến trúc doanh nghiệp
Mô hình hóa và thiết kế dữ liệu: Phân tích, thiết kế, xây dựng, thử
nghiệm và bảo trì
Lưu trữ và hoạt động dữ liệu: Triển khai và quản lý tài sản dữ liệu vật lý
có cấu trúc
Bảo mật dữ liệu: Đảm bảo quyền riêng tư, bảo mật và truy cập thích hợp
Tích hợp dữ liệu và khả năng tương tác: Thu thập, trích xuất, chuyển
đổi, di chuyển, phân phối, sao chép, liên kết, ảo hóa và hỗ trợ hoạt động
Trang 22 Tài liệu và nội dung: Lưu trữ, bảo vệ, lập chỉ mục và cho phép truy cập
vào dữ liệu được tìm thấy trong các nguồn không có cấu trúc và cung cấp dữ liệunày để tích hợp và tương tác với dữ liệu có cấu trúc
Dữ liệu tham chiếu và dữ liệu chủ: Quản lý dữ liệu được chia sẻ để giảm
dư thừa và đảm bảo chất lượng dữ liệu tốt hơn thông qua định nghĩa và sử dụngcác giá trị dữ liệu được tiêu chuẩn hóa
Kho dữ liệu và thông minh kinh doanh (BI): Quản lý việc xử lý dữ liệu
phân tích và cho phép truy cập vào dữ liệu hỗ trợ quyết định để báo cáo và phântích
Siêu dữ liệu: Thu thập, phân loại, duy trì, tích hợp, kiểm soát, quản lý và
cung cấp siêu dữ liệu
Chất lượng dữ liệu: Xác định, giám sát, duy trì tính toàn vẹn của dữ liệu
và cải thiện chất lượng dữ liệu
Ngoài ra, trong quản trị dữ liệu cần cần phải đảm bảo tám nguyên tắcchủ đạo: (1) Tất cả những người tham gia quản trị dữ liệu phải có tính chínhtrực trong giao dịch của họ với nhau Họ phải trung thực và thẳng thắn trongviệc thảo luận về các trình điều khiển, các ràng buộc, các lựa chọn và tác độngđối với các quyết định liên quan đến dữ liệu; (2) Các quy trình quản lý vàquản lý dữ liệu yêu cầu tính minh bạch Phải rõ ràng cho tất cả những ngườitham gia và kiểm toán viên về cách thức và thời điểm đưa các quyết định vàkiểm soát liên quan đến dữ liệu vào các quá trình; (3) Các quyết định, quytrình và kiểm soát liên quan đến dữ liệu chịu sự quản lý dữ liệu phải có thểkiểm toán được Chúng phải được kèm theo tài liệu để hỗ trợ các yêu cầuđánh giá hoạt động và dựa trên tuân thủ; (4) Quản trị dữ liệu phải xác định aichịu trách nhiệm về các quyết định, quy trình và kiểm soát liên quan đến dữliệu đa chức năng; (5) Quản trị dữ liệu phải xác định ai chịu trách nhiệm vềcác hoạt động quản lý là trách nhiệm của từng người đóng góp và các nhómquản lý dữ liệu; (6) Kiểm tra và cân bằng Quản trị dữ liệu sẽ xác định tráchnhiệm giải trình theo cách đưa ra việc kiểm tra và cân bằng giữa các nhómnghiệp vụ và công nghệ, và giữa những người tạo / thu thập thông tin, nhữngngười quản lý thông tin, những người sử dụng thông tin đó và những người
Trang 23đưa ra các tiêu chuẩn và yêu cầu tuân thủ; (7) Quản trị dữ liệu sẽ giới thiệu và
hỗ trợ tiêu chuẩn hóa dữ liệu doanh nghiệp và (8) Thay đổi cách quản lý.Quản trị dữ liệu sẽ hỗ trợ các hoạt động quản lý thay đổi chủ động và phảnứng đối với các giá trị dữ liệu tham chiếu và cấu trúc / việc sử dụng dữ liệuchính và siêu dữ liệu
1.1.3 Cơ sở dữ liệu thống kê
1.1.3.1 Khái niệm cơ sở dữ liệu thống kê
Cơ sở dữ liệu (CSDL) thống kê là một tập hợp các dữ liệu có quan hệlogic với nhau và tập hợp này có thể dễ dàng được chia sẻ và được thiết kếnhằm đáp ứng nhu cầu sử dụng của một số cơ quan, tổ chức hay bộ phân nhànghiên cứu nào đó Nói cách khác, CSDL là tập hợp có cấu trúc của những dữliệu có liên quan với nhau được lưu trữ lại với một mục đích xác định nhưphục vụ lưu trữ, truy xuất dữ liệu cho các ứng dụng hay người dùng
Hình 1.3 Sơ đồ từ thông tin đến CSDL
Nguồn: David J Hand (2015)
Trong thống kê, nguồn dữ liệu được chia thành hai loại: (i) Dữ liệu thứcấp và (ii) Dữ liệu sơ cấp
Dữ liệu thứ cấp: là dữ liệu được thu thập từ các nguồn sẵn có Ví dụ
trong các công ty, tập đoàn doanh nghiệp luôn có các thông tin sẵn có về nhânviên, khách hàng và các dữ liệu liên quan đến toàn bộ hoạt động kinh doanh của họ(doanh thu, lợi nhuận, thuế vv) Hoặc ở Bộ Lao động Thương binh và Xã hội, sẽ
có những dữ liệu liên quan đến tỷ lệ thất nghiệp của người lao động, các dữ liệu vềtiền lương, quy mô nguồn lao động…vv Đặc điểm của dữ liệu thứ cấp là chỉ cungcấp các thông tin mô tả tình hình, thông tin về quy mô của hiện tượng kinh tế xãhội chứ chưa phản ánh và thể hiện được bản chất cũng như mối liên hệ bên trongcủa các hiện tượng kinh tế xã hội đó Dữ liệu thứ cấp có thể được chia
Trang 24thành: (1) Dữ liệu thứ cấp bên trong (dữ liệu bắt nguồn từ bên trong các
tổ chức) và (2) Dữ liệu thứ cấp bên ngoài (các tài liệu đã được xuất bản,trang mạng thông tin toàn cầu ) Ngoài ra, có 03 tiêu chuần đánh gia dữliệu thứ cấp thông qua tiêu chí:
o Tính cụ thể (Dữ liệu thứ cấp được cho là tốt là dữ liệu phải đảmbảo tính cụ thể, rõ ràng cả về nguồn dữ liệu cũng như bản thân dữ liệu), phù hợpvới mục đích nghiên cứu của các nhà nghiên cứu;
o Tính chính xác của dữ liệu (Dữ liệu cần phải đáp ứng yêu cầu chínhxác và đảm bảo phục vụ được cho các mục đích nghiên cứu)
o Tính kịp thời (Nguồn dữ liệu hành chính cần đảm bảo tính kịp thời
và thời sự của nó và giảm thiểu độ trễ về thời gian của dữ liệu xuống mức thấpnhất)
Dữ liệu sơ cấp: Dữ liệu sơ cấp là dữ liệu chưa có sẵn được thu thập từ
các nghiên cứu thống kê, nói cách khác dữ liệu sơ cấp là dữ liệu do chính nhữngnhà nghiên cứu thu thập để phục vụ mục đích nghiên cứu của mình Các nghiêncứu thống kê bao gồm: nghiên cứu thực nghiệm (phỏng vấn, điều tra) và quan sát
1.1.3.2 Các mô hình cơ sở dữ liệu phổ biến
Theo Cổng dữ liệu quốc gia (2020b) thì mô hình cơ sở dữ liệu là một cấutrúc logic của cơ sở dữ liệu để xác định cách mà dữ liệu sẽ được lưu trữ, lấy ra
và cập nhật mối quan hệ tồn tại giữa các mục dữ liệu Có nhiều mô hình dữliệu khác nhau đã xuất hiện trong những năm qua Hiện nay có 4 mô hình cơ
sở dữ liệu phổ biến sẽ được giới thiệu ngắn gọn và thảo luận những đặc điểm
cơ bản: (i) Mô hình phân cấp, (ii) Mô hình mạng, (iii) Mô hình quan hệ và(iv) Mô hình hướng đối tượng
Mô hình phân cấp (Hierarchical Model)
Mô hình phân cấp bao gồm một tập hợp các bản ghi được nối với nhauthông qua các liên kết Một bản ghi là một tập hợp các trường, mỗi trường chỉchứa một giá trị dữ liệu Một liên kết là liên kết giữa hai bản ghi Do đó, môhình phân cấp tương tự như mô hình mạng theo nghĩa là dữ liệu và mối quan
hệ giữa dữ liệu cũng được biểu diễn bằng các bản ghi và liên kết tương ứng
Trang 25Sơ đồ cấu trúc cây là một lược đồ cho cơ sở dữ liệu phân cấp, bao gồmhai thành phần cơ bản: hộp (boxes), tương ứng với các loại bản ghi và dòng,tương ứng với các liên kết Sơ đồ cấu trúc cây phục vụ cùng mục đích như sơ
đồ thực thể liên kết E-R, nó chỉ định cấu trúc logic tổng thể của cơ sở dữ liệu
Sơ đồ cấu trúc cây tương tự như sơ đồ cấu trúc dữ liệu trong mô hình mạng.Đối với mỗi sơ đồ E-R, có một sơ đồ cấu trúc cây tương ứng Do đó, lược đồ
cơ sở dữ liệu được biểu diễn dưới dạng tập hợp các sơ đồ cấu trúc cây
Trong mô hình dữ liệu phân cấp, thông tin được tổ chức như một tậphợp các bản ghi, được biểu diễn dưới dạng cây, cây này có thể có độ sâu tùy
ý Bản ghi tại gốc của cây bắt đầu từ số 0 và có nhiều bản ghi được gọi là bảnghi con Một bản ghi ở trên cùng của cây được gọi là bản ghi cha, mối quan hệ đệquy của bản ghi cha - con này tiếp tục hình thành một cây Mỗi bản ghi chứa nhiềutrường, trong đó mỗi trường chỉ chứa một giá trị dữ liệu như số nguyên, số thực,văn bản hoặc một con trỏ tới bản ghi Con trỏ không được phép tạo thành một chutrình Hệ quản trị cơ sở dữ liệu DBMS (Database Management System) phân cấp
hỗ trợ các giá trị null hoặc các trường có độ dài biến đổi
Các ứng dụng có thể truy xuất cơ sở dữ liệu phân cấp bằng cách bắt đầu
từ gốc và tiếp tục đi xuống từ nút cha mẹ sang nút con cho đến khi tìm thấybản ghi mong muốn Việc tìm kiếm bất kỳ bản ghi nào trong cây phân cấp đềuđược thực hiện rất nhanh và đơn giản bởi vì cơ sở dữ liệu phân cấp sử dụng
bộ nhớ tiếp giáp cho cấu trúc phân cấp Đối với mô hình dữ liệu phân cấp,Ngôn ngữ định nghĩa dữ liệu DDL (Data Definition Language) phải hỗ trợđịnh nghĩa các loại trường, loại bản ghi, con trỏ và mối quan hệ cha-con Môhình dữ liệu phân cấp chỉ hỗ trợ dữ liệu độc lập có giới hạn và không thể hiệncác mô hình thông tin phức tạp Dữ liệu được nhân rộng thành cùng một câyhoặc các cây khác nhau Nhược điểm của mô hình dữ liệu phân cấp là có thểcùng có thông tin được lưu trữ nhiều lần và mô hình không hỗ trợ tính nhấtquán và bảo mật thông tin
Mô hình mạng (Network Model)
Mô hình dữ liệu mạng bao gồm một tập hợp các bản ghi được nối với
Trang 26nhau thông qua các liên kết, các bản ghi này tương tự như một thực thể trong
mô hình thực thể liên kết E-R Mỗi bản ghi là một tập hợp các trường (thuộctính - attributes), mỗi trường chỉ chứa một giá trị dữ liệu Sơ đồ cấu trúc dữliệu là một lược đồ cho cơ sở dữ liệu mạng Một sơ đồ như vậy bao gồm haithành phần cơ bản: hộp (boxes), tương ứng với các loại bản ghi và dòng,tương ứng với các liên kết Một sơ đồ cấu trúc dữ liệu phục vụ cùng một mụcđích như sơ đồ E-R; cụ thể là, nó chỉ định cấu trúc logic tổng thể của cơ sở dữliệu Đối với mỗi sơ đồ E-R, có một sơ đồ cấu trúc dữ liệu tương ứng Dữ liệutrong mô hình dữ liệu mạng được tổ chức như một tập hợp các đồ thị của bảnghi có liên quan với con trỏ Một con trỏ là một địa chỉ vật lý xác định nơi màcác bản ghi tiếp theo có thể được tìm thấy trên đĩa Mô hình dữ liệu mạng linhhoạt hơn mô hình dữ liệu phân cấp và vẫn hỗ trợ điều hướng hiệu quả
Mô hình dữ liệu mạng chứa các bản ghi là tập hợp các trường trong đómỗi trường chứa một giá trị đơn giản hoặc là kích thước cố định hoặc cácbiến Mô hình dữ liệu mạng cũng hỗ trợ các chỉ mục của các trường và bảnghi, bộ con trỏ và vị trí vật lý của bản ghi Đối với các mô hình dữ liệu mạng,Ngôn ngữ định nghĩa dữ liệu DDL cho phép định nghĩa các loại bản ghi, loại,con trỏ và chỉ mục của trường Và Ngôn ngữ thao tác dữ liệu DML (DataManipulation Language) hỗ trợ điều hướng thông qua các đồ thị, con trỏ vàchỉ mục Mô hình dữ liệu mạng điều hướng chặt chẽ các cấu trúc lưu trữ vật
lý Dữ liệu được nhân rộng vào cùng một biểu đồ hoặc đồ thị khác nhau.Nhược điểm của mô hình dữ liệu này là có thể có cùng một thông tin được lưutrữ nhiều lần Mô hình dữ liệu mạng hỗ trợ dữ liệu độc lập có giới hạn vàkhông hỗ trợ tính nhất quán và bảo mật dữ liệu
Mô hình cơ sở dữ liệu quan hệ (Relation database Model)
Một trong những ứng dụng quan trọng nhất cho máy tính là lưu trữ vàquản lý thông tin Cách thức tổ chức thông tin có thể có ảnh hưởng sâu sắcđến việc truy cập và quản lý thông tin, cách đơn giản nhất để sắp xếp thôngtin là lưu trữ nó trong bảng Mô hình cơ sở dữ liệu quan hệ biểu thị cơ sở dữliệu như một tập hợp các quan hệ Trong mô hình này, mối quan hệ giữa các
dữ liệu được biểu diễn dưới dạng bảng Bảng là một tập hợp các hàng và cột,
Trang 27cột chứa các giá trị dữ liệu đơn giản từ một số miền như số nguyên (integer),
số thực (real), văn bản (tex) và hàng chứa số trường được gọi là bản ghi Môhình này dựa trên đại số quan hệ Mỗi cột chứa một giá trị nguyên tử cho mỗibản ghi và mỗi cột có một tên duy nhất Mô hình quan hệ ngoài việc hỗ trợkhái niệm các khóa để xác định các bản ghi và tạo mối quan hệ giữa 2 hoặcnhiều bảng thì nó cũng hỗ trợ dữ liệu độc lập và tối ưu hóa truy vấn Hìnhthức kiểm soát truy cập thông thường nhất trong cơ sở dữ liệu quan hệ làkhung nhìn Khung nhìn là một bảng logic, được tạo ra với lệnh SQL VIEW
Mô hình cơ sở dữ liệu quan hệ có tính bảo mật, nhất quán cao và tránh sự dưthừa của các bản ghi Mô hình này được hỗ trợ bởi khái niệm về cơ sở dữ liệuphân tán (Distributed Database) Mô hình cơ sở dữ liệu quan hệ cung cấp mộtnền tảng quan trọng và trung tâm để quản lý dữ liệu và giải quyết truy vấn
Mô hình cơ sở dữ liệu hướng đối tượng (Object-Oriented database Model)
Mô hình dữ liệu hướng đối tượng được thiết lập dựa trên khái niệm vềlập trình hướng đối tượng, để xác định cấu trúc dữ liệu Việc phát triển môhình cơ sở dữ liệu hướng đối tượng thể hiện nỗ lực tích hợp các nguyên tắc
mô hình hóa dữ liệu và kỹ thuật phần mềm của các thiết kế ngôn ngữ lập trìnhđược hỗ trợ bởi công nghệ cơ sở dữ liệu
Phần tử cơ bản của mô hình cơ sở dữ liệu hướng đối tượng chính là đốitượng, hoạt động như một thực thể thời gian chạy và mọi đối tượng lại có mộttrạng thái, hành vi và định danh duy nhất Lớp cơ sở dữ liệu hướng đối tượng
là một thùng chứa dữ liệu và các phương thức kỹ thuật đóng gói Các phươngthức kỹ thuật sử dụng để thực hiện đóng gói được thao tác trên các mục dữliệu Các lớp được sắp xếp theo dạng phân cấp Trong hệ thống phân cấp này,
ở lớp gốc, một lớp được gọi là lớp cha và các lớp khác kế thừa (sử dụng) cácthuộc tính của lớp cha được gọi là lớp con (phần tử) Tùy theo nhu cầu của ngườidùng, các thuộc tính này có thể được sửa đổi trong lớp con Một đối tượng có thểtương tác với đối tượng khác bằng cách truyền thông điệp cho nhau, mô hình nàycung cấp khả năng tái sử dụng dữ liệu và phương pháp kế thừa dữ liệu Dữ liệu cóthể là dữ liệu trừu tượng, cung cấp nhiều bảo mật và
Trang 28tích hợp cơ sở dữ liệu cho người dùng.
1.2 Quản trị Quy trình thu thập và khai thác thông tin thống kê
Theo nghiên cứu của Hoàng Tuấn Long và Phạm Thu Thủy (2020) kếthừa của các nghiên cứu Ainsworth (2020); Dallemand (2019) và Rouse(2020) thì xây dựng quy trình cho việc xử lý, làm sạch, lưu trữ, bảo mật vàchia sẻ dữ liệu thống kê gồm 5 bước cơ bản: (i) xác định số liệu cần thu thập;(ii) xây dựng phương pháp thu thập số liệu; (iii) xây dựng khung nhập liệu;(iv) đào tạo và thống nhất giữa người thu thập số liệu, người nhập số liệu và người thiết lập khung nhập số liệu và (v) quy trình làm sạch số liệu
Hình 1.4 Quy trình quản lý số liệu/thông tin thống kê
Nguồn: Hoàng Tuấn Long và Phạm Thu Thủy (2020)
Nghiên cứu của Hoàng Tuấn Long và Phạm Thu Thủy (2020) tập trung
đề xuất quy trình thu thập số liệu/thông tin thống kê còn nghiên cứu của TrầnTuấn Hưng và cộng sự (2019) thì tập trung đến quản trị quy trình khai thácthông tin thống kê Nghiên cứu chỉ ra 4 bước liên qua đến quá trình khai thác
số liệu/thông tin thống kê là: (i) Trích xuất, chuyển đổi và tải dữ liệu vào kho
dữ liệu; (ii) Lưu trữ và quản lý dữ liệu trong cơ sở dữ liệu đa chiều; (iii) Xácđịnh các giá trị chính từ tập dữ liệu được trích xuất và (iv) Phân tích dữ liệuhiện tại dưới dạng dễ hiểu, chẳng hạn như biểu đồ
Tuy nhiên đề tài mà tác giả thực hiện trong Luận văn nghiên cứu củamình lại có những nét đặc trưng riêng của ngành cũng như tuân thủ nhữngquy định riêng của Chinh phủ nên việc quản trị quy trình thu thập và khai thácthông tin thống kê cũng có những nét tương đồng và khác biệt Tác giả xinđưa ra quy trình tiêu chuẩn của ngành trong việc thu thập và khai thác thôngtin thống kê tiêu chuẩn căn cứ theo Quyết định 945/QĐ-TCTK ngày
Trang 2924 tháng 9 năm 2013 của Tổng cục trưởng Tổng cục Thống kê (TCTK) vềquy trình sản xuất thông tin thống kê cấp cao của Tổng cục Thống kê, trong
đó đã quy định quy trình thu thập và khai thác thông tin thống kê theo 7 bước:(1) Xác định nhu cầu thông tin; (2) Chuẩn bị thu thập thông tin; (3) Thu thậpthông tin; (4) Xử lý thông tin; (5) Phân tích thông tin; (6) Phổ biến thông tin
và (7) Lưu trữ thông tin
Hình 1.5 Quy trình sản xuất thông tin thống kê
B1: Xác định
nhu cầu
thông tin
B2: Chuẩn bị thu thập thông tin
B7: Lưu trữ thông tin
B3: Thu thập thông tin
B6: Phổ biến thông tin
B4: Xử lý thông tin
B5: Phân tích thông tin
Nguồn: Quyết định 945/QĐ-TCTK ngày 24/9/2013 1.2.1 Thu thập thông tin thống kê
Nguồn thu thập thông tin thống kê
Như đã đề cập trên mục khái niệm về quy trình ở mục 1.1.1.3 thì quytrình là sự đơn giản hóa hiện thực một cách có chủ đích nhằm thể hiện một sựvật, hiện tượng hoặc quá trình nào đó một cách đơn giản, hợp lý và kháchquan Theo Luật Thống kê (2015) và trên thực tế, số liệu thống kê có thể thuthập từ các nguồn chủ yếu sau: (1) Số liệu từ các cuộc điều tra thống kê; (2)
Dữ liệu hành chính (từ hoạt động thống kê nhà nước); (3) Số liệu từ Báo cáothống kê
Thông tin thống kê được sử dụng phải từ các nguồn số liệu chính thức do
hệ thống tổ chức thống kê trực tiếp thực hiện hoặc tổng hợp từ thông tin thống
kê do các Bộ, cơ quan ngang Bộ, Cơ quan thuộc Chính phủ, Toà án nhân dântối cao, Viện Kiểm sát Nhân dân tối cao… thực hiện, nhằm đáp ứng yêu cầuquản lý chung của Nhà nước Số liệu của các chỉ tiêu thống kê được lựa chọntrên cơ sở các các nguồn số liệu thống kê sau:
Trang 30 Niên giám thống kê của Tổng cục Thống kê; Niên giám thống kê củatỉnh, thành phố trực thuộc Trung ương; Niên giám thống kê của bộ, ngành (như Bộ
Y tế; Bộ Giáo dục và Đào tạo; Bộ Lao động-Thương binh và Xã hội; Bộ Côngan…);
Kết quả của các cuộc điều tra trong chương trình điều tra thống kê quốcgia như Tổng điều tra dân số và nhà ở năm 2019, Khảo sát mức sống dân cư ViệtNam, Điều tra lao động, việc làm,…);
Các Báo cáo và Thông tin thống kê tại Việt Nam tại website chính thức của Tổng cục Thống kê (www.gso.gov.vn);
Cổng thông tin điện tử chính thức của các Bộ, ngành, các cơ quan trựcthuộc chính phủ, UBND tỉnh/thành phố trực thuộc Trung ương, UBND xã phường,thị trấn…
Các ấn phẩm số liệu thống kê chính thức của TCTK như Báo cáo Chỉ sốhài lòng về sự phục vụ hành chính (SIPAS); Báo cáo “Nghèo đa chiều của trẻ emViệt Nam vùng dân tộc thiểu số: Thực trạng, biến động và những thách thức
Dữ liệu hành chính của các Bộ, ngành và địa phương…được các bộngành, địa phương gửi chính thức cho Tổng cục Thống kê qua báo cáo thống kêhoặc theo yêu cầu chính thức của Tổng cục Thống kê
Xác định nhu cầu thông tin:
Mỗi tổ chức, cá nhân có nhu cầu thông tin khác nhau cho những mụcđích và công việc khác nhau Vì thông tin rất đa dạng, việc xác định đúng nhucầu thông tin sẽ giúp cho việc thu thập thông tin có trọng tâm, bảo đảm thuthập các thông tin cần thiết, khắc phục tình trạng thu thập thông tin dàn trải,vừa thừa lại vừa thiếu các thông tin cần thiết theo yêu cầu công việc cần giảiquyết Để xác định đúng nhu cầu thông tin cần căn cứ vào chức năng, nhiệm
vụ và nội dung mục đích của thông tin cần thu thập Việc xác định đúng nhucầu thông tin đối với chủ thể sử dụng thông tin sẽ giúp định hướng xác địnhthu thập thông tin cần thiết, tránh việc ôm đồm, thu thập những thông tinngoài lề, không liên quan trực tiếp đến vị trí, công việc cần giải quyết Việc
Trang 31xác định nhu cầu thông tin phải theo nguyên tắc mở, có nghĩa là thông tinphải được tiếp cận theo cách tiếp cận mở, khai thác nhiều nguồn thông tin,không bó hẹp ở một nguồn thông tin nhằm tạo ra nguồn thông tin đa dạng, đachiều giúp tiếp cận vấn đề toàn diện hơn Riêng đối với xác định thông tinthống kê cần thu thập gắn liền với việc xây dựng hệ thống chỉ tiêu thống kênhằm phản ánh các mặt, các tính chất quan trọng nhất, các mối liên hệ cơ bảngiữa các mặt trong tổng thể và giữa các hiện tượng nghiên cứu với các hiệntượng có liên quan.
Để xây dựng nhu cầu thu thập thông tin thống kê cần căn cứ vào mục
đích nghiên cứu, tính chất và đặc điểm của đối tượng nghiên cứu cũng nhưkhả năng nhân lực và tài chính để nêu được đặc điểm và mối liên hệ cơ bảncủa hiện tượng nghiên cứu; Phải có các chỉ tiêu mang tính chất chung, các chỉtiêu mang tính chất bộ phận và các chỉ tiêu nhân tố; Phải đảm bảo tính thốngnhất về nội dung, phương pháp và phạm vi tính toán của các chỉ tiêu cùngloại
Chuẩn bị thu thập thông tin
Sau khi xác định nhu cầu thông tin, Bên tiến hành thu thập thông tin(TCTK, các Cục Thống kê, Trung tâm tư vấn và dịch vụ thống kê, Bộ ngànhhay các tổ chức) sẽ tiến hành các bước chuẩn bị thu thập thông tin gồm một sốnội dung công việc sau:
Khi được chấp nhận phê duyệt Phương án thu thập thông tin, cơquan/đơn vị thực hiện thu thập thông tin sẽ gửi thông báo chính thức tới các đốitượng điều tra qua văn thư chính thức (Công văn/Thông báo…) hoặc qua cácphương tiện thông tin đại chúng
Bên tiến hành thu thập thông tin tổ chức sắp đặt cuộc phỏng vấn bằngviệc báo trước (gọi điện, viết thư ) cho đối tượng được phỏng vấn (đề nghị) đượcphỏng vấn (trò chuyện, trao đổi ) Bên tiến hành thu thập thông tin phải giới thiệuđầy đủ, chính xác và rõ ràng tư cách của người phỏng vấn, mục đích và nội dungcuộc phỏng vấn, địa điểm, thời gian phỏng vấn; các quyền lợi và nghĩa vụ củangười tham gia phỏng vấn…
Trang 32khác như chuẩn bị phương tiện di chuyển đến nơi phỏng vấn(fieldwork), trang phục phù hợp (nhiều cuộc điều tra yêu cầu Điều traviên mặc đồng phục, đeo thẻ và xuất trình Quyết định tổ chức Điềutra/Khảo sát trước khi phỏng vấn…)
Đối với việc thu thập thông tin từ văn bản tài liệu thì phải sao chụp mộtphần hoặc toàn bộ văn bản, tài liệu Việc sao chụp văn bản, tài liệu cần được lựachọn khoa học, xác định đúng nội dung cần sao chụp để thuận lợi trong quá trình
xử lý, tránh sự quá tải về khối lượng tài liệu sao chụp Các văn bản pháp luật và tàiliệu khác có liên quan phải được sưu tập, thu thập, tổng hợp và lưu trữ Các vănbản phải được quản lý, sắp xếp một cách khoa học và sắp xếp theo một thứ tự nhấtđịnh để dễ tra cứu; Tổng hợp các tin, bài theo từng vấn đề;
Thu thập thông tin.
Sau khi đã xác định nhu cầu thông tin và chuẩn bị thu thập, việc xácđịnh kênh và nguồn thu thập thông tin là bước tiếp theo của quá trình thu thậpthông tin Thu thập thông tin là một khâu trong quá trình thông tin của một cơquan/tổ chức Thu thập thông tin gắn với yếu tố đầu vào của tổ chức Thu thậpthông tin không tách rời quá trình xử lý thông tin, nhằm đảm bảo thông tincho hoạt động của tổ chức Thu thập thông tin có tính đa dạng về phươngpháp, cách thức Tùy theo yêu cầu về thông tin, nguồn lực mà có thể áp dụngcác phương pháp, cách thức thu thập thông tin cho phù hợp; Thu thập thôngtin có thể tìm kiếm từ các nguồn, kênh thông tin khác nhau Mỗi kênh thôngtin có những ưu điểm và nhược điểm riêng, phù hợp với mỗi loại thông tincần thu thập Việc lựa chọn nguồn thông tin thích hợp bảo đảm hiệu quả quátrình thu thập thông tin và chất lượng của thông tin;
Thu thập thông tin là một quá trình liên tục, nhằm bổ sung, hoàn chỉnhthông tin cần thiết; Thu thập thông tin chịu tác động của nhiều nhân tố về kỹnăng thu thập thông tin, kỹ năng sử dụng các phương pháp, cách thức thu thậpthông tin
Yêu cầu với thông tin thu thập
Trang 33hợp với công việc cần giải quyết, có tính hợp pháp, có giá trị sử dụng.Thông tin phải chính xác: Thông tin phải phản ánh đúng bản chất của đốitượng, được cung cấp bởi những chủ thể đáng tin cậy, đã được kiểmchứng hoặc có cơ sở để tiến hành kiểm chứng.
Thông tin phải đầy đủ: Thông tin phải phản ánh được các mặt, các
phương diện của đối tượng, giúp nhận diện đúng vấn đề
Thông tin phải kịp thời: Thông tin có tính mới, phản ánh đối tượng ởthời điểm hiện tại, không phải là những thông tin cũ, thông tin đã lạc hậu
Thông tin phải có tính hệ thống và tổng hợp: Thông tin phải phản ánh được đúng về đối tượng, sự vật, sự việc liên quan
Thông tin đơn giản dễ hiểu: Thông tin có thể dễ dàng sử dụng, phục vụ cho yêu cầu công việc
Thông tin phải đảm bảo yêu cầu bí mật: Trong một số trường hợp thôngtin thu thập được phải bảo đảm tính bí mật, sử dụng trong phạm vi quy định ví dụnhư các thông tin về bí quyết công nghệ, các thông tin chưa được phép công bốtrên diện rộng, các thông tin theo quy định là bí mật nhà nước…
Nguồn thu thập thông tin
Cần xác định rõ nguồn thu thập thông tin Nguồn thông tin trên thực tế
có thể phân loại theo những cách tiếp cận khác nhau nhưng tổng thể có thểđược chia thành thông tin thứ cấp và sơ cấp
Thông tin thứ cấp là nguồn thông tin sẵn có từ các chủ thể khác cungcấp Thông tin sơ cấp là thông tin mới, được thu thập thông qua các phương pháp,
kỹ thuật nhất định (thông tin từ các hồ sơ, tài liệu và văn bản hay thông tin từ sáchbáo, tạp chí, đài phát thanh, truyền hình, internet và các phương tiện thông tin đạichúng khác
Thu thập thông tin qua nguồn sơ cấp (thông tin bằng bảng hỏi địnhlượng, quan sát tại chỗ, lấy ý kiến chuyên gia qua thảo luận nhóm/hội
thảo chuyên đề, thu thập thông tin gián tiếp )
Trang 341.2.2 Khai thác thông tin thống kê
Khai thác dữ liệu là hoạt động thu lấy những dữ liệu cần thiết từ tập các
dữ liệu hay CSDL; là tập hợp các kỹ thuật, các quy trình xử lý dữ liệu để tìm
ra các mối quan hệ lẫn nhau của dữ liệu trong một tập hợp dữ liệu và các mẫu tiềm ẩn trong tập dữ liệu đó; để có được các dữ liệu theo cấu trúc mong
muốn với mục tiêu đầu ra là dạng mẫu hoặc mối liên hệ hoặc xác định các giá
trị còn thiếu, các giá trị trong tương lai của dữ liệu Khai thác dữ liệu là một
tiến trình sử dụng các công cụ phân tích dữ liệu khác nhau để khám phá ra cácmẫu dưới nhiều góc độ khác nhau nhằm phát hiện ra các mối quan hệ giữa các
dữ kiện, đối tượng bên trong CSDL, kết quả của việc khai thác là xác định cácmẫu hay các quy trình đang tồn tại bên trong, nhưng chúng nằm ẩn khuất ởcác CSDL Để từ đó rút trích ra được các mẫu, các quy trình hay các thông tin
và tri thức từ các CSDL
Quy trình khai thác dữ liệu trong đề tài nay được hiểu là một hệ thốngcác cách thức, các bước, các phương pháp thu thập, khai thác dữ liệu mộtcách đầy đủ, khoa học khách quan theo một trình tự chặt chẽ và có chủ đích
Xây dựng quy trình khai thác dữ liệu phục công tác thống kê nhà nước
là quá trình nghiên cứu, đề xuất và xây dựng các phương pháp, các cách thức,các bộ công cụ một cách khái quá hóa để có thể khai thác được các dữ liệunhằm phục vụ công tác thống kê
Quy trình tiêu chuẩn khai thác thông tin thống kê
Quy trình khai thác thông tin thống kê gồm 7 bước cơ bản:
Bước 2: Tích hợp dữ liệu: quá trình hợp nhất dữ liệu thành những kho dữliệu sau khi đã làm sạch và tiền xử lý;
Bước 3: Trích chọn dữ liệu: trích chọn dữ liệu từ những kho dữ liệu vàsau đó chuyển đổi về dạng thích hợp cho quá trình khai thác tri thức Quá trình nàybao gồm cả việc xử lý với dữ liệu nhiễu, dữ liệu không đầy đủ;
Bước 4: Chuyển đổi dữ liệu: Các dữ liệu được chuyển đổi sang các dạng phù hợp cho quá trình xử lý;
Trang 35 Bước 5: Khai phá dữ liệu: Là một trong các bước quan trọng nhất, trong
đó sử dụng những phương pháp thông minh để chắt lọc ra những mẫu dữ liệu
Bước 6: Ước lượng mẫu: quá trình đánh giá các kết quả tìm được thông qua các độ đo nào đó;
Bước 7: Quá trình này sử dụng các kỹ thuật để biểu diễn và thể hiện trực quan cho người dùng
Các phương pháp khai thác thông tin thống kê, dịch vụ thống kê
Trong phạm vi nghiên cứu của Luận văn, tác giả chỉ đưa ra hai phươngpháp khai thác thông tin, dữ liệu thống kê thường được đề cập và sử dụng phổbiến tại Việt Nam và trên thế giới, gồm:
Theo phương pháp này các bản ghi dữ liệu thống kế chính như là công
cụ để kết hợp, đối chiếu các bộ dữ liệu từ các nguồn khác nhau Các nguồn dữliệu khác nhau này được coi như các nguồn vệ tinh
Các nguồn vệ tinh có thể được sử dụng gồm: Các thông tin từ các khuvực có hồ sơ đăng ký hành chính, Các thông tin từ các doanh nghiệp; Cácthông tin từ điều tra; Hệ thống thông tin từ các khu vực địa lý…
Dữ liệu hành chính là dữ liệu được thu thập đầu tiên phục vụ mục đíchquản lý hành chính nên đối với mục đích thống kê, dữ liệu hành chính là dữliệu thứ cấp Theo phương pháp này, thông tin đầu vào chính là các nguồn dữliệu hành chính, cơ cơ quan đang quản lý các dữ liệu hành chính Tiến trình
xử lý là các mối quan hệ giữa các cơ quan trung gian, các phương pháp xử lý
số liệu Thông tin đầu ra: là kết quả, số liệu của chỉ tiêu thống kê Phươngpháp khai thác dữ liệu từ dữ liệu hành chính cần đảm bảo được các yêu cầu:
o Thể hiện được đầy đủ các cấu phần của hệ thống thông tin từ nguồn
số liệu, các đơn vị trung gian, đơn vị cuối cùng tổng hợp và công bố
số liệu
o Thể hiện được mối quan hệ giữa các cấu phần trong quy trình với nhau, đề xuất cơ chế phối hợp giữa các cấu phần (nếu cần)
Trang 36o Mang tính thực tiễn: thể hiện đúng hiện thực khách quan quá trình
thu thập số liệu, hiện trạng số liệu
o Khả thi: quy trình đề xuất cần cân nhắc đến việc có thể áp dụng trong thực tế
o Quy trình xây dựng cần đảm bảo yêu cầu dữ liệu thu thập được mang tính chính xác, đúng thời điểm, có tính đại diện…
1.3 M.3 ả văn bthi: quy trình đề xuấ trong lĩnh vực thống kê
Một số văn bản quy phạm pháp luật về số liệu, dữ liệu thống kê, hệ
thống chỉ tiêu thống kê được sử dụng chủ yếu dựa trên một số văn bản sau:
Bảng 1.1 Một số văn bản quy phạm pháp luật về số liệu, dữ liệu thống kê,
hệ thống chỉ tiêu thống kê
Quyết định số 2179/QĐ- Kế hoạch phát triển hệ thống thông tin và dữ liệuBTC ngày 27/8/2010 thống kê tài chính đến năm 2015
Quyết định số 2331/QĐ- Hệ thống chỉ tiêu và chế độ báo cáo thống kê tàiBTC ngày 4/10/2011 chính
Quyết định số 945/QĐ- Phê duyệt Quy trình sản xuất thông tin thống kêTCTK ngày 24/9/2013 cấp cao của Tổng cục Thống kê
Quyết định số 680/QĐ- Quy chế phổ biến thông tin thông kê của TổngBKHĐT ngày 28/5/2014 cục Thống kê
Quyết định số 1471/QĐ- Quy định nội dung, cơ chế phối hợp, chia sẻBKHĐT ngày 12/10/2015 thông tin thống kê giữa Tổng cục Thống kê và
các Bộ, ngànhLuật Thống kê số Quy định về hoạt động thống kê, sử dụng thông89/2015/QH13 ban hành tin thống kê nhà nước; quyền, nghĩa vụ và tráchngày 23/11/2015 có hiệu nhiệm của cơ quan, tổ chức, cá nhân trong hoạtlực từ ngày 01/7/2016 động thống kê, sử dụng thông tin thống kê nhà
nước; tổ chức thống kê nhà nước và hoạt độngthống kê, sử dụng thông tin thống kê ngoài thống
kê nhà nước…
Trang 37Nghị định 94/2016/NĐ-CP Quy định chi tiết và hướng dẫn thi hành một sốngày 1/7/2016 của Chính điều của Luật Thống kê
phủ
Nghị định số 95/2016/NĐ- Quy định về xử phạt hành chính trong lĩnh vực
CP ngày 1/7/2016 thống kê
Nghị định số 97/2016/NĐ- Quy định nội dung chỉ tiêu thống kê thuộc hệ
CP ngày 01/7/2016 thống chỉ tiêu thống kê quốc gia
Nghị định số 60/2018/NĐ- Quy định chi tiết nội dung Chế độ báo cáo thống
CP ngày 20/4/2018 kê cấp quốc gia
Quyết định số 43/2016/QĐ- Chương trình Điều tra thống kê quốc gia
Trang 38Tiểu kết Chương 1
Trong Chương 1 này, tác giả luận văn đã đưa ra các khái niệm, địnhnghĩa và nội hàm của số liệu thống kê, thông tin thống kê, dữ liệu thống kê,chỉ tiêu thống kê, cơ sở dữ liệu, nguồn dữ liệu; các loại dữ liệu; Chương 1cũng đưa ra các văn bản quy phạm pháp luật quy định về số liệu, dữ liệuthống kê, hệ thống chỉ tiêu thống kê từ 2016 đến nay Luận văn cũng cung cấpkhái niệm về quy trình nói chung và quy trình thu thập thông tin thống kê nóiriêng, các nguồn thu thập thông tin thống kê, các nội dung chủ yếu của từngbước trong quy trình thu thập thông tin thống kê Luận văn cũng đưa ra cáckhái niệm về khai thác dữ liệu và thông tin thống kê; quy trình khai thác dữliệu; các khái niệm về dịch vụ thống kê; các phương pháp khai thác thông tin.Trên cơ sở nghiên cứu đó, tác giả sẽ có những đề xuất về quản trị quy trìnhthu thập và khai thác thông tin thống kê cho Trung tâm Tư vấn và dịch vụthống kê - Tổng cục Thống kê trong Chương 2
Trang 39Chương 2 THỰC TRẠNG QUẢN TRỊ QUY TRÌNH THU THẬP VÀ KHAI THÁC THÔNG TIN THỐNG KÊ TẠI TRUNG TÂM TƯ VẤN VÀ DỊCH VỤ
THỐNG KÊ 2.1 Giới thiệu tổng quan về Tổng cục Thống kê và Trung tâm Tư vấn và dịch vụ thống kê
Ngày 6 tháng 5 năm 1946, Chủ tịch Hồ Chí Minh đã ký Sắc lệnh số61/SL thành lập Nha Thống kê Việt Nam thuộc Bộ Quốc dân kinh tế – tiềnthân của ngành Thống kê và Tổng cục Thống kê ngày nay Đến trước năm
2007, Tổng cục Thống kê là cơ quan ngang Bộ trực thuộc Chính phủ
Hiện nay, Tổng cục Thống kê là cơ quan trực thuộc Bộ Kế hoạch vàĐầu tư thực hiện chức năng tham mưu, giúp Bộ trưởng Bộ Kế hoạch và Đầu
tư quản lý nhà nước về thống kê; tổ chức các hoạt động thống kê và cung cấpthông tin thống kê kinh tế – xã hội cho các cơ quan, tổ chức, cá nhân trongnước và quốc tế theo quy định của pháp luật
Tổng cục Thống kê được tổ chức theo hệ thống ngành dọc từ Trungương đến địa phương theo đơn vị hành chính: Cơ quan Tổng cục Thống kê ởTrung ương với 16 đơn vị hành chính và 9 đơn vị sự nghiệp; các cơ quanthống kê ở địa phương với 63 Cục Thống kê tỉnh, thành phố và 713 Chi cụcThống kê huyện, quận; với tổng số trên 5,3 nghìn công chức, viên chức, trong
đó nữ chiếm tỷ lệ xấp xỉ 43%, 66% công chức, viên chức có trình độ đại học
và trên đại học
Trải qua 2/3 thế kỷ xây dựng và trưởng thành, ngành Thống kê ViệtNam đã và đang khẳng định được vai trò quan trọng trong việc cung cấpthông tin thống kê phục vụ lãnh đạo Đảng, Nhà nước và chính quyền các cấpnhằm đánh giá, dự báo tình hình, hoạch định chiến lược, chính sách, xây dựng
kế hoạch phát triển kinh tế – xã hội và đáp ứng nhu cầu thông tin thống kê củacác tổ chức, cá nhân Những thông tin thống kê do Tổng cục Thống kê công
bố, cung cấp là nguồn thông tin chính thống, có tính pháp lý, được các cấp,các ngành, các tổ chức, cá nhân trong nước và quốc tế tin cậy, sử dụng
2.1.1 Giới thiệu chung về cơ cấu tổ chức và chức năng nhiệm vụ của Tổng
Trang 40cục Thống kê
Theo Quyết định số 10/2020/QĐ-BKHĐT ngày 18/3/2020 quy địnhchức năng, nhiệm vụ, quyền hạn và cơ cấu tổ chức của Tổng cục Thống kêthuộc Bộ Kế hoạch và Đầu tư và Nghị định số 85/2017/NĐ-CP ngày 19 tháng
7 năm 2017 của Chính phủ quy định cơ cấu, nhiệm vụ, quyền hạn của hệthống tổ chức thống kê tập trung và thống kê bộ, cơ quan ngang bộ, Tổng cụcThống kê được tổ chức thành hệ thống ngành dọc từ trung ương đến địaphương, bảo đảm nguyên tắc tập trung thống nhất Bao gồm:
2.1.1.1 Cơ quan thống kê ở trung ương
Vụ Thống kê Tổng hợp và Phổ biến thông tin thống kê;
Vụ Hệ thống Tài khoản quốc gia;
Vụ Thống kê Nông, Lâm nghiệp và Thủy sản;
Vụ Thống kê Công nghiệp và Xây dựng;
Vụ Thống kê Thương mại và Dịch vụ;
Vụ Thống kê Giá;
Vụ Thống kê Dân số và Lao động;
Vụ Thống kê Xã hội và Môi trường;
Vụ Thống kê nước ngoài và Hợp tác quốc tế;
Vụ Tổ chức cán bộ;
Vụ Kế hoạch tài chính;
Vụ Pháp chế và Thanh tra thống kê;
Cục Thu thập dữ liệu và Ứng dụng công nghệ thông tin thống kê;
Viện Khoa học Thống kê;
Tạp chí Con số và Sự kiện;
Nhà Xuất bản Thống kê;
Trường Cao đẳng Thống kê (tại Bắc Ninh)
Trường Cao đẳng Thống kê II (tại Đồng Nai)
2.1.1.2 Cơ quan thống kê ở địa phương