Tăng cường và nâng cao chất lượng sử dụng dữ liệu hành chính trong công tác thống kê nhà nước tại Việt Nam là xu thế tất yếu trong bối cảnh cuộc cách mạng công nghiệp 4.0 cùng với nền kinh số, xã hội số đang phát triển mạnh mẽ ở nhiều quốc gia trên thế giới, nhất là các quốc gia có trình độ phát triển cao. Mục tiêu phấn đấu vào năm 2025 đạt 50%, vào năm 2030 đạt 70% số chỉ tiêu thống kê thuộc các hệ thống chỉ tiêu thống kê được biên soạn từ nguồn dữ liệu hành chính. Một trong giải pháp quan trọng sản xuất thông tin thống kê từ dữ liệu hành chính là tăng cường xây dựng cơ sở dữ liệu hành chính cấp quốc gia, cấp bộ, ngành, tỉnh, thành phố đi với việc kết nối và liên thông.
Trang 1NGHIÊN CỨU - TRAO ĐỔIVây
TS Nguyễn Ngọc Tú*, TS Nguyễn Trí Duy**, KS Nguyễn Công Hoan***
Thực hiện Nghị định số
108/2014/NÐ-CP ngày 20/11/2014 của Chính phủ về chính
sách tinh giản biên chế; Nghị quyết số
39-NQ/TW ngày 17/4/2015 của Bộ Chính trị về
tinh giản biên chế và cơ cấu lại đội ngũ cán
bộ, công chức, viên chức; Nghị quyết số
18-NQ/TW ngày 25/10/2017 Ban Chấp hành
Trung ương, Hội nghị lần thứ sáu, Ban chấp
hành Trung ương khóa XII, Một số vấn đề về
tiếp tục đổi mới, sắp xếp tổ chức bộ máy của
hệ thống chính trị tinh gọn, hoạt động hiệu
lực, hiệu quả; Kế hoạch số 07-KH/TW ngày
27/11/2017 của Bộ Chính trị thực hiện Nghị
quyết số 18-NQ/TW; Nghị quyết số
56/2017/QH14 ngày 24/11/2017 của Quốc
hội về việc tiếp tục cải cách tổ chức bộ máy
hành chính nhà nước tinh gọn, hoạt động
hiệu lực, hiệu quả Trong những năm gần
đây, ngành Thống kê đã thực hiện tinh giảm
các đầu mối Chi Cục Thống kê cấp huyện,
giảm đầu mối Phòng thống kê cấp Cục và
giảm một số đơn vị tại cơ quan Tổng cục
Thống kê, cùng với tinh giảm bộ máy, Ngành
cũng thực hiện việc tinh giảm biên chế theo
chủ trương của Đảng và nhà nước Tuy
* Viện trưởng Viện Khoa học Thống kê
** Phó viện trưởng Viện Khoa học Thống kê
*** Nghiên cứu viên, Viện khoa học Thống kê
nhiên, nhiệm vụ cung cấp thông tin thông kê ngày càng tăng, tăng về số lượng các chỉ tiêu kinh tế, xã hội, tăng các chỉ tiêu phản ánh hiện tượng mới phát sinh Đứng trước yêu cầu nhiệm vụ ngày càng nhiều, trong khi bộ máy cần phải tinh gọn, biên chế ngày càng giảm, ngành Thống kê luôn cố gắng cung cấp thông tin thống kê chính xác, kịp thời phục vụ sự quản lý điều hành của Đảng và Nhà nước Đặc biệt, trong bối cảnh dịch Covid-19 lan rộng trên toàn cầu; kinh tế - xã hội trong nước và trên thế giới liên tục thay đổi, diễn biến nhanh, phức tạp, khó lường, càng đòi hỏi các quyết sách đưa ra kịp thời hơn và phải dựa trên bằng chứng về thông tin thống kê chính xác Những thách thức mới đòi hỏi ngành Thống kê phải chủ động đổi mới để thích ứng, tăng cường ứng dụng công nghệ thông tin, các công nghệ thông minh nhằm rút ngắn quy trình điều tra, tổng hợp, phân tích số liệu; tăng cường kết nối, sử dụng dữ liệu hành chính, dữ liệu lớn nhằm cung cấp thông tin thống kê một cách nhanh nhất, chính xác với chi phí ít nhất
Nhận thức được tầm quan trọng của dữ liệu hành chính trong việc sản xuất thông tin thống kê nhà nước làm căn cứ để hoạch định các chủ trương, đường lối, chính sách và giám
Trang 2sát, đánh giá quá trình phát triển đất nước
Trong những năm qua, Tổng cục Thống kê
Việt Nam (TCTK) ngày càng quan tâm đến
việc khám phá các cách thức sử dụng dữ liệu
hành chính để sản xuất thông tin thống kê và
báo cáo về kinh tế - xã hội hàng năm.1
Hơn nữa, tăng cường và nâng cao chất
lượng sử dụng dữ liệu hành chính trong công
tác thống kê nhà nước tại Việt Nam là xu thế
tất yếu trong bối cảnh cuộc cách mạng công
nghiệp 4.0 cùng với nền kinh số, xã hội số
đang phát triển mạnh mẽ ở nhiều quốc gia
trên thế giới, nhất là các quốc gia có trình độ
phát triển cao Phát triển nền kinh tế số đang
dần trở thành vấn đề quan tâm hàng đầu của
nhiều quốc gia trên thế giới Trong đó, Việt
Nam là một trong những quốc gia tích cực
tham gia vào công tác chuyển đổi số, đồng
thời cũng là một trong những quốc gia đầu
tiên trên thế giới ban hành các chính sách
như: Nghị quyết, Chiến lược về chuyển đổi số
quốc gia Chuyển đổi số sẽ là điều kiện thuận
lợi cho Việt Nam chủ động khai thác triệt để
các thành tựu và cơ hội mà cuộc cách mạng
công nghệ 4.0 mang lại để bứt phá và vươn
lên, thay đổi thứ hạng, phấn đấu đến năm
2025 là nước đang phát triển, có công nghiệp
theo hướng hiện đại; đến năm 2030 là nước
đang phát triển có công nghiệp hiện đại, thu
nhập trung bình cao; đến năm 2045 là một
nước phát triển, có thu nhập bình quân đầu
người cao Hòa trong dòng chảy phát triển
1 TS Nguyễn Thị Hương, Tổng cục trưởng Tổng cục
Thống kê, phát biểu tại Hội nghị “Định hướng phát
triển Thống kê Kinh tế,
http://consosukien.vn/phoi-
hop-chia-se-du-lieu-hanh-chinh-trong-hoat-dong-thong-ke-nha-nuoc.htm
nền kinh tế số, xã hội số, mọi hoạt động kinh
tế, xã hội sẽ được lữu trữ hành chính dưới dạng số hóa Vì vậy, việc sử dụng thông tin đầu vào từ hồ sơ của các cơ quan hành chính
để sản xuất thông tin thống kê là tất yếu Bên cạnh đó việc sử dụng dữ liệu hành chính
sẽ tăng cường sự hợp tác, phối hợp, kết nối, chia sẻ thông tin; tạo lập sự thống nhất, đồng thuận giữa các cơ quan quản lý nhà nước; tăng cường công khai, minh bạch thông tin, tiết kiệm chi phí, cung cấp dịch vụ công tốt hơn cho người dân và doanh nghiệp
1 Khái niệm dữ liệu hành chính
Hiện nay, dữ liệu hành chính đã được khám phá giá trị tiềm năng và ứng dụng rất nhiều trong các lĩnh vực như y tế, giáo dục, giao thông vận tải, hàng không, v.v… Tuy nhiên, dữ liệu hành chính được thu thập, quản lý bởi các cơ quan nhà nước có thẩm quyền Theo luật thống kê 2015 “Dữ liệu hành chính là dữ liệu của cơ quan nhà nước được ghi chép, lưu giữ, cập nhật trong các
hồ sơ hành chính dạng giấy hoặc dạng điện tử” Do đó, để tiếp cận và sử dụng được đòi hỏi chúng ta cần có những chính sách và quy trình riêng biệt
Điều này cho thấy sự khác biệt rõ ràng nhất giữa dữ liệu hành chính và dữ liệu thống
kê truyền thống để tạo ra số liệu thống kê chính là từ mục đích của việc thu thập dữ liệu
Theo luật thống kê 2015 “Dữ liệu thống kê gồm dữ liệu định lượng và dữ liệu định tính để hình thành thông tin thống kê về hiện tượng nghiên cứu” Dữ liệu thống kê được thu thập cho mục đích chuẩn bị số liệu thống kê Và được chỉ định và thu thập với
Trang 3mục đích duy nhất là mô tả tình trạng hoặc
sự phát triển của một hiện tượng cụ thể khi
không có sẵn dữ liệu đầy đủ khác và ít khi
được phép sử dụng cho các mục đích khác
Ngược lại, theo Giáo sư Svein Nordbotten,
Đại học Bergen, Na Uy2 “Dữ liệu hành chính
được thu thập chủ yếu cho mục đích không
phải thống kê” Dữ liệu hành chính được thu
thập bằng các quy trình thống kê khoa học
để cung cấp số liệu thống kê tổng quát phù
hợp cho việc đánh giá và ra quyết định
Dữ liệu hành chính đối với thống kê, có
thể thấy là quan trọng, hiện nay, một số chỉ
tiêu thống kê thuộc hệ thống chỉ tiêu thống
kê quốc gia đã biên soạn từ số liệu thống kê
nhà nước được chuẩn bị trực tiếp hoặc gián
tiếp từ dữ liệu hành chính Bên cạnh đó, việc
sử dụng hiệu quả các dữ liệu hành chính đối
với thống kê đòi hỏi phải phát triển các công
nghệ và phương pháp mới để chuyển và
chỉnh sửa dữ liệu, cũng như để ước tính và
đánh giá chất lượng của các số liệu thống kê
từ nguồn dữ liệu hành chính
2 Kinh nghiệm sản xuất số liệu
thống kê nhà nước từ nguồn dữ liệu
hành chính ở một số nước phát triển
Cơ quan Thống kê ở các nước phát
triển đã sớm nhận thấy việc sản xuất thông
tin thống kê nhà nước từ nguồn điều tra
thống kê sang khai thác từ nguồn dữ liệu
hành chính là xu thế và phù hợp với sự tiến
bộ của xã hội, sự phát triển kinh tế, đặc biệt
phù hợp trong bối cảnh cách mạng công
gia trên thế giới Việc sản xuất số liệu thống
kê thông qua dữ liệu hành chính đã giúp nhà nước tiết kiệm kinh phí và nguồn nhân lực, điều quan trọng hơn là cung cấp thông tin nhanh hơn, thậm chí bất kỳ vào thời gian nào Để thấy rõ hơn kết quả của việc sử dụng dữ liệu hành chính trong sản xuất thông tin thống kê, nhóm tác giả đã nghiên cứu kinh nghiệm sử dụng dữ liệu hành chính của cơ quan Thống kê Thụy Điển, Đan Mạch3,v.v sẽ cho chúng ta thấy tiềm năng giá trị lớn của dữ liệu hành chính trong thống
kê
Ngày nay 80% số liệu thống kê giáo dục của Đan Mạch được tổng hợp từ nguồn
dữ liệu hành chính Tuy nhiên, điều đó chưa phải là đặc biệt tại Đan Mạch Thành tựu lớn nhất trong việc sử dụng dữ liệu hành chính của Đan Mạch cho đến nay, được đánh giá là cuộc Tổng điều tra dân số năm 1980 hoàn toàn dựa trên dữ liệu hành chính (Báo cáo Thống kê Đan Mạch 1995) Đặc biệt là bởi trong thời điểm điều tra, làm sao để liên kết được phần thông tin nhà ở của cuộc điều tra dân số với dữ liệu dân số đã gây ra những vấn đề khó khăn cho cơ quan Thống kê Đan Mạch, nhưng những vấn đề này đã được giải quyết, bằng việc liên kết dữ liệu hành chính
về tòa nhà / nhà / địa chỉ với dữ liệu dân số Ngoài ra, một số thống kê điển hình được sử dụng từ dữ liệu hành chính của Đan Mạch là: (1) Thống kê dân số (Hồ sơ đăng ký nhân khẩu học và vị trí); (2) Thống kê thương mại
Trang 4(Hồ sơ dữ liệu hải quan); (3) Thống kê xã hội
(Hồ sơ đăng ký dịch vụ công); (4) Thống kê
việc làm (Hồ sơ đăng ký thất nghiệp); (5)
Thống kê giáo dục (Hồ sơ đăng ký của sinh
viên); (6) Thống kê sức khỏe (Hồ sơ đăng ký
y tế); (7) Thống kê tội phạm (Hồ sơ đăng ký
tư pháp); (8) Thống kê thu nhập (Hồ sơ dữ
liệu thuế); (9) Thống kê doanh nghiệp (Hồ sơ
sổ đăng ký doanh nghiệp)
Đối với, thống kê doanh nghiệp nói
riêng và thống kê kinh tế nói chung, sử dụng
trực tiếp từ dữ liệu thuế và dữ liệu đăng ký
đang được mở rộng và chúng ta có thể thấy
khả năng sử dụng liên kết giữa các đối tượng
doanh nghiệp khác nhau như một bước đầu
tiên trong tương lai để thống kê bao quát
được nền kinh tế quốc gia Việc liên kết các
đối tượng doanh nghiệp với các đối tượng
liên quan là con người, sử dụng các thông tin
về địa lý tương ứng của chúng, mang lại một
khía cạnh mới khác cho thống kê và phân
tích kinh tế
Thành công lớn nhất trong sử dụng dữ
liệu hành chính ở Thụy Điển là dự án Hệ
thống lưu trữ thông tin thống kê sử dụng dữ
liệu hành chính (archive-statistical system
viết tắt ARKSY6,1970) của Cơ quan Thống kê
Thụy Điển Kết quả của dự án đã hình thành
một hệ thống lưu trữ thông tin thống kê sử
dụng dữ liệu hành chính liên kết thông tin
giữa sổ đăng ký và kho lưu trữ Trong đó, sổ
đăng ký là một danh sách các ID bên ngoài
xử lý thông tin và tính bảo mật, các ID bên ngoài có thể được chuyển đổi thành các số
ID thông tin nội bộ trong các kho lưu trữ thống kê Như vậy thuật ngữ hệ thống thông tin thống kê dựa trên sổ đăng ký đã thay thế thuật ngữ hệ thống lưu trữ thông tin thống
kê Điều này nhằm ẩn đi sự khác biệt giữa hệ thống lưu trữ thông tin thống kê công khai và các hệ thống lưu trữ thông tin thống kê nội
7 Tài liệu Israel sử dụng dữ liệu trong Tổng điều tra dân số và được trình bày tại hội nghị Viện Thống kê thế giới 2021: https://unece.org/fileadmin/DAM/ stats/documents/ece/ces/ge.41/2017/Meeting- Geneva-Oct/WP27_ENG.pdf
Trang 5đó chứa thông tin địa chỉ cư trú và quan hệ
gia đình, tình trạng hôn nhân
Trong các cuộc điều tra dân số truyền
thống trước đây ở Israel, PR được sử dụng
để đảm bảo dân số được lựa chọn đồng đều
các khu vực trên toàn quốc Như Điều tra
dân số năm 2008 là một cuộc Tổng điều tra
dân số, trong đó có lấy mẫu khảo sát dân cư
theo khu vực Việc ước tính quy mô dân số,
kết hợp danh sách của những cư dân được
lấy mẫu khảo sát sống trong khu vực với một
cuộc phỏng vấn qua điện thoại (kết quả là
Báo cáo cư dân thường trú [UR]) của danh
sách cư dân đã đăng ký tại PR trong cùng
khu vực Từ các mẫu đó được sử dụng xây
dựng lên kế hoạch cho cuộc điều tra dân số
năm 2022, điều này sẽ kiểm tra sự khác biệt
thông tin công dân khai báo có thông tin giữa
địa chỉ PR và UR Những người được lấy mẫu
khảo sát được lựa chọn theo khu vực sẽ điền
vào bảng câu hỏi và sẽ phỏng vấn theo ba
phương thức: Internet, điện thoại hoặc gặp
mặt trực tiếp
Các cuộc Điều tra dân số năm 2022 sử
dụng sổ đăng ký (PR) để kiểm tra đánh giá
khả năng xem việc chuyển đổi sang sử dụng
dữ liệu hành chính (AC) trong tương lai Tuy
nhiên, lý do chính cản trở quá trình chuyển
đổi sang sử dụng AC là độ chính xác của ước
tính dân số thu được từ PR trong việc xác
định UR ở cấp quốc gia và địa phương chưa
cao Gần đây kinh nghiệm điều tra dân số ở
Israel cho thấy khoảng 20% cư dân đăng ký
PR tại một địa chỉ nhưng sống ở địa chỉ khác
(trong đó 13% đăng ký ở cùng địa phương
nhưng sinh sống ở khu vực khác và 7% ở địa
phương khác) Để xử lý các vấn đề đó ở
Israel thiết lập kho dữ liệu di cư cấp quốc gia ước tính và sử dụng các nguồn dữ liệu thông tin bổ sung như địa chỉ (sử dụng điện, mã số thuế, thông tin khai báo sinh viên và không phải sinh viên để "sửa chữa" các lỗi tồn tại trong PR
Việc lựa chọn các thông tin bổ sung đó
đã được thực hiện bằng cách sử dụng các công cụ học máy được áp dụng vào “tập huấn cho dữ liệu” dựa trên kinh nghiệm của điều tra dân số năm 2017 Kết quả của các
mô hình là kiểm tra trên "dữ liệu thử nghiệm" cho kết quả tốt Những phát hiện sơ bộ cho thấy dữ liệu hành chính đã được cải thiện đáng kể, thúc đẩy để có tiến hành với dữ liệu hành chính trong tương lai
2.4 Cơ quan Thống kê quốc gia
Ở Vương quốc Anh, sử dụng dữ liệu hành chính để ước tính số lượng dân số Từ một số nguồn dữ liệu hành chính và sử dụng hồi quy và các kỹ thuật học máy để ước tính dân số Tuy nhiên, vấn đề là một số nguồn
dữ liệu hành chính được sử dụng có sự trùng lặp thông tin như (đăng ký bệnh nhân (PR), nhân khẩu học cá nhân dịch vụ (PDS), cơ quan thống kê giáo dục đại học (HESA), và Điều tra dân số trường học tiếng Anh và tiếng Wales (ESC / WSC)) Để xử lý vấn đề này ở Anh dùng Hypercube (phương pháp
8 Sử dụng dữ liệu hành chính để đếm số dân, tại Anh, và được trình bày tại hội nghị Viện Thống kê thế giới 2021 :https://www.nrscotland.gov.uk/ statistics-and-data/statistics/statistics-by
based-population-estimates-scotland-2016-
theme/population/developments/administrative-data-statistical research
Trang 6khối đa chiều để xử lý thông tin liên kết) và
kết hợp với Điều tra dân số năm 2011 để tạo
ra 'sự thật' trạng thái thông tin (bao gồm dân
số thực và địa chỉ thực) cho mỗi công dân
trong mỗi nguồn dữ liệu hành chính để xử lý
trùng lặp thông tin đăng ký Phương pháp
tiếp cận dựa trên dữ liệu hành chính giúp cho
các tập dữ liệu được liên kết và hiển thị rõ
thông tin thuộc tính như tuổi, giới tính và vị
trí cư trú, từ đó các kết quả đầu ra đa biến
của từng công dân sau đó có thể được trích
xuất thông tin Các kết quả ban đầu cho thấy
mức độ khả quan trong tương lai, với mỗi mô
hình ước tính dân số đều có chất lượng chính
xác và phù hợp với tổng số mẫu đã biết được
lấy từ Điều tra dân số năm 2011, và mô hình
lựa chọn hoạt động tốt nhất
Tổng điều tra dân số và nhà ở Ý từ
năm 2018 có sử dụng tích hợp dữ liệu hành
chính và dữ liệu từ các cuộc khảo sát mẫu để
ước tính lượng dân số thường trú tại một
ngày tham chiếu, làm sạch các lỗi ở Sổ đăng
ký
Điều tra dân số dựa trên Sổ đăng ký
Dân số (PBR), có nguồn dữ liệu hành chính
chính là Sổ đăng ký dân số địa phương
Những nguồn dữ liệu hành chính được sử
dụng để liên kết thành một sổ đăng ký gồm
(sổ đăng ký Lao động và Giáo dục, Sổ đăng
ký Khai thuế, Thu nhập, Đã nghỉ hưu) có thể
giúp xác định các nhóm tương ứng với định
9 Sử dụng dữ liệu hành chính để ước tính dân số
thường trú tại Ý, và được trình bày tại hội nghị
thống kê thế giới 2021 :https://unece.org/sites/
default/files/2021-05/14%20Zindato%20Italy%20
ENG.pdf
nghĩa về “dân số thường trú” Khi liên kết thông tin đã phát hiện ra những công dân còn thường trú thực tế và những công dân không còn sinh sống tại khu vực Đây là sự tham chiếu rất hữu ích để phát hiện phạm vi bao phủ của PBR Do đó, việc cải thiện ước tính số lượng dân số cuối cùng cũng như khi khảo sát không đạt được các yêu cầu về chất lượng thì đây cũng là kết quả hữu ích cho việc ước tính số lượng dân số, cải thiện chất lượng của sổ đăng ký dân số và một số điều tra mẫu có thể thiếu
Qua năm ví dụ về kinh nghiệm của cơ quan Thống kê Đan Mạch, Thụy Điển, Israel, Vương Quốc Anh và Ý có thể nhận thấy để xây dựng được cơ sở dữ liệu hành chính hiệu quả cần phải có chính sách rõ ràng, và cơ sở
hạ tầng công nghệ thông tin đảm bảo cho việc thực hiện khai thác và xử lý dữ liệu hành chính được thông suốt
3 Thực trạng công tác sản xuất thông tin thống kê hiện nay
Công tác sản xuất thông tin thông kê của TCTK thông qua 03 hình thức thu thập thông tin được quy định trong Luật Thống kê
2015 gồm (1) Điều tra thống kê; (2) Hệ thống chế độ báo cáo thống kê; (3) Dữ liệu hành chính Tuy nhiên, trên thực tế hoạt động thu thập thông tin của TCTK hiện nay tiến hành chủ yếu thông qua hình thức điều tra thống kê, chế độ báo cáo thống kê Theo Báo cáo tổng kết thực hiện Chiến lược phát triển thống kê Việt Nam giai đoạn 2011-
2020, tầm nhìn đến năm 2030, Hệ thống chỉ tiêu thống kê quốc gia được quy định trong Luật Thống kê năm 2015 gồm 186 chỉ tiểu, trong đó: 106 chỉ tiêu đã thu thập, tổng hợp
Trang 7và công bố đầy đủ các phân tổ (56,99%), 70
chỉ tiêu đã thu thập, tổng hợp và công bố
một số phân tổ (37,63%), 10 chỉ tiêu chưa
thu thập, tổng hợp được (5,38%) Trong 176
chỉ tiêu đã thu thập, tính toán, 66 chỉ tiêu từ
điều tra thống kê, chiếm 37,5%; 73 chỉ tiêu
từ hệ thống chế độ báo cáo thống kê, chiếm
41,47%; chỉ có 01 chỉ tiêu từ dữ liệu hành
chính, chiếm 0,57%, đó là chỉ tiêu “Số trường
hợp tử vong được đăng ký khai tử” Kết quả
khai thác từ nguồn dữ liệu hành chính đến
nay quá khiêm tốn
Nhìn chung, trong những năm gần đây
ngành Thống kê luôn đổi mới hình thức thu
thập thống tin thống kê qua qua điều tra
thống kê và hệ thống chế độ báo cáo thống
kê nhằm đáp ứng tốt nhất yêu cầu cung cấp
thông tin thống kê phục vụ sự chỉ đạo điều
hành của Nhà nước Trong điều tra, tổng
điều tra thống kê, Ngành đã tích cực chuyển
từ điều tra phiếu giấy sang phiếu điện tử
được sử dụng trên thiết bị điện tử như: máy
tính bảng, điện thoại thông minh (CAPI),
phiếu trực tuyến sử dụng internet (webform)
và phiếu giấy in sẵn Đây là một trong
những đột phá của ngành Thống kê nhằm
rút ngắn thời gian và tiết kiệm kinh phí Tuy
nhiên, sản xuất thông tin thống kê theo cách
truyền thống dần không còn phù hợp vì gánh
nặng chi phí thực hiện quá lớn; chưa tận
dụng được tối đa các nguồn dữ liệu sẵn có
như dữ liệu hành chính, dữ liệu lớn; chưa tận
dụng được tối đa các lợi thế của công nghệ
thông tin Cần phải cải tiến phương pháp thu
thập thông tin để tiến tới giảm và không thực
hiện các cuộc điều tra, khảo sát lớn Bên
cạnh đó, thách thức đối với ngành Thống kê
nói riêng và bộ máy hành chính nhà nước nói
chung, phải đổi mới theo chủ chương của Đảng và Nhà nước là xây dựng bộ máy tổ chức tinh gọn, hoạt động hiệu lực, hiệu quả, cùng với việc tinh giảm biên chế Đứng trước yêu cầu cung cấp các chỉ tiêu thống kê ngày càng nhiều, và nhanh hơn, kịp thời hơn, chính xác hơn trong điệu kiện nhân lực của Ngành ngày càng giảm Do đó, đòi hỏi TCTK cần phải tích cực đổi mới hơn nữa trong hoạt động thu thập thông tin thống kê từ nhiều nguồn dữ liệu mới như dữ liệu hành chính,
dữ liệu lớn
Nhận thức được xu thế và tầm quan trọng của dữ liệu hành chính, TCTK đã chủ động thực hiện kế hoạch phát triển theo hướng khai thác sử dụng nguồn dữ liệu hành chính để phục vụ công tác thống kê nhà nước, cụ thể trong Luật Thống kê Việt Nam
2015 quy định sẽ phải xây dựng 07 cơ sở dữ liệu hành chính sử dụng cho hoạt động thống
kê nhà nước trong tương lai 10 gồm: (1) Cơ
sở dữ liệu về con người; (2) Cơ sở dữ liệu về đất đai; (3) Cơ sở dữ liệu về cơ sở kinh tế; (4) Cơ sở dữ liệu về thuế; (5) Cơ sở dữ liệu
về hải quan; (6) Cơ sở dữ liệu về bảo hiểm; (7) Cơ sở dữ liệu hành chính khác Tuy nhiên, hiện nay có những cơ sở dữ liệu hành chính phần lớn chưa được xây dựng và khai thác hiệu quả Cụ thể11:
(1) Cơ sở dữ liệu về con người: Do
Bộ Công an xây dựng và triển khai thực hiện bước đầu đưa vào khai thác từ ngày 1 tháng
7 năm 2021 “Cơ sở dữ liệu quốc gia về dân
10 Luật thống kê 2015, Điều 36 Sử dụng dữ liệu hành chính cho hoạt động thống kê nhà nước
11 https://data.gov.vn/web/guest/news/-/asset _publisher/FRkblAs8yr3H/content/hien-trang-csdl-
qg
Trang 8cư”12 bao gồm thông tin về công dân tại Việt
Nam như các thông tin định danh (tên tuổi,
giới tính, năm sinh, địa điểm thường trú, quê
quán) Đặc biệt, khi cơ sở dữ liệu công dân
được liên kết thẻ căn cước công dân lưu trữ
thông tin về công dân đó với thông tin các
thành viên trong gia đình và thông tin về vị
trí ở hiện tại giúp cho Bộ Công an có thể
quản lý công dân trên toàn quốc Đối với
TCTK, cơ sở dữ liệu công dân giúp TCTK có
thể giảm bớt gánh nặng trong điều tra dân
số, điều tra di cư nội địa giữa các huyện, các
tỉnh, thành phố trong cả nước Có thể nói, Hệ
thống Cơ sở dữ liệu quốc gia về dân cư là
nền tảng quan trọng, là điều kiện tối cần
thiết để hình thành định danh số cho mỗi
công dân Việt Nam trên môi trường số, giúp
kích thích, vận dụng được năng lực số không
bị giới hạn về thời gian và địa giới hành chính
trong các giao dịch giữa chính quyền và
người dân, doanh nghiệp và giữa người dân,
doanh nghiệp với nhau Đó chính là động lực
để phát triển nền kinh tế số, xã hội số
(2) Cơ sở dữ liệu Đất đai quốc gia:
Do Bộ Tài nguyên và Môi trường xây dựng và
đang triển khai thực hiện trên cả nước kết
quả đến hiện tại đã có 161/713 đơn vị hành
chính cấp huyện trên phạm vi 45 tỉnh/thành
phố đang vận hành, khai thác, sử dụng cơ sở
dữ liệu (CSDL) đất đai, trong đó có 15
(3) Cơ sở dữ liệu về cơ sở kinh tế (Đăng ký doanh nghiệp): Do Bộ Kế hoạch
và Đầu tư xây dựng và triển khai thực hiện
đã đưa vào sử dụng từ năm 2010 Đến nay,
Cơ sở dữ liệu quốc gia về Đăng ký doanh nghiệp hiện đang lưu trữ thông tin về đăng
ký kinh doanh của hơn một triệu doanh nghiệp và đơn vị phụ thuộc trên toàn quốc và được kết nối chia sẻ dữ liệu theo thời gian thực với Hệ thống thông tin của Tổng cục Thuế để cấp mã số doanh nghiệp Bên cạnh
đó, để người dân và doanh nghiệp tiếp cận một cách thuận tiện trong quá trình thành lập doanh nghiệp và gia nhập thị trường
(4) Cơ sở dữ liệu quốc gia về tài chính (Thuế và hải quan): Do Bộ Tài chính
xây dựng và triển khai thực hiện Hiện nay
Cơ sở dữ liệu quốc gia về Tài chính, gồm CSDL tổng hợp các CSDL quản lý chuyên ngành: Thuế; Kho bạc; Hải quan; Chứng khoán; Dự trữ nhà nước; Giá; Bảo hiểm; Nợ công; Tài sản công; Quản lý, giám sát vốn nhà nước tại doanh nghiệp; Thu, chi ngân sách nhà nước; Danh mục điện tử dùng chung ngành Tài chính Đến thời điểm hiện tại, các CSDL quản lý chuyên ngành đều đã được triển khai, Một số CSDL đã hoàn thành trong đó có cơ sở dữ liệu về thuế và hải quan Đối với TCTK, hiện đang triển khai kết nối dữ liệu Thuế của Tổng cục Thuế, Bộ Tài
Trang 9chính Trong đó, Thông tin do cơ quan Thuế
cung cấp bao gồm: Thông tin định danh của
toàn bộ người nộp thuế do cơ quan Thuế
quản lý; thông tin về tình hình hoạt động sản
xuất kinh doanh của người nộp thuế thông
qua các chỉ tiêu trên Tờ khai thuế Giá trị gia
tăng; thông tin về kết quả hoạt động sản
xuất kinh doanh của người nộp thuế thông
qua các chỉ tiêu Tờ khai thuế Thu nhập
doanh nghiệp và Báo cáo tài chính doanh
nghiệp Thông tin do cơ quan Thống kê cung
cấp bao gồm: Báo cáo kết quả các cuộc điều
tra thống kê liên quan đến người nộp thuế và
cơ sở kinh doanh; các báo cáo phân tích
chuyên đề liên quan đến người nộp thuế và
cơ sở kinh doanh; các Danh mục chuẩn cấp
quốc gia (như Danh mục hành chính, Danh
mục ngành kinh tế quốc dân, Danh mục sản
phẩm, Danh mục nghề nghiệp, ); các thông
tin thống kê kinh tế vĩ mô; thông tin thống kê
khác liên quan đến người nộp thuế và cơ sở
kinh doanh Điều đó giúp cho TCTK giảm bớt
gánh nặng trong các cuộc điều tra Doanh
nghiệp
(5) Cơ sở dữ liệu quốc gia về Bảo
hiểm: Do Bảo hiểm xã hội Việt Nam đang
xây dựng triển khai thực hiện Hiện nay, Bảo
hiểm xã hội Việt Nam đã xây dựng các CSDL
nghiệp vụ chuyên ngành làm gốc để hình
thành nên Cơ sở dữ liệu quốc gia về Bảo
hiểm như CSDL hộ gia đình tham gia bảo
hiểm y tế; CSDL quản lý thu, sổ, thẻ; CSDL
quản lý và giải quyết hưởng chế độ chính
sách bảo hiểm xã hội, bảo hiểm y tế Bảo
hiểm xã hội Việt Nam đã thu thập được
thông tin cá nhân của 93 triệu người Tuy
nhiên, các dữ liệu này mới đang nằm trong
các CSDL chuyên ngành của bảo hiểm xã hội Trong thời gian tới, Bảo hiểm xã hội Việt Nam sẽ thực hiện việc chuẩn hóa dữ liệu, tích hợp vào Cơ sở dữ liệu quốc gia Hệ thống này sẽ tập trung dữ liệu từ các hệ thống CSDL nghiệp vụ của Bảo hiểm xã hội Việt Nam góp phần tạo điều kiện thuận lợi để xây dựng Cơ sở dữ liệu quốc gia về Bảo hiểm
cơ sở dữ liệu quốc gia đòi hỏi các cơ sở phải được xây dựng, hoàn thiện dựa trên yêu cầu thông tin đầu ra và phải được cập nhật theo thời gian thực Đối với TCTK, hiện vẫn chưa tiếp cận được hết các cơ sở dữ liệu hành chính từ các Bộ ngành, vì nhiều nguyên nhân liên quan đến cơ chế chia sẻ và kỹ thuật kết nối chia sẻ dữ liệu dùng chung Nhưng nhìn chung, qua đó chúng ta có thể thấy tiềm năng lớn của dữ liệu hành chính khai thác để sử dụng tính toán chỉ tiêu thống kê
Hơn nữa, việc tăng cường và nâng cao chất lượng sử dụng dữ liệu hành chính trong Thống kê nhà nước tại Việt Nam cũng phù hợp định hướng phát triển trong Chiến lược phát triển kinh tế 2021-2030 mà Đại hội
Trang 10Đảng XIII đã đưa ra đó là 13 “…kết nối liên
thông các cơ sở dữ liệu lớn, nhất là dữ liệu
về dân cư, y tế, giáo dục, bảo hiểm, doanh
nghiệp, đất đai, nhà ở, phục vụ kịp thời, hiệu
quả cho phát triển kinh tế - xã hội và đời
sống nhân dân Thực hiện chuyển đổi số
quốc gia một cách toàn diện để phát triển
kinh tế số, xây dựng xã hội số Phấn đấu đến
năm 2030, hoàn thành xây dựng chính phủ
số…”
Từ những nhận thức trên thấy rõ tầm
quan trọng của dữ liệu hành chính đối với
công tác thống kê và cần thiết phải xây
dựng phát triển hoàn thiện cơ sở dữ liệu
hành chính đáp ứng thông tin được cung
cấp nhanh hơn, kịp thời hơn trong thời gian
thực, giảm nguồn kinh phí liên quan đến
điều tra và nguồn nhân lực Tuy nhiên, khi
xây dựng cơ sở dữ liệu hành chính cần phải
hiểu dữ liệu hành chính là gì và có điểm gì
khác dữ liệu thống kê truyền thống, ứng
dụng của dữ liệu hành chính trong thống
kê; các chỉ tiêu thống kê quốc gia có thể
được khai thác từ dữ liệu hành chính? Bên
cạnh đó, chúng ta xem xét các thách thức
khi sử dụng dữ liệu hành chính, chỉ ra
những hạn chế, từ đó, đề xuất các giải
pháp để tăng cường và nâng cao chất
lượng khai thác sử dụng dữ liệu hành chính
trong thống kê
4 Đánh giá tiềm năng các chỉ
tiêu thống kê thống kê quốc gia có thể
khai thác được từ dữ liệu hành chính
13 Nội dung Chiến lược phát triển kinh tế - xã hội 10
năm 2021-2030 mà Đại hội Đảng XIII đã đặt ra mục
cụ thể về dữ liệu hành chính đó là phải tập trung khai thác, sử dụng dữ liệu hành chính; phấn đấu vào năm 2025 đạt 50%, vào năm 2030 đạt 70% số chỉ tiêu thống kê thuộc các hệ thống chỉ tiêu thống kê được biên soạn từ nguồn dữ liệu hành chính Thay thế 85% phiếu điều tra giấy bằng phiếu điều tra điện tử trong điều tra và tổng điều tra thống kê vào năm 2025; trên 95% vào năm 2030 Như vậy, với mục tiêu
đề ra rất rõ ràng, trước mắt đến năm 2025
số chỉ tiêu thống kê sử dụng dữ liệu hành chính đạt 50%, có nghĩa với hệ thống chỉ tiêu thống kê quốc gia hiện nay là 186 chỉ tiêu nếu không có sự thay đổi về số lượng chỉ tiêu thống kê thì đến năm 2025 chúng
ta sẽ phải tính toán được 93 chỉ tiêu thống
kê quốc gia từ dữ liệu hành chính Nhằm minh chứng cho mục tiêu này, nhóm nghiên cứu tiến hành rà soát từ 186 chỉ tiêu thuộc hệ thống chỉ tiêu thống kê quốc gia và đề xuất những chỉ tiêu có thế sản xuất từ dữ liệu hành chính Cụ thể trong Bảng 1 dưới đây:
14 http://vienthongke.vn/wpcontent/uploads/2021/ 02/2.-Du-thao-Quyet-dinh-cua-TTCP.pdf