Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM
-
NGUYỄN THỊ PHƯƠNG THY
XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM
-
NGUYỄN THỊ PHƯƠNG THY
XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ
Trang 3CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM
Cán bộ hướng dẫn khoa học : TS Đặng Trường Sơn
Luận văn Thạc sĩ được bảo vệ tại Trường Đại học Công nghệ TP HCM ngày
19 tháng 11 năm 2017
Thành phần Hội đồng đánh giá Luận văn Thạc sĩ gồm:
Xác nhận của Chủ tịch Hội đồng đánh giá Luận văn sau khi Luận văn đã sửa chữa (nếu có)
Chủ tịch Hội đồng đánh giá LV
Đỗ Phúc
Trang 4NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ tên học viên: NGUYỄN THỊ PHƯƠNG THY Giới tính: NỮ
Ngày, tháng, năm sinh: 28/11/1983 Nơi sinh: Kiên Giang
Chuyên ngành: Công nghệ thông tin MSHV: 1541860049
I- Tên đề tài:
XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ CỦA VĂN BẢN
HÀNH CHÍNH
II- Nhiệm vụ và nội dung:
- Tìm hiểu về văn bản hành chính và đề dẫn cứ trong văn bản hành chính
- Tìm hiểu về kỹ thuật tách từ trong văn bản tiếng Việt
- Xây dựng bộ kiểm tra căn cứ hợp lệ hay không hợp lệ
III- Ngày giao nhiệm vụ: 15/03/2017
IV- Ngày hoàn thành nhiệm vụ: 31/08/2017
V- Cán bộ hướng dẫn: TS ĐẶNG TRƯỜNG SƠN
CÁN BỘ HƯỚNG DẪN
TS Đặng Trường Sơn
KHOA QUẢN LÝ CHUYÊN NGÀNH
Trang 5LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này cũng như các trích dẫn hay tài liệu học thuật tham khảo đã được cảm ơn đến tác giả
và các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc
Học viên thực hiện Luận văn
Nguyễn Thị Phương Thy
Trang 6LỜI CÁM ƠN
Trước hết, cho tôi được gửi lời cảm ơn đến sự hướng dẫn và giúp đỡ tận tình của TS Đặng Trường Sơn
Xin cảm ơn các Thầy/Cô, Khoa CNTT Đại Học Công Nghệ TP HCM
đã giúp đỡ và cung cấp cho tôi những kiến thức quý giá trong suốt thời gian học tập và nghiên cứu thực hiện luận văn
Tôi cũng xin gởi lời cảm ơn đến gia đình, bạn bè và những đồng nghiệp
đã luôn quan tâm và giúp đỡ tôi trong suốt thời gian học tập và nghiên cứu hoàn thành luận văn này
Luận văn không thể tránh khỏi những sai sót, rất mong nhận được ý kiến đóng góp của mọi người cho luận văn được hoàn thiện hơn
Tôi xin chân thành cảm ơn
Nguyễn Thị Phương Thy
Trang 7TÓM TẮT
Văn bản quản lý hành chính nhà nước (QLHCNN) được các cơ quan quản lý nhà nước soạn thảo và ban hành theo đúng trình tự, thủ tục, hình thức nhất định; trong quá trình biên soạn văn bản các cơ quan nhà nước phải dựa vào căn cứ pháp
lý để làm cơ sở ban hành sau cho văn bản đó hợp hiến, hợp pháp và tăng giá trị của văn bản biên soạn
Việc đề dẫn các căn cứ pháp lý vào văn bản soạn thảo sau cho đúng chính xác không sai lệch về số ký hiệu, ngày ban hành, cơ quan ban hành, hoặc nội dung trích yếu của các văn bản đã được ban hành trước đó là điều cần thiết giúp cho văn bản mới nâng cao tính logic và giá trị pháp lý khi được ban hành
Luận văn này tập trung vào nghiên cứu giải pháp kiểm tra các căn cứ được đề dẫn vào các văn bản soạn thảo trên phần mềm Microsoft Word có hợp lệ hay không
Sử dụng giải pháp tách từ trong văn bản soạn thảo để ra được các căn cứ đề dẫn, trong mỗi căn cứ tách ra các thông tin gồm: số ký hiệu văn bản, ngày ban hành, cơ quan ban hành, và trích yếu của văn bản, sau đó so sánh với bộ dữ liệu (các công văn đến và đi đã được ban hành) được lưu trữ trong tập tin XML, nếu các thông tin của căn cứ đề dẫn trùng khớp với dữ liệu thì căn cứ đó hợp lệ, ngược lại là không hợp lệ
Hình thức của sản phẩm là phần mềm Kiểm tra căn cứ văn bản hành chính Được viết bằng ngôn ngữ C# trên nền NET Framework của Microsoft Cơ sở dữ liệu của phần mềm là bộ văn bản đã được ban hành lưu trong tập tin XML Bộ văn bản này lấy từ 2 nguồn: nguồn thứ nhất là tập hợp 59.156 văn bản pháp luật của trung ương và các bộ ngành ban hành lấy từ nguồn cơ sở dữ liệu quốc gia [15], đây
là nhóm dữ liệu chính dùng để kiểm tra căn cứ cho tất cả các loại văn bản hành chính Nguồn dữ liệu thứ 2 là 3100 văn bản hành chính do trường Cao đẳng Kinh tế
Kỹ thuật Kiên Giang ban hành, đây là nhóm dữ liệu dùng để kiểm tra căn cứ của các văn bản trường Cao đẳng Kinh tế Kỹ thuật biên soạn Dữ liệu kiểm tra phần mềm là các văn bản do trường KTKT Kiên Giang, UBND tỉnh Kiên Giang, Bộ Lao Động TBXH ban hành
Trang 8ABSTRACT
State administrative management documents are drafted and issued by state agencies in a certain sequences, procedures and forms; during the process of compiling documents, state agencies must base on the legal basis to make the document promulgated so that these documents are constitutional, legal, and more valuable
The insertion legal basis into the draft documents accurately the number of symbols, the date of issue, the promulgating agency, or the abstract of the previous promulgated documents is essential in order that the new texts improve logical and legal validity when they are issued
This thesis focuses on researching solutions to check the insertion legal basis into the drafted documents on Microsoft Word software if they are valid or invalid Using the word separation solution in the document to identify the legal basis, on each base separating the information includes: the number of the document symbol, the date of issue, the promulgating agency, and the abstract of the document, then compared to the data set (the incoming and outgoing dispatches) are stored in the XML file, if the information of the legal basis matches the data, it is valid and vice versa
The form of the product is the test administrative documents software It is written in C # on Microsoft's NET Framework The database of the software is the document set that have been issued and saved in the XML file This document set is from two sources: the first source is a collection of 59,156 legal documents issued
by the central government and ministries issued from the national database [15] These are the main database used to check the basis for all types of administrative documents The second source of data is 3100 administrative documents issued by Kien Giang Technical and Economic College, which is a data group used to check the basis of Kien Giang Technical and Economic College issued
Data for testing software are documents issued by Kien Giang Technical and Economic College and Ministry of Labor, Invalids and Social Affairs and General Department of Vocational Training
Trang 9MỤC LỤC
LỜI CAM ĐOAN i
LỜI CÁM ƠN ii
ABSTRACT iv
MỤC LỤC v
DANH MỤC CÁC TỪ VIẾT TẮT vii
DANH MỤC CÁC BẢNG viii
DANH MỤC CÁC HÌNH ix
PHẦN MỞ ĐẦU 1
1 Lý do chọn đề tài 1
2 Mục tiêu của đề tài: 1
3 Nội dung nghiên cứu: 2
4 Phương pháp nghiên cứu 2
Chương 1: TỔNG QUAN VỀ CĂN CỨ TRONG VĂN BẢN HÀNH CHÍNH 3
1.1 Giới thiệu về văn bản hành chính 3
1.2 Soạn thảo văn bản hành chính 4
1.3 Đề dẫn căn cứ trong văn bản hành chính 6
1.4 Căn cứ hợp lệ và không hợp lệ 9
1.4.1 Căn cứ hợp lệ: 9
1.4.2 Căn cứ không hợp lệ 10
1.4.3 Các trường hợp ngoại lệ 11
Chương 2: PHƯƠNG PHÁP TÁCH TỪ TRONG VĂN BẢN TIẾNG VIỆT 13
2.1 Vấn đề tách từ trong văn bản tiếng Việt 13
2.2 Các hướng tiếp cận kỹ thuật tách từ tiếng Việt 14
2.2.1 Hướng tiếp cận dựa trên từ 14
2.2.2 Hướng tiếp cận dựa trên ký tự 15
2.3 Một số phương pháp tách từ tiếng Việt 16
2.3.1 So khớp từ dài nhất (Longest Matching) 16
2.3.2 Học dựa trên sự cải biến 17
Trang 102.3.3 Chuyển đổi trạng thái trọng số hữu hạn 18
Chương 3: XÂY DỰNG BỘ KIỂM TRA CĂN CỨ VĂN BẢN HÀNH CHÍNH 21
3.1 Lưu đồ kiểm tra căn cứ trong văn bản hành chính 21
3.2 Đọc tập tin văn bản soạn thảo 22
3.3 Trích lọc căn cứ 23
3.4 Tách câu, tách từ trong căn cứ 24
3.5 Kiểm tra căn cứ: 26
3.6 Trình bày kết quả: 28
Chương 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 29
4.1 Thực nghiệm 29
4.1.1 Trích lọc căn cứ từ một hay nhiều văn bản 29
4.1.2 Hiệu chỉnh Tách từ trong căn cứ với VnTokenizer 33
4.1.3 Kiểm tra căn cứ hợp lệ hay không hợp lệ: 37
4.2 Đánh giá kết quả 43
CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 46
5.1 Kết luận 46
5.2 Hướng phát triển 46
TÀI LIỆU THAM KHẢO 47
Trang 11LĐTBXH Lao động thương binh xã hội
CĐKTKTKG Cao đẳng Kinh tế Kỹ thuật Kiên Giang
Trang 12DANH MỤC CÁC BẢNG
Bảng 4.1 Danh sách số lượng văn bản ban hành làm cơ sở dữ liệu 38 Bảng 4.2 Kết quả thực nghiệm Giá trị trung bình của Precision là 1.00, Recall là 0.67 và F1 = 0.80.chi tiết trên 10 văn bản UBND tỉnh Kiên Giang 43 Bảng 4.3 Kết quả thực nghiệm đồng loạt trên 100 văn bản Bộ LĐTBXH 44
Trang 13DANH MỤC CÁC HÌNH
Hình 1.1 Sơ đồ bố cục các thành phần thể thức văn bản 5
Hình 1.2 Viện dẫn căn cứ trong nghị định của Chính Phủ 8
Hình 1.3 Lỗi đánh máy khi viện dẫn căn cứ 12
Hình 2.1 Sơ đồ các hướng tiếp cận của kỹ thuật tách từ tiếng Hoa 14
Hình 3.1 Lưu đồ kiểm tra căn cứ văn bản hành chính 21
Hình 3.2 Giao diện cài đặt của Microsft Word 14.0 Object Library 22
Hình 3.3 Thư mục các tập tin văn bản cần đọc 23
Hình 3.4 Lưu đồ trích lọc căn cứ 24
Hình 3.5 Quy trình tách từ 25
Hình 3.6 Lưu đồ kiểm tra căn cứ 27
Hình 4.1 Thuật toán tìm căn cứ trong tập tin văn bản microsoft word 30
Hình 4.2 Ví dụ viện dẫn căn cứ của một thông tư 31
Hình 4.3 Kết quả tách căn cứ trong một văn bản hành chính 31
Hình 4.4 Kết quả tách căn cứ trong nhiều văn bản hành chính 32
Hình 4.5 Kết quả tách từ trong căn cứ của vnTokenizer 34
Hình 4.6 Biểu thức nhận dạng tách từ của một số hiệu 35
Hình 4.7 Biểu thức nhận dạng tách từ của một số hiệu 35
Hình 4.8 Biểu thức nhận dạng tách từ của một số hiệu 35
Hình 4.9 Kết quả tách từ sau khi hiệu chỉnh biểu thức trong laxers 36
Hình 4.10 Kết quả tách từ của một định dạng ngày tháng năm 36
Hình 4.11 Biểu thức tách ngày tháng năm ban hành của văn bản 37
Hình 4.12 Kết quả tách từ ngày tháng năm sau khi định nghĩa biểu thức 37
Hình 4.13 Cấu trúc tập tin dữ liệu văn bản ban hành trong XML 39
Hình 4.14 Lưu đồ thuật toán kiểm tra căn cứ 40
Hình 4.15 Thuật toán kiểm tra căn cứ 42
Hình 4.16 Giao diện chính của chương trình thực hiện nhiều văn bản 44
Trang 14PHẦN MỞ ĐẦU
1 Lý do chọn đề tài
Văn bản hành chính là phương tiện không thể thiếu ở các cơ quan hành chính nhà nước, ước tính bình quân mỗi ngày mỗi cơ quan nhà nước ban hành từ 2 đến 5 văn bản
Văn bản hành chính gồm nhiều loại khác nhau như Công văn, Thông báo, Kế hoạch, Quyết định, … Mỗi văn bản thường có từ 2 đến 3 căn cứ pháp lý, tùy thuộc vào nội dung, tính chất của mỗi văn bản mà có căn cứ pháp lý khác nhau nhưng phải đúng và chính xác theo yêu cầu trong quy định soạn thảo văn bản
Khi viện dẫn căn cứ trong văn bản soạn thảo thì vẫn còn xảy ra việc các văn bản viện dẫn đã hết hiệu lực toàn bộ, hoặc không đúng số ký hiệu, tên cơ quan ban hành, trích yếu… những hạn chế, tồn tại nêu trên cho thấy nguyên nhân chủ yếu xuất phát từ năng lực và nhận thức của người soạn thảo văn bản: chưa chọn lọc kỹ càng những văn bản liên quan trực tiếp đến nội dung quyết định quản lý hành chính ban hành; chưa rà soát, cập nhật thường xuyên, kịp thời tình trạng pháp lý (còn hiệu lực hay hết hiệu lực) của văn bản thuộc lĩnh vực phụ trách, theo dõi v.v… [12]
Vì vậy, nghiên cứu giải pháp kiểm tra căn cứ pháp lý của văn bản hành chính
là việc cần thiết trong bối cảnh hiện nay
2 Mục tiêu của đề tài:
- Mục tiêu tổng quát: Xây dựng bộ kiểm tra các căn cứ pháp lý của văn bản hành chính
Trang 15+ Ứng dụng các thuật toán, giải pháp tách để từ nhận dạng các từ khóa chính như số ký hiệu, ngày ban hành
+ Kiểm tra được nội dung căn cứ pháp lý của văn bản là hợp lệ hay không hợp lệ
3 Nội dung nghiên cứu:
- Tìm hiểu các văn bản hành chính nhà nước còn hiệu lực, phân loại, gom nhóm, xây dựng bộ cơ sở dữ liệu các văn bản quy phạm pháp luật
- Tìm hiểu cấu trúc của văn bản hành chính nhà nước
- Tìm hiểu các công cụ hoặc giải pháp đọc và tách ra các từ trong nội dung của văn bản soạn thảo
- Tìm hiểu kỹ thuật tách từ trong văn bản tiếng Việt để nhận dạng các số ký hiệu, ngày ban hành, tên cơ quan ban hành, … của căn cứ pháp lý
- Ứng dụng kỹ thuật tách từ trên văn bản soạn thảo để xác định được các từ khóa chính của căn cứ như số ký hiệu, ngày ban hành, tên cơ quan ban hành, …
- So sánh từ khóa chính với nội dung trong cơ sở dữ liệu về mức độ khớp nhau để xác định căn cứ đó là hợp lệ hay không hợp lệ
4 Phương pháp nghiên cứu
- Tiến hành thu thập và đọc các tài liệu có liên quan đến đề tài
- Tìm tài liệu bởi các từ khoá Kỹ thuật tách từ trong văn bản tiếng Việt
- Nghiên cứu tổng quan về trích dẫn căn cứ trong văn bản hành chính
- Nghiên cứu kỹ thuật tách từ trong văn bản hành chính tiếng Việt
- Xây dựng chương trình và đánh giá kết quả đạt được
Trang 16Chương 1: TỔNG QUAN VỀ CĂN CỨ TRONG VĂN BẢN
HÀNH CHÍNH
1.1 Giới thiệu về văn bản hành chính
Văn bản quản lý hành chính nhà nước được hiểu là những văn bản chứa đựng những quyết định và thông tin quản lý do các cơ quan nhà nước ban hành theo thẩm quyền, trình tự, thủ tục, hình thức nhất định nhằm điều chỉnh các mối quan hệ quản lý hành chính nhà nước giữa các cơ quan nhà nước với nhau và giữa các cơ quan nhà nước với các tổ chức và công dân Và như vậy, về mặt nội dung của văn bản: văn bản quản lý nhà nước chứa đựng những quyết định và thông tin quản lý nhà nước
Về mặt chủ thể ban hành văn bản: văn bản quản lý nhà nước do các cơ quan quản lý nhà nước ban hành theo thẩm quyền được Nhà nước quy định Về mặt quy trình ban hành: văn bản quản lý nhà nước được ban hành theo trình tự, thủ tục, hình thức nhất định; Về mặt mục đích: văn bản quản lý nhà nước được ban hành nhằm điều chỉnh các mối quan hệ quản lý hành chính nhà nước giữa các cơ quan nhà nước với nhau và giữa các cơ quan nhà nước với các tổ chức và công dân
Một trong những văn bản hành chính phổ biến trong cơ quan nhà nước thuộc trường học đó là lĩnh vực khen thưởng, nhân sự và đào tạo Hàng năm nhà trường thường xuyên ban hành các loại văn bản như các kế hoạch đào tạo, khen thưởng, hay điều động nhân sự Mỗi văn bản khi soạn thảo để ban hành nếu muốn tăng tính hợp pháp thì thường phải có từ 2 căn cứ trở lên, các căn cứ này thường được trích lọc từ bộ dữ liệu của hàng ngàn văn bản đến và hàng ngàn văn bản đi (do cơ quan ban hành), cho nên việc kiểm tra các căn cứ là điều làm thường xuyên nhưng gặp nhiều khó khăn ở các nhà trường
Văn bản hành chính là loại văn bản mang tính thông tin quy phạm Nhà nước,
cụ thể hóa việc thi hành văn bản pháp quy, giải quyết những vụ việc cụ thể trong khâu quản lý Văn bản hành chính được chia thành 2 loại chính sau:
Trang 17- Văn bản hành chính cá biệt là phương tiện thể hiện các quyết định quản lý của cơ quan quản lý hành chính nhà nước có thẩm quyền trên cơ sở những quy định chung, quyết định quy phạm của cơ quan nhà nước cấp trên hoặc quy định quy phạm của cơ quan mình nhằm giải quyết các công việc cụ thể Bao gồm: Quyết định
cá biệt; Chỉ thị cá biệt; Nghị quyết cá biệt
- Văn bản hành chính thông thường là những văn bản mang tính thông tin điều hành nhằm thực hiện các văn bản quy phạm pháp luật khác hoặc dùng để giải quyết các công việc cụ thể, phản ánh tình hình, giao dịch, trao đổi, ghi chép công việc trong cơ quan, tổ chức Hệ thống loại văn bản này rất đa dạng và phức tạp, có thể phân thành 2 loại chính:
+ Văn bản không có tên loại: Công văn là văn bản dùng để giao dịch về công việc giữa các cơ quan đoàn thể Đối với loại văn bản này thì ở đầu văn bản không thể hiện tên loại văn bản Đây cũng là cách để phân biệt công văn với loại văn bản hành chính khác
+ Văn bản có tên gọi: Thông báo, báo cáo, biên bản, tờ trình, đề án, chương trình, kế hoạch, hợp đồng, các loại giấy (giấy đi đường, giấy giới thiệu, giấy nghỉ phép, giấy ủy nhiệm,…) các loại phiếu (phiếu gửi, phiếu báo, phiếu trình…) Những văn bản loại này thường thể hiện loại tên gọi cụ thể Ví dụ: Báo cáo; Thông báo; Biên bản
Văn bản hành chính có vai trò chủ yếu là cụ thể hóa văn bản quy phạm pháp luật, hướng dẫn cụ thể các chủ trương, chính sách của nhà nước, hỗ trợ cho quá trình quản lý hành chính nhà nước và thông tin pháp luật
1.2 Soạn thảo văn bản hành chính
Soạn thảo văn bản hành chính được thực hiện theo hướng dẫn của thông tư
số 01/2011/TT-BNV của Bộ Nội vụ về việc Hướng dẫn thể thức và kỹ thuật trình bày văn bản hành chính Trong thông tư có 4 chương và 6 phụ lục quy định đầy đủ
về thể thức soạn thảo một văn bản hành chính được áp dụng đối với các cơ quan nhà nước, tổ chức xã hội, tổ chức xã hội - nghề nghiệp như phạm vi áp dụng, thể
Trang 18thức, cách trình bày, kỹ thuật trình bày, phông chữ, khổ giấy, và các khoản khác của một văn bản hành chính
Điều đó có nghĩa là văn bản hành chính được trình bày theo khuôn mẫu nhất định, câu chữ được lựa chọn, vị trí các thành phần được sắp xếp theo trật tự cho nên việc phân tích nội dung một văn bản thuộc về văn bản hành chính cũng không quá phức tạp như các văn bản khác
Ví dụ về việc bố trí các thành phần văn bản hành chính theo Phụ lục II 1
Trang 19Trong đó:
1_ Quốc hiệu
2_ Tên cơ quan, tổ chức ban hành văn bản
3_ Số, ký hiệu của văn bản
4_ Địa danh và ngày, tháng, năm ban hành văn bản
5a_ Tên loại và trích yếu nội dung văn bản
5b_ Trích yếu nội dung công văn
6_ Nội dung văn bản
7a_, 7b_, 7c_ Quyền hạn, chức vụ, họ tên và chữ ký của người có thẩm quyền
8_ Dấu của cơ quan, tổ chức
13_ Ký hiệu người đánh máy và số lượng bản phát hành
14_ Địa chỉ cơ quan, tổ chức; địa chỉ E-Mail; địa chỉ Website; số điện thoại,
số Telex, số Fax
15_ Logo (in chìm dưới tên cơ quan, tổ chức ban hành văn bản)
Tuy nhiên đó là đối với những người soạn thảo đúng quy định, được tập huấn về thể thức văn bản hành chính, còn những người mới vào cơ quan nhà nước
để soạn thảo một văn bản hành chính cũng có nhiều sai sót, chưa thống nhất cho nên để máy tính phân tích nội dung của văn bản hành chính cũng khá khó khăn
1.3 Đề dẫn căn cứ trong văn bản hành chính
Căn cứ pháp lý được xem là cơ sở để kiểm tra tính hợp hiến, hợp pháp, tính thống nhất của văn bản Khi tiến hành kiểm tra một văn bản hành chính, người có thẩm quyền kiểm tra sẽ xem xét nội dung của văn bản được kiểm tra với những văn
Trang 20bản là căn cứ pháp lý để ban hành văn bản đó làm cơ sở để đối chiếu, so sánh nhằm xác định nội dung của văn bản được ban hành có phù hợp với Hiến pháp, Luật và văn bản quy phạm pháp luật của cơ quan nhà nước cấp trên Trong quá trình kiểm tra văn bản, căn cứ vào những văn bản làm cơ sở pháp lý người có thẩm quyền kiểm tra văn bản tìm hiểu xem văn bản được ban hành đó có căn cứ pháp lý cho việc ban hành không? Trường hợp đối tượng và phạm vi điều chỉnh của văn bản được kiểm tra không đúng với quy định trong các căn cứ pháp lý để ban hành văn bản, điều đó có nghĩa rằng việc quy định nội dung đó là không có căn cứ pháp lý Ví dụ: Quyết định số…của Hiệu trưởng trường Cao Đẳng Kinh Tế Kỹ Thuật Kiên Giang
về việc bổ nhiệm viên chức quản lý
Khi soạn thảo văn bản hành chính phần căn cứ văn bản thường xuyên được
sử dụng nhất khi chúng ta soạn thảo, trong văn bản hành chính có nhiều loại văn bản khác nhau thì phần căn cứ cũng được trình bày theo nhiều cách khác nhau, chúng ta phải dựa vào văn bản đã có để làm căn cứ cho các văn bản soạn thảo
Đối với những văn bản có phần căn cứ pháp lý để ban hành thì sau mỗi căn
cứ phải xuống dòng, cuối dòng có dấu “chấm phẩy”, riêng căn cứ cuối cùng kết thúc bằng dấu “phẩy” 2
“Tùy theo thể loại và nội dung, văn bản có thể có phần căn cứ pháp lý để ban hành” 3
Trường hợp viện dẫn các điều, khoản, điểm của một văn bản cụ thể thì viết hoa chữ cái đầu của điều, khoản, điểm
Ví dụ:
- Căn cứ Điều 10 Bộ luật Lao động…
- Căn cứ Điểm a, Khoản 1, Điều 5 Luật Giao dịch điện tử…4
Vị trí của căn cứ pháp lý trong văn bản hành chính là nằm ở phần đầu văn bản, dưới tiêu đề và trích yếu của văn bản, nhưng trên nội dung của văn bản
2 Khoản 2, Điều 11, thông tư số 01/2011/TT-BNV
3 Điểm b, Khoản 1, Điều 11 thông tư số 01/2011/TT-BNV
4
Khoản 6, Điều 5, thông tư số 01/2011/TT-BNV
Trang 21Ví dụ về vị trí của các căn cứ trong văn bản nghị định [2]
Căn cứ Luật Tổ chức Chính phủ ngày 25 tháng 12 năm 2001;
Căn cứ Luật Tổ chức Hội đồng nhân dân và Ủy ban nhân dân ngày 26 tháng 11 năm 2003;
Căn cứ Luật Ban hành văn bản quy phạm pháp luật của Hội đồng nhân dân, Ủy ban nhân dân ngày 03 tháng 12 năm 2004;
Căn cứ Luật Ban hành văn bản quy phạm pháp luật ngày 03 tháng 6 năm 2008;
Xét đề nghị của Bộ trưởng Bộ Tư pháp,
NGHỊ ĐỊNH:
Chương I NHỮNG QUY ĐỊNH CHUNG Điều 1 Đối tượng và phạm vi điều chỉnh ….”
Hình 1.2 Viện dẫn căn cứ trong nghị định của Chính Phủ
Trong nghị định trên ta thấy các căn cứ nằm dưới tiêu đề Nghị Định và trên Chương I của nội dung, và đó chính là vị trí của căn cứ trong các văn bản quy phạp pháp luật
Trang 22Cấu trúc của một căn cứ gồm:
- Đầu ngữ với cụm từ “Căn cứ”
- Căn cứ thiếu nơi ban hành:
“Căn cứ Luật viên chức số 58/2010/QH12 ngày 15 tháng 11 năm 2010;”
1.4 Căn cứ hợp lệ và không hợp lệ
1.4.1 Căn cứ hợp lệ:
Căn cứ pháp lý là cơ sở để xác định việc văn bản đó được ban hành có đúng thẩm quyền không? Điều đó có nghĩa là nội dung quy định trong văn bản đó phải phù hợp với quy định trong các căn cứ pháp lý làm cơ sở để ban hành văn bản đó
Cụ thể trong quá trình kiểm tra người có thẩm quyền kiểm tra văn bản xem xét, đối chiếu, xem nội dung của văn bản được ban hành có phù hợp với quy định pháp luật, quy định của cơ quan nhà nước cấp trên không? Để từ đó đưa ra kết luận về việc văn bản đó được ban hành có đảm bảo tính hợp hiến, hợp pháp hay không?
Theo quy định tại khoản 1 Điều 3 Nghị định số 40/2010/NĐ-CP có nêu:
“1 Ban hành đúng căn cứ pháp lý
a) Có căn cứ pháp lý cho việc ban hành;
b) Những văn bản làm căn cứ pháp lý đó đã được ký ban hành, thông qua vào thời điểm ban hành văn bản được kiểm tra.”
Trang 23Như vậy, văn bản được ban hành đúng căn cứ pháp lý là văn bản đảm bảo đủ các yêu cầu:
- Có căn cứ pháp lý cho việc ban hành Nghĩa là đã có văn bản quy phạm pháp luật của các cơ quan nhà nước cấp trên quy định về thẩm quyền, chức năng, nhiệm vụ của cơ quan ban hành văn bản và vấn đề thuộc đối tượng, phạm vi điều chỉnh của văn bản, hoặc văn bản do chính cơ quan ban hành văn bản đã ban hành,
có hiệu lực pháp lý cao hơn văn bản mới ban hành quy định về vấn đề thuộc đối tượng, phạm vi điều chỉnh của văn bản mới;
- Những văn bản làm căn cứ pháp lý đó đã được ký ban hành, thông qua vào thời điểm ban hành văn bản được kiểm tra Nghĩa là vào thời điểm ban hành văn bản, các văn bản được lấy làm căn cứ pháp lý đã được ký ban hành và chưa bị sửa đổi, bãi bỏ, huỷ bỏ, đình chỉ (bị ngưng hiệu lực) hoặc hết hiệu lực
1.4.2 Căn cứ không hợp lệ
Căn cứ không hợp lệ là gì? Là những căn cứ vi phạm các điều sau đây:
- Chưa được ban hành hoặc hết hiệu lực ban hành
- Số ký hiệu trích dẫn không đúng với số ký hiệu gốc
- Sai ngày ban hành, tên cơ quan ban hành, hoặc trích yếu văn bản
- Căn cứ không phù hợp với nội dung văn bản
- Căn cứ hết hiệu lực ban hành
Trong luận văn này chúng ta chỉ xét căn cứ không hợp lệ là những căn cứ có
số ký hiệu trích dẫn không đúng, sai ngày ban hành, tên cơ quan ban hành, đặc biệt
là những căn cứ đã hết hiệu lực ban hành, có những căn cứ pháp lý hết hiệu lực một phần và rất khó để xác định được phần nào đã hết hiệu lực cho nên trường hợp đó chúng ta xem căn cứ đó là hợp lệ và đưa ra thông báo cảnh báo đến người dùng
Vậy để kiểm tra căn cứ không hợp lệ chúng ta cần giải quyết 2 vấn đề: Thứ nhất là giải quyết bài toán tách từ trong văn bản, để tách ra các căn cứ trong văn bản soạn thảo, và trong mỗi căn cứ tách ra số ký hiệu, cơ quan ban hành, ngày ban hành và trích yếu của căn cứ đó
Trang 24Thứ hai là xây dựng bộ dữ liệu văn bản để làm cơ sở kiểm tra căn cứ pháp lý, giả thuyết rằng khi kiểm tra số ký hiệu văn bản làm căn cứ có tồn tại trong bộ dữ liệu này thì số ký hiệu căn cứ đó là hợp lệ Ngược lại thì số ký hiệu căn cứ đó không hợp lệ
1.4.3 Các trường hợp ngoại lệ
Căn cứ pháp lý được viện dẫn trong các văn bản hành chính rất đa dạng, có nhiều nơi căn cứ pháp lý là những chỉ đạo của người đứng đầu đơn vị, hoặc “Xét đề nghị của tại tờ trình số ” [16], hay dựa vào tình trạng thực tế của đơn vị, những căn cứ này chúng ta không thể xác định được tính pháp lý mà đưa vào căn cứ hợp lệ hay không hợp lệ cho nên chúng ta xem xét nó là những trường hợp ngoại lệ
Ngoài ra, khi kiểm tra căn cứ kết quả trả về không tìm thấy trong cơ sở dữ liệu điều đó có 2 nguyên nhân chính: một là người soạn thảo trình bài số hiệu bị lỗi đánh máy hoặc sai số hiệu văn bản dẫn đến không tìm thấy, hai là do bộ dữ liệu văn bản làm cơ sở dữ liệu tra cứu chưa đầy đủ dẫn đến cho dù người soạn thảo viết đúng nội dung căn cứ mà vẫn không được tìm thấy, trong trường hợp này tác giả sẽ đưa
ra cảnh báo “không tìm thấy” cho người sử dụng
Trang 25
Hình 1.3 Lỗi đánh máy khi viện dẫn căn cứ
Trong hình minh họa trên, ta thấy căn cứ Nghị định số “29/2003/ NĐ-CP” người soạn thảo nhập dư ký tự trắng giữa ký tự / và N, cho nên khi máy tính đọc sẽ xem ký tự trắng đó là một ký tự trong số hiệu, và sẽ không tìm thấy văn bản có số hiệu đó trong bộ dữ liệu các văn bản ban hành
Trang 26Chương 2: PHƯƠNG PHÁP TÁCH TỪ TRONG VĂN BẢN
TIẾNG VIỆT
2.1 Vấn đề tách từ trong văn bản tiếng Việt
Để kiểm tra căn cứ pháp lý có hợp lệ hay không, chúng ta cần phải tách căn
cứ ra từ văn bản soạn thảo, sau đó kiểm tra trong bộ cơ sở dữ liệu căn cứ, nếu căn
cứ đó tồn tại và còn hiệu lực tại thời điểm ban hành thì căn cứ đó hợp lệ
Tách từ trong văn bảng tiếng Việt là một bài toán khó, bởi tiếng Việt là một dạng ngôn ngữ đơn lập, với những đặc tính như sau:
Từ ở dạng nguyên thể, hình thức và ý nghĩa của từ độc lập với cú pháp
Từ được cấu trúc từ tiếng
Từ bao gồm từ đơn và từ phức (bao gồm từ láy và từ ghép)
Trong tiếng Anh và nhiều ngôn ngữ khác, các từ được phân tách với nhau bằng dấu cách Tuy nhiên trong tiếng Việt, dấu cách được dùng để phân tách các tiếng (âm tiết) chứ không phải từ Trong nhiều nghiên cứu khác, bài toán tách từ trong tiếng Việt cho thấy rất nhiều khó khăn, qua đó có nhận xét như sau:
Tiếng Việt là loại hình phi hình thái nên việc phân loại từ (danh từ, động
từ, tính từ… ) và ý nghĩa từ là rất khó khăn, cho dù có sử dụng từ điển
Việc tiền xử lý văn bản (tách từ, tách đoạn, tách câu…) sẽ thêm phức tạp với phần xử lý các hư từ, phụ từ, từ láy…
Phương thức ngữ pháp chủ yếu là trật tự từ nên nếu áp dụng phương pháp tính xác suất xuất hiện của từ có thể không chính xác như mong đợi
Ranh giới từ không được xác định mặc định bằng khoảng trắng Điều này khiến cho việc phân tích hình thái (tách từ) tiếng Việt trở nên khó khăn Việc nhận diện ranh giới từ là quan trọng và làm tiền đề cho các xử lý tiếp theo sau đó, như: kiểm tra lỗi chính tả, gán nhãn từ loại, thống kê tần suất từ
Vì tiếng Anh và tiếng Việt có những điểm khác biệt nên chúng ta không thể áp dụng y nguyên các thuật toán tiếng Anh cho tiếng Việt
Trang 272.2 Các hướng tiếp cận kỹ thuật tách từ tiếng Việt
Dựa vào các kỹ thuật tách từ của tiếng Hán, và những điểm tương đồng giữa tiếng Việt và tiếng Hán Chúng ta có thể xây dựng sơ đồ các hướng tiếp cận của kỹ thuật tách từ tiếng Việt, dưới đây là kết quả khảo sát của Foo và Li [9] về tách từ trong văn bản tiếng Hoa:
Hình 2.1 Sơ đồ các hướng tiếp cận của kỹ thuật tách từ tiếng Hoa
2.2.1 Hướng tiếp cận dựa trên từ
Hướng tiếp cận dựa trên từ với mục tiêu tách được các từ hoàn chỉnh trong câu Hướng tiếp cận này có thể chia ra theo 3 hướng : dựa trên thống kê (statistics - based), dựa trên từ điển (dictionary – based) và hydrid (kết hợp nhiều phương pháp)
Hybrid
Vietnamese segmentation
Full word/ Phrase Component
Shortest Match Longest Match Overlap Match
Trang 28Hướng tiếp cận dựa trên thống kê (statistic-based): dựa trên các thông tin như tần số xuất hiện của từ trong tập huấn luyện ban đầu
Hướng tiếp cận dựa trên từ điển (dictionary- based): ý tưởng của hướng tiếp cận này là những cụm từ được tách ra từ văn bản phải được so khớp với các từ trong
từ điển
Tùy thuộc vào loại từ điển sử dụng để so khớp lại có 2 hướng tiếp cận : full word/ pharse và component Trong đó full word/ pharse cần sử dụng một từ điển hoàn chỉnh Còn component thì sử dụng từ điển thành phần
Tùy theo cách chọn so khớp từ (match) hướng tiếp cận ‘full word/ pharse’ có thể chia ra làm 3 loại: so khớp dài nhất (longest match), so khớp ngắn nhất (shortest match) và so khớp kết hợp (overlap) Trong so khớp kết hợp mỗi chuỗi được phát sinh từ văn bản có thể chồng lấp lên chuỗi khác nếu chuỗi đó có trong từ điển
Hiện nay thì hướng tiếp cận so khớp dài nhất được xem là phương pháp quan trọng và có hiệu quả nhất trong hướng tiếp cận dựa trên từ điển
Hướng tiếp cận hybrid: Với mục đích kết hợp các hướng tiếp cận khác nhau
để thừa hưởng được các ưu điểm của nhiều kỹ thuật và các hướng tiếp cận khác nhau nhằm nâng cao kết quả Hướng tiếp cận này thường kết hợp giữa hướng dựa trên thống kê và dựa trên từ điển nhằm tận dụng các mặt mạnh của các phương pháp này Tuy nhiên hướng tiếp cận Hybrid lại mất nhiều thời gian xử lý , không gian đĩa
và đòi hỏi nhiều chi phí
2.2.2 Hướng tiếp cận dựa trên ký tự
Trong tiếng Việt, hình vị nhỏ nhất là “tiếng” được hình thành bởi nhiều ký tự trong bảng chữ cái Hướng tiếp cận này đơn thuần rút trích ra một số lượng nhất định các tiếng trong văn bản như rút trích từ 1 ký tự (unigram) hay nhiều ký tự (n-gram) và cũng mang lại một số kết quả nhất định được minh chứng thông qua một
số công trình nghiên cứu đã được công bố, như của tác giả Lê An Hà xây dựng tập ngữ liệu thô 10MB bằng cách sử dụng phương pháp qui hoạch động để cựa đại hóa xác suất xuất hiện của các ngữ Rồi công trình nghiên cứu của H Nguyễn làm theo hướng tiếp cận là thay vì sử dụng ngữ liệu thô, công trình tiếp cận theo hướng xem
Trang 29Internet như một kho ngữ liệu khổng lồ, sau đó tiến hành thống kê và sử dụng thuật giải di truyền để tìm cách tách từ tối ưu nhất , và một số công trình của một số tác giả khác Khi so sánh kết quả của tác giả Lê An Hà và H.Nguyễn thì thấy công trình của H.Nguyễn cho được kết quả tốt hơn khi tiến hành tách từ , tuy nhiên thời gian
xử lý lâu hơn Ưu điểm nổi bật của hướng tiếp cận dựa trên nhiều ký tự là tính đơn giản, dễ ứng dụng, ngoài ra còn có thuận lợi là ít tốn chi phí cho thao tác tạo chỉ mục và xử lý nhiều câu truy vấn Qua nhiều công trình nghiên cứu của các tác giả
đã được công bố, hướng tiếp cận tách từ dựa trên nhiều ký tự, cụ thể là cách tách từ hai ký tự được cho là sự lựa chọn thích hợp
2.3 Một số phương pháp tách từ tiếng Việt
2.3.1 So khớp từ dài nhất (Longest Matching)
Longest Matching là thuật toán dựa trên tư tưởng tham lam Nó xét các tiếng
từ trái qua phải, các tiếng đầu tiên dài nhất có thể mà xuất hiện trong từ điển sẽ được tách ra làm một từ Thuật toán sẽ dừng khi xét hết các tiếng Thuật toán chỉ đúng khi không có sự nhập nhằng những tiếng đầu của từ sau có thể ghép với từ trước tạo thành một từ có trong từ điển
Wmax= từ đầu danh sách V; // từ dài nhất
Foreach (v thuộc từ gồm các tiếng bắt đầu trong V)
If(length(v)> length(Wmax) and v thuộc T) then Wmax= v;
Loại đi các tiếng trong W max ở đầu danh sách V;
End
Trang 30Ví dụ : Tôi là sinh viên trường Đại học Hutech
Bước Từ dài nhất có thể Các tiếng còn lại
Ưu điểm:
- Tách từ nhanh đơn giản chỉ cần dựa vào từ điển
- Độ chính xác tương đối cao
2.3.2 Học dựa trên sự cải biến
Đây là cách tiếp cận dựa trên ngữ liệu đã đánh dấu Theo cách tiếp cận này,
để huấn luyện cho máy tính biết cách nhận diện ranh giới từ tiếng Việt, ta có thể cho máy “học” trên ngữ liệu hàng vạn câu tiếng Việt đã được đánh dấu ranh giới từ đúng
Sau khi học xong, máy sẽ xác định được các tham số (các xác suất) cần thiết cho
mô hình nhận diện từ
Ưu điểm:
- Đặc điểm của phương pháp này là khả năng tự rút ra quy luật của ngôn ngữ