1. Trang chủ
  2. » Luận Văn - Báo Cáo

Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính

61 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 61
Dung lượng 2,04 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính Xây dựng bộ kiểm tra căn cứ pháp lý của văn bản hành chính luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp

Trang 1

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM

-

NGUYỄN THỊ PHƯƠNG THY

XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ

Trang 2

BỘ GIÁO DỤC VÀ ĐÀO TẠO

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM

-

NGUYỄN THỊ PHƯƠNG THY

XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ

Trang 3

CÔNG TRÌNH ĐƯỢC HOÀN THÀNH TẠI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ TP HCM

Cán bộ hướng dẫn khoa học : TS Đặng Trường Sơn

Luận văn Thạc sĩ được bảo vệ tại Trường Đại học Công nghệ TP HCM ngày

19 tháng 11 năm 2017

Thành phần Hội đồng đánh giá Luận văn Thạc sĩ gồm:

Xác nhận của Chủ tịch Hội đồng đánh giá Luận văn sau khi Luận văn đã sửa chữa (nếu có)

Chủ tịch Hội đồng đánh giá LV

Đỗ Phúc

Trang 4

NHIỆM VỤ LUẬN VĂN THẠC SĨ

Họ tên học viên: NGUYỄN THỊ PHƯƠNG THY Giới tính: NỮ

Ngày, tháng, năm sinh: 28/11/1983 Nơi sinh: Kiên Giang

Chuyên ngành: Công nghệ thông tin MSHV: 1541860049

I- Tên đề tài:

XÂY DỰNG BỘ KIỂM TRA CĂN CỨ PHÁP LÝ CỦA VĂN BẢN

HÀNH CHÍNH

II- Nhiệm vụ và nội dung:

- Tìm hiểu về văn bản hành chính và đề dẫn cứ trong văn bản hành chính

- Tìm hiểu về kỹ thuật tách từ trong văn bản tiếng Việt

- Xây dựng bộ kiểm tra căn cứ hợp lệ hay không hợp lệ

III- Ngày giao nhiệm vụ: 15/03/2017

IV- Ngày hoàn thành nhiệm vụ: 31/08/2017

V- Cán bộ hướng dẫn: TS ĐẶNG TRƯỜNG SƠN

CÁN BỘ HƯỚNG DẪN

TS Đặng Trường Sơn

KHOA QUẢN LÝ CHUYÊN NGÀNH

Trang 5

LỜI CAM ĐOAN

Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi Các số liệu, kết quả nêu trong Luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác

Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện Luận văn này cũng như các trích dẫn hay tài liệu học thuật tham khảo đã được cảm ơn đến tác giả

và các thông tin trích dẫn trong Luận văn đã được chỉ rõ nguồn gốc

Học viên thực hiện Luận văn

Nguyễn Thị Phương Thy

Trang 6

LỜI CÁM ƠN

Trước hết, cho tôi được gửi lời cảm ơn đến sự hướng dẫn và giúp đỡ tận tình của TS Đặng Trường Sơn

Xin cảm ơn các Thầy/Cô, Khoa CNTT Đại Học Công Nghệ TP HCM

đã giúp đỡ và cung cấp cho tôi những kiến thức quý giá trong suốt thời gian học tập và nghiên cứu thực hiện luận văn

Tôi cũng xin gởi lời cảm ơn đến gia đình, bạn bè và những đồng nghiệp

đã luôn quan tâm và giúp đỡ tôi trong suốt thời gian học tập và nghiên cứu hoàn thành luận văn này

Luận văn không thể tránh khỏi những sai sót, rất mong nhận được ý kiến đóng góp của mọi người cho luận văn được hoàn thiện hơn

Tôi xin chân thành cảm ơn

Nguyễn Thị Phương Thy

Trang 7

TÓM TẮT

Văn bản quản lý hành chính nhà nước (QLHCNN) được các cơ quan quản lý nhà nước soạn thảo và ban hành theo đúng trình tự, thủ tục, hình thức nhất định; trong quá trình biên soạn văn bản các cơ quan nhà nước phải dựa vào căn cứ pháp

lý để làm cơ sở ban hành sau cho văn bản đó hợp hiến, hợp pháp và tăng giá trị của văn bản biên soạn

Việc đề dẫn các căn cứ pháp lý vào văn bản soạn thảo sau cho đúng chính xác không sai lệch về số ký hiệu, ngày ban hành, cơ quan ban hành, hoặc nội dung trích yếu của các văn bản đã được ban hành trước đó là điều cần thiết giúp cho văn bản mới nâng cao tính logic và giá trị pháp lý khi được ban hành

Luận văn này tập trung vào nghiên cứu giải pháp kiểm tra các căn cứ được đề dẫn vào các văn bản soạn thảo trên phần mềm Microsoft Word có hợp lệ hay không

Sử dụng giải pháp tách từ trong văn bản soạn thảo để ra được các căn cứ đề dẫn, trong mỗi căn cứ tách ra các thông tin gồm: số ký hiệu văn bản, ngày ban hành, cơ quan ban hành, và trích yếu của văn bản, sau đó so sánh với bộ dữ liệu (các công văn đến và đi đã được ban hành) được lưu trữ trong tập tin XML, nếu các thông tin của căn cứ đề dẫn trùng khớp với dữ liệu thì căn cứ đó hợp lệ, ngược lại là không hợp lệ

Hình thức của sản phẩm là phần mềm Kiểm tra căn cứ văn bản hành chính Được viết bằng ngôn ngữ C# trên nền NET Framework của Microsoft Cơ sở dữ liệu của phần mềm là bộ văn bản đã được ban hành lưu trong tập tin XML Bộ văn bản này lấy từ 2 nguồn: nguồn thứ nhất là tập hợp 59.156 văn bản pháp luật của trung ương và các bộ ngành ban hành lấy từ nguồn cơ sở dữ liệu quốc gia [15], đây

là nhóm dữ liệu chính dùng để kiểm tra căn cứ cho tất cả các loại văn bản hành chính Nguồn dữ liệu thứ 2 là 3100 văn bản hành chính do trường Cao đẳng Kinh tế

Kỹ thuật Kiên Giang ban hành, đây là nhóm dữ liệu dùng để kiểm tra căn cứ của các văn bản trường Cao đẳng Kinh tế Kỹ thuật biên soạn Dữ liệu kiểm tra phần mềm là các văn bản do trường KTKT Kiên Giang, UBND tỉnh Kiên Giang, Bộ Lao Động TBXH ban hành

Trang 8

ABSTRACT

State administrative management documents are drafted and issued by state agencies in a certain sequences, procedures and forms; during the process of compiling documents, state agencies must base on the legal basis to make the document promulgated so that these documents are constitutional, legal, and more valuable

The insertion legal basis into the draft documents accurately the number of symbols, the date of issue, the promulgating agency, or the abstract of the previous promulgated documents is essential in order that the new texts improve logical and legal validity when they are issued

This thesis focuses on researching solutions to check the insertion legal basis into the drafted documents on Microsoft Word software if they are valid or invalid Using the word separation solution in the document to identify the legal basis, on each base separating the information includes: the number of the document symbol, the date of issue, the promulgating agency, and the abstract of the document, then compared to the data set (the incoming and outgoing dispatches) are stored in the XML file, if the information of the legal basis matches the data, it is valid and vice versa

The form of the product is the test administrative documents software It is written in C # on Microsoft's NET Framework The database of the software is the document set that have been issued and saved in the XML file This document set is from two sources: the first source is a collection of 59,156 legal documents issued

by the central government and ministries issued from the national database [15] These are the main database used to check the basis for all types of administrative documents The second source of data is 3100 administrative documents issued by Kien Giang Technical and Economic College, which is a data group used to check the basis of Kien Giang Technical and Economic College issued

Data for testing software are documents issued by Kien Giang Technical and Economic College and Ministry of Labor, Invalids and Social Affairs and General Department of Vocational Training

Trang 9

MỤC LỤC

LỜI CAM ĐOAN i

LỜI CÁM ƠN ii

ABSTRACT iv

MỤC LỤC v

DANH MỤC CÁC TỪ VIẾT TẮT vii

DANH MỤC CÁC BẢNG viii

DANH MỤC CÁC HÌNH ix

PHẦN MỞ ĐẦU 1

1 Lý do chọn đề tài 1

2 Mục tiêu của đề tài: 1

3 Nội dung nghiên cứu: 2

4 Phương pháp nghiên cứu 2

Chương 1: TỔNG QUAN VỀ CĂN CỨ TRONG VĂN BẢN HÀNH CHÍNH 3

1.1 Giới thiệu về văn bản hành chính 3

1.2 Soạn thảo văn bản hành chính 4

1.3 Đề dẫn căn cứ trong văn bản hành chính 6

1.4 Căn cứ hợp lệ và không hợp lệ 9

1.4.1 Căn cứ hợp lệ: 9

1.4.2 Căn cứ không hợp lệ 10

1.4.3 Các trường hợp ngoại lệ 11

Chương 2: PHƯƠNG PHÁP TÁCH TỪ TRONG VĂN BẢN TIẾNG VIỆT 13

2.1 Vấn đề tách từ trong văn bản tiếng Việt 13

2.2 Các hướng tiếp cận kỹ thuật tách từ tiếng Việt 14

2.2.1 Hướng tiếp cận dựa trên từ 14

2.2.2 Hướng tiếp cận dựa trên ký tự 15

2.3 Một số phương pháp tách từ tiếng Việt 16

2.3.1 So khớp từ dài nhất (Longest Matching) 16

2.3.2 Học dựa trên sự cải biến 17

Trang 10

2.3.3 Chuyển đổi trạng thái trọng số hữu hạn 18

Chương 3: XÂY DỰNG BỘ KIỂM TRA CĂN CỨ VĂN BẢN HÀNH CHÍNH 21

3.1 Lưu đồ kiểm tra căn cứ trong văn bản hành chính 21

3.2 Đọc tập tin văn bản soạn thảo 22

3.3 Trích lọc căn cứ 23

3.4 Tách câu, tách từ trong căn cứ 24

3.5 Kiểm tra căn cứ: 26

3.6 Trình bày kết quả: 28

Chương 4: THỰC NGHIỆM VÀ ĐÁNH GIÁ KẾT QUẢ 29

4.1 Thực nghiệm 29

4.1.1 Trích lọc căn cứ từ một hay nhiều văn bản 29

4.1.2 Hiệu chỉnh Tách từ trong căn cứ với VnTokenizer 33

4.1.3 Kiểm tra căn cứ hợp lệ hay không hợp lệ: 37

4.2 Đánh giá kết quả 43

CHƯƠNG 5: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 46

5.1 Kết luận 46

5.2 Hướng phát triển 46

TÀI LIỆU THAM KHẢO 47

Trang 11

LĐTBXH Lao động thương binh xã hội

CĐKTKTKG Cao đẳng Kinh tế Kỹ thuật Kiên Giang

Trang 12

DANH MỤC CÁC BẢNG

Bảng 4.1 Danh sách số lượng văn bản ban hành làm cơ sở dữ liệu 38 Bảng 4.2 Kết quả thực nghiệm Giá trị trung bình của Precision là 1.00, Recall là 0.67 và F1 = 0.80.chi tiết trên 10 văn bản UBND tỉnh Kiên Giang 43 Bảng 4.3 Kết quả thực nghiệm đồng loạt trên 100 văn bản Bộ LĐTBXH 44

Trang 13

DANH MỤC CÁC HÌNH

Hình 1.1 Sơ đồ bố cục các thành phần thể thức văn bản 5

Hình 1.2 Viện dẫn căn cứ trong nghị định của Chính Phủ 8

Hình 1.3 Lỗi đánh máy khi viện dẫn căn cứ 12

Hình 2.1 Sơ đồ các hướng tiếp cận của kỹ thuật tách từ tiếng Hoa 14

Hình 3.1 Lưu đồ kiểm tra căn cứ văn bản hành chính 21

Hình 3.2 Giao diện cài đặt của Microsft Word 14.0 Object Library 22

Hình 3.3 Thư mục các tập tin văn bản cần đọc 23

Hình 3.4 Lưu đồ trích lọc căn cứ 24

Hình 3.5 Quy trình tách từ 25

Hình 3.6 Lưu đồ kiểm tra căn cứ 27

Hình 4.1 Thuật toán tìm căn cứ trong tập tin văn bản microsoft word 30

Hình 4.2 Ví dụ viện dẫn căn cứ của một thông tư 31

Hình 4.3 Kết quả tách căn cứ trong một văn bản hành chính 31

Hình 4.4 Kết quả tách căn cứ trong nhiều văn bản hành chính 32

Hình 4.5 Kết quả tách từ trong căn cứ của vnTokenizer 34

Hình 4.6 Biểu thức nhận dạng tách từ của một số hiệu 35

Hình 4.7 Biểu thức nhận dạng tách từ của một số hiệu 35

Hình 4.8 Biểu thức nhận dạng tách từ của một số hiệu 35

Hình 4.9 Kết quả tách từ sau khi hiệu chỉnh biểu thức trong laxers 36

Hình 4.10 Kết quả tách từ của một định dạng ngày tháng năm 36

Hình 4.11 Biểu thức tách ngày tháng năm ban hành của văn bản 37

Hình 4.12 Kết quả tách từ ngày tháng năm sau khi định nghĩa biểu thức 37

Hình 4.13 Cấu trúc tập tin dữ liệu văn bản ban hành trong XML 39

Hình 4.14 Lưu đồ thuật toán kiểm tra căn cứ 40

Hình 4.15 Thuật toán kiểm tra căn cứ 42

Hình 4.16 Giao diện chính của chương trình thực hiện nhiều văn bản 44

Trang 14

PHẦN MỞ ĐẦU

1 Lý do chọn đề tài

Văn bản hành chính là phương tiện không thể thiếu ở các cơ quan hành chính nhà nước, ước tính bình quân mỗi ngày mỗi cơ quan nhà nước ban hành từ 2 đến 5 văn bản

Văn bản hành chính gồm nhiều loại khác nhau như Công văn, Thông báo, Kế hoạch, Quyết định, … Mỗi văn bản thường có từ 2 đến 3 căn cứ pháp lý, tùy thuộc vào nội dung, tính chất của mỗi văn bản mà có căn cứ pháp lý khác nhau nhưng phải đúng và chính xác theo yêu cầu trong quy định soạn thảo văn bản

Khi viện dẫn căn cứ trong văn bản soạn thảo thì vẫn còn xảy ra việc các văn bản viện dẫn đã hết hiệu lực toàn bộ, hoặc không đúng số ký hiệu, tên cơ quan ban hành, trích yếu… những hạn chế, tồn tại nêu trên cho thấy nguyên nhân chủ yếu xuất phát từ năng lực và nhận thức của người soạn thảo văn bản: chưa chọn lọc kỹ càng những văn bản liên quan trực tiếp đến nội dung quyết định quản lý hành chính ban hành; chưa rà soát, cập nhật thường xuyên, kịp thời tình trạng pháp lý (còn hiệu lực hay hết hiệu lực) của văn bản thuộc lĩnh vực phụ trách, theo dõi v.v… [12]

Vì vậy, nghiên cứu giải pháp kiểm tra căn cứ pháp lý của văn bản hành chính

là việc cần thiết trong bối cảnh hiện nay

2 Mục tiêu của đề tài:

- Mục tiêu tổng quát: Xây dựng bộ kiểm tra các căn cứ pháp lý của văn bản hành chính

Trang 15

+ Ứng dụng các thuật toán, giải pháp tách để từ nhận dạng các từ khóa chính như số ký hiệu, ngày ban hành

+ Kiểm tra được nội dung căn cứ pháp lý của văn bản là hợp lệ hay không hợp lệ

3 Nội dung nghiên cứu:

- Tìm hiểu các văn bản hành chính nhà nước còn hiệu lực, phân loại, gom nhóm, xây dựng bộ cơ sở dữ liệu các văn bản quy phạm pháp luật

- Tìm hiểu cấu trúc của văn bản hành chính nhà nước

- Tìm hiểu các công cụ hoặc giải pháp đọc và tách ra các từ trong nội dung của văn bản soạn thảo

- Tìm hiểu kỹ thuật tách từ trong văn bản tiếng Việt để nhận dạng các số ký hiệu, ngày ban hành, tên cơ quan ban hành, … của căn cứ pháp lý

- Ứng dụng kỹ thuật tách từ trên văn bản soạn thảo để xác định được các từ khóa chính của căn cứ như số ký hiệu, ngày ban hành, tên cơ quan ban hành, …

- So sánh từ khóa chính với nội dung trong cơ sở dữ liệu về mức độ khớp nhau để xác định căn cứ đó là hợp lệ hay không hợp lệ

4 Phương pháp nghiên cứu

- Tiến hành thu thập và đọc các tài liệu có liên quan đến đề tài

- Tìm tài liệu bởi các từ khoá Kỹ thuật tách từ trong văn bản tiếng Việt

- Nghiên cứu tổng quan về trích dẫn căn cứ trong văn bản hành chính

- Nghiên cứu kỹ thuật tách từ trong văn bản hành chính tiếng Việt

- Xây dựng chương trình và đánh giá kết quả đạt được

Trang 16

Chương 1: TỔNG QUAN VỀ CĂN CỨ TRONG VĂN BẢN

HÀNH CHÍNH

1.1 Giới thiệu về văn bản hành chính

Văn bản quản lý hành chính nhà nước được hiểu là những văn bản chứa đựng những quyết định và thông tin quản lý do các cơ quan nhà nước ban hành theo thẩm quyền, trình tự, thủ tục, hình thức nhất định nhằm điều chỉnh các mối quan hệ quản lý hành chính nhà nước giữa các cơ quan nhà nước với nhau và giữa các cơ quan nhà nước với các tổ chức và công dân Và như vậy, về mặt nội dung của văn bản: văn bản quản lý nhà nước chứa đựng những quyết định và thông tin quản lý nhà nước

Về mặt chủ thể ban hành văn bản: văn bản quản lý nhà nước do các cơ quan quản lý nhà nước ban hành theo thẩm quyền được Nhà nước quy định Về mặt quy trình ban hành: văn bản quản lý nhà nước được ban hành theo trình tự, thủ tục, hình thức nhất định; Về mặt mục đích: văn bản quản lý nhà nước được ban hành nhằm điều chỉnh các mối quan hệ quản lý hành chính nhà nước giữa các cơ quan nhà nước với nhau và giữa các cơ quan nhà nước với các tổ chức và công dân

Một trong những văn bản hành chính phổ biến trong cơ quan nhà nước thuộc trường học đó là lĩnh vực khen thưởng, nhân sự và đào tạo Hàng năm nhà trường thường xuyên ban hành các loại văn bản như các kế hoạch đào tạo, khen thưởng, hay điều động nhân sự Mỗi văn bản khi soạn thảo để ban hành nếu muốn tăng tính hợp pháp thì thường phải có từ 2 căn cứ trở lên, các căn cứ này thường được trích lọc từ bộ dữ liệu của hàng ngàn văn bản đến và hàng ngàn văn bản đi (do cơ quan ban hành), cho nên việc kiểm tra các căn cứ là điều làm thường xuyên nhưng gặp nhiều khó khăn ở các nhà trường

Văn bản hành chính là loại văn bản mang tính thông tin quy phạm Nhà nước,

cụ thể hóa việc thi hành văn bản pháp quy, giải quyết những vụ việc cụ thể trong khâu quản lý Văn bản hành chính được chia thành 2 loại chính sau:

Trang 17

- Văn bản hành chính cá biệt là phương tiện thể hiện các quyết định quản lý của cơ quan quản lý hành chính nhà nước có thẩm quyền trên cơ sở những quy định chung, quyết định quy phạm của cơ quan nhà nước cấp trên hoặc quy định quy phạm của cơ quan mình nhằm giải quyết các công việc cụ thể Bao gồm: Quyết định

cá biệt; Chỉ thị cá biệt; Nghị quyết cá biệt

- Văn bản hành chính thông thường là những văn bản mang tính thông tin điều hành nhằm thực hiện các văn bản quy phạm pháp luật khác hoặc dùng để giải quyết các công việc cụ thể, phản ánh tình hình, giao dịch, trao đổi, ghi chép công việc trong cơ quan, tổ chức Hệ thống loại văn bản này rất đa dạng và phức tạp, có thể phân thành 2 loại chính:

+ Văn bản không có tên loại: Công văn là văn bản dùng để giao dịch về công việc giữa các cơ quan đoàn thể Đối với loại văn bản này thì ở đầu văn bản không thể hiện tên loại văn bản Đây cũng là cách để phân biệt công văn với loại văn bản hành chính khác

+ Văn bản có tên gọi: Thông báo, báo cáo, biên bản, tờ trình, đề án, chương trình, kế hoạch, hợp đồng, các loại giấy (giấy đi đường, giấy giới thiệu, giấy nghỉ phép, giấy ủy nhiệm,…) các loại phiếu (phiếu gửi, phiếu báo, phiếu trình…) Những văn bản loại này thường thể hiện loại tên gọi cụ thể Ví dụ: Báo cáo; Thông báo; Biên bản

Văn bản hành chính có vai trò chủ yếu là cụ thể hóa văn bản quy phạm pháp luật, hướng dẫn cụ thể các chủ trương, chính sách của nhà nước, hỗ trợ cho quá trình quản lý hành chính nhà nước và thông tin pháp luật

1.2 Soạn thảo văn bản hành chính

Soạn thảo văn bản hành chính được thực hiện theo hướng dẫn của thông tư

số 01/2011/TT-BNV của Bộ Nội vụ về việc Hướng dẫn thể thức và kỹ thuật trình bày văn bản hành chính Trong thông tư có 4 chương và 6 phụ lục quy định đầy đủ

về thể thức soạn thảo một văn bản hành chính được áp dụng đối với các cơ quan nhà nước, tổ chức xã hội, tổ chức xã hội - nghề nghiệp như phạm vi áp dụng, thể

Trang 18

thức, cách trình bày, kỹ thuật trình bày, phông chữ, khổ giấy, và các khoản khác của một văn bản hành chính

Điều đó có nghĩa là văn bản hành chính được trình bày theo khuôn mẫu nhất định, câu chữ được lựa chọn, vị trí các thành phần được sắp xếp theo trật tự cho nên việc phân tích nội dung một văn bản thuộc về văn bản hành chính cũng không quá phức tạp như các văn bản khác

Ví dụ về việc bố trí các thành phần văn bản hành chính theo Phụ lục II 1

Trang 19

Trong đó:

1_ Quốc hiệu

2_ Tên cơ quan, tổ chức ban hành văn bản

3_ Số, ký hiệu của văn bản

4_ Địa danh và ngày, tháng, năm ban hành văn bản

5a_ Tên loại và trích yếu nội dung văn bản

5b_ Trích yếu nội dung công văn

6_ Nội dung văn bản

7a_, 7b_, 7c_ Quyền hạn, chức vụ, họ tên và chữ ký của người có thẩm quyền

8_ Dấu của cơ quan, tổ chức

13_ Ký hiệu người đánh máy và số lượng bản phát hành

14_ Địa chỉ cơ quan, tổ chức; địa chỉ E-Mail; địa chỉ Website; số điện thoại,

số Telex, số Fax

15_ Logo (in chìm dưới tên cơ quan, tổ chức ban hành văn bản)

Tuy nhiên đó là đối với những người soạn thảo đúng quy định, được tập huấn về thể thức văn bản hành chính, còn những người mới vào cơ quan nhà nước

để soạn thảo một văn bản hành chính cũng có nhiều sai sót, chưa thống nhất cho nên để máy tính phân tích nội dung của văn bản hành chính cũng khá khó khăn

1.3 Đề dẫn căn cứ trong văn bản hành chính

Căn cứ pháp lý được xem là cơ sở để kiểm tra tính hợp hiến, hợp pháp, tính thống nhất của văn bản Khi tiến hành kiểm tra một văn bản hành chính, người có thẩm quyền kiểm tra sẽ xem xét nội dung của văn bản được kiểm tra với những văn

Trang 20

bản là căn cứ pháp lý để ban hành văn bản đó làm cơ sở để đối chiếu, so sánh nhằm xác định nội dung của văn bản được ban hành có phù hợp với Hiến pháp, Luật và văn bản quy phạm pháp luật của cơ quan nhà nước cấp trên Trong quá trình kiểm tra văn bản, căn cứ vào những văn bản làm cơ sở pháp lý người có thẩm quyền kiểm tra văn bản tìm hiểu xem văn bản được ban hành đó có căn cứ pháp lý cho việc ban hành không? Trường hợp đối tượng và phạm vi điều chỉnh của văn bản được kiểm tra không đúng với quy định trong các căn cứ pháp lý để ban hành văn bản, điều đó có nghĩa rằng việc quy định nội dung đó là không có căn cứ pháp lý Ví dụ: Quyết định số…của Hiệu trưởng trường Cao Đẳng Kinh Tế Kỹ Thuật Kiên Giang

về việc bổ nhiệm viên chức quản lý

Khi soạn thảo văn bản hành chính phần căn cứ văn bản thường xuyên được

sử dụng nhất khi chúng ta soạn thảo, trong văn bản hành chính có nhiều loại văn bản khác nhau thì phần căn cứ cũng được trình bày theo nhiều cách khác nhau, chúng ta phải dựa vào văn bản đã có để làm căn cứ cho các văn bản soạn thảo

Đối với những văn bản có phần căn cứ pháp lý để ban hành thì sau mỗi căn

cứ phải xuống dòng, cuối dòng có dấu “chấm phẩy”, riêng căn cứ cuối cùng kết thúc bằng dấu “phẩy” 2

“Tùy theo thể loại và nội dung, văn bản có thể có phần căn cứ pháp lý để ban hành” 3

Trường hợp viện dẫn các điều, khoản, điểm của một văn bản cụ thể thì viết hoa chữ cái đầu của điều, khoản, điểm

Ví dụ:

- Căn cứ Điều 10 Bộ luật Lao động…

- Căn cứ Điểm a, Khoản 1, Điều 5 Luật Giao dịch điện tử…4

Vị trí của căn cứ pháp lý trong văn bản hành chính là nằm ở phần đầu văn bản, dưới tiêu đề và trích yếu của văn bản, nhưng trên nội dung của văn bản

2 Khoản 2, Điều 11, thông tư số 01/2011/TT-BNV

3 Điểm b, Khoản 1, Điều 11 thông tư số 01/2011/TT-BNV

4

Khoản 6, Điều 5, thông tư số 01/2011/TT-BNV

Trang 21

Ví dụ về vị trí của các căn cứ trong văn bản nghị định [2]

Căn cứ Luật Tổ chức Chính phủ ngày 25 tháng 12 năm 2001;

Căn cứ Luật Tổ chức Hội đồng nhân dân và Ủy ban nhân dân ngày 26 tháng 11 năm 2003;

Căn cứ Luật Ban hành văn bản quy phạm pháp luật của Hội đồng nhân dân, Ủy ban nhân dân ngày 03 tháng 12 năm 2004;

Căn cứ Luật Ban hành văn bản quy phạm pháp luật ngày 03 tháng 6 năm 2008;

Xét đề nghị của Bộ trưởng Bộ Tư pháp,

NGHỊ ĐỊNH:

Chương I NHỮNG QUY ĐỊNH CHUNG Điều 1 Đối tượng và phạm vi điều chỉnh ….”

Hình 1.2 Viện dẫn căn cứ trong nghị định của Chính Phủ

Trong nghị định trên ta thấy các căn cứ nằm dưới tiêu đề Nghị Định và trên Chương I của nội dung, và đó chính là vị trí của căn cứ trong các văn bản quy phạp pháp luật

Trang 22

Cấu trúc của một căn cứ gồm:

- Đầu ngữ với cụm từ “Căn cứ”

- Căn cứ thiếu nơi ban hành:

“Căn cứ Luật viên chức số 58/2010/QH12 ngày 15 tháng 11 năm 2010;”

1.4 Căn cứ hợp lệ và không hợp lệ

1.4.1 Căn cứ hợp lệ:

Căn cứ pháp lý là cơ sở để xác định việc văn bản đó được ban hành có đúng thẩm quyền không? Điều đó có nghĩa là nội dung quy định trong văn bản đó phải phù hợp với quy định trong các căn cứ pháp lý làm cơ sở để ban hành văn bản đó

Cụ thể trong quá trình kiểm tra người có thẩm quyền kiểm tra văn bản xem xét, đối chiếu, xem nội dung của văn bản được ban hành có phù hợp với quy định pháp luật, quy định của cơ quan nhà nước cấp trên không? Để từ đó đưa ra kết luận về việc văn bản đó được ban hành có đảm bảo tính hợp hiến, hợp pháp hay không?

Theo quy định tại khoản 1 Điều 3 Nghị định số 40/2010/NĐ-CP có nêu:

“1 Ban hành đúng căn cứ pháp lý

a) Có căn cứ pháp lý cho việc ban hành;

b) Những văn bản làm căn cứ pháp lý đó đã được ký ban hành, thông qua vào thời điểm ban hành văn bản được kiểm tra.”

Trang 23

Như vậy, văn bản được ban hành đúng căn cứ pháp lý là văn bản đảm bảo đủ các yêu cầu:

- Có căn cứ pháp lý cho việc ban hành Nghĩa là đã có văn bản quy phạm pháp luật của các cơ quan nhà nước cấp trên quy định về thẩm quyền, chức năng, nhiệm vụ của cơ quan ban hành văn bản và vấn đề thuộc đối tượng, phạm vi điều chỉnh của văn bản, hoặc văn bản do chính cơ quan ban hành văn bản đã ban hành,

có hiệu lực pháp lý cao hơn văn bản mới ban hành quy định về vấn đề thuộc đối tượng, phạm vi điều chỉnh của văn bản mới;

- Những văn bản làm căn cứ pháp lý đó đã được ký ban hành, thông qua vào thời điểm ban hành văn bản được kiểm tra Nghĩa là vào thời điểm ban hành văn bản, các văn bản được lấy làm căn cứ pháp lý đã được ký ban hành và chưa bị sửa đổi, bãi bỏ, huỷ bỏ, đình chỉ (bị ngưng hiệu lực) hoặc hết hiệu lực

1.4.2 Căn cứ không hợp lệ

Căn cứ không hợp lệ là gì? Là những căn cứ vi phạm các điều sau đây:

- Chưa được ban hành hoặc hết hiệu lực ban hành

- Số ký hiệu trích dẫn không đúng với số ký hiệu gốc

- Sai ngày ban hành, tên cơ quan ban hành, hoặc trích yếu văn bản

- Căn cứ không phù hợp với nội dung văn bản

- Căn cứ hết hiệu lực ban hành

Trong luận văn này chúng ta chỉ xét căn cứ không hợp lệ là những căn cứ có

số ký hiệu trích dẫn không đúng, sai ngày ban hành, tên cơ quan ban hành, đặc biệt

là những căn cứ đã hết hiệu lực ban hành, có những căn cứ pháp lý hết hiệu lực một phần và rất khó để xác định được phần nào đã hết hiệu lực cho nên trường hợp đó chúng ta xem căn cứ đó là hợp lệ và đưa ra thông báo cảnh báo đến người dùng

Vậy để kiểm tra căn cứ không hợp lệ chúng ta cần giải quyết 2 vấn đề: Thứ nhất là giải quyết bài toán tách từ trong văn bản, để tách ra các căn cứ trong văn bản soạn thảo, và trong mỗi căn cứ tách ra số ký hiệu, cơ quan ban hành, ngày ban hành và trích yếu của căn cứ đó

Trang 24

Thứ hai là xây dựng bộ dữ liệu văn bản để làm cơ sở kiểm tra căn cứ pháp lý, giả thuyết rằng khi kiểm tra số ký hiệu văn bản làm căn cứ có tồn tại trong bộ dữ liệu này thì số ký hiệu căn cứ đó là hợp lệ Ngược lại thì số ký hiệu căn cứ đó không hợp lệ

1.4.3 Các trường hợp ngoại lệ

Căn cứ pháp lý được viện dẫn trong các văn bản hành chính rất đa dạng, có nhiều nơi căn cứ pháp lý là những chỉ đạo của người đứng đầu đơn vị, hoặc “Xét đề nghị của tại tờ trình số ” [16], hay dựa vào tình trạng thực tế của đơn vị, những căn cứ này chúng ta không thể xác định được tính pháp lý mà đưa vào căn cứ hợp lệ hay không hợp lệ cho nên chúng ta xem xét nó là những trường hợp ngoại lệ

Ngoài ra, khi kiểm tra căn cứ kết quả trả về không tìm thấy trong cơ sở dữ liệu điều đó có 2 nguyên nhân chính: một là người soạn thảo trình bài số hiệu bị lỗi đánh máy hoặc sai số hiệu văn bản dẫn đến không tìm thấy, hai là do bộ dữ liệu văn bản làm cơ sở dữ liệu tra cứu chưa đầy đủ dẫn đến cho dù người soạn thảo viết đúng nội dung căn cứ mà vẫn không được tìm thấy, trong trường hợp này tác giả sẽ đưa

ra cảnh báo “không tìm thấy” cho người sử dụng

Trang 25

Hình 1.3 Lỗi đánh máy khi viện dẫn căn cứ

Trong hình minh họa trên, ta thấy căn cứ Nghị định số “29/2003/ NĐ-CP” người soạn thảo nhập dư ký tự trắng giữa ký tự / và N, cho nên khi máy tính đọc sẽ xem ký tự trắng đó là một ký tự trong số hiệu, và sẽ không tìm thấy văn bản có số hiệu đó trong bộ dữ liệu các văn bản ban hành

Trang 26

Chương 2: PHƯƠNG PHÁP TÁCH TỪ TRONG VĂN BẢN

TIẾNG VIỆT

2.1 Vấn đề tách từ trong văn bản tiếng Việt

Để kiểm tra căn cứ pháp lý có hợp lệ hay không, chúng ta cần phải tách căn

cứ ra từ văn bản soạn thảo, sau đó kiểm tra trong bộ cơ sở dữ liệu căn cứ, nếu căn

cứ đó tồn tại và còn hiệu lực tại thời điểm ban hành thì căn cứ đó hợp lệ

Tách từ trong văn bảng tiếng Việt là một bài toán khó, bởi tiếng Việt là một dạng ngôn ngữ đơn lập, với những đặc tính như sau:

 Từ ở dạng nguyên thể, hình thức và ý nghĩa của từ độc lập với cú pháp

 Từ được cấu trúc từ tiếng

 Từ bao gồm từ đơn và từ phức (bao gồm từ láy và từ ghép)

Trong tiếng Anh và nhiều ngôn ngữ khác, các từ được phân tách với nhau bằng dấu cách Tuy nhiên trong tiếng Việt, dấu cách được dùng để phân tách các tiếng (âm tiết) chứ không phải từ Trong nhiều nghiên cứu khác, bài toán tách từ trong tiếng Việt cho thấy rất nhiều khó khăn, qua đó có nhận xét như sau:

 Tiếng Việt là loại hình phi hình thái nên việc phân loại từ (danh từ, động

từ, tính từ… ) và ý nghĩa từ là rất khó khăn, cho dù có sử dụng từ điển

 Việc tiền xử lý văn bản (tách từ, tách đoạn, tách câu…) sẽ thêm phức tạp với phần xử lý các hư từ, phụ từ, từ láy…

 Phương thức ngữ pháp chủ yếu là trật tự từ nên nếu áp dụng phương pháp tính xác suất xuất hiện của từ có thể không chính xác như mong đợi

 Ranh giới từ không được xác định mặc định bằng khoảng trắng Điều này khiến cho việc phân tích hình thái (tách từ) tiếng Việt trở nên khó khăn Việc nhận diện ranh giới từ là quan trọng và làm tiền đề cho các xử lý tiếp theo sau đó, như: kiểm tra lỗi chính tả, gán nhãn từ loại, thống kê tần suất từ

 Vì tiếng Anh và tiếng Việt có những điểm khác biệt nên chúng ta không thể áp dụng y nguyên các thuật toán tiếng Anh cho tiếng Việt

Trang 27

2.2 Các hướng tiếp cận kỹ thuật tách từ tiếng Việt

Dựa vào các kỹ thuật tách từ của tiếng Hán, và những điểm tương đồng giữa tiếng Việt và tiếng Hán Chúng ta có thể xây dựng sơ đồ các hướng tiếp cận của kỹ thuật tách từ tiếng Việt, dưới đây là kết quả khảo sát của Foo và Li [9] về tách từ trong văn bản tiếng Hoa:

Hình 2.1 Sơ đồ các hướng tiếp cận của kỹ thuật tách từ tiếng Hoa

2.2.1 Hướng tiếp cận dựa trên từ

Hướng tiếp cận dựa trên từ với mục tiêu tách được các từ hoàn chỉnh trong câu Hướng tiếp cận này có thể chia ra theo 3 hướng : dựa trên thống kê (statistics - based), dựa trên từ điển (dictionary – based) và hydrid (kết hợp nhiều phương pháp)

Hybrid

Vietnamese segmentation

Full word/ Phrase Component

Shortest Match Longest Match Overlap Match

Trang 28

Hướng tiếp cận dựa trên thống kê (statistic-based): dựa trên các thông tin như tần số xuất hiện của từ trong tập huấn luyện ban đầu

Hướng tiếp cận dựa trên từ điển (dictionary- based): ý tưởng của hướng tiếp cận này là những cụm từ được tách ra từ văn bản phải được so khớp với các từ trong

từ điển

Tùy thuộc vào loại từ điển sử dụng để so khớp lại có 2 hướng tiếp cận : full word/ pharse và component Trong đó full word/ pharse cần sử dụng một từ điển hoàn chỉnh Còn component thì sử dụng từ điển thành phần

Tùy theo cách chọn so khớp từ (match) hướng tiếp cận ‘full word/ pharse’ có thể chia ra làm 3 loại: so khớp dài nhất (longest match), so khớp ngắn nhất (shortest match) và so khớp kết hợp (overlap) Trong so khớp kết hợp mỗi chuỗi được phát sinh từ văn bản có thể chồng lấp lên chuỗi khác nếu chuỗi đó có trong từ điển

Hiện nay thì hướng tiếp cận so khớp dài nhất được xem là phương pháp quan trọng và có hiệu quả nhất trong hướng tiếp cận dựa trên từ điển

Hướng tiếp cận hybrid: Với mục đích kết hợp các hướng tiếp cận khác nhau

để thừa hưởng được các ưu điểm của nhiều kỹ thuật và các hướng tiếp cận khác nhau nhằm nâng cao kết quả Hướng tiếp cận này thường kết hợp giữa hướng dựa trên thống kê và dựa trên từ điển nhằm tận dụng các mặt mạnh của các phương pháp này Tuy nhiên hướng tiếp cận Hybrid lại mất nhiều thời gian xử lý , không gian đĩa

và đòi hỏi nhiều chi phí

2.2.2 Hướng tiếp cận dựa trên ký tự

Trong tiếng Việt, hình vị nhỏ nhất là “tiếng” được hình thành bởi nhiều ký tự trong bảng chữ cái Hướng tiếp cận này đơn thuần rút trích ra một số lượng nhất định các tiếng trong văn bản như rút trích từ 1 ký tự (unigram) hay nhiều ký tự (n-gram) và cũng mang lại một số kết quả nhất định được minh chứng thông qua một

số công trình nghiên cứu đã được công bố, như của tác giả Lê An Hà xây dựng tập ngữ liệu thô 10MB bằng cách sử dụng phương pháp qui hoạch động để cựa đại hóa xác suất xuất hiện của các ngữ Rồi công trình nghiên cứu của H Nguyễn làm theo hướng tiếp cận là thay vì sử dụng ngữ liệu thô, công trình tiếp cận theo hướng xem

Trang 29

Internet như một kho ngữ liệu khổng lồ, sau đó tiến hành thống kê và sử dụng thuật giải di truyền để tìm cách tách từ tối ưu nhất , và một số công trình của một số tác giả khác Khi so sánh kết quả của tác giả Lê An Hà và H.Nguyễn thì thấy công trình của H.Nguyễn cho được kết quả tốt hơn khi tiến hành tách từ , tuy nhiên thời gian

xử lý lâu hơn Ưu điểm nổi bật của hướng tiếp cận dựa trên nhiều ký tự là tính đơn giản, dễ ứng dụng, ngoài ra còn có thuận lợi là ít tốn chi phí cho thao tác tạo chỉ mục và xử lý nhiều câu truy vấn Qua nhiều công trình nghiên cứu của các tác giả

đã được công bố, hướng tiếp cận tách từ dựa trên nhiều ký tự, cụ thể là cách tách từ hai ký tự được cho là sự lựa chọn thích hợp

2.3 Một số phương pháp tách từ tiếng Việt

2.3.1 So khớp từ dài nhất (Longest Matching)

Longest Matching là thuật toán dựa trên tư tưởng tham lam Nó xét các tiếng

từ trái qua phải, các tiếng đầu tiên dài nhất có thể mà xuất hiện trong từ điển sẽ được tách ra làm một từ Thuật toán sẽ dừng khi xét hết các tiếng Thuật toán chỉ đúng khi không có sự nhập nhằng những tiếng đầu của từ sau có thể ghép với từ trước tạo thành một từ có trong từ điển

Wmax= từ đầu danh sách V; // từ dài nhất

Foreach (v thuộc từ gồm các tiếng bắt đầu trong V)

If(length(v)> length(Wmax) and v thuộc T) then Wmax= v;

Loại đi các tiếng trong W max ở đầu danh sách V;

End

Trang 30

Ví dụ : Tôi là sinh viên trường Đại học Hutech

Bước Từ dài nhất có thể Các tiếng còn lại

Ưu điểm:

- Tách từ nhanh đơn giản chỉ cần dựa vào từ điển

- Độ chính xác tương đối cao

2.3.2 Học dựa trên sự cải biến

Đây là cách tiếp cận dựa trên ngữ liệu đã đánh dấu Theo cách tiếp cận này,

để huấn luyện cho máy tính biết cách nhận diện ranh giới từ tiếng Việt, ta có thể cho máy “học” trên ngữ liệu hàng vạn câu tiếng Việt đã được đánh dấu ranh giới từ đúng

Sau khi học xong, máy sẽ xác định được các tham số (các xác suất) cần thiết cho

mô hình nhận diện từ

Ưu điểm:

- Đặc điểm của phương pháp này là khả năng tự rút ra quy luật của ngôn ngữ

Ngày đăng: 14/04/2021, 13:11

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[4] Nguyễn Việt Cường (2006), “Sử dụng các khái niệm mờ trong biểu diễn văn bản và áp dụng vào bài toán phân lớp văn bản”, luận văn tốt nghiệp đại học, trường Đại học Công nghệ, Đại học Quốc gia Hà Nội Sách, tạp chí
Tiêu đề: Sử dụng các khái niệm mờ trong biểu diễn văn bản và áp dụng vào bài toán phân lớp văn bản
Tác giả: Nguyễn Việt Cường
Năm: 2006
[6] Nguyễn Việt Bình (2004), “Dùng lý thuyết tập thô và các kỹ thuật khác để phân loại, phân cụm văn bản tiếng Việt”, Kỷ yếu hội thảo ICT.rda’04. Hà Nội Sách, tạp chí
Tiêu đề: Dùng lý thuyết tập thô và các kỹ thuật khác để phân loại, phân cụm văn bản tiếng Việt
Tác giả: Nguyễn Việt Bình
Năm: 2004
[11] Nguyễn Thị Vân Anh (2016). Căn cứ pháp lý - Cơ sở để kiểm tra văn bản quy phạm pháp luật [online], truy cập ngày 01/04/2017, từhttp://sotuphap.namdinh.gov.vn/so-tu--phap/1222/28300/39090/68786/xay-dung---kiem-tra-van-ban-quy-pham-phap-luat/can-cu-phap-ly---co-so-de-kiem-tra-van-ban-quy-pham-phap-luat.aspx Link
[12] Bộ tư pháp (2015). Căn cứ pháp lý - Cơ sở để kiểm tra văn bản quy phạm pháp luật [online], truy cập ngày 16/4/2017, từhttp://ktvb.moj.gov.vn/qt/tintuc/Pages/nghien-cuu-trao-doi.aspx?ItemID=10 Link
[13] Nguyen Van Hai (2015), Vietnamese Natural Language Processing [online], truy cập 14/4/2017, từ http://viet.jnlp.org/ Link
[14] Lưu Tuấn Anh, Yamamoto Kazuhide (2012) [online], truy cập ngày 14/5/2017, từ http://viet.jnlp.org/dongdu Link
[15] Cục Công nghệ thông tin - Bộ Tư pháp (2013). Cơ sở dữ liệu quốc gia về văn bản pháp luật [online], truy cập ngày 15/3/2017, từ http://vbpl.vn/pages/portal.aspx[16] Ths. NCS Nguyễn Mạnh Cường (2013), Trao đổi về cách viện dẫn các căn cứ ban hành trong một số quyết định (cá biệt) hiện nay [online], truy cập ngày15/6/2017, từ http://www.netc- Link
[1] Bộ Tư pháp (2010), Thông tư của Bộ Tư pháp quy định chi tiết thi hành một số điều của Nghị định số 40/2010/NĐ-CP ngày 12/04/2010 của Chính phủ về kiểm tra và xử lý văn bản quy phạm pháp luật, 20/2010/TT-BTP. Toàn quốc Khác
[2] Chính phủ (2010), Nghị định của chính phủ về việc kiểm tra và xử lý văn bản quy phạm pháp luật, 40/2010/NĐ-CP. Toàn quốc Khác
[3] Đỗ Phúc (2006), ‘Nghiên cứu ứng dụng tập phổ biến và luật kết hợp vào bài toán phân loại văn bản tiếng Việt có xem xét ngữ nghĩa’, Tạp chí phát triển KH&CN, tập 9, số 2, pp.23-32 Khác
[5] Chính phủ (2011), Thông tư của Bộ Nội vụ về hướng dẫn thể thức và kỹ thuật trình bày văn bản hành chính, 01/2011/TT-BNV. Toàn quốc Khác
[7] Nguyễn Minh Thuyết, Nguyễn Văn Hiệp (2004), Thành phần câu tiếng Việt, Nhà xuất bản Giáo dục, Việt Nam Khác
[8] Lưu Tuấn Anh (2012). Ứng dụng phương pháp Pointwise vào bài toán tách từ cho tiếng Việt.Tiếng Anh Khác
[9] Foo S., Li H, Chinese Word Segmentation and Its Effect on Information Retrieval, Information Processing & Management: An International Journal, 40(1), 2004, pp161-190.Tài liệu Internet Khác
[10] GS. Hồ Tú Bảo (2014). Xử lí văn bản tiếng Việt thuộc đề tài KC01.01/06-10 "Nghiên cứu phát triển một số sản phẩm thiết yếu về xử lí tiếng nói và văn bản tiếng Khác

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w