Bài toán biểu diễn ngữ nghĩa của ngôn ngữ tự nhiên đã được các nhà khoa học trên thế giới nghiên cứu từ nhiều thập kỷ trước, đầu tiên phải kể đến đó là công trình của Montague 1974 về ng
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
NGUYỄN VĂN HƯNG
NGHIÊN CỨU TÍCH HỢP THÀNH PHẦN NGỮ NGHĨA VÀO VĂN PHẠM
TAG CHO TIẾNG VIỆT
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – Năm 2014
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
NGUYỄN VĂN HƯNG
NGHIÊN CỨU TÍCH HỢP THÀNH PHẦN NGỮ NGHĨA VÀO VĂN PHẠM
TAG CHO TIẾNG VIỆT
Chuyên ngành: Cơ sơ toán học cho tin học
Mã số: 60460110
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS NGUYỄN THỊ MINH HUYỀN
Hà Nội – Năm 2014
Trang 31
Lời cảm ơn
Trong quá trình thực hiện luận văn này cũng như trong suốt quá trình học lớp cao học Cơ sở toán học cho tin học, em đã nhận được sự chỉ bảo, hướng dẫn tận tâm của TS Nguyễn Thị Minh Huyền Em xin tới cô lời cảm ơn chân thành sâu sắc nhất
Ngoài ra, em cũng xin gửi lời cảm ơn tới các thầy giáo, cô giáo, các cán bộ, nhân viên trong khoa Toán- Cơ- Tin học, trong trường đại học Khoa học tự nhiên, Đại học Quốc gia Hà Nội đã tận tình dạy dỗ và giúp đỡ em trong suốt quá trình học tập
Nhân dịp này, em cũng xin gửi lời cảm ơn tới gia đình, bạn bè đã động viên, khuyến khích và tạo điều kiện cho em trong quá trình học tập và quá trình thực hiện luận văn này
Do hạn chế về kiến thức, kinh nghiệm, thời gian tìm hiểu, thực hiện đặc biệt
là việc chưa có một hiểu biết hệ thống về ngữ pháp, ngữ nghĩa nên luận văn chắc chắn còn nhiều hạn chế, thiếu sót Em rất mong sẽ nhận được nhiều ý kiến đóng góp của thầy, cô và các bạn để em có được cái nhìn sâu sắc hơn về vấn đề này
Hà Nội, tháng 12 năm 2014
Học viên
Nguyễn Văn Hưng
Trang 42
MỤC LỤC
MỞ ĐẦU 4
Chương 1- KIẾN THỨC CƠ SỞ 6
1.1 Văn phạm kết nối cây TAG 6
1.1.1 Giới thiệu về TAG 6
1.1.2 Định nghĩa hình thức của văn phạm TAG 6
1.1.3 Các thao tác trong văn phạm TAG 7
1.1.4 Cây dẫn xuất trong văn phạm kết nối 9
1.1.5 Cấu trúc đặc trưng TAG 11
1.2 Phân tích cú pháp tiếng Việt 12
1.2.1 Danh ngữ 12
1.2.2 Động từ 14
1.2.3 Tính từ 18
1.3 Biểu diễn ngữ nghĩa bằng logic vị từ cấp một 27
1.3.1 Biểu diễn ngữ nghĩa 27
1.3.2 Phân tích cú pháp và biểu diễn ngữ nghĩa 30
1.3.3 Kết hợp tính toán lambda trong biểu diễn ngữ nghĩa 31
Chương 2- TÍCH HỢP NGỮ NGHĨA CHO VĂN PHẠM TAG 34
2.1 Giới thiệu 34
2.2 Giao diện cú pháp/ngữ nghĩa dựa trên phép hợp nhất với TAG 35
2.3 Văn phạm và siêu văn phạm: khai thác thành phần thông tin chung 38
2.4 Cây phân tích và xây dựng ngữ nghĩa 46
2.5 Rừng dẫn xuất, từ vựng ngữ nghĩa và xây dựng ngữ nghĩa 46
Chương 3- XÂY DỰNG VĂN PHẠM TAG CÓ TÍCH HỢP NGỮ NGHĨA CHO TIẾNG VIỆT 54
3.1 Công cụ TULIPA và XMG 54
3.2 Dữ liệu đầu vào 54
3.3 Thực nghiệm 59
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 62
Trang 53
DANH MỤC CÁC HÌNH
Hình 1.1: Mô tả cây phụ trợ 7
Hình 1.2: Cây phụ trợ 7
Hình 1.3: Cây khởi tạo 7
Hình 1.4 Mô tả phép nối cây 8
Hình 1.5: Phép nối cây 8
Hình 1.6: Mô tả phép thế 9
Hình 1.7: Phép thế 9
Hình 1.8: Cây dẫn xuất trong CFG 9
Hình 1.9: Cây dẫn được của TAG 10
Hình 1.10: Cây dẫn xuất 11
Hình 1.11: Cấu trúc đặc trưng với phép nối 11
Hình 1.12: Cấu trúc đặc trưng với phép thế 12
Hình 2.1- Mô tả ngữ nghĩa câu John loves Mary 37
Hình 2.2 Các cây cơ sở TAG bao gồm ngữ nghĩa 47
Hình 2.3 Cây dẫn xuất TAG bao gồm ngữ nghĩa 48
Hình 2.4 Cây dẫn xuất cho câu Jean court (Jean chạy) 49
Hình 3.1:Kết quả phân tích cú pháp/ngữ nghĩa câu “An thích Bình” 60
Hình 3.2:Kết quả phân tích cú pháp/ngữ nghĩa câu “Một cơn gió bất ngờ ào đến” 61
Trang 64
MỞ ĐẦU
Để máy tính hiểu và xử lý được ngôn ngữ của con người là một bài toán khó trong ngành khoa học máy tính Lĩnh vực xử lý ngôn ngữ tự nhiên (natural language processing – NLP) ra đời nhằm giải quyết vấn đề này Các bài toán và ứng dụng nổi bật của lĩnh vực xử lý ngôn ngữ tự nhiên như: Nhận dạng chữ viết, nhận dạng giọng nói, dịch tự động, tìm kiếm thông tin, … đã thu được nhiều thành tựu nhất định Các bước để xử lý ngôn ngữ tự nhiên gồm: phân tích hình thái, phân tích cú pháp, phân tích ngữ nghĩa, phân tích ngữ dụng Trong đó phân tích ngữ nghĩa là một trong những bước xử lý khó khăn nhất bởi nó liên quan đến việc hiểu ý nghĩa của ngôn ngữ - công cụ hoàn hảo của tư duy và giao tiếp
Bài toán biểu diễn ngữ nghĩa của ngôn ngữ tự nhiên đã được các nhà khoa học trên thế giới nghiên cứu từ nhiều thập kỷ trước, đầu tiên phải kể đến đó là công trình của Montague (1974) về ngữ nghĩa hình thức, trong đó các quy tắc ngữ pháp được kết hợp đồng thời với các quy tắc ngữ nghĩa để xây dựng không chỉ cây cú pháp mà cả hạng thức lambda biểu diễn nghĩa của thành phần cú pháp Cho đến nay các nhà khoa học đã có nhiều bước tiến quan trọng trong việc xây dựng các mô hình
để biểu diễn và tính toán ngữ nghĩa của các phần văn bản, đi từ cấp độ từ vựng tới cấp độ ngữ, cấp độ câu và rộng hơn là cấp văn bản
Các công trình nghiên cứu về xử lý ngôn ngữ tự nhiên cho tiếng Việt trong những năm gần đây đã đạt được nhiều thành quả nhất định Tuy nhiên phần lớn mới chỉ tập trung vào các bài toán phân tích từ vựng, phân tích cú pháp Với các kết quả
đã đạt được về xử lí từ vựng và cú pháp, đây là lúc cần đầu tư cho các nghiên cứu
về xử lí ngữ nghĩa tiếng Việt Luận văntập trung nghiên cứu về tích hợp thành phần ngữ nghĩa vào văn phạm TAG cho tiếng Việt
Cấu trúc luận văn được trình bày như sau:
Chương 1: Kiến thức cơ sở: Trong chương này, luận văn giới thiệu
các kiến thức cơ sở phục vụ cho công việc tích hợp thành phần ngữ nghĩa như văn phạm TAG, phân tích cú pháp tiếng việt, biểu diễn ngữ nghĩa bằng logicvị từ cấp một
Trang 75
Chương 2: Tích hợp ngữ nghĩa vào văn phạm TAG: Chương này
nghiên cứu phương pháp xây dựng ngữ nghĩa vào trong văn phạm TAG
Chương 3: Xây dựng văn phạm TAG có thành phần ngữ nghĩa cho
tiếng Việt: Chương này nghiên cứu sử dụng công cụ TULIPA để tích hợp thành phần ngữ nghĩa vào văn phạm TAG, xây dựng văn phạm TAG có thành phần ngữ nghĩa cho tiếng Việt và đưa ra các kết quả thực nghiệm đối với một số câu tiếng Việt cụ thể
Kết luận: Phần này tóm tắt lại nội dung của luận văn và đưa ra hướng
phát triển của luận văn
Trang 86
Chương 1- KIẾN THỨC CƠ SỞ
Chương này diễn giải về các kiến thức cần thiết cho việc xử lý ngữ nghĩa Các kiến thức cơ sở bao gồm: văn phạm kết nối cây TAG, phân tích cú pháp tiếng Việt và thảo luận về phương pháp biểu diễn ngữ nghĩa bằng logicvị từ cấp một
1.1 Văn phạm kết nối cây TAG
1.1.1 Giới thiệu về TAG
Văn phạm kết nối cây (Tree Adjoining Grammar-TAG[4]) được đưa ra bởi Joshi, Levy và Takahashi (1975), Joshi (1985) TAG thao tác với các đối tượng cơ bản là các đối tượng có cấu trúc (cây) chứ không phải là các xâu Việc sử dụng các đối tượng có cấu trúc cho phép xây dựng các hệ hình thức có khả năng sinh mạnh tức là cho phép sinh các mô tả cấu trúc Các hệ hình thức như thế thích hợp với các
mô tả ngôn ngữ học hơn là các hệ hình thức có khả năng sinh yếu, tức là chỉ sinh ra tập các xâu
Cây cơ bản biểu diễn những cấu trúc tương ứng với các đơn vị ngôn ngữ học
Có hai loại cây cơ bản:
o Cây khởi tạo: tương ứng với cấu trúc gồm các thành phần bắt buộc của câu
o Cây phụ trợ: tương ứng với cấu trúc cho phép thêm vào các thành phần phụ của câu
1.1.2 Định nghĩa hình thức của văn phạm TAG
Văn phạm TAG là một bộ năm (∑, N, I, A, S) trong đó:
- ∑: tập các ký hiệu kết thúc (bảng chữ cái chính)
- N: tập các ký hiệu không kết thúc (bảng chữ cái phụ)
- I: tập các cây “khởi tạo” (initial trees)
- A: tập các cây “phụ trợ” (auxiliary trees)
- S: tiên đề, S N
Trang 97
Cây trong văn phạm là các cây mà mỗi nút được đánh dấu bằng một ký hiệu
(kết thúc hoặc không kết thúc)
Cây phụ trợ: cây có chứa một nút lá trùng tên (cùng phân loại) với nút gốc,
nút lá này được ký hiệu với một dấu * bên cạnh và được gọi là nút chân của cây phụ
trợ (xem Hình 1.1)
Ví dụ cây phụ trợ (xem Hình 1.2):
Ví dụ cây khởi tạo (xem Hình 1.3):
1.1.3 Các thao tác trong văn phạm TAG
Thao tác cơ bản trong văn phạm TAG gồm: phép nối cây (adjoining) và phép
S NP↓ VP
sớm
VP ADV VP*
Trang 108
Phép nối có thể mô tả bằng hình vẽ sau (xem Hình 1.4):
Ví dụ (xem Hình 1.5):
Các ràng buộc đối với phép nối:
- Với mỗi nút bất kỳ chỉ được thực hiện tối đa một phép nối
- Phép nối không phải là thao tác bắt buộc
- Các nút chân đều là các nút cấm thực hiện phép nối
- Ngoài các nút chân, thêm ký hiệu NA cho nút cấm mà ở đó phép nối bị cấm
VP VP* ADJ
sớm
S NP↓ VP
V NP↓
ăn
S NP↓ VP
VP ADJ
V NP↓
ăn
sớm (α3)
Trang 119
b Phép thế
Các nút tại đó thực hiện phép thế được bổ sung thêm ký hiệu ↓ (xem Hình
1.9):
Phép thế là bắt buộc tại các nút có ký hiệu thế Tất cả các cây có gốc là A có
thể thế vào nút A↓ Ví dụ (xem Hình 1.7):
1.1.4 Cây dẫn xuất trong văn phạm kết nối
Đối với văn phạm phi ngữ cảnh, cho một cây dẫn được ở một thời điểm là đủ
để xác định ngay các quy tắc dẫn xuất đã thực hiện Ví dụ cho cây (xem Hình 1.8)
S NP↓ VP
Hình 1.8: Cây dẫn xuất trong CFG
Trang 12(α2)
V
Hình 1.9: Cây dẫn được của TAG
Trang 1311
Vì vậy đối với TAG phải có thêm cây mô tả dẫn xuất, trên đó ghi lại các thao
tác đã thực hiện để sinh ra cây dẫn được
Khái niệm cây dẫn xuất:
- Mỗi nút lá của cây là tên một cây cơ sở
- Các cung trên cây được đặt ký hiệu bằng tên thao tác đã thực hiện và tên
nút của cây cơ sở mà trên đó đã thực hiện thao tác
Ví dụ (xem Hình 1.10):
1.1.5 Cấu trúc đặc trƣng trong văn phạmTAG
Cấu trúc đặc trưng trong văn phạm TAG là các thuộc tính trong các nút của cây Cấu trúc đặc trưng được sử dụng để thực hiện phép nối (hình 1.11) hoặc phép thế (hình 1.12) trên cây
Trong TAG, mỗi nút cây kết hợp với hai cấu trúc đặc trưng được gọi là đỉnh (top) và đáy (bottom) Cấu trúc đặc trưng đỉnh mã hóa thông tin cần thiết để ghép nối cây mà phép nối được thực hiện trên đó trong khi đáy mã hóa thông tin mà vị trí còn lại cho nút mà phép nối thực hiện trên đó (xem hình 1.11) Phép hợp nhất được liệt kê như trong hình 1.13
(α3)
(β2) (adj,2)
(α2)
(α3)
(sub,1 )
(α1 )
Trang 1412
Hình 1.12: Cấu trúc đặc trưng với phép thế
- Phép nối tại nút X với đặc trưng đỉnh tX và đặc trưng đáy bX, của cây phụ trợ với đặc trưng đỉnh gốc r và đặc trưng đáy chân f kéo theo phép hợp nhất của tX với r và bX với f
- Phép thế tại nút X với đặc trưng đỉnh tX và đặc trưng đáy bX, của một cây với đặc trưng đỉnh gốc t và đặc trưng đáy chân b kéo theo phép hợp nhất của tX với t và của bX với b
- Kết thúc của một dẫn xuất, đặc trưng đỉnh và đáy của tất cả các nút trong
cây dẫn xuất được hợp nhất
1.2 Phân tích cú pháptiếng Việt
Phân tích cú pháp là phân tích thành phần cấu tạo ngữ pháp của câu Câu chính là đơn vị lớn nhất của mặt cấu trúc trong tổ chức ngữ pháp của một ngôn ngữ Trong phần này luận văn tập trung trên những vấn đề sau đây: Danh ngữ, câu có động từ làm trung tâm, câu có tính từ làm trung tâm, thể hiện bằng văn phạm hình thức TAG
1.2.1 Danh ngữ
Loại ngữ do danh từ làm chính tố gọi là danh ngữ Xét về mặt nghĩa, trong
danh ngữ các phụ tố tạo nên nghĩa có tính xác định của chính tố Nhưng các phụ tố
có thể được lược bớt và ngữ chỉ còn có chính tố mà vẫn có tính xác định Đó là trường hợp danh ngữ làm phần đề trong nòng cốt N = a+b
Trang 1513
Cấu trúc đầy đủ của danh ngữ trong Tiếng việt có trật tự như sau:
C1 C2 C3 N1 N2 C4 C5
Trong đó:
C1 là phụ tố tổng thể như tất cả, hết thảy, toàn bộ
C2 là phụ tố số lượng như những, các, ba, bốn
C3 là phụ từ tình thái (trợ từ) cái Ví dụ: cái quyển sách này
N1 là từ loại thể (loại từ) như quyển, cuốn
N2 là từ chính có thể do nhiều loại danh từ đảm nhiệm
năm [C2 ] quyển [N1] cũ [C4] này [C5]
Cấu trúc có thể có của danh ngữ được cho trong bảng sau:
P
(C1)
D/M (C2)
N1 N2 N/V/A/M/OP
(C4)
P (C5)
Trang 16Cấu trúc đầy đủ của danh từ ngữ được mô tả như hình sau:
con mèo đen của nhà bạn Nam (mà) tôi mới xin hôm qua ấy
Trang 1715
Động từ có một vai trò quan trọng cấu trúc nghĩa miêu tả của câu (nghĩa phản ánh thực tại khách quan) Trong phần này luận văn sẽ tìm hiểu chi tiết hơn cấu trúc câu với hạt nhân là động từ và các diễn tố tạo nên
1.2.2.1 Phân loại động từ
Có thể phân loại động từ theo những tiểu loại sau đây:
1 Động từ ngoại động: chỉ những hoạt động có bắc cầu sang sự vật ở ngoài
nó Ví dụ: ăn, viết, đọc, xây dựng…Cần phải có phụ tố chỉ đối tượng mới đủ nghĩa,
ví dụ: ăn bánh, viết thư, xây dựng chủ nghĩa xã hội…
2 Động từ nội động: chỉ những hoạt động không bắc cầu sang sự vật ở ngoài
nó Ví dụ: ngủ, tắm, cười, chạy, bay, làm lụng, nghỉ ngơi… Không nhất thiết phải
có phụ tố chỉ đối tượng của hoạt động, ví dụ: chim bay, em bé đang ngủ…
3 Động từ cảm nghĩ: chỉ những hoạt động như nghĩ ngợi, nhận biết, thụ cảm
Ví dụ: nghe, biết, tin, yêu, nhớ, nghi ngờ… Cần phụ tố chỉ đối tượng, ví dụ: nghe
nhạc, tin người, nhớ quê hương…, có thể dùng them các phụ tố chỉ mức độ ở phía
trước, ví dụ: rất yêu nước, rất biết lẽ phải…
4 Động từ phương hướng: chỉ những hoạt động có bao hàm phương hướng
Ví dụ: ra, vào, lên, xuống… Không cần phụ tố hoặc có thể them phụ tố để chỉ rõ cái đích của hoạt động, ví dụ: khách vào, khách vào nhà nghỉ…
5 Động từ tồn tại: chỉ trạng thái tồn tại của sự vật Ví dụ: có, còn, hết, mất…
Cần phụ tố chỉ sự tồn tại, ví dụ: còn tiền, hết đạn, mất sách…
6 Động từ biến hoá: chỉ trạng thái biến hoá của sự vật Ví dụ: hoá, thành, nên, trở thành… Cần phụ tố để chỉ kết quả biến hoá, ví dụ: đã nên người, đã trở thành tốt…
7 Động từ ý chí: chỉ trạng thái ý chí Ví dụ: muốn, quyết, dám, toan, định…
Cần phụ tố chỉ nội dùng ý chí, ví dụ: dám nghĩ, toan nói, muốn nghỉ ngơi…
8 Động từ tiếp thụ: chỉ trạng thái tiếp thụ Ví dụ: bị, phải, được… Cần phụ
tố chỉ sự vật tiếp thụ, ví dụ: bị mắng, phải gió, được thưởng…
9 Động từ so sánh: chỉ các trạng thái so sánh Ví dụ: bằng, hơn, kém, thua…
Cần có phụ tố chỉ đối tượng so sánh, ví dụ: bằng nhau, thua bạn, hơn người…
10 Động từ là: có tính chất đặc biệt
Trang 1816
1.2.2.2 Thứ tự các đối
Theo tài liệu “Cơ sở tiếng Việt” của Hữu Đạt, Trần Trí Dõi, Đào Thanh Lan [1]: Khi nghiên cứu về cấu trúc nghĩa miêu tả của câu (nghĩa phản ánh những mảng của thực tại khách quan), nhà ngôn ngữ học L.Tesniere đề xuất ra cấu trúc vị từ - tham thể Ông cho rằng cấu trúc câu xoay quanh vị từ (vị từ là trung tâm, hạt nhân của cấu trúc Các thành tố bổ sung nghĩa cho vị từ là những thực thể tham gia vào cấu trúc được gọi là tham thể (hay đối) Ở bình diện cấu trúc, các tham thể đó gọi là diễn tố - những yếu tố tham gia vai diễn trong vở kịch nhỏ có động từ làm trung tâm) Ngữ nghĩa của vị từ quy định số lượng các diễn tố Vị từ có một diễn tố gọi là
vị từ đơn trị Vị từ có hai diễn tố gọi là vị từ song trị Vị từ có ba diễn tố gọi lầ vị từ
- Tôi viết thư
- Nam nhớ người yêu
Động từ có ba tham thể
- Nam tặng hoa người yêu
- Tôi vay tiền ngân hàng
Chi tiết về thứ tự các đối của động từ dưới dạng cấu trúc tham khảo trong phần 2.1 của phụ lục
1.2.2.3 Khả năng lƣợc bỏ các đối
Trong hoàn cảnh nhất định có những phụ tố có thể được lược bỏ mà không ảnh hưởng đến ngữ nghĩa của câu Các phụ tố đó đã được nhắc đến ở câu nói trước đó
Khi động từ ngoại động làm trung tâm của câu, trong nhiều trường hợp
có thể không cần phụ tố chỉ đối tượng của hoạt động
Ví dụ: Cậu ăn cơm chưa ? Tôi đang ăn
Trang 1917
Khi động từ cảm nghĩ làm trung tâm của câu, có trường hợp không cần phụ tố chỉ đối tượng
Ví dụ: Lâu rồi không về quê, tôi rất nhớ
Khi động từ tồn tại làm trung tâm của câu, có trường hợp không cần phụ
Ba và Lan cũng đều học giỏi như Tuấn
Ba và Lan đều cũng học giỏi như Tuấn
Ngoài ra còn có các cụm: vẫn cứ còn, vẫn còn cứ, cứ vẫn còn
3 Nếu chính tố là động từ cảm nghĩ thì phụ tố trước có thể là phụ tố mức độ
Ví dụ:
Tôi rất tin bạn
Trang 20thấy những loại phụ tố khác nhau sau đây:
- Phụ tố thời gian, nơi chốn, phương tiện
- nói nhanh, làm việc với tinh thần trách nhiệm cao
Chi tiết về phụ tố trước và phụ tố sau của câu có động từ làm trung tâm tham khảo phần 2.2 của phụ lục
Trang 2119
pháp khác trong câu quay quần xung quanh vị tố Vị tố gắn bó với các yếu tố xung quanh nó theo những mức độ khác nhau, và trên cơ sở đó mà phân định những lớp yếu tố xét theo mối quan hệ với các chức năng cú pháp trong câu: các yếu tố nằm trong cấu trúc ngữ pháp của câu và trực tiếp diễn đạt sự thể, các yếu tố không nằm trong cấu trúc ngữ pháp và nhìn chung không diễn đạt sự thể trong câu chứa chúng
Đối với lớp tính từ, các vấn đề thường được nhắc đến là phân biệt những lớp con dưới đây:
- Ý nghĩa về các loại phẩm chất như ở các từ tốt, xấu, đẹp, vụng, trơn, nhám,
sạch,bẩn, trong, đục, tầm thường, quan trọng, đúng, sai, phải, trái…
- Ý nghĩa về lượng thuộc nhiều phương diện như mật độ, độ dài, trọng lượng,
hình dạng, màu sắc, âm thanh, mùi vị… như ở các từ nhiều, ít, đông, thưa, ngắn,
dài, to, nhỏ, béo, gầy, cao, thấp, sâu, cạn, nhanh, chậm, nặng, nhẹ…; méo, tròn, ngay, lệch, thẳng, cong, nhọn, cùn…; xanh, đỏ, vàng, tím…; vang, dội, ồn, lặng,
trầm, bổng…; thơm, nồng, cay…
2 Tính từ quan hệ
Tính từ quan hệ là tính từ mà ý nghĩa chỉ tính chất của chúng được vay mượn
ở ý nghĩa thực thể của danh từ và chấp nhận sự đo đạc ở phương diện thang độ
thong qua từ rất chứng tố Số lượng tính từ quan hệ ở tiếng Việt không lớn, chỉ danh từ nào ở vị trí sẵn chứa hoặc có thể thêm rất vào trước thì mới được coi là tính
từ Tuy nhiên đó mới chỉ là điều kiện cần cho danh từ từ có bản tính từ loại của tính
từ, chứ chưa phải là đủ để nó được coi là tính từ quan hệ Cần có thêm điều kiện đó
là khả năng xuất hiện chứng tố rặt thay vì rất: danh từ nào chấp nhận theo lối phân
bố bổ sung chứng tố rất và chứng tố rặt (tức là có rất thì không có rặt và ngược lại) thì đó là tính từ quan hệ Chỉ chấp nhận rất mà không chấp nhận rặt được thì đó là
Trang 2220
tính từ tính chất.Tính từ quan hệ có thể có gốc là danh từ chung, cũng có thể có gốc
là danh từ riêng
Ví dụ tính từ có quan hệ danh từ riêng: giọng (rất) Sài Gòn, cái nhìn (rất)
Việt Nam, thái độ (rất) Chí Phèo…
Ví dụ tính từ có quan hệ danh từ chung: tác phong (rất) công nghiệp, cung
cách (rất) quý phái, giọng lưỡi (rất) côn đồ, thái độ (rất) cửa quyền…
1.2.3.2 Tính từ thang độ và tính từ không thang độ
1 Tính từ thang độ
Tính từ thang độ là tính từ có thể kết hợp với các phó từ chỉ thang độ, rất,
hơi, khí, quá, cực kì… về phía trước, hoặc lắm, quá, cực kì… về phía sau, như rất
đẹp, rất vui, rất anh hùng, rất Việt Nam…, đẹp lắm, vui quá, anh dũng cực kì…
Các tính từ quan hệ khó kết hợp với các yếu tố chỉ thang độ đứng sau
2 Tính từ không thang độ
Trong tiếng Việt có một nhóm nhỏ từ, xét cách hoạt động từ trong câu và xét mặt ý nghĩa, thì giống hệt tính từ ,nhưng không kết hợp được với các phó từ chỉ thang độ thường đứng trước tính từ Đó là những tính từ không có sự phân biệt về
thang độ, gọi gọn là tính từ không thang độ như chính, công, chung, quốc doanh,
riêng, tư… Trong các tổ hợp từ vấn đề chính, quyền lợi chung, quỹ công, đời tư, hàng quốc doanh, gia đình riêng…
1.2.3.3Đặc điểm trong hoạt động ngữ pháp của tính từ
1.2.3.3.1Chức năng vị tố của tính từ
Trong chức năng vị tố, tính từ có thể được xét về số lượng tham thể và tính
động
1 Phương diện số lượng tham thể
Trong chức năng vị tố, tính từ có thể kết hợp với một tham thể, có kèm hoặc không kém yếu tố chỉ cảnh huống, cảnh huống này có thể hoạt động với tư cách một tham thể (như yếu tố bắt buộc)
Ví dụ (tham thể cảnh huống được gạch dưới):
(A) Trăngsáng quá (Một tham thể)
(B) Nhà tôixatrường học (Hai tham thể)
Trang 2321
Câu (A) chỉ quan hệ thâm nhập với khía cạnh thuộc tính từ, tức là đi sâu
vào thực thể nêu ở chủ ngữ về phương diện thuộc tính từ Câu (B) có vị tố xa chỉ
thuộc tính là khoảng cách không gian, với thuộc tính này yếu tố chỉ cảnh huống
trường học định vị mốc của khoảng cách với nhà, và trường học có thể ngầm hiểu,
không cần có mặt trong câu
Lưu ý trong cách dùng tính từ làm vị tố không có trợ động từ là đòi hỏi danh
từ chủ ngữ phải có tính xác định đủ rõ
Ví dụ: có thể nói “cô ấy thông minh” nhưng không thể nói “cô thông minh”
2 Phương diện tính động
Trong ý nghĩa của tính từ có thể phân biệt tính động từ như nhanh, vội,
chậmrãi…, hoặc tĩnh như yếu, đẹp, đặc, nặng, buồn (cảnh vật)…
Ví dụ:
Anh này nhanh thật! (Động)
Tôi đang vội (Động)
Bột đặc quá (Tĩnh)
Không khí ở đây trong lành quá! (Tĩnh)
1.2.3.3.2 Khả năng kết hợp với phó từ (phụ tố)
1 Khả năng kết hợp với phó từ đứng trước
Do khả năng làm vị tố có tính từ chất thường xuyên của mình, tính từ dễ dàng kết hợp được với nhiều phó từ đặc trưng cho từ loại động từ Cụ thể là những nhóm con phụ tố chuyên đứng trước tính từ dưới đây:
Từ chỉ thời gian: đã, sẽ, đang, vừa, mới,…, từng, vẫn, cứ…
Từ chỉ tính đồng nhất (identity) và tương tự (similarity): đều, cũng…
Từ chỉ mức độ: rất, hơi, khí, quá…
Từ chỉ tính từ phân cực (trong đó có khẳng định và phủ định): có, không,
chưa, chẳng…
Từ chỉ tần số (số lần, hay tính từ thường thường - usuality): thường, hay,
năng, ít, chẳng mấy khi, chẳng bao giờ…
Trang 2422
Mô tả dưới dạng cây:
Ngoài ra, nhóm con từ tình thái nêu ý sai khiến, khuyên nhủ như hãy, đừng,
chớ vốn thường xuất hiện trước động từ, có khi cũng xuất hiện trước tính từ Chẳng
hạn như câu thơ của Hồ Xuân Hương:
Có phải duyên nhau thì thắm
Đừng xanh như lá, bạc như vôi
Hoặc :
Anh cho tôi một tờ giấy, đừng xấu quá!
2 Khả năng kết hợp với phó từ đứng sau
a Khả năng kết hợp với phó từ rồi
Trừ các từ lắm,quá, cực kì, tuyệt có thể đứng sau tính từ, phó từ có thể xuất hiện sau phần lớn các tính từ là từ rồi Đáng chú ý là nếu khi đi với động từ chỉ hành động từ vật lí, rồi có thể có nghĩa như xong, thì với tư cách yếu tố mở rộng về phía sau của tính từ , rồi không thể có nghĩa như xong, mà bao giờ cũng là ý nghĩa
“kết thúc giai đoạn chuyển vào trạng thái mới” hoặc “hoàn thành sự bắt đầu trạng thái hiện đương”, gọi gọn là có nghĩa “bắt đầu”, một thứ ý nghĩa chỉ thời gian Mô
tả dưới dạng cây:
Ví dụ:
PredP PredP* R
PredP
R PredP*
rồi
Trang 2523
Mô tả dưới dạng cây như sau:
Ở cương vị vị tố và trong cách kết hợp với từ rồi, tính từ quan hệ thường có
phó từ chỉ thang độ đi kèm để chánh lẫn lộn với danh từ làm vị tố So sánh:
Danh từ Tính từ quan hệ
Bây giờ hắn (là) công chức rồi Bây giờ hắn công chức lắm rồi
Bây giờ hắn rặt công chức rồi
b Khả năng kết hợp với phó từ chỉ hướng ra, lên, đi, lại
Nhiều tính từ có khả năng kết hợp với các phó từ chỉ hướng đứng sau, và các
phó từ thường gặp là ra, lên, đi, lại, và có sự lựa chọn tuỳ theo sự phù hợp về nghĩa
So sánh:
Trong sự kết hợp với các từ chỉ hướng này, tính từ khác với động từ ở mấy điểm sau:
Số lượng từ chỉ hướng có thể kết hợp với tính từ thường chỉ hạn chế ở bốn
từ ra, lên, đi, lại
PredP
A R
S NP
cùn rồi
Trang 2624
- Ý nghĩa chỉ hướng ở các từ này khi đi kèm với tính từ mờ nhạt hơn khi đi với động từ di chuyển Đi kèm sau tính từ, chúng thường chỉ ra hướng chung của sự diễn biến tính từ chất nêu ở tính từ, và thường hàm chứa một tiền giả định từ vựng
có nội dung nghịch đối Khi người ta nói gầy đi thì hàm chứa trước đó “không gầy”
hoặc “béo, mập” ý nghĩa của các từ ra, lên gợi lên hướng ra tăng, phát triển của đặc trưng nêu ở tính từ; ý nghĩa của các từ đi, lại gợi lên hướng thu giảm, quy tụ của các đặc trưng nêu ở tính từ
1.2.3.3.3 Khả năng kết hợp với thực từ làm bổ ngữ
Cũng giống như ở nhiều động từ, phần lớn các tính từ do nội dung chưa đủ
rõ của chúng, đòi hỏi sự kết hợp với thực từ (hoặc tổ hợp từ có thực từ làm yếu tố chính) về phía sau với tư cách bổ ngữ của tính từ về mặt cú pháp Sau đây là những
kiểu kết hợp của tính từ với thực từ bổ ngữ (đứng sau) thường gặp
1 Tính từ kết hợp với danh từ - bổ ngữ chỉ chủ thể logic
a Tính từ chỉ số lượng
Các tính từ chỉ số lượng như nhiều, lắm, ít, đông, đầy, vắng, thưa… có khả
năng kết hợp với danh từ làm bổ ngữ (về cú pháp) và bổ ngữ này chỉ chủ thể logic (đương thể xét về nghĩa kinh nghiệm) của số lượng nêu ở tính từ làm vị tố
Ví dụ:
Ngoài đường đông người
(Hôm nay) cửa hàng vắng khách
Mô tả dưới dạng cây:
vắng khách
Trang 2725
Trong quan hệ chỉnh thể và bộ phận giữa hai danh từ, một số tính từ có thể làm vị tố và đòi hỏi bổ ngữ là danh từ chỉ bộ phận, và chính danh từ này chỉ chủ thể logic của tính chất nêu ở tính từ - vị tố
Ví dụ:
Vải này rộng khổ
Cây này sai quả
Áo này ngắn tay
Thùng này méo miệng
Mô tả dưới dạng cây:
Các tổ hợp từ tự do thuộc kiểu này đều có thể chấp nhận sự mở rộng cấu tạo
bằng cách thêm vào những từ thích hợp chẳng hạn như Cây này vàng lá trên ngọn;
Áo này ngắn tay trái; Thùng này méo một bên miệng…
c Tính từ chỉ phẩm chất
Một số tính từ chỉ phẩm chất cần có phụ tố sau chỉ phạm vi thể hiện của tính
từ chất, do tiểu loại danh từ đảm nhiệm
Ví dụ:
Anh ấy giàu tiền
Mô tả dưới dạng cây:
Áo này
ngắn tay
Trang 2826
Có thể dùng thêm kết từ về, trong
Ví dụ:
Anh ấy giàu về tiền
Cô ấy nghiêm túc trong suy nghĩ
Mô tả dưới dạng cây:
2 Tính từ chỉ sự đo lường kết hợp với bổ ngữ chỉ số đo
Những tính từ mang ý nghĩa về các phương diện đo lường (như chiều cao, diện tích, khối lượng, nhịêt lượng…) có thể kết hợp về phía sau với bổ ngữ là số từ chính xác và từ chỉ đơn vị đo lường
Ví dụ:
cao 1m60 (chiều cao)
dài 100km (chiều dài)
rộng 100m 2 (diện tích)
nặng 50kg (khối lượng)
PredP
A OP giàu O
giàu tiền
Trang 2927
nóng 30 0 (nhiệt lượng)
1.3 Biểu diễn ngữ nghĩa bằng logic vị từ cấp một
Phần này được trình bày theo tài liệu của nhóm tác giả A Burchardt, S Walter,A Koller, M Kohlhase, P Blackburn and J Bos[5] và tài liệu của hai tác
giả P.Blackburn, J Bos[6]
1.3.1 Biểu diễn ngữ nghĩa
Đây là phần trình bày về cách thức biểu diễn ngữ nghĩa bằng logic vị từ cấp một Các biểu diễn của chúng ta sẽ là phân tích cú pháp rồi sử dụng phép tính lambda để kết hợp các thành phần cú pháp lại thành công thức logic
1.3.1.1 Các khái niệm ngữ nghĩa
Để tiến hành việc biểu diễn ngữ nghĩa thành công thức logic, chúng ta cần thêm một số khái niệm sau:
Từ vựng
Khi dùng logic vị từ cấp một để nói về một chủ đề, ta phải có từ vựng để nói
về chủ đề ấy Trong cách biểu diễn ngữ nghĩa bằng logic vị từ cấp một, chúng ta biểudiễn cấu trúc từ vựng như sau:
(Danh sách các hằng, Danh sách các tân từ)
Ví dụ:
({AN, BÌNH, CHI, DUY},{(SINH-VIÊN, 1), (YÊU, 2), (XINH, 1)})
Trong đó:
AN, BÌNH, CHI, DUY là các hằng;
Các cặp (SINH-VIÊN, 1), (YÊU, 2), (XINH, 1) tương ứng có SINH-VIÊN, YÊU, XINH là vị từ và 1,2,1 là số đối số cho các vị từ ấy
Để thuật tiện cho việc theo dõi, dấu cách giữa các tiếng sẽ được thay thế bằng dấu "-" Và các từ trong từ vựng sẽ được viết hoa toàn bộ các chữ cái
Mô hình vị từ cấp một
Trang 3028
Mô hình vị từ cấp một (gọi tắt là mô hình) là một cấu trúc được sử dụng để
mô tả một tình huống Mô hình cho chúng ta hai thông tin Thông tin đầu tiên là tập hợp các thực thể (ký hiệu là D) được nói đến, được gọi là miền xác định (hay trường minh họa)
Ví dụ:
D ={d1, d2, d3, d4} Thứ hai là hàm minh họa (ký hiệu là F), mỗi ký hiệu trong từ điển sẽ được ánh xạ với với một (hoặc nhiều) bộ các phần tử trong miền xác định Một bộ tương ứng với một vị từ sẽ có số phần tử là số đối của ký hiệu đó, một bộ tương ứng với
ký hiệu hằng sẽ có một phần tử Tức là: với mỗi ký hiệu hằng c trong từ điển ta có F(c) D, với mỗi quan hệ n-ngôi R ta có F(R) Dn
Định nghĩa 1.3.1.1(Mô hình)
Mô hình M là một cặp sắp thứ tự (D, F) trong đó D là trường minh họa và F
là hàm minh họa xác định các giá trị trong D
Ví dụ:
Giả sử ta có mô hình M=(D,F) như sau:
1 Từ vựng: ({AN, BÌNH, CHI, DUY},{(SINH-VIÊN, 1), (YÊU, 2), (XINH, 1)});
Trang 3129
F(XINH) = {d1, d3 }
Định nghĩa 1.3.1.2 (Mô hình chính xác)
Mô hình chính xác là mô hình trong đó mỗi thực thể trong trường minh họa
có một tên (được gán giá trị cho một hằng)
Mô hình được cho ở ví dụ trên là một mô hình chính xác Nếu chúng ta tạo một trường minh họa mới D’ = D {d5, d6} và có hàm minh họa F’ như sau:
1 Không có yêu cầu bắt buộc mọi thực thể trong mô hình phải có tên
2 Không có yêu cầu bắt buộc mỗi thực thể trong mô hình chỉ được minh họa cho một hằng Ví dụ: một người có hai tên là Bình và Duy trong đó một tên
là tên thật, một tên là tên thân mật
Chúng ta sẽ xây dựng ngôn ngữ vị từ cấp một dựa trên từ điển với các thành phần sau:
1 Tất cả các ký hiệu trong từ điển (được gọi là ký hiệu phi logic)
2 Một tập hợp vô hạn đếm được các biến x, y, z, w,
3 Các phép toán logic (phủ định), (kéo theo), (tuyển), (hội)
4 Các phép lượng hóa (toàn thể) và (tồn tại)
Trang 3230
5 Cặp dấu đóng, mở ngoặc ")" và "(" để nhóm các ký hiệu
Các thành phần 2-5 chung cho mọi ngôn ngữ tân từ, thành phần duy nhất để phân biệt các ngôn ngữ với nhau là các ký hiệu phi logic (các ký hiệu trong từ điển)
1.3.2 Phân tích cú pháp và biểu diễn ngữ nghĩa
Việc biểu diễn ngữ nghĩa của một câu trong ngôn ngữ tự nhiên thành công thức logic có thể được chia thành một số bước:
1 Phân tách câu trong ngôn ngữ tự nhiên thành các ký hiệu trong từ vựng và thông tin cú pháp về các ký hiệu ấy
2 Ghép các ký hiệu vừa được phân tách thành một công thức logic
Việc phân tích câu trong ngôn ngữ tự nhiên thành các ký hiệu trong từ vựng được thực hiện bởi quá trình phân tích cú pháp Và với việc phân tích cú pháp này
ta cũng có thể tiến hành việc kết hợp các thành phần để xây dựng công thức logic Đây là giải pháp đầu tiên và đơn giản nhất khi chúng ta muốn chuyển một câu ngôn ngữ tự nhiên thành công thức logic Chúng ta xét một ví dụ đơn giản: An thích Bình
Kết quả chúng ta muốn thu được là: THÍCH(AN, BÌNH)
Khi tiến hành phân tích cú pháp chúng ta thu được thành phần chủ ngữ của câu thu được là danh từ riêng "An", vị ngữ của câu thu được là ngoại động từ "thích" kết hợp với tân ngữ là danh từ riêng "Bình" Sau khi phân tích cú pháp, ta thu được ngoại động từ "thích" là vị từchính của câu, vị từ này có hai đối số là "An" và Bình (NP)
Với việc thu được ngoại động từ "thích", dựa trên nguyên tắc của ngoại động
từ trong ngôn ngữ tự nhiên, ta sẽ phải có một biểu diễn logic tương ứng với công thức logic của ngoại động từ: THÍCH sẽ là một vị từ có hai đối số, đối số đầu tiên là đối tượng gây ra tác động, đối số thứ hai là đối tượng bị tác động Vì thế, căn cứ vào phân tích nhận được, ta có công thức thu được là THÍCH(AN, BÌNH)
Trang 3331
Có thể thấy, với việc tiến hành phân tích cú pháp và dựa trên thông tin cú pháp nhận được, ta cũng đã có thể tiến hành kết hợp các ký hiệu thu được thành công thức logic vị từ cấp một Nếu có một luật quy định cho từng loại thành phần
cú pháp (giống như cho ngoại động từ trong ví dụ trên) thì chúng ta có thể đặt các thành phần vào đúng vị trí của nó Tuy nhiên, việc kết hợp này không chỉ đơn giản như vậy, ví dụ trên chỉ là một ví dụ rất đơn giản, chỉ với ví dụ phức tạp hơn một chút chúng ta sẽ gặp rất nhiều khó khăn
Xét câu có sự xuất hiện của lượng từ: Một người đàn ông đang chạy
Công thức đúng cho câu này lẽ ra là: x.(ĐÀN-ÔNG(x) CHẠY(x))
Tức là chúng ta phải có các biến và đưa đúng biến đó vào là đối số của các vị
từ tương ứng Nhưng việc xác định cần có bao nhiêu biến để biểu diễn và đưa biến nào vào vị trí nào là rất phức tạp nếu dùng phân tích cú pháp và logic vị từ cấp một đơn thuần Vấn đề đưa các biến, hằng vào các vị trí thích hợp trong công thức logic được giải quyết nhờ một công cụ rất hữu hiệu đó là tính toán Lambda
1.3.3 Kết hợp tính toán lambda trong biểu diễn ngữ nghĩa
Bằng việc sử dụng tính toán lambda, chúng ta biểu diễn các ký hiệu thu được
từ việc phân tích cú pháp thành các biểu thức lambda và tiến hành kết hợp chúng theo các quy tắc tính toán lambda
Biểu diễn một số từ loại bằng biểu thức lambda
Để tiện theo dõi, phép áp dụng (M N) sẽ được viết thành (M@N) Trong phần này, chúng ta sẽ chỉ dừng lại ở việc xét cấu trúc ngữ pháp với các luật như sau: