1. Trang chủ
  2. » Luận Văn - Báo Cáo

Lý thuyết biểu diễn diễn ngôn

82 35 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 82
Dung lượng 23,26 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Lý thuyết biểu diễn diễn ngôn Lý thuyết biểu diễn diễn ngôn Lý thuyết biểu diễn diễn ngôn luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp luận văn tốt nghiệp,luận văn thạc sĩ, luận văn cao học, luận văn đại học, luận án tiến sĩ, đồ án tốt nghiệp

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-

VŨ THỊ HƯƠNG

LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

LUẬN VĂN THẠC SĨ KHOA HỌC

Hà Nội – 2014

Trang 2

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN

-

VŨ THỊ HƯƠNG

LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

Chuyên ngành: Cơ sở toán học cho tin học

Mã số: 60460110

LUẬN VĂN THẠC SĨ KHOA HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:

TS Nguyễn Thị Minh Huyền

Hà Nội – Năm 2014

Trang 3

2

MỤC LỤC

LỜI CẢM ƠN 5

GIỚI THIỆU 6

CHƯƠNG 1 CƠ SỞ TOÁN HỌC 10

1.1 LOGIC VỊ TỪ CẤP MỘT VÀ PHÉP HỢP NHẤT 10

1.1.1 Các khái niệm cơ bản 10

1.1.2 Các khái niệm ngữ nghĩa 11

1.1.3 Phép hợp nhất (Unification) 12

1.2 TÍNH TOÁN LAMBDA 14

1.2.1 Cú pháp của tính toán lambda 15

1.2.2 Biến tự do và biến ràng buộc 16

1.2.3 Các phép biến đổi 17

CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN 21

2.1 CÁC THÀNH PHẦN CƠ BẢN CỦA DRT 21

2.1.1 Tổng quan về DRT 21

2.1.2 Cách xây dựng cấu trúc biểu diễn diễn ngôn 24

2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN 27

2.2.1 Ngôn ngữ DRS mở rộng bậc một 27

2.2.2 Ngữ nghĩa chủ đích, mệnh đề, trạng thái thông tin và khả năng thay đổi ngữ cảnh 32

2.2.3 Các lượng từ 40

2.2.4 Số nhiều 41

2.2.5 Thời và thể 45

2.3 TIỀN GIẢ ĐỊNH (PRESUPPOSITION) 49

Trang 4

3

2.3.1 Ý nghĩa của tiền giả định 49

2.3.2 Một ví dụ 50

CHƯƠNG 3 BIỂU DIỄN DIỄN NGÔN VỚI THAM CHIẾU THỜI GIAN TRONG TIẾNG VIỆT 55

3.1 ĐỊNH VỊ THỜI GIAN 55

3.1.1 Biểu diễn thời gian trong mối quan hệ với không gian 55

3.1.2 Định vị thời gian 58

3.2 YẾU TỐ THỜI TRONG TIẾNG VIỆT 69

3.2.1 Các quan niệm về thời trong tiếng Việt 69

3.2.2 Cách diễn đạt ý nghĩa thời trong tiếng Việt 70

3.3 DẤU HIỆU TỪ VỰNG ĐỂ NHẬN BIẾT THỜI TRONG TIẾNG VIỆT 73

KẾT LUẬN 79

TÀI LIỆU THAM KHẢO 80

DANH MỤC HÌNH VẼ Hình 1: Cây cú pháp của một biểu thức lambda. 16

Hình 2: Phân tích cú pháp kết hợp tính toán lambda của câu (2). 20

Hình 3: Thời gian được biểu diễn theo định hướng không gian. 55

Hình 4: Định vị thời gian với ẩm dụ người quan sát đứng yên 56

Hình 5: Định vị thời gian với ẩm dụ người quan sát chuyển động 56

DANH MỤC TỪ VIẾT TẮT

Trang 5

4

DRT Discourse representation theory

DRS Discourse representation structure

EKAW Knowledge Engineering and Knowledge Management

Trang 6

5

LỜI CẢM ƠN

Đầu tiên em xin gửi lời cảm ơn chân thành và sâu sắc nhất tới TS Nguyễn Thị Minh Huyền đã luôn chỉ bảo, hướng dẫn tận tâm cho em trong suốt quá trình thực hiện luận văn

Việc hoàn thành luận văn này không thể không kể tới sự hỗ trợ và tạo điều kiện của Viện Công nghệ thông tin, Viện Khoa học và Công nghệ quân

sự, Bộ Quốc Phòng là cơ quan tôi đang công tác Tôi xin trân trọng gửi lời cảm ơn tới các thủ trưởng, các đồng nghiệp, các đồng chí của mình

Bên cạnh đó, em cũng xin cảm ơn các thầy cô, các cán bộ và nhân viên của Bộ môn Tin học nói riêng và khoa Toán – Cơ – Tin học, trường Đại học Khoa học Tự nhiên nói chung đã tận tình dạy dỗ và giúp đỡ em từ khi em còn

là sinh viên của trường đến những năm em trở lại học tập, nghiên cứu tại khoa với cương vị học viên cao học

Tôi xin cảm ơn gia đình, bạn bè và tất cả mọi người đã quan tâm, tạo điều kiện, động viên cổ vũ tôi để tôi có thể hoàn thành nhiệm vụ của mình

Luận văn của tôi không tránh khỏi những thiếu sót do hạn chế về thời gian thực hiện và hiểu biết thật hệ thống về ngữ pháp, ngữ nghĩa tiếng Việt Tôi rất mong nhận được những ý kiến đóng góp của các thầy cô và các bạn

Hà Nội, tháng 11 năm 2014

Học viên

Vũ Thị Hương

Trang 7

6

GIỚI THIỆU

Sự chi phối của ngữ cảnh trong ngôn ngữ tự nhiên là một hiện tượng thiên biến vạn hóa vô cùng phức tạp, khiến nhiều nhà ngôn ngữ về ngữ nghĩa dày công nghiên cứu Trước đây, quan niệm về ngữ nghĩa chính tắc coi lý thuyết ngữ nghĩa là mối quan tâm cơ bản, khái niệm trọng tâm là thông tin chứ không phải sự thật, ý nghĩa của một câu không phải là các điều kiện sự thật

mà là khả năng thay đổi thông tin Khi các nhà nghiên cứu chú trọng vào sự phụ thuộc ngữ cảnh trong ngôn ngữ thì mô thức xử lý các bài toán ngữ nghĩa

có sự thay đổi lớn, các lý thuyết ngữ nghĩa động được thiết kế đặc thù để làm việc với mối tương quan giữa phát ngôn và ngữ cảnh đã phản ánh được sự thay đổi đó Tuy nhiên, quan hệ giữa thông tin và sự thật vẫn có vị trí tối quan trọng và là thành phần quyết định của tất cả các lý thuyết động

Trong hai thập kỷ gần đây, các lý thuyết về ngữ nghĩa động phát triển mạnh mẽ, xoay quanh vấn đề cốt lõi là mô tả sự phụ thuộc ngữ cảnh vào ngữ nghĩa [10] Đó là đặc tính luôn có trong các ngôn ngữ tự nhiên và sự tương tác này có tính đối ứng Ta có thể kể đến một vài lý thuyết ngữ nghĩa động như:

- Năm 1991 Groenendijk và Stokhof đưa ra văn phạm Montague động dựa vào logic vị từ

- Năm 1991 Chierchia nghiên cứu mối liên kết động trong hiện tượng thay thế đại từ

- Năm 1996 Kohlhase đưa ra lý thuyết tính toán ngữ nghĩa dựa vào tính toán lambda

Trang 8

- Wikifier: Công cụ xác định các thực thể và khái niệm quan trọng trong văn bản, xử lý hiện tượng mập mờ về nghĩa và liên kết tới trang Wikipedia

- Context-Sensitive Spelling Correction (Sửa lỗi từ dựa vào ngữ cảnh): Công cụ này tìm ra và gợi ý cách sửa cho những lỗi sai về nghĩa

- Co-reference Resolution (Giải quyết đồng tham chiếu): Một thực thể có thể được nhắc đến trong văn bản theo nhiều cách khác nhau Công cụ này phát hiện ra các cụm từ thể hiện cùng một thực thể

- Context Sensitive Verb Paraphrasing (Chú thích động từ dựa trên ngữ cảnh): Công cụ này là một bộ phân loại xem xét động từ v và ngữ cảnh của nó cùng với một động từ ứng viên u, đồng thời xác định trong một ngữ cảnh đã cho nào đó u có thể thay thế cho v để vẫn giữ nguyên ý nghĩa văn bản không

Chúng ta có thể tham khảo minh họa trực tuyến của các công cụ này trên trang

Trang 9

8

Lý thuyết biểu diễn diễn ngôn (DRT: Discourse Representation Theory)

nằm trong phạm vi ngữ nghĩa động, nhưng khác biệt ở chỗ nó chỉ ra được vai trò cực kỳ nổi bật của sự thật trong phát ngôn Một công cụ tiêu biểu dựa trên DRT hiện nay là Boxer do Johan Bos phát triển Với đầu vào là CCG

(Combinatory Categorial Grammar: văn phạm danh mục kết nối), Boxer cho

ra cấu trúc biểu diễn diễn ngôn (tham khảo minh họa tại

Valentina Presutti, Francesco Draicchio và Aldo Gangemi công bố tại hội thảo quốc tế EKAW 2012 đưa ra phương pháp kết hợp DRT với các mẫu bản thể học để trích xuất tri thức [13]

Luận văn nghiên cứu về DRT với mục đích tạo tiền đề lý thuyết cho ứng dụng biểu diễn diễn ngôn tiếng Việt Cấu trúc của luận văn gồm ba phần:

Chương đầu tiên trình bày về cơ sở toán học sử dụng cho các chương sau, bao gồm logic vị từ cấp một, tính toán lambda và phép toán hợp nhất trong xử lý ngôn ngữ Đây là các công cụ chính để biểu diễn và tính toán ngữ nghĩa

Chương hai trình bày về lý thuyết biểu diễn diễn ngôn Phần đầu của chương giới thiệu cách xây dựng cấu trúc biểu diễn diễn ngôn là phương tiện

để biểu diễn diễn ngôn cũng như cách thể hiện những yếu tố cú pháp trong các cấu trúc đó Mô hình tiền giả định được trình bày ở phần sau Các kết luận và

ví dụ minh họa đều áp dụng cho tiếng Anh

Chương ba khảo sát cách định vị thời gian và những phương thức thể hiện yếu tố thời trong phát ngôn tiếng Việt Từ đó có những nhận xét về cách

Trang 10

9 chọn thời gian tham chiếu phù hợp và thể hiện trọn vẹn được yếu tố thời trong khi biểu diễn diễn ngôn tiếng Việt

Trang 11

10

CHƯƠNG 1 CƠ SỞ TOÁN HỌC

Chương này nhắc lại các cơ sở về toán học sẽ được sử dụng trong các chương tiếp theo của luận văn, bao gồm logic vị từ và tính toán lambda

1.1 LOGIC VỊ TỪ CẤP MỘT VÀ PHÉP HỢP NHẤT

1.1.1 Các khái niệm cơ bản

Nội dung phần này có tham khảo tài liệu của tác giả Đỗ Đức Giáo [2]

Để tiện theo dõi, luận văn không trình bày lại các khái niệm cơ sở mà chỉ nhắc lại các thuật ngữ Ta xét câu tiếng Anh sau:

(1) If Pedro owns a donkey, he likes it

Phân tích cú pháp của câu trên ta được:

- Trong mệnh đề thứ nhất: Chủ ngữ là danh từ riêng “Pedro”, vị ngữ là ngoại động từ “own” với bổ ngữ “donkey” Ta có biểu diễn dưới dạng vị từ 2 đối: own(Pedro,donkey) Vì “donkey” chưa xác định nên ta kí hiệu là x, ta có: donkey(x)

- Tương tự mệnh đề thứ hai được biểu diễn thành: like(Pedro, x) Ta kí hiệu danh từ riêng Pedro là a

Thay “donkey”, “own” và “like” lần lượt thành các vị từ P, Q, R ta được biểu diễn ngữ nghĩa của câu trên bằng công thức logic vị từ cấp một như sau:

Trong công thức trên ta có:

- a là hằng x là biến Biến x bị ràng buộc trong phạm vi lượng từ , các biến khác (nếu có) sẽ là biến tự do

công thức con) là các hạng tử

Trang 12

11

- P(x), Q(x) là các công thức nguyên tử

Trong logic vị từ cấp một, những công thức không chứa biến tự do được gọi là một câu

1.1.2 Các khái niệm ngữ nghĩa

Nội dung phần này có tham khảo tài liệu của tác giả A Burchardt [7] Các khái niệm ngữ nghĩa sau đây phục vụ cho việc biểu diễn ngữ nghĩa thành công thức logic vị từ cấp một Ta vẫn dùng ví dụ (1) để minh họa

Từ vựng

Khi nói về một chủ đề, ta cần từ vựng Đó là yếu tố cơ bản của ngôn ngữ để tiến hành hội thoại, là các thuật ngữ ta có thể sử dụng để diễn tả chủ

đề

Cấu trúc từ vựng trong logic vị từ cấp một như sau:

(Tập các hằng, tập các vị từ (có chỉ rõ số các đối của mỗi vị từ))

- Hàm minh họa F, ánh xạ mỗi từ vựng thành một (nhiều) bộ các phần tử

trên trường minh họa Một bộ tương ứng với một vị từ sẽ có số phần tử

là số đối của vị từ đó, một bộ tương ứng với ký hiệu hằng sẽ có một phần tử Tức là với mỗi ký hiệu hằng a trong tập từ vựng ta có

, còn với mỗi quan hệ n-ngôi R ta có

Trang 13

12

Định nghĩa 1.1.1 (Mô hình) Mô hình M là một cặp được sắp (D, F) trong đó

D là trường minh họa và F là hàm minh họa chỉ tới các tập con trong D

Ví dụ ta có mô hình M = (D, F) như sau:

- Từ vựng: ({PEDRO}, {(DONKEY, 1), (OWN, 2), (LIKE, 2)})

- Trường minh họa: D = {d1, d2}

- Hàm minh họa: F(PEDRO) = d1, F(DONKEY) = d2,

F(OWN) = (d1, d2), F(LIKE) = (d1, d2)

1.1.3 Phép hợp nhất (Unification)

Phần này trình bày theo tài liệu của tác giả A Martelli [8] và F Baader [9]

Trước hết ta định nghĩa một số giả thiết và khái niệm liên quan:

Cho trước các đối tượng sau:

- Tập vô hạn các biến V

- Tập các hạng tử T (chứa V)

- Ánh xạ vars: T → Vn, cho tương ứng mỗi hạng tử t T với tập các biến

tự do trong t:

- Quan hệ tương đương trên T, ký hiệu là ≡, hai hạng tử tương đương

nhau nếu chúng đối sánh

Trang 14

13

Định nghĩa 1.1.3 (Bài toán hợp nhất) Cho một tập hữu hạn các cặp hạng tử {li

ri,…, lk rk}, ta cần tìm phép thế để các cặp hạng tử này đối sánh nhau

Phép thế σ là nghiệm của bài toán hợp nhất (hay còn gọi là phần tử hợp nhất: unifier) nếu li(σ) và ri(σ) đối sánh nhau (i = 1, 2,…,k) Bài toán hợp nhất có thể không có nghiệm hoặc có nhiều nghiệm

Ví dụ bài toán hợp nhất { } có nghiệm (x/y)

Phép hợp nhất là một thuật toán dùng để xác định những phép thế cần thiết cho các tham biến vị từ để làm cho hai công thức vị từ đối sánh nhau Với các công thức logic vị từ cấp một, nếu bài toán hợp nhất có nghiệm thì luôn có một nghiệm, phần tử hợp nhất khi đó gọi là phần tử hợp nhất tổng

quát nhất (mgu: most general unifier).

* Thuật toán hợp nhất

Thuật toán sau đây Martelli và Montanari đề xuất năm 1982

Cho trước tập hữu hạn các cặp hạng tử cần hợp nhất G = {s1 t1, , sn tn}, thuật toán hợp nhất áp dụng các luật để biến đổi nó thành một tập tương đương có dạng {x1 u1, , xm um } trong đó x1, , xm là các

biến phân biệt và u1, , um là các hạng tử không chứa biến xi nào Tập có dạng này có thể coi là phép thế Ta ký hiệu G(t/x) là toán tử thực hiện thay thế tất cả các vị trí của biến x trong bài toán thành hạng tử t Để đơn giản trong trình bày, ta coi các ký hiệu hằng như các ký hiệu hàm không có đối

G ∪ {f(s0,…, sk) f(t0,…, tk)} G ∪ {s0 t0,…, sk tk} Phân tích

Trang 15

P(x, x) và P(y,z) (P(y/x)) (z/y) hoặc P(x/y,x/z)

P(x,f(y)) và P(Joe,z) P(Joe/x) P(f(y)/z)

Trang 16

15

1.2.1 Cú pháp của tính toán lambda

Định nghĩa 1.2.1 (Biểu thức lambda) Giả sử V là tập vô hạn các biến A là

bảng chữ cái tạo nên các phần tử của V và các ký hiệu đặc biệt “(“, “)”, “λ”,

“.” Gọi A* là tập các chuỗi trên A Tập hợp các biểu thức lambda là tập con nhỏ nhất Λ ⊆ A* thỏa mãn:

(i) Nếu x V thì x Λ và đây được gọi là một biến,

(ii) Nếu M, N Λ thì (M N) Λ và đây được gọi là phép áp dụng (app),

(iii) Nếu x V và M Λ thì (λx.M) Λ và đây được gọi là một phép trừu tượng hóa lambda

Ta sử dụng ký hiệu (M N) để chỉ sự áp dụng của hàm M cho đối N Ký hiệu trong phép trừu tượng λx.M thể hiện M là một hàm có đối x

* Kỹ thuật tham biến hóa từng phần

Khi biểu diễn hàm M có nhiều tham biến x1, x2,…, xn, ta sử dụng kỹ thuật tham biến hóa từng phần để đưa về dạng trừu tượng chỉ sử dụng một biến:

λx1.( λx2 …(λxn.M)…)

* Cây cú pháp của biểu thức lambda

Ta có thể biểu diễn biểu thức lambda bằng cây cú pháp (hay còn gọi là cấu trúc lambda) Ví dụ biểu thức (λx.(x y)(x y)) được biểu diễn bằng cây cú pháp sau:

Trang 17

16

Hình 1: Cây cú pháp của một biểu thức lambda.

* Một số quy ước

Để tiện cho việc trình bày, ta quy ước như sau:

- Ta sẽ bỏ các cặp ngoặc đơn ngoài cùng Ví dụ ta viết M N thay cho (M

N),

- Các phép áp dụng có tính chất kết hợp trái nên M N P có thể viết thành

(M N) P, tương tự khi viết f xyz ta sẽ hiểu là ((f x) y) z,

- Phần chính của phép trừu tượng hóa lambda (phần sau dấu chấm) sẽ

được mở rộng nhất có thể về bên phải, giả sử khi ta viết λx.M N thì ta hiểu là λx.(M N) chứ không phải (λx.M) N,

- Các phép trừu tượng hóa lambda có tính chất kết hợp phải nên

λx.λy.λz.M có thể viết thành λxyz.M

1.2.2 Biến tự do và biến ràng buộc

Biến tự do và biến ràng buộc trong tính toán lambda được định nghĩa tương tự như trong logic vị từ cấp một

Trong biểu thức λx.M, tất cả các vị trí của x trong phần chính M đều là ràng buộc Một vị trí của biến không phải ràng buộc thì là vị trí tự do Biến có

vị trí tự do gọi là biến tự do, biến có vị trí ràng buộc gọi là biến ràng buộc

Trang 18

17

Về mặt hình thức, ta có thể định nghĩa biến tự do như sau:

Định nghĩa 1.2.2 (Biến tự do) Ký hiệu FV(M) là tập các biến tự do của M Ta

có:

FV(x) = {x}

FV(M N) = FV(M) U FV(N) FV(λx.M) = FV(M)\{x}

1.2.3 Các phép biến đổi

* Phép biến đổi alpha (α-conversion)

Ta ký hiệu là phép tương đương alpha Với mọi công thức M và mọi biến y không xuất hiện trong M, ta có:

λx.M λy.(M{y/x}) Quan hệ tương đương alpha tuân theo một số luật sau (ta viết = thay cho

Ta ký hiệu M[N/x] là phép thay thế x bởi N trong M với x là một biến

tự do trong M Ta định nghĩa phép thay thế như sau:

Trang 19

(λy.M) [N/x] λy.(M[N/x]), nếu x ≠ y và y FV(N)

(λy.M) [N/x] λy’.(M[y’/y][N/x]) nếu x ≠ y, y FV(N), y’ là biến mới

* Phép rút gọn beta (β-reduction)

Ta ký hiệu là phép rút gọn beta với các luật sau:

(Kết hợp trái)

(Kết hợp phải)

Ví dụ ta kết hợp tính toán lambda để biểu diễn ngữ nghĩa cho câu sau:

(2) Pedro owns a donkey

Khi phân tích cú pháp của câu này, ta có các luật sau:

S -> NP, VP

NP -> PN

VP -> TV, NP

NP -> Det, Noun Biểu diễn lambda của các thành phần câu tương ứng với phân tích này là:

Thành phần câu Biểu diễn lambda Áp dụng

Noun

(danh từ chung)

λx.Noun(x) donkey: λx.DONKEY(x)

Trang 20

* Tổng kết

Trong chương đầu tiên này, chúng ta đã biểu diễn được ngữ nghĩa của một câu trong ngôn ngữ tự nhiên thành một công thức logic với sự trợ giúp của tính toán lambda Nhưng ngôn ngữ tự nhiên chứa một chuỗi nhiều câu liên tiếp có liên quan ý nghĩa với nhau chứ không đơn thuần là từng câu riêng lẻ Như vậy ngoài các xử lý ở mức câu đã thực hiện trong chương này, chúng ta cần có cách thức kết hợp các kết quả lại Trong chương tiếp theo, chúng ta sẽ tìm hiểu các kỹ thuật xử lý ở mức cao hơn trong lý thuyết biểu diễn diễn ngôn

Nói riêng về tính toán lambda, đây là công cụ nền để tính toán ngữ nghĩa Khi biểu diễn câu bằng các biểu thức logic vị từ, tính toán lambda giúp định vị biến Khi xây dựng các chương trình ứng dụng lý thuyết biểu diễn diễn ngôn, tính toán lambda không thể thiếu trong các biểu thức biểu diễn ngữ nghĩa để thực hiện việc kết nối thông tin và xác định các đối tượng có tham chiếu tới nhau Vì luận văn tập trung nghiên cứu lý thuyết nên chỉ dừng lại ở việc giới thiệu về tính toán lambda tại đây

Trang 21

20

Pedro owns a donkey

Hình 2: Phân tích cú pháp kết hợp tính toán lambda của câu (2)

a(detSem) λQ.λR w(Q(w)^R(w))

a donkey(npSem) λQ.λR w(Q(w)^R(w)) (λx.DONKEY(x))

= λR w(λx.DONKEY(x) (w)^R(w))

= λR w(DONKEY(w)^R(w))

own(tvSem) λX.λz.(X λy.OWN(z,y))

= λz.(λR w(DONKEY(w)^R(w)) λy.OWN(z,y))

= λz.( w(DONKEY(w)^ λy.OWN(z,y) (w)))

= λz.( w(DONKEY(w)^ OWN(z,w)))

Trang 22

21

CHƯƠNG 2 LÝ THUYẾT BIỂU DIỄN DIỄN NGÔN

Với các công cụ toán học đã nêu ở chương trước, ta có thể biểu diễn một câu trong văn bản qua các công thức logic Trong chương này ta sẽ xây dựng biểu diễn cho một diễn ngôn gồm nhiều câu liên tiếp, trong đó các câu

có liên quan với nhau về mặt ý nghĩa trong ngữ cảnh chung Lý thuyết biểu

diễn diễn ngôn (DRT: Discourse Representaion Theory) là công cụ xử lý tốt

các quan hệ thay thế trong từng câu cũng như giữa nhiều câu trong một văn bản

Chương này tham khảo tài liệu về DRT của tác giả H Kamp [10] và tác giả A Burchardt [7]

2.1 CÁC THÀNH PHẦN CƠ BẢN CỦA DRT

2.1.1 Tổng quan về DRT

Giả sử ta biểu diễn ngữ nghĩa cho diễn ngôn sau:

(3) A delegate arrived She registered

Ta có thể biểu diễn ngữ nghĩa cho từng câu rồi ghép lại thành công thức sau:

Biểu diễn này chứa biến tự do y nên không phải là một câu trong logic vị từ cấp một Hơn nữa nó không thể hiện được yếu tố ngữ cảnh là đại từ “she” ở câu sau chỉ đến “delegate” ở câu trước

Như vậy ta phải có một cách thức khác để biểu diễn ngữ nghĩa cho diễn ngôn DRT giải quyết được tình huống trên DRT có sử dụng một công cụ để

cấu trúc hóa diễn ngôn, đó là cấu trúc biểu diễn diễn ngôn (DRS: discourse representation structure) Ta có các định nghĩa sau:

Trang 23

22

Định nghĩa 2.1.1 (Tham chiếu diễn ngôn) Tham chiếu diễn ngôn là các thực

thể được nhắc đến trong diễn ngôn mà sau đó có thể dùng đại từ để tham chiếu lại

Trong ví dụ (3) có hai tham chiếu diễn ngôn là x và y (lần lượt thay thế cho “delegate” và “she”)

Định nghĩa 2.1.2 (Cấu trúc biểu diễn diễn ngôn) Cấu trúc biểu diễn diễn ngôn

<U, Con> là một cấu trúc dữ liệu gồm hai thành phần:

- Tập các tham chiếu diễn ngôn U (còn gọi là “không gian” của DRS),

- Tập các điều kiện Con, mô tả các ràng buộc giữa các tham chiếu Trong cấu trúc biểu diễn diễn ngôn, tập tham chiếu diễn ngôn cho ta thông tin về các đối tượng được nhắc đến trong diễn ngôn còn tập điều kiện cho ta biết các thuộc tính, quan hệ, hoạt động của các đối tượng do tham chiếu diễn ngôn chỉ đến Ví dụ câu đầu tiên trong (3) tương ứng với DRS sau:

<{x}, {delegate(x), arrive(x)}>

Hoặc ta có thể dùng dạng biểu diễn hình hộp:

Phiên bản gốc DRT do Kamp đề xuất năm 1981 thiết lập biểu diễn lần lượt từng phần diễn ngôn Giả sử ta cần xử lý một chuỗi câu S1, S2,…, Sn, ta thực hiện lần lượt (theo hướng từ trên xuống):

Trang 24

(presupposition)

Định nghĩa 2.1.3 (Tiền giả định) Tiền giả định là một giả thiết ngầm về tri

thức hiện thực hoặc hoàn cảnh xung quanh có liên quan đến một phát ngôn và xác định đúng trong diễn ngôn

Ta xét một số ví dụ:

Jane no longer writes fiction Jane once wrote fiction

John saw the man with two heads There exists a man with two heads Robert’s children are very noisy Robert has children

Ta có thể mô tả tiền giả định là một yêu cầu mà câu văn đưa ra cho ngữ cảnh Nếu ngữ cảnh không thỏa mãn các tiền giả định của câu thì nó có thể biến đổi thành ngữ cảnh mới qua quá trình thích nghi Nếu ngữ cảnh không thỏa tất cả các tiền giả định cũng không thể biến đổi thành một ngữ cảnh thỏa mãn tiền giả định nào đó thì biểu diễn bị loại bỏ Thủ tục xử lý các tiền giả định gồm hai trạng thái:

- Khởi tạo một biểu diễn cho riêng từng câu, trong đó các tiền giả định là các biểu diễn hiện được cho trước

Trang 25

Phiên bản DRT mới xây dựng biểu diễn theo hướng từ dưới lên: các biểu diễn khởi tạo được xây dựng từ các cây phân tích cú pháp bằng cách gán các biểu diễn ngữ nghĩa cho các lá, sau đó xây dựng các biểu diễn cho các thành phần phức tạp bằng cách kết nối các biểu diễn của các phần cú pháp liền

kề Luận văn chú trọng mô tả phiên bản DRT mới

2.1.2 Cách xây dựng cấu trúc biểu diễn diễn ngôn

Gần đây hướng xử lý từ dưới lên ngày càng phổ biến trong DRT [10] Luận văn sẽ mô tả thuật toán hướng từ dưới lên để xây dựng cấu trúc biểu diễn diễn ngôn (áp dụng cho phiên bản DRT mới dựa trên tiền giả định) Thuật toán gồm hai trạng thái

- Trạng thái đầu khởi tạo biểu diễn cho các câu trong đó tiền giả định được thể hiện rõ ràng trong DRS Biểu diễn khởi tạo đơn giản nhất

có dạng <P, D> trong đó DRS D là phần biểu diễn không có tiền giả định còn P là tập tất cả các biểu diễn (các biểu diễn này có thể có dạng DRS) tiền giả định của câu Phức tạp hơn, chính P có thể chứa luôn các DRS khởi tạo còn D có thể chứa thêm phần tiền giả định

- Trong trạng thái sau, tiền giả định được kiểm chứng trong các ngữ cảnh tương ứng, có thể có hoặc không xảy ra quá trình thích nghi ngữ cảnh Đến khi tiền giả định được kiểm chứng thành công thì phần

Trang 26

tham chiếu Tất cả các NP (noun phrase) xác định coi như luôn đi cùng một

tiền giả định với ảnh hưởng là có một cách xác định tham chiếu của chúng độc lập với phần còn lại trong câu phát ngôn chứa NP đó; tiền giả định này có thể

có rất nhiều dạng, giả sử như tham chiếu qua đồng tham chiếu với một đối tượng được thay thế Các NP không xác định lại được coi là không đi kèm tiền giả định

Trong quá trình xây dựng cấu trúc biểu diễn diễn ngôn, ta sử dụng toán

tử trộn (merge) để kết hợp các DRS với nhau Toán tử trộn có tính đối xứng

Định nghĩa 2.1.4 (Toán tử trộn) Cho hai DRS <U1, Con1> và <U2, Con2> Toán tử trộn, ký hiệu là , được định nghĩa như sau:

Ta thực hiện thuật toán cho ví dụ (3):

Chủ ngữ của câu đầu tiên “a delegate” là một NP không xác định nên

nó không yêu cầu tiền giả định Ta giả sử các phần khác của câu này cũng không đính kèm tiền giả định và ngữ cảnh hiện còn trống Như vậy ta có biểu diễn khởi tạo cho câu đầu như sau:

Ngữ cảnh DRS khởi tạo

Trang 27

26

Vì không cần giải quyết các tiền giả định, ta tích hợp phần DRS khởi tạo đã loại bỏ tiền giả định với ngữ cảnh, được kết quả là DRS ngữ cảnh mới cho câu thứ hai:

Chủ ngữ câu thứ hai là NP đại từ “she”, đòi hỏi một đối tượng được thay thế phù hợp, phải có giới tính nữ hoặc trung lập Đại từ này chỉ đến “a delegate” ở câu trước, đối tượng được thay thế ở đây có tính chất trung lập Như vậy tiền giả định có thể được thỏa mãn bằng cách đưa fem(x) vào DRS ngữ cảnh Câu sau sẽ có DRS khởi tạo như sau:

Tiền giả định được giải quyết bằng cách thêm y = x vào phần DRS khởi tạo đã

bỏ đi tiền giả định Cuối cùng sử dụng toán tử trộn một lần nữa ta được kết quả:

Như vậy ta đã xây dựng xong cấu trúc diễn ngôn cho câu (3)

Trang 28

27

2.2 NGÔN NGỮ DRS CƠ BẢN VÀ BIỂU DIỄN

Trong phần này chúng ta đưa ra một số định nghĩa chính tắc về cú pháp

và ngữ nghĩa của một một ngôn ngữ DRS cơ bản Phần đầu giới thiệu ngôn ngữ DRS mở rộng bậc một, biểu diễn một mô hình ngôn ngữ chủ đích và định nghĩa khái niệm mệnh đề được biểu diễn bởi một DRS trong thế giới giả định Tuy nhiên các điều kiện sự thật và các đề xuất không thể hiện hết các thể động của biểu diễn diễn ngôn trong DRT khi các câu được phiên dịch ngược với ngữ cảnh đã thiết lập trước đó và khi một ngữ cảnh cho trước được cập nhật trong biểu diễn này thành một ngữ cảnh mới sử dụng cho các câu tiếp theo Ta

mô hình hóa các yếu tố ngữ nghĩa động này thành các trạng thái thông tin và khả năng thay đổi ngữ cảnh, hoặc các quan hệ giữa các trạng thái thông tin Sau đó ta xem xét các mở rộng liên quan đến các lượng từ, số nhiều, thời và thể

2.2.1 Ngôn ngữ DRS mở rộng bậc một

Các DRS được xét trong phần này không chứa các điều kiện phức hợp (gọi là các DRS đơn giản) hoặc tiền giả thiết (gọi là các DRS đầy đủ), và chỉ chứa các biến ràng buộc (gọi là các DRS phù hợp) Các định nghĩa liên quan

sẽ được trình bày ngay dưới đây:

Định nghĩa 2.2.1 Từ vựng của ngôn ngữ DRS mở rộng bậc một L bao gồm:

- Tập các tham chiếu diễn ngôn Ref

- Tập các hằng quan hệ xác định một ngôi Name

- Các tập các hằng vị từ Reln

- Tập các ký hiệu phép toán logic Sym =

Trang 29

28

Ta xét ví dụ (1) trong ngôn ngữ DRS mở rộng bậc một:

- Hằng a (thay cho Pedro) có thể biểu diễn qua một vị từ một ngôi thuộc

tập Name Như vậy thay cho một hằng các thể a, Name sẽ chứa một vị

từ một ngôi Pedro và điều kiện Pedro(y) diễn tả y tham chiếu đến cá thể Pedro

- Biến x là một tham chiếu diễn ngôn thuộc Ref Giờ đây Ref chứa thêm

y

- P = donkey là vị từ thuộc Rel1 còn Q = own, R = like là các vị từ thuộc Rel2

Câu (1) sẽ được biểu diễn lại như sau:

[(donkey(x) ^ Pedro(y) ^ own(y,x)) like(y,x)]

Định nghĩa 2.2.2 Cú pháp DRS và các điều kiện DRS của L:

(i) Nếu và Con là một tập các điều kiện thì <U, Con> là

một DRS (ii) Nếu xi, xj Ref thì xi = xj là một điều kiện

(iii) Nếu N Name và x Ref thì N(x) là một điều kiện

(iv) Nếu P là một hằng vị từ n ngôi trong Rel và x1, …, xn Ref thì

P(x1, …, xn) là một điều kiện (v) Nếu K là một DRS thì là một điều kiện

(vi) Nếu K1 và K2 là các DRS thì K1 v K2 là một điều kiện

(vii) Nếu K1 và K2 là các DRS thì K1 => K2 là một điều kiện

Các điều kiện (ii) – (iv) được gọi là các điều kiện cơ bản, các điều kiện (v) – (vii) là các điều kiện phức

Trang 30

Tương ứng tập các tham chiếu diễn ngôn ràng buộc của K là tập BV(K)

= V(K) / FV(K) trong đó V(K) là tập tất cả các tham chiếu diễn ngôn trong K

Định nghĩa 2.2.4 DRS K là phù hợp nếu

Sau đây ta sẽ trình bày khái niệm DRS thuần nhất cũng như tính truy cập được giữa các DRS và giữa các tham chiếu diễn ngôn, các khái niệm này cần sử dụng các khái niệm về quan hệ DRS trực thuộc

Định nghĩa 2.2.5 (Tính trực thuộc) K1 là DRS trực thuộc K, ký hiệu K1 ≤ K, nếu một trong các điều kiện sau thỏa mãn:

(i)

(ii) Tồn tại DRS K2 sao cho hoặc

(iii) Tồn tại DRS K2 sao cho hoặc

(iv) K1 ≤ K2 và K2 ≤ K với DRS K2 nào đó

Định nghĩa 2.2.6 (Tính thuần nhất) K là DRS thuần nhất khi và chỉ khi với

mọi cặp DRS phân biệt K1 và K2 sao cho K2 ≤ K1 và K1 ≤ K thì:

Trang 31

30

Định nghĩa 2.2.7 (Tính truy cập được giữa hai cấu trúc diễn ngôn) DRS K có

thể truy cập được từ DRS K1, ký hiệu là K acc K1 nếu:

(i) K ≤ K1 hoặc

(ii) K và K1 cùng biểu diễn một DRS

Định nghĩa 2.2.8 (Tính truy cập được giữa hai tham chiếu diễn ngôn) Cho x,

y lần lượt là các tham chiếu diễn ngôn trong hai DRS K và K1 x có thể truy

cập được từ y, ký hiệu là x acc y, khi và chỉ khi K acc K1

* Các định nghĩa về xác nhận và sự thật

Ta có thể mở rộng các mô hình <U, F> cho ngôn ngữ DRS đơn giản L vừa định nghĩa ở trên cho các mô hình bậc nhất

Định nghĩa 2.2.9 (Hàm biểu diễn của mô hình) Hàm biểu diễn F cho các mô

hình của L được định nghĩa như sau:

Trang 32

31

Ký hiệu: : X là tập các tham chiếu diễn ngôn (có thể rỗng), đối tượng chèn k mở rộng g thành các tham chiếu diễn ngôn trong X, nghĩa là Dom(k) = Dom(g) X

Ý tưởng DRS là mô hình thành phần chỉ dùng trong trường hợp tất cả các điều kiện của K là công thức nguyên tử Khi DRS chứa các điều kiện phức hợp hơn, vấn đề trở nên khó khăn bởi chính cách xử lý các phép kéo theo và phủ định

Định nghĩa 2.2.10 (Đối tượng chèn xác nhận) Đối tượng chèn xác nhận cho

các DRS và các điều kiện DRS của L là:

(ii)

(iii)

(iv)

(v)

Ký hiệu: với là điều kiện của DRS, ta nói xác nhận trong , với là DRS, ta nói xác nhận theo

Định nghĩa 2.2.11 (Tính đúng của DRS trong mô hình) Một DRS phù hợp K

là đúng trong mô hình M khi và chỉ khi tồn tại một đối tượng chèn xác nhận h cho K trong M theo phép gán rỗng Ʌ

Trang 33

32

Hai định nghĩa 2.2.10 và 2.2.11 bảo đảm rằng các tham chiếu diễn ngôn trong không gian của một DRS chính (không xuất hiện ở vị trí trực thuộc DRS khác) được biểu diễn như các biến định lượng tồn tại Ngôn ngữ DRS trong đó chỉ những điều kiện phức tạp có dạng phủ định hoàn toàn có thể biểu diễn qua các tính toán vị từ (nhờ đó các ngôn ngữ trực thuộc có thể biểu diễn và các toán tử logic khác của logic cổ điển)

2.2.2 Ngữ nghĩa chủ đích, mệnh đề, trạng thái thông tin và khả năng thay đổi ngữ cảnh

Ngoài hai tài liệu [7] và [10], phần này còn tham khảo thêm tài liệu của tác giả K von Fintel [11] Ta xét ví dụ sau:

(4) It is raining (in Hanoi)

Câu này mô tả hiện tượng đang xảy ra tại thời điểm hiện tại ở đây (Hà Nội)

Ta có thể thêm một số yếu tố vào câu đang xét để đưa ra một phát ngôn trong các tình huống khác (tình huống thay thế: displacement) Giả sử ta thay đổi thời gian thành:

(4’) At noon yesterday, it was raining in Hanoi

Nói chung ngôn ngữ tự nhiên không giới hạn chỉ trong những diễn ngôn

mô tả vị trí và thời điểm của người nói Ngôn ngữ tự nhiên có khả năng gọi tên các thực thể và tham chiếu tới chúng trong trường hợp các thực thể không

ở vị trí người nói hay xuất hiện tại thời điểm người đưa ra phát ngôn Ví dụ:

(5) In the world of Sherlock Holmes, a detective lives at 221B Baker Street

Câu trên không nói về một nhân vật trong thế giới thực mà là thế giới được

mô tả trong tiểu thuyết Sherlock Holmes của Sir Arthur Conan Doyle Câu hỏi

Trang 34

33

đặt ra là: Làm cách nào ngôn ngữ tự nhiên có thể nắm bắt được các hiện tượng thay thế? Làm thế nào ta có thể quản lý được các phát ngôn về các thế giới giả thiết nào đó? Ngữ nghĩa chủ đích là một giải pháp được trình bày sau đây

Định nghĩa 2.2.12 (Thế giới giả thiết) Thế giới giả thiết là một cách thức nào

đó khiến cho sự vật, sự việc có khả năng tồn tại hay diễn ra

Ví dụ trong tình huống thực tế (xét trong thế giới hiện thực) đang có 2 cốc cà phê trên bàn Nhưng vẫn có những trường hợp có thể có nhiều hay ít hơn (tình huống giả thiết) Như vậy có một thế giới giả thiết nào đó tồn tại trường hợp

có 17 cốc cà phê trên bàn chứ không phải 2

Khi xây dựng biểu diễn diễn ngôn ở các phần trên, ta đã xét một miền các thực thể cùng các giá trị sự thật và mối quan hệ giữa chúng Trong phần này ta sẽ kết hợp với khái niệm mới về thế giới giả thiết

Ban đầu mục đích của ngữ nghĩa lý thuyết mô hình là giải thích ý nghĩa dưới dạng các điều kiện sự thật và tham chiếu Mục đích này được thực hiện qua một thủ tục gồm hai bước:

- Biểu diễn ngôn ngữ đối tượng được gán một dạng logic hoặc “biểu diễn

ngữ nghĩa” – một biểu diễn phụ thuộc vào một số ngôn ngữ chuẩn tắc

- Ta cho trước định nghĩa lý thuyết mô hình về các điều kiện sự thật cho

các biểu diễn ngữ nghĩa dạng logic trên Trong trường hợp đó các điều kiện sự thật của một biểu diễn của ngôn ngữ đối tượng là các điều kiện

sự thật của các biểu diễn chuẩn tắc được gán cho nó

Với DRT ta cũng thực hiện thủ tục trên:

- Gán biểu diễn chuẩn tắc (DRS) cho các bit ngôn ngữ tự nhiên

Trang 35

34

- Chỉ rõ định nghĩa sự thật khi áp dụng cho DRS

Các DRS được gán các điều kiện sự thật, còn các điều kiện sự thật của DRS được hiểu là các điều kiện sự thật của bit ngôn ngữ nó biểu diễn, và do đó như

là nội dung mệnh đề của bit ngôn ngữ này

DRS còn làm được nhiều hơn:

- Biểu diễn nội dung mệnh đề

- Ngoài ra DRS còn cung cấp ngữ cảnh mà qua đó các câu mới trong diễn

ngôn được phiên dịch

Trong DRT tất cả các câu mới của một diễn ngôn đều đóng góp và và lần lượt được phiên dịch qua một ngữ cảnh được xem xét liên tục Khái niệm mới về ý nghĩa như cập nhật ngữ cảnh và phiên dịch trong ngữ cảnh là dấu hiện nhật biết của ngữ nghĩa “động” từ thời điểm phát triển sơ khai đã được DRT khởi xướng Một khía cạnh của sự phụ thuộc các câu vào ngữ cảnh trong các văn bản hay diễn ngôn nối liền là trong cấu trúc xử lý theo hướng từ dưới lên, DRS xây dựng từ một câu nào đó thường không có tính phù hợp: nó sẽ chứa tham chiếu diễn ngôn tự do (nhưng thuộc vào không gian của DRS ngữ cảnh; tình huống này xảy ra khi một đại từ được xử lý trong ngữ cảnh) Trong các trường hợp này, định nghĩa xác nhận 2.2.10 và định nghĩa sự thật 2.2.11 chỉ gán các điều kiện sự thật được định nghĩa tốt cho tổng trộn của DRS mới với DRS ngữ cảnh

Một câu hỏi đặt ra là: Ta có thể giải thích cách thức câu mới cập nhật ngữ cảnh mà câu được phiên dịch trong đó bằng cách gán một hàm ứng với các điều kiện sự thật của ngữ cảnh DRS với ngữ cảnh mới cập nhật không? Với lý thuyết tập hợp mở rộng ta sẽ xét sau đây (mô hình chủ đích), vấn đề trở thành:

Trang 36

Phần này trình bày các khái niệm cho ngôn ngữ DRS đơn giản L trong định nghĩa 2.2.1 Để đơn giản ta giả sử với mỗi mô hình, tất cả các thế giới giả thiết (gọi tắt là thế giới) đều thuộc cùng không gian, các tên gọi chỉ ký hiệu một lần trong toàn mô hình Tuy nhiên các quan hệ được định nghĩa cho riêng từng thế giới Riêng quan hệ truy cập được là quan hệ thỏa mãn toàn không gian

Định nghĩa 2.2.13 (Mô hình chủ đích) Mô hình chủ đích M là bộ ba

, trong đó:

(i) W M là tập các thế giới

(ii) U M là tập khác rỗng các cá thể trong thế giới

(iii) – Với tên gọi,

- Với các quan hệ n ngôi,

Định nghĩa 2.2.14 (Đối tượng chèn xác nhận (định nghĩa toàn cục)) Trong mô

hình M, với nào đó, một đối tượng chèn xác nhận được định nghĩa như sau:

Định nghĩa 2.2.15 (Ngữ nghĩa chủ đích) Ngữ nghĩa chủ đích cho các DRS và

các điều kiện DRS của L là:

Trang 37

Định nghĩa 2.2.16 (Tính đúng của DRS trong mô hình) Một DRS phù hợp K

là đúng trong M tại một thế giới khi và chỉ khi tồn tại một đối tượng chèn h của UK sao cho

Định nghĩa 2.2.17 (Mệnh đề) Cho một DRS phù hợp K, mệnh đề biểu diễn bởi K liên quan đến M được định nghĩa như sau:

Khái niệm ngữ nghĩa chủ đích giúp DRT mở rộng được danh mục các điều kiện DRS phức hợp Các mô hình chủ đích có thể mô hình hóa ngữ nghĩa động cho DRS theo nghĩa nào đó khác với các phiên bản đã nêu ở trên Trong DRT, các biểu diễn ngữ nghĩa được xây dựng theo dạng DRS ngữ cảnh, trong

đó cứ một phần diễn ngôn mới thêm vào được xét trong ngữ cảnh đã có lại cập nhật ngay ngữ cảnh đó thành ngữ cảnh mới cho các phần diễn ngôn tiếp theo Các DRS liên kết với điều kiện sự thật và mô hình chủ đích đã có để định nghĩa ra mệnh đề biểu diễn bởi một DRS như tập các thế giới định nghĩa đúng DRS đó Tuy nhiên có nhiều ví dụ cho thấy chỉ dùng các điều kiện sự thật (và các giá trị ngữ nghĩa động dựa trên các hàm đi từ mệnh đề vào mệnh đề) vẫn

Trang 38

Định nghĩa 2.2.18 (Trạng thái thông tin) Cho một DRS phù hợp K, trạng thái

thông tin biểu diễn bởi K theo mô hình chủ đích M được định nghĩa như sau:

Các đối tượng chèn xác nhận f trong một DRS ngữ cảnh K cho trước ghi lại các tham chiếu diễn ngôn có sẵn trong UK khi trong câu thuộc ngữ cảnh của K xuất hiện các đối tượng được tham chiếu Các hàm chèn f xuất hiện trong trạng thái thông tin biểu diễn bởi một DRS K trong M sẽ có cùng miền xác định (UK): nếu thì Dom(f) = UK Ta chấp nhận giả thiết sau như ràng buộc chung cho trạng thái thông tin: với mỗi trạng thái thông tin I luôn tồn tại một tập X các tham chiếu diễn ngôn sao cho

Trang 39

38

, Dom(f) = X, X gọi là cơ sở của I và ký hiệu là XI Cho một DRS

K, mệnh đề định nghĩa bởi K (nghĩa là tập các thế giới có thể có xác định K đúng) có thể suy ra từ trạng thái thông tin

Rõ ràng ánh xạ từ trạng thái thông tin vào mệnh đề là ánh xạ nhiều-một: hai câu có thể biểu diễn cùng một mệnh

đề nhưng lại có trạng thái thông tin khác nhau Không giống mệnh đề, trạng thái thông tin ghi nhận những tham chiếu diễn ngôn do ngữ cảnh cung cấp như các đối tượng được NP trong các câu thuộc ngữ cảnh tham chiếu

Định nghĩa 2.2.19 (Các loại trạng thái thông tin) Cho một mô hình chủ đích

M, một DRS K và một tập các tham chiếu diễn ngôn X, ta định nghĩa:

(i) I là trạng thái thông tin liên quan đến M và X khi và chỉ khi

(ii) I là trạng thái thông tin liên quan đến M khi và chỉ khi tồn tại X sao cho

I là trạng thái thông tin liên quan đến M và X

(iii) I là trạng thái thông tin liên quan đến M và X, X được gọi là cơ sở

của I và ký hiệu là XI

(iv) Trạng thái thông tin rỗng liên quan đến M,

(v) Mệnh đề Prop(I) được xác định bởi I:

* Khả năng thay đổi ngữ cảnh (CCP: context change potential)

Cho một DRS ngữ cảnh Ki và một DRS K cho một câu được phiên dịch trong ngữ cảnh biểu diễn bởi Ki dẫn tới một ngữ cảnh mới K0 Giá trị ngữ nghĩa động (CCP) liên kết với K có thể chuyển đổi ngữ cảnh đầu vào Ki thành

Trang 40

39

ngữ cảnh đầu ra K0 bằng cách sử dụng K để cập nhật Ki Ví dụ sau cho thấy K không cần là DRS phù hợp:

(8) John owns a donkey It loves him

Ki là DRS phù hợp nhưng K thì không vì nó chứa biến x, y tự do, DRS kết quả

K0 vẫn bảo toàn tính phù hợp Vậy K là yếu tố cập nhật Ki Ta có thể giải thích bằng công thức như sau:

( với mô hình M bất kì) Điều kiện này là nguyên tắc chung cho đặc tính của CCP của một DRS K liên quan đến mô hình M nào đó: đó là một hàm định nghĩa trên các trạng thái thông tin I liên quan đến mô hình M sao cho và gán cho mỗi I có

dạng một trạng thái thông tin biểu diễn bởi Tổng quát hóa cho trạng thái thông tin bất kỳ ta có định nghĩa sau:

Định nghĩa 2.2.20 (Khả năng thay đổi ngữ cảnh (CCP)) Khả năng thay đổi

ngữ cảnh (hay ngữ nghĩa động của một biểu diễn) của DRS K liên quan đến mô hình M được định nghĩa là một hàm thành phần từ trạng thái thông tin

đến trạng thái thông tin sao cho:

(i) được định nghĩa cho các trạng thái thông tin I liên quan đến M

sao cho

Ngày đăng: 23/02/2021, 15:37

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
(1) Nguyễn Đức Dân (1996), Nhận diện thời gian trong tiếng Việt, Tạp chí Ngôn ngữ số 3, Viện Ngôn ngữ học Sách, tạp chí
Tiêu đề: Nhận diện thời gian trong tiếng Việt
Tác giả: Nguyễn Đức Dân
Năm: 1996
(3) Nguyễn Văn Hán (2012), Định vị thời gian trong tiếng Việt dưới góc nhìn của ngôn ngữ học tri nhận (so sánh với tiếng Anh), Luận án tiến sĩ Ngôn ngữ học, Trường Đại học Khoa học Xã hội và Nhân văn, Đại học Quốc gia Thành phố Hồ Chí Minh Sách, tạp chí
Tiêu đề: Định vị thời gian trong tiếng Việt dưới góc nhìn của ngôn ngữ học tri nhận (so sánh với tiếng Anh)
Tác giả: Nguyễn Văn Hán
Năm: 2012
(4) Cao Xuân Hạo (1998), Về ý nghĩa “thì” và “thể” trong tiếng Việt, Tạp chí Ngôn ngữ số 5, Viện Ngôn ngữ học Sách, tạp chí
Tiêu đề: Về ý nghĩa “thì” và “thể” trong tiếng Việt
Tác giả: Cao Xuân Hạo
Năm: 1998
(5) Vũ Thị Ngân (2003), Phạm trù thời thể tiếng Pháp và tiếng Việt, Đề tài cấp Đại học Quốc gia Hà Nội, Trường Đại học Ngoại ngữ, Đại học Quốc gia Hà Nội Sách, tạp chí
Tiêu đề: Phạm trù thời thể tiếng Pháp và tiếng Việt
Tác giả: Vũ Thị Ngân
Năm: 2003
(6) Nguyễn Minh Thuyết (1998), Thành phần câu tiếng Việt, Nhà xuất bản Đại học Quốc gia Hà Nội.Tài liệu tiếng Anh Sách, tạp chí
Tiêu đề: Thành phần câu tiếng Việt
Tác giả: Nguyễn Minh Thuyết
Nhà XB: Nhà xuất bản Đại học Quốc gia Hà Nội. Tài liệu tiếng Anh
Năm: 1998
(7) A. Burchardt, S. Walter, A. Koller, M. Kohlhase, P. Blackburn, J. Bos (2002), Computational Semantics, MiLCA, Department of Computer- linguistic, Saarlandes Saarbrucken University, Germany Sách, tạp chí
Tiêu đề: Computational Semantics
Tác giả: A. Burchardt, S. Walter, A. Koller, M. Kohlhase, P. Blackburn, J. Bos
Năm: 2002
(8) A. Martelli, U. Montanari (1982), An Efficient Unification Algorithm, Journal: ACM Transactions on Programming Languages and Systems, New York, USA Sách, tạp chí
Tiêu đề: An Efficient Unification Algorithm
Tác giả: A. Martelli, U. Montanari
Năm: 1982
(9) F. Baader, W. Snyder (2001), Unification Theory, Elsevier Science Publishers Sách, tạp chí
Tiêu đề: Unification Theory
Tác giả: F. Baader, W. Snyder
Năm: 2001
(10) H. Kamp, Josef van Genabith, Uwe Reyle (2011), Discourse Representation Theory, An Updated Survey. In: D. Gabbay (ed.), Handbook of Philosophical Logic, 2nd ed., Vol XV Sách, tạp chí
Tiêu đề: Discourse Representation Theory
Tác giả: H. Kamp, Josef van Genabith, Uwe Reyle
Năm: 2011
(11) K. von Fintel, Irene Heim (2011), Intensional Semantics, MIT Spring Sách, tạp chí
Tiêu đề: Intensional Semantics
Tác giả: K. von Fintel, Irene Heim
Năm: 2011
(12) P. Selinger (2007), Lecture Notes on the Lambda Calculus, Department of Mathematics and Statistics, Dalhousie University, Halifax, Canada Sách, tạp chí
Tiêu đề: Lecture Notes on the Lambda Calculus
Tác giả: P. Selinger
Năm: 2007
(13) V. Presutti, Francesco Draicchio, Aldo Gangemi (2012), Knowledge extraction based on discourse representation theory and linguistic frames, EKAW'12 Proceedings of the 18th international conference on Knowledge Engineering and Knowledge Management, Springer-Verlag Berlin, Heidelberg Sách, tạp chí
Tiêu đề: Knowledge extraction based on discourse representation theory and linguistic frames
Tác giả: V. Presutti, Francesco Draicchio, Aldo Gangemi
Năm: 2012

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w