Nội dung chính của bài viết trình bày mô tả thông tin từ vựng trong từ điển dùng cho máy tính. Để hiểu rõ hơn, mời các bạn tham khảo chi tiết nội dung bài viết này.
Trang 1HƯỚNG DẪN MÔ TẢ THÔNG TIN TỪ VỰNG TRONG TỪ ĐIỂN DÙNG CHO MÁY TÍNH
SP 7.2 – Đề tài KC.01.01.05/06-10
Vũ Xuân Lương1, Nguyễn Thị Minh Huyền2, Hồ Tú Bảo3
Mục lục
A THÔNG TIN HÌNH THÁI – MORPHOLOGICAL 5
I THÔNG TIN CẤU TẠO TỪ 5
1 Tiêu chí xác định 5
2 Thực hành gán nhãn thông tin cấu tạo từ 5
2.1 Từ đơn : simple word 5
2.2 Từ ghép (compound word); 6
2.3 Từ láy (reduplicative word) 6
B THÔNG TIN CÚ PHÁP – SYNTACTIC 8
I THÔNG TIN TỪ LOẠI 8
1 Tiêu chí xác định từ loại 8
2 Thực hành gán nhãn thông tin cú pháp 8
2.1 Danh từ (Nouns - N) 8
2.1.1 Danh từ riêng : Proper Noun 8
2.1.2 Danh từ đơn thể : Concrete Noun 8
2.1.3 Danh từ tổng hợp : Collective Noun 9
2.1.4 Danh từ trừu tượng : Abstract Noun 9
2.1.5 Danh từ loại thể : Classify Noun 10
2.1.6 Danh từ đơn vị : Unit Noun 10
2.2 Động từ (Verbs – V) 11
2.2.1 Nội động từ (intransitive verb) 11
2.2.2 Ngoại động từ (transitive verb), 11
2.2.3 Động từ trạng thái (state verb) 11
1 Trung tâm Từ điển học (Vietlex)
2 Đại học Khoa học Tự nhiên – Đại học Quốc gia Hà Nội
3 JAIST
Trang 22.2.4 Trợ động từ (auxiliary verb) 12
2.3 Tính từ (Adjective – A) 12
2.3.1 Tính từ chỉ tính chất 12
2.3.2 Tính từ quan hệ 13
2.3.3 Tính từ tượng thanh : Onomatopoetic Adjective 13
2.3.4 Tính từ tượng hình : Pictographic Adjective 13
2.4 Đại từ (Pronoun – P) 14
2.4.1 Đại từ xưng hô 14
2.4.2 Đại từ chỉ định 14
2.4.3 Đại từ nghi vấn 14
2.5 Số từ (Numeral – M) 14
2.5.1 Số đếm 14
2.5.1 Số thứ tự 14
2.6 Lượng từ (Numeral – M) 14
2.7 Phụ từ (Adverb – R) 14
2.8 Giới từ (Preposition – O) 15
2.9 Liên từ (Conjunction – C) 15
2.10 Trợ từ (Introductory word – I) 15
2.11 Cảm từ (Emotivity word – E) 15
C THÔNG TIN NGỮ NGHĨA - SEMANTIC 16
I LOGICAL CONSTRAINT: 16
1 Tiêu chí xác định 16
2 Thực hành gán nhãn thông tin ngữ nghĩa 16
2.1 Con người : People 16
2.1.1 Người : Person 16
2.1.2 Tổ chức : Organization 16
2.1.3 Nhân vật siêu nhiên : Supernatural Being 16
2.2 Động vật : Animal 17
2.2.1 Thú : Animal 17
2.2.2 Chim : Bird 17
2.2.3 Cá : Fish 17
Trang 32.2.4 Lưỡng cư : Amphibian 17
2.2.5 Bò sát : Reptile 17
2.2.6 Sâu : Worm 18
2.1.2.7 Côn trùng : Insect 18
2.1.2.8 Động vật thân mềm : Shellfish 18
2.1.2.9 Động vật giáp xác : 18
2.1.2.10 động vật hư cấu : Fictional Animal 19
2.3 Vi sinh vật : Microorganism 19
2.4 Thực vật : Plant 19
2.4.1 cây thân gỗ : Tree 19
2.4.2 cây bụi : Bush 19
2.4.3 cây thân leo : Vine 19
2.4.4 cây thân cỏ : Herb 19
2.5 Thức ăn : Food 19
2.6 Vật dụng : Artifact 19
2.7 Vật hư cấu : Fictional Object 19
2.8 Bộ phận : Part 19
2.9 Chất liệu : Substance 20
2.10 Tự nhiên : Natural Object 20
2.11 Vị trí : Location 20
2.12 Lĩnh vực tri thức : Field Of Knowledge 20
2.13 Trạng thái : State 20
2.14 Hoạt động : Action 20
2.15 Quan hệ : Relation 20
2.16 Tình thái : 20
2.17 Thuộc tính: Attribute 20
2.18 Giá trị : Value 20
2.19 Đơn vị : Unit 20
II SEMANTIC CONSTAINT: 20
1 Tiêu chí xác định 20
2 Thực hành gán nhãn thông tin Semantic constraint 21
Trang 42.1 Subject : chủ thể 21
2.2 Object : khách thể Error! Bookmark not defined. 2.2.1 Direct object (Dob) : bổ ngữ trực tiếp 21
2.2.2 Indirect object (iob) : bổ ngữ gián tiếp 22
2.2.3 Object (Obj) : bổ ngữ tự do 23
2.3 Location (Loc) : vị trí, địa điểm 24
Trang 5A THÔNG TIN HÌNH THÁI – MORPHOLOGICAL
I THÔNG TIN CẤU TẠO TỪ
1 Tiêu chí xác định
Trong phạm vi của đề tài, cấu tạo của từ được xét về những mặt sau đây:
a) Căn cứ vào mặt ý nghĩa và khả năng hoạt động để phân biệt từ đơn với từ phức
b) Từ đơn là từ chỉ chứa một tiếng, tiếng ấy phải có nghĩa và có khả năng hoạt động độc lập Chúng nằm trong vốn từ cơ bản của tiếng Việt, và phần lớn trong số đó là
từ gốc (hiểu theo nghĩa là những từ có khả năng được dùng để cấu tạo hàng loạt từ phức)
c) Từ phức là từ gồm hai tiếng trở lên kết hợp chặt chẽ với nhau, và có ý nghĩa cho sẵn mà không thể nào xác định được một cách rõ ràng bằng việc suy ra từ ý nghĩa của mỗi tiếng
d) Muốn nhận ra một từ phức thì phải tìm ra trong nó ít nhất một tiếng có nghĩa
e) Trong loại từ phức, căn cứ vào phương thức cấu tạo để phân biệt từ ghép với từ
láy hoặc dạng láy
2 Thực hành gán nhãn thông tin cấu tạo từ
2.1 Từ đơn : simple word
Đặc điểm:
- Gồm những từ có một tiếng vừa có nghĩa, vừa hoạt động độc lập
- Những từ có nhiều tiếng (bao gồm cả từ vay mượn đã được Việt hoá, hoặc có hình thức phiên âm gần giống với tiếng Việt), nhưng nếu mỗi tiếng trong đó tự
nó không có ý nghĩa (phải cả khối gồm nhiều tiếng gộp lại mới có ý nghĩa) thì
cũng được xếp vào loại từ đơn Ví dụ: bồ nông, bồ hóng, bù nhìn, mạt chược,
ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lô, blốc, crếp, v.v
- Những từ có nhiều tiếng có hình thức cấu tạo giống như từ láy nhưng nếu chia các tiếng đó ra mà mỗi tiếng không có một ý nghĩa nào hết cũng được xếp vào
loại từ đơn Ví dụ: ba ba, chuồn chuồn, cào cào, châu chấu, đu đủ, su su,
thuồng luồng, v.v
Danh sách:
trâu, bò, lợn, gà, sách, đèn, bàn, ghế, ông, bà, cha, mẹ, núi, sông, cây, hoa, máy, xe, con, cục, cái, ăn, học, ngủ, đi, đứng, khóc, cười, đẹp, xấu, tốt, đã, sẽ, đang, bồ nông, bồ
Trang 6hóng, bù nhìn, mạt chược, ba ba, chuồn chuồn, ca la thầu, ba lô, béc giê, cà phê, căng tin, xi măng, xích lô, blốc, crếp, v.v
2.2 Từ ghép (compound word);
Đặc điểm:
- Từ ghép được cấu tạo theo phương thức phối hợp ngữ nghĩa giữa các tiếng được dùng làm yếu tố cấu tạo
- Từ ghép gồm chủ yếu những từ có hai tiếng, cũng có thể là từ nhiều tiếng, mỗi
tiếng đều có nghĩa rõ rệt và có thể hoạt động như một từ đơn
- Căn cứ vào phương thức phối hợp ngữ nghĩa lại có thể phân biệt thành từ ghép
song song (từ ghép đẳng lập) và từ ghép chính phụ
- Từ ghép song song có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ bình
đẳng, song song, không có tiếng chính, tiếng phụ (ví dụ: nhà cửa, ruộng vườn,
quần áo, núi sông), và thường mang ý nghĩa khái quát Trật tự trước sau giữa
hai tiếng có thể thay đổi (ví dụ: nhà cửa - cửa nhà, chờ mong – mong chờ, chèo
chống – chống chèo)
- Từ ghép chính phụ có sự phối hợp ngữ nghĩa giữa hai tiếng theo quan hệ không bình đẳng Đó là sự phối hợp giữa một tiếng chính có ý nghĩa khái quát và một
tiếng phụ có ý nghĩa hạn định (ví dụ: xe đạp, tàu hoả, nhà ga, nhà thương, nhà
rông, rượu chanh, bánh mì, cơm chay)
- Những từ hai tiếng có cấu tạo theo phương thức lặp lại hoàn toàn (giống từ láy), nhưng có nghĩa ngữ pháp chỉ “số nhiều đều đặn” thì được xếp vào loại từ ghép
Ví dụ: ai ai, chiều chiều, đâu đâu, ngày ngày, người người, sáng sáng, tối tối,
2.3 Từ láy (reduplicative word)
Đặc điểm:
Trang 7- Từ láy được cấu tạo theo phương thức láy, đó là phương thức lặp lại có tính
chất hoà phối ngữ âm toàn bộ tiếng gốc hay lặp lại một bộ phận nào đó của tiếng gốc bằng một tiếng khác gọi là tiếng láy (âm tiết láy)
- Từ láy gồm chủ yếu là những từ có hai tiếng (có một số ít là từ ba hoặc bốn tiếng), trong đó có thể chỉ có một tiếng có nghĩa, hoặc có thể có nhiều tiếng có
nghĩa Ví dụ: long lanh (long có nghĩa), long tong (tong có nghĩa), xanh xanh (cả hai tiếng đều có nghĩa), (căn phòng trông) tối tối (cả hai tiếng đều có nghĩa),
v.v
- Căn cứ vào phương thức phối hợp ngữ âm có thể phân biệt 2 kiểu từ láy: láy bộ
phận (chúm chím, bập bềnh, lênh khênh, ) và láy toàn bộ (lăm lăm, đùng
đùng, oang oang, ) Để có được tính chất hoà phối ngữ âm, việc láy không
đơn thuần là sự lặp lại tiếng gốc ban đầu, mà thường kèm theo một sự biến đổi
nhất định về mặt âm thanh (đo đỏ, lành lạnh, nho nhỏ, vành vạnh, )
- Căn cứ vào số lần lặp lại của hình thức ngữ âm có thể phân biệt 3 kiểu từ láy:
láy đôi (gọn gàng, vững vàng, chắc chắn, ), láy ba (dửng dừng dưng, sạch
sành sanh, tẻo tèo toe, ), và láy tư (đủng đa đủng đỉnh, long la long lanh, nhí nha nhí nhảnh)
- Chú ý phân biệt giữa từ láy và dạng láy, chẳng hạn đủng đỉnh, long lanh, nhí
nhảnh (từ láy) và đủng đa đủng đỉnh, loang la long lanh, nhí nha nhí nhảnh
(dạng láy)
- Chú ý phân biệt giữa từ ghép và dạng láy; chẳng hạn đỏ hoét (từ ghép) và đỏ
hoen hoét (dạng láy), đỏ hỏn (từ ghép) và đỏ hon hỏn (dạng láy), xanh lè (từ
ghép) và xanh lè lè (dạng láy), xanh lét (từ ghép) và xanh len lét (dạng láy), v.v
- Chú ý phân biệt giữa từ láy và dạng lặp trong từ ghép Chẳng hạn, tối tối với nghĩa “tối nào cũng vậy” là dạng lặp (từ ghép); còn tối tối (hay tôi tối) với nghĩa “lúc gần tối, chưa tối hẳn” (Có tiếng chim gì mổ nhau kêu quang quác
trong chiếc lồng kẽm chỗ tối tối) là từ láy
- Chú ý phân biệt giữa từ láy và từ đơn Chẳng hạn các tổ hợp ba ba, cào cào,
châu chấu, chuồn chuồn, (quả) đu đủ, (quả) su su, thuồng luồng về hình thức
ngữ âm có cấu tạo giống như từ láy, nhưng khi xét riêng mỗi yếu tố trong từng
tổ hợp thì chúng đều không mang một ý nghĩa nào hết, vì lẽ đó chúng được xếp vào danh sách các từ đơn
Ghi chú: Trong phạm vi đề tài này, chúng tôi không phân biệt các kiểu từ láy, và đồng
thời xếp chung cả dạng láy vào loại từ láy,
Danh sách:
ào ào, bập bềnh, bập bà bập bềnh, bập bùng, chí chát, chí cha chí chát, chông chênh,
đỏ hon hỏn, lênh khênh, long bong, long tong, ma mảnh, mơn mởn, …
Trang 8B THÔNG TIN CÚ PHÁP – SYNTACTIC
I THÔNG TIN TỪ LOẠI
1 Tiêu chí xác định từ loại
1.1 Tiêu chí về ý nghĩa khái quát: ý nghĩa khái quát được hiểu là ý nghĩa được
nhận biết thông qua ý nghĩa hay cách sử dụng của một loạt từ nhất định (ý nghĩa ngữ pháp), chứ không phải thông qua ý nghĩa hay cách sử dụng của từng từ cụ thể (ý nghĩa từ vựng) Chẳng hạn: ý nghĩa về sự vật được xếp
thành loại danh từ; ý nghĩa về hành động và trạng thái được xếp thành loại
động từ; ý nghĩa về tính chất được xếp thành loại tính từ, v.v
1.2 Tiêu chí về khả năng kết hợp:
- Từ có khả năng làm đầu tố trong trong cụm từ chính phụ;
- Từ có tham gia vào cụm từ chính phụ nhưng không làm đầu tố;
- Từ không tham gia vào cụm từ chính phụ, nhưng có thể có quan hệ với cụm từ chính phụ trong trường hợp cụ thể
1.3 Tiêu chí về chức năng cú pháp:
- Chức năng của từ là đóng vai trò gì trong thành phần câu Dùng chức năng của
từ để góp phần làm cho việc phân định từ loại được rõ ràng
- Có thể nhận ra được chức năng của từ trong hoạt động ngôn ngữ, chẳng hạn
chức năng chủ ngữ đối với danh từ, vị ngữ đối với động từ, v.v
2 Thực hành gán nhãn thông tin cú pháp
2.1 Danh từ (Nouns - N)
2.1.1 Danh từ riêng : Proper Noun
Đặc điểm:
- Không kết hợp được với số từ, đại từ chỉ định, trừ danh từ chỉ tên người trong
những trường hợp đặc biệt Vd: trong lớp này có hai Tuấn; thêm một Thứ nữa
là vừa bảy
Danh sách:
Nguyễn Du, Việt Nam, Hải Phòng, Trường Đại học Bách khoa, Mộc tinh,
2.1.2 Danh từ đơn thể : Concrete Noun
Đặc điểm:
Trang 9- Chỉ những vật thể mà ta có thể dùng cảm quan thông thường để phân biệt được một cách cụ thể
- Chỉ những vật thể tưởng tượng gắn với đời sống tâm linh của con người
- Đứng sau danh từ chỉ loại hoặc sau số từ + danh từ chỉ loại
- Đứng trước đại từ chỉ định (này, kia, ấy, nọ)
Danh sách:
bàn, ghế, sách, vở, dao, thuyền, xe đạp, xe lửa, tàu thuỷ, cầu, đường, nhà ga, cửa sổ,
gà, ngựa, giáo viên, học sinh, bác sĩ, thần, thánh, tiên, bụt, ma, quỷ, sông, hồ, núi, âm phủ, thiên đàng, niết bàn,
2.1.3 Danh từ tổng hợp : Collective Noun
- Không đứng sau danh từ chỉ loại
- Không đứng trước đại từ chỉ định (này, kia, ấy, nọ)
Danh sách:
nhà cửa, gà qué, thầy trò, đồ đạc, cây cối, chim muông, quần áo, trong ngoài, trên dưới, quan quân, binh lính, binh mã, người ngựa, nhân dân, quân đội, uỷ ban, ban chấp hành, sư đoàn, tỉnh thành, thành phố, nông thôn, thủ đô,
2.1.4 Danh từ trừu tượng : Abstract Noun
Đặc điểm:
- Chỉ những khái niệm được khái quát hoá trong tư duy
- Không đứng sau số từ, danh từ chỉ loại, trừ những trường hợp đặc biệt; chẳng
hạn: một nền dân chủ, nỗi tâm tư, cái tình yêu, cái tật, cái thói
Danh sách:
chính sách, chủ trương, tư tưởng, tâm tư, tình cảm, chính trị, lí luận, kinh tế, kế hoạch, nghề nghiệp, nghiệp vụ, phán đoán, định luật, định lí, bệnh tật, tật, thói, vùng, miền, trong, trên, ngoài, dưới,
Trang 102.1.5 Danh từ loại thể : Classify Noun
Đặc điểm:
- Chỉ từng cá thể, từng đơn vị sự vật, hiện tượng xác định
- Chỉ tập hợp những vật cùng loại
- Không đảm nhiệm vai trò định danh
- Đứng trước và làm phụ tố cho những danh từ đơn thể đảm nhiệm vai trò chính
tố
- Thường đứng sau số từ
- Trong chu cảnh cụ thể, có thể thay thế cho danh từ đơn thể để đảm nhiệm vai
trò chính tố, chẳng hạn: trong chuồng nuôi hai con ngựa, (một) con thì béo, (một) con thì gầy
Danh sách:
con, cây, cục, cái, chiếc, tấm, phiến, tờ, tập, tệp, mẩu, mảnh, miếng, cuốn, quyển, pho, ngọn, quả, lá, cọng, ngôi, toà, túp, căn, thửa, tiếng, tia, cột, bó, chồng, mớ, giàn, xiên, xâu, bánh, luồng, hạt, dòng, cụ, ông, người, tên, thằng, đứa, cậu, chú, cô, cuộc, sự, nỗi, niềm, toán, bầy, đàn, lũ, tốp, bộ, đợt, trận, cơn, ván, bàn,
2.1.6 Danh từ đơn vị : Unit Noun
Đặc điểm:
- Danh từ đơn vị khoa học, chỉ đơn vị đo lường do các nhà khoa học đặt ra và
quy ước chung, như gam, mét, lít Các danh từ loại này đứng trước và làm phụ
tố cho những danh từ đơn thể chỉ chất liệu đảm nhiệm vai trò chính tố
- Danh từ đơn vị dân gian, vốn có nghĩa phái sinh từ những danh từ chỉ đồ đựng
hay các hành động tạo lượng do nhân dân quy ước, như đấu, thùng, bồ, nắm,
ngụm Các danh từ loại này thường đứng sau số từ
- Danh từ đơn vị tiền tệ (đồng, hào, yên, bảng, ); luôn luôn đứng sau số từ
- Danh từ đơn vị thời gian, chỉ một khoảng thời gian xác định hoặc không xác định; thường đứng sau số từ (giờ, phút, canh, khắc, ); luôn luôn đứng sau số từ.; thường dùng làm chính tố trong ngữ danh từ
- Danh từ đơn vị tổ chức (làng, xã, phường, huyện, bang, lớp, ); luôn luôn đứng
sau số từ; thường dùng làm chính tố trong ngữ danh từ; thường đứng trước danh
từ riêng chỉ địa danh
Danh sách:
Trang 11cm, kg, tấn, tạ, ca, thùng, đấu, bơ, bò, nắm, ngụm, nhúm, … giờ, phút, giây, canh, khắc, ngày, tháng, năm, quý, lúc, làng, bản, thôn, xóm, xã, phường, huyện, quận, tỉnh, nhóm, tổ, đội, lớp, bang,
2.2 Động từ (Verbs – V)
2.2.1 Nội động từ : intransitive verb
Đặc điểm:
- Chỉ những động từ hoạt động không bắc cầu sang những sự vật ở ngoài nó
- Khi những động từ này làm chính tố (vị ngữ chính) trong câu thì không đòi hỏi
phải có bổ ngữ đối tượng trực tiếp nhưng nghĩa của câu vẫn được hiểu đầy đủ
- Chỉ những động từ hoạt động có bắc cầu sang những sự vật ở ngoài nó
- Khi những động từ này làm chính tố (vị ngữ chính) trong câu đòi hỏi phải có bổ
ngữ đối tượng trực tiếp, bổ ngữ đối tượng gián tiếp, hoặc bổ ngữ tự do thì nghĩa
của câu mới được hiểu đầy đủ
- Chỉ những động từ biểu thị tình trạng, cách thức tồn tại của sự vật
- Khi những động từ này hoạt động làm chính tố (vị ngữ chính) thì sau nó phải có
phụ tố chỉ nội dung (còn tiền, mất của, ở bẩn, được ăn, mèo già hoá cáo, nên người, thành vợ chồng )
Danh sách:
có, còn, hết, được, mất, hoá, thành, nên, trở thành, trở nên, thua
Trang 122.2.4 Trợ động từ : auxiliary verb
Đặc điểm:
- Chỉ những động từ chuyên dùng phụ thêm cho một động từ khác để làm thành
vị ngữ trong câu
- Những động từ này có thể đứng trước hoặc sau động từ chính
- Một số biểu thị điều kiện và thái độ của chủ thể đối với hành động
- Một số biểu thị hướng của hành động
Danh sách:
bị, được, chịu, phải, muốn, toan, quyết, quyết phải, định, dám, nên, cần, đâm, sinh,
xuống (lặn xuống, xẹp xuống), lên (lớn lên ~ lửa bùng lên ~ thét lên ~ tức phát điên
lên ~ đỏ bừng mặt lên), ra (ra kết quả ~ nhận ra lỗi ~ đã hiểu ra),
2.3 Tính từ (Adjective – A)
2.3.1 Tính từ chỉ tính chất
Đặc điểm:
- Những từ mang ý nghĩa về các loại phẩm chất, như: tốt, đẹp, xấu, hay, dở, sạch,
bẩn, đục, trong, đúng, sai, quan trọng, tầm thường,
- Những từ mang ý nghĩa về lượng thuộc nhiều mặt như mật độ, độ dài, trọng
lượng, hình dạng, màu sắc, mùi vị, âm thanh: nhiều, ít, đông, thưa, dài, ngắn,
to, nhỏ, cao, thấp, nông, sâu, cong, thẳng, vênh, xanh, đỏ, thơm, thối, vang, dội,
ồn, lặng,
- Thường đi sau phụ từ chỉ thời gian (đã, đang, sẽ ), chỉ thang độ (rất, hơi, khí,
quá ), chỉ tần xuất (thường, hay, năng ), chỉ tính khẳng định và phủ định (có, không, chưa, chẳng )
- Thường đi trước phụ từ rồi (xong rồi, đẹp rồi, đỏ rồi, hỏng rồi ), phụ từ chỉ hướng phát triển ra, lên, đi, lại (đẹp ra, nhanh lên, xấu đi, nhỏ đi, nhỏ lại, chậm lại, trắng lại)
Danh sách:
tốt, đẹp, xấu, hay, dở, sạch, bẩn, đục, trong, đúng, sai, trái, phải, quan trọng, tầm thường, nhiều, ít, đông, thưa, dài, ngắn, to, nhỏ, cao, thấp, nông, sâu, cong, thẳng, vênh, xanh, đỏ, thơm, thối, vang, dội, ồn, lặng, gập ghềnh, chông chênh, lênh khênh, sừng sỏ, hùng hổ,