Như giáo sư Nguyễn Tài Cẩn trong cuốn Giáo trình lịch sử ngữ âm tiếng Việt sơ thảo ựã chỉ ra rằng, tiếng Việt Ộlà một ngôn ngữ thuộc nhóm Việt Mường, tiểu chi Việt-Chứt vẫn thường gọi l
Trang 1TẠP CHÍ KHOA HỌC, đại học Huế, Số 66, 2011
GÓP PHẦN XÁC đỊNH NGUỒN GỐC TIẾNG VIỆT QUA ỘBẢNG 100 TỪ CƠ BẢN SWADESHỢ
Võ Trung định Trường đại học Ngoại ngữ, đại học Huế
TÓM TẮT
ỘBảng 100 từ cơ bản SwadeshỢ là Bảng từ cơ bản thông dụng trên thế giới Ứng dụng Bảng này trong việc truy tìm từ nguyên tiếng Việt có thể phát hiện ra mối quan hệ giữa tiếng Việt và các thứ tiếng khác trong khu vực Châu Á thuộc ngữ hệ Nam Á, ngữ hệ Nam đảo hay cả với ngữ hệ Hán Tạng Thực ra 100 từ cơ bản này là 100 khái niệm, trên cơ sở ựó có thể quy nạp, tổng kết hàng ngàn lớp từ vựng cơ bản khác trong tiếng Việt, từ ựó có cái nhìn toàn diện hơn, chắnh xác hơn về nguồn gốc tiếng Việt
1 đặt vấn ựề
Về vấn ựề xác ựịnh nguồn gốc tiếng Việt, kể từ mốc 1852 khi J.R Logan trong
bài nghiên cứu Ethnology of the Indo-Pacific Islands lần ựầu tiên xếp tiếng Việt vào
dòng Môn-Khmer, họ Nam Á thì quan ựiểm này cho ựến nay vẫn ựược nhiều người chấp nhận nhất và trở thành quan ựiểm chắnh thống cho các nhà nghiên cứu lịch sử tiếng
Việt Như giáo sư Nguyễn Tài Cẩn trong cuốn Giáo trình lịch sử ngữ âm tiếng Việt (sơ thảo) ựã chỉ ra rằng, tiếng Việt Ộlà một ngôn ngữ thuộc nhóm Việt Mường, tiểu chi
Việt-Chứt (vẫn thường gọi là tiểu chi Việt-Mường) nằm trong khối Việt-Katu thuộc khu vực phắa đông của ngành Mon-Khmer, họ Nam ÁỢ [1, trang 332], cho dù trong một quãng thời gian sau này tiếng Việt có mối quan hệ và ảnh hưởng sâu ựậm với tiếng Hán, nhưng
ựó chỉ là quan hệ tiếp xúc chứ không phải quan hệ thân thuộc
Tuy nhiên, ngoài quan ựiểm chắnh thống ựó, tiếng Việt còn ựược nhiều học giả khác xếp vào các ngữ hệ khác nhau, do bởi trong quá trình sinh sống và di trú của cư dân Việt cổ, tổ tiên chúng ta ựã tiếp xúc và vay mượn rất nhiều các ngôn ngữ trong khu
vực Tiêu biểu như học giả người Pháp H Maspéro trong công trình Nghiên cứu lịch sử ngữ âm tiếng An Nam-Các âm ựầu (Étude sur la phonétique historique de la langue Annamite Les initiales, 1912) sau khi nghiên cứu tiếng Hán Việt, tiếng Mường, tiếng
Thái và một số ngôn ngữ Môn-Khmer khác ựã ựưa ra nhận xét rằng Ộhệ thống thanh ựiệu làm cho tiếng Việt khác với các ngôn ngữ Môn-Khmer và ựó là một căn cứ quan trọng ựể tách nó ra khỏi các ngôn ngữ Môn-Khmer ựược biết ựến như là những ngôn ngữ không thanh ựiệu Hệ thống thanh ựiệu của tiếng Việt ựã ựược hình thành dựa trên những nguyên tắc chung như trong tiếng Hán, tiếng Thái và ngôn ngữ Tạng Miến, nhưng nó thống nhất với hệ thanh của tiếng Thái cổ, tiếng Việt phải ựược quy vào họ
Trang 2Thái” [1, trang 336] Có rất nhiều nhà ngôn ngữ học tán thành quan ñiểm này như W.Schmidt (1926), K.Wuff (1934), R.Shafer (1942)… Nhà ngôn ngữ học trứ danh Trung Quốc Vương Lực cũng theo quan ñiểm này Năm 1939 ông ñến Hà Nội nghiên
cứu tiếng Việt, sau ñó ra mắt công trình Nghiên cứu tiếng Hán Việt Do chịu ảnh hưởng
sâu sắc của lớp từ Việt gốc Hán trong tiếng Việt nên Vương Lực ñã xếp tiếng Việt vào
“ngữ hệ Hán Tạng, ngữ tộc Hán Thái” [2, trang 25]
Một nhà nghiên cứu khác là Bình Nguyên Lộc ñã xếp tiếng Việt vào họ ngôn
ngữ Nam ðảo Trong hai cuốn Nguồn gốc Mã Lai của dân tộc Việt Nam (Sài Gòn, 1972) và Lột trần Việt ngữ (Sài Gòn, 1973) ông ñã có sự so sánh tương ứng giữa từ
vựng tiếng Việt với các ngôn ngữ khác nhau trong họ Nam ðảo, từ ñó nhiều lần ñưa ra kết luận tiếng Việt “ñã mượn ñến 40% danh từ của Mã Lai Nam Dương” [3, trang 383]
Tuy các quan ñiểm trên có nhiều mức ñộ ñúng sai khác nhau, nhưng chính những nhận ñịnh này khiến chúng ta khi ñặt vấn ñề xác minh nguồn gốc tiếng Việt không thể không xét ñến các yếu tố Tày-Thái, yếu tố gốc Hán và cả yếu tố Nam ðảo trong lớp từ vựng cơ bản tiếng Việt ngày nay Vấn ñề ñặt ra ở ñây là sử dụng phương pháp nào trong việc xác ñịnh nguồn gốc tiếng Việt? Bởi ñối với bất kỳ một loại ngôn ngữ nào, ba hệ thống lớn ngữ âm, từ vựng, ngữ pháp và các tiểu hệ thống của nó ñều có
sự diễn biến khác nhau trong lịch sử, có yếu tố ñược bảo toàn lâu dài bên cạnh những yếu tố bị mất ñi và nhanh chóng ñược thay thế bằng những yếu tố khác, tuyệt ñối không thể có sự ñồng ñều về mặt diễn biến ngôn ngữ Do vậy, việc xác ñịnh cho ñược một phương pháp nghiên cứu ñáng tin cậy là ñiều tối quan trọng
2 Phương pháp nghiên cứu
“Mỗi một từ ñều có lịch sử của nó”, ñây là cách nhìn nhận của trường phái
Phương ngữ học (dialectology) [4, trang 315] Nhận ñịnh này càng nghĩ càng thấy ñúng, vấn ñề ñặt ra là chúng ta ñi nghiên cứu lịch sử của từ như thế nào? Trong các phương pháp so sánh ñối chiếu hiện nay, phương pháp so sánh-lịch sử có thể giúp chúng ta phát hiện ra sự thân thuộc giữa các ngôn ngữ về mặt cội nguồn ðây là phương pháp thông qua sự ñối sánh về mặt ngữ âm, từ vựng và ngữ pháp giữa hai hoặc nhiều phương ngữ hoặc các ngôn ngữ thân thuộc ñể rút ra quy luật diễn biến, từ ñó xác ñịnh nguồn gốc của một ngôn ngữ Phương pháp này dựa trên yếu tố tĩnh của sự phân bố từ vựng ñể xem xét yếu tố ñộng của quá trình diễn biến từ, như sự sản sinh từ mới nghĩa mới, sự tiêu vong lớp từ cũ nghĩa cũ… Ngoài ra, phương pháp này cũng xem xét ñặc ñiểm phân bố
về mặt ñồng ñại và quy luật diễn biến về mặt lịch ñại các từ mục trong nhóm từ có trường nghĩa
Do vậy, phương pháp phân tích trường nghĩa cũng không thể thiếu khi xác ñịnh
nguồn gốc từ F de Saussure trong Giáo trình ngôn ngữ học ñại cương ñã chỉ ra hai
dạng quan hệ, ñó là quan hệ ngang (quan hệ tuyến tính, quan hệ ngữ ñoạn) và quan hệ dọc (quan hệ liên tưởng, quan hệ hệ hình) Theo hai dạng quan hệ ñó có thể có hai loại
Trang 3trường nghĩa: trường nghĩa ngang (trường nghĩa tuyến tính) và trường nghĩa dọc (trường nghĩa liên tưởng) Chúng ta nên sử dụng trường nghĩa dọc (bao gồm trường nghĩa biểu vật và trường nghĩa biểu niệm) ñể khảo sát và xác ñịnh từ nguyên A.G.Haudricourt khi
phân tích một nhóm từ cụ thể (nhóm từ chỉ bộ phận cơ thể như mắt, tai mũi, miệng, răng, lưỡi, cổ, tay…) ñã cho thấy “sự tương ứng về từ vựng cơ bản giữa tiếng Việt và
các ngôn ngữ Môn-Khmer là sự tương ứng mang tính bản chất cội nguồn, khác với sự tương ứng giữa tiếng Việt với các ngôn ngữ Thái” [5, trang 96] ðể xác ñịnh giữa các ngôn ngữ có quan hệ ñồng nguyên ñồng tộc, thì phải có một số lượng từ ñồng nguyên ñáng kể ñể chứng minh Ngôn ngữ học lịch sử (historical linguistics) dựa lớp từ vựng cơ bản ñó so sánh ñối chiếu ñể “quyết ñịnh những ngôn ngữ nào cùng có chung một tổ tiên,
và do ñó, có những ngữ hệ nào, tiến hành phục nguyên ñể vạch ra ñặc tính của cái ngôn ngữ gốc không ñược ghi (các tiền ngôn ngữ), nhận diện những thay ñổi khác nhau khiến mỗi ngôn ngữ mẹ phân tách thành một số ngôn ngữ con” [6, trang 294] A G
Haudricourt cũng từng nhấn mạnh trong trường hợp xếp loại nguồn gốc tiếng Việt “cái quyết ñịnh là từ vựng cơ bản” [7, trang 20] Tuy nhiên, việc xác ñịnh cho ñược ñâu là
lớp từ vựng cơ bản, ñâu là lớp từ vựng vay mượn hay từ vựng văn hóa thực sự không dễ dàng Do bởi trong quá trình phát triển, có rất nhiều ngôn ngữ ñã bị phân hóa thành nhiều nhóm, nhiều dòng ngôn ngữ khác nhau Tiếng Việt cũng không ngoại lệ Công việc của các nhà ngôn ngữ học lịch sử là truy nguyên ngôn ngữ ñược cho là ngôn ngữ nguồn ñó, là “bà mẹ” sản sinh ra các dòng ngôn ngữ sau này, từ ñó tiến hành quy nạp chúng vào những chi, những họ, những ngành khác nhau dựa trên mức ñộ thân thuộc nhiều hay ít Khi tiến hành nghiên cứu so sánh-lịch sử, nếu chúng ta chưa xác ñịnh ñược ñâu là cội nguồn, ñâu là vay mượn trong nhóm từ vựng giống nhau giữa hai hay nhiều ngôn ngữ, thì chưa ñủ ñiều kiện ñể xác ñịnh quan hệ họ hàng thân thuộc giữa chúng Tuy nhiên, A G Haudricourt cũng thừa nhận các ngôn ngữ không có biến hóa hình thái như tiếng Việt cũng có sự vay mượn từ vựng cơ bản Do vậy, các nhà nghiên cứu muốn ñạt ñược mục ñích phân loại trong số những từ tương ứng giữa hai hay nhiều ngôn ngữ,
từ nào mang tính cội nguồn, từ nào mang tính vay mượn, thì phải xem xét chúng theo từng nhóm từ vựng có ý nghĩa trọn vẹn, tức là sử dụng phương pháp phân tích trường nghĩa như ñã nói ở trên
3 Bảng 100 từ cơ bản của Swadesh
Morris Swadesh (1909-1967) là nhà ngôn ngữ học người Mỹ Ông ñề nghị phương pháp xác ñịnh thời gian tách rời (length of separation) của hai ngôn ngữ cùng một nguồn, bằng cách tìm ra bao nhiêu từ thay ñổi khi so sánh số vốn từ căn bản ðây
cũng là nền tảng của một ngành ngôn ngữ học mới gọi là Glottochronology (môn học xác ñịnh tuổi của ngôn ngữ), hay còn gọi là “phương pháp Ngữ thời học, vắn tắt hơn là phương pháp Swadesh” [8, trang 8] Chính phương pháp này ñã ñưa ngôn ngữ học, một
ngành theo truyền thống khoa học nhân văn, trở nên một ngành ngôn ngữ ñịnh lượng (quantitative linguistics) và ñem môn này ñến gần các ngành khoa học chính xác khác
Trang 4GS Nguyễn Tài Cẩn trong giáo trình Lịch sử ngữ âm tiếng Việt (sơ thảo) ựã vận
dụng có phê phán phương pháp Swadesh, ựó là phương pháp xuất phát từ quan niệm cho rằng, qua thời gian, việc thay thế từ vựng cơ bản cổ bằng từ vựng mới là một việc xảy ra theo quy luật chung cho mọi ngôn ngữ Theo sự thống kê và tắnh toán trên một số lượng rất nhiều ngôn ngữ, phương pháp này ựưa ra cách xác ựịnh như sau: cứ qua 1000 năm thì số lượng từ trong kho từ vựng cơ bản của một ngôn ngữ sẽ bị mất ựi 15%, chỉ còn lại 85% Như vậy, nếu hai ngôn ngữ hay hai phương ngữ A, B cùng gốc tách nhau khoảng 1.000 năm, thì trong bảng từ vựng chúng chỉ còn giữ lại 74% là chung (85%85%=74%); nếu tách nhau 2.000 năm, thì số từ vựng chung còn lại chiếm khoảng 55% (74%74%=55%); tách nhau 4.000 năm, thì số từ vựng chung còn lại chỉ chiếm khoảng 30% (55%55%=30%); tách nhau 8.000 năm, thì số từ vựng chung còn lại càng ắt hơn, chỉ chiếm khoảng 9% (30%30%=9%) Qua hơn 8000 năm thì lượng từ
cơ bản chung sẽ rút ựi tới mức không thể xác lập nổi mối quan hệ nguồn gốc giữa hai ngôn ngữ nữa
Swadesh năm 1952 ựề xuất ra Bảng 200 từ cơ bản 200 từ này có ựược trên cơ
sở ông phân tắch, quy nạp các ngôn ngữ ở châu Âu, châu Mỹ, châu Phi và châu Úc Ban ựầu ông cho rằng 200 từ này là lớp từ cơ bản ổn ựịnh nhất trong tất cả các ngôn ngữ, nhưng trong quá trình nghiên cứu sau ựó, ông nhận thấy có khá nhiều từ trong Bảng có thể vay mượn qua lại lẫn nhau, vì thế năm 1955 ông rút gọn lại chỉ còn 100 từ cơ bản Ý
ựồ của ông là muốn có một ranh giới dứt khoát giữa vấn ựề vay mượn hay không vay mượn, tuy nhiên sau này theo khảo sát của một số nhà nghiên cứu thì trong Bảng 100 từ này vẫn có một số từ có thể vay mượn, nhưng ắt hơn nhiều so với Bảng 200 từ Có thể nói Bảng 100 từ cơ bản ựã xác ựịnh ựược lớp từ vựng ổn ựịnh nhất trong mọi ngôn ngữ
và ựã trở thành Bảng 100 từ thông dụng trên thế giới khi khảo sát nguồn gốc từ Vì vậy ứng dụng Bảng 100 từ cơ bản của Swadesh vào truy nguyên gốc tắch tiếng Việt sẽ trở nên thuận tiện hơn cho các nghiên cứu khi so sánh ựối chiếu với Bảng 100 từ cơ bản của các ngôn ngữ khác mà ựã ựược khảo sát trước ựó điều cần lưu ý là do Swadesh chỉ khảo sát các ngôn ngữ Ấn Âu Vì vậy, khi áp dụng vào các ngôn ngữ vùng châu Á nói chung và đông Nam Á nói riêng, nơi liên tục xảy ra các cuộc di cư và hội tụ của các tộc người, nơi mà sự tiếp xúc giữa các chi nhóm ngôn ngữ là xảy ra thường xuyên và lâu dài, thì khi áp dụng phương pháp này ựòi hỏi phải nghiên cứu trên quan ựiểm so sánh ựa ngữ thì mới có cái nhìn khoa học hơn về nguồn gốc tiếng Việt
F de Saussure trong Giáo trình ngôn ngữ học ựại cương (1916) cũng ựã dành một chương Ngôn ngữ học ựịa lý phân tắch khá rõ nguyên nhân tạo nên sự khác biệt
trong lịch sử diễn biến ngôn ngữ, ựó là tìm hiểu những vấn ựề ựịa lý liên quan tới nó Bởi vì, Ộmối liên hệ giữa lịch sử phát triển, tức mặt thời gian, với môi trường phát triển, tức mặt không gian, là một liên hệ có tắnh bản chất của bất kỳ một sự phát triển nàoỢ [9, trang 334] Như ựã nói ở trên, do hiện nay nhận thức chung của ựa số các nhà ngôn ngữ
là tiếng Việt thuộc ngữ hệ Nam Á, do ựó, dấu vết từ vựng của họ ngôn ngữ này trong
Trang 5tiếng Việt ựược coi là cội nguồn, các ngôn ngữ khác chỉ ựược coi là ngôn ngữ láng giềng chứ không phải là ngôn ngữ thân thuộc Quan hệ giữa tiếng Việt với các ngôn ngữ láng giềng này chỉ là quan hệ tiếp xúc vay mượn lẫn nhau, do vị trắ ựịa lý quá gần nhau,
và những sự tiếp xúc lâu dài giữa cư dân các vùng miền xảy ra trong một thời gian dài Tuy nhiên, cũng chắnh vì ựiều này mà khiến cho lớp từ vựng ựược coi là vay mượn ựôi khi thực sự rất khó xác ựịnh, vô hình trung ựược coi là yếu tố cội nguồn Vắ dụ như theo một số kết quả nghiên cứu hiện nay, thì chúng ta có thể nhận ựịnh rằng tiếng Việt-Mường ựã từng có những sự tiếp xúc lâu dài với các ngôn ngữ thuộc họ Nam đảo Chứng cứ của sự tiếp xúc này là trong vốn từ tiếng Việt hiện nay vẫn còn một lớp từ rất
cổ xưa có nguồn gốc Mã Lai-đa ựảo (xem thêm mục 4.3) Bởi vì thời gian tiếp xúc quá
xa xưa, vì vậy khó có thể kết luận ngôn ngữ nào vay mượn ngôn ngữ nào, và cũng khó
có thể nói những từ rất cơ bản, rất cổ xưa ấy là những từ vay mượn chứ không phải là từ
cơ bản đây chắnh là khó khăn lớn nhất, gây nhiều tranh cãi nhất khi xác ựịnh nguồn gốc tiếng Việt, và sự tranh cãi trong gần suốt 200 năm này thậm chắ cho ựến giờ xem ra vẫn còn chưa ngã ngũẦ
Từ lúc lý thuyết của Swadesh ra ựời ựã có những khảo cứu từ những ngôn ngữ khác nhau trên thế giới cho thấy kết quả tương ựối khả quan và hiện ựang ựược sử dụng
vì có một số lợi ắch thiết thực và thành tựu ựáng kể Tuy nhiên cũng có nhiều tranh luận
về các tiền ựề cơ bản của lý thuyết này, như tốc ựộ thay ựổi của ngôn ngữ không luôn ựều ựặn Có quá nhiều yếu tố ảnh hưởng ựến sự thay ựổi của ngôn ngữ như các biến cố lịch sử xã hội (chiến tranh xâm lược, thôn tắnh ựất ựai, các cuộc cách mạngẦ), vì vậy mốc thời gian thay ựổi không thể là một hằng số Mặc dù vậy, Bảng 100 từ cơ bản của Swadesh có thể ựược coi là Bảng chuẩn hiện nay cho việc xác ựịnh từ vựng cơ bản của tất cả các ngôn ngữ Bảng này có thể tạm chia thành các nhóm sau:
a Nhóm sự vật hiện tượng thiên nhiên
1 Mặt trời (sun); 2 Mặt trăng (moon); 3 Sao (star); 4 Nước (water); 5 Mưa (rain); 6 Mây (cloud); 7 đá (stone); 8 Cát (sand); 9 đất (earth); 10 Núi (mountain);
11 đường (path); 12 Lửa (fire); 13 Khói (smoke); 14 Tro (ash); 15 đêm (night)
b Nhóm bộ phận cơ thể người
16 đầu (head); 17 Tóc (hair); 18 Mắt (eye); 19 Mũi (nose); 20 Răng (tooth);
21 Lưỡi (tongue); 22 Tai (ear); 23 Miệng (mouth); 24 Cổ (neck); 25 Tay (hand); 26 Bụng (belly); 27 Vú (breasts); 28 Chân (foot); 29 Da (skin); 30 Tim (heart); 31 Gan (liver); 32 Xương (bone); 33 đầu gối (knee); 34 Máu (blood); 35 Thịt (flesh)
c Nhóm ựộng thực vật
36 Chim (bird); 37 Cá (fish); 38 Chó (dog); 39 Chắ/Rận (louse); 40 Cây (tree);
41 Hạt (seed); 42 Lá (leaf); 43 Gốc/Rễ (root); 44 Vỏ cây (bark); 45 Dầu/Mỡ (grease); 46 Trứng (egg); 47 đuôi (tail); 48 Sừng (horn); 49 Lông (feather); 50 Móng
Trang 6(claw)
d Nhóm ựộng tác
51 Ăn (eat); 52 Uống (drink); 53 Cắn (bite); 54 Nói (say); 55 Nhìn (see); 56 Nghe (hear); 57 Biết (know); 58 Ngủ (sleep); 59 Chết (die); 60 Giết (kill); 61 đi (walk); 62 Bay (fly); 63 Bơi (swim); 64 đến (come); 65 Ngồi (sit); 66 đứng (stand);
67 Nằm (lie); 68 Cho/Tặng (give); 69 đốt (burn)
e Nhóm tắnh chất trạng thái
70 Mới (new); 71 Tốt/đẹp (good); 72 Nóng (hot); 73 Lạnh (cold); 74 đầy (full); 75 Khô (dry); 76 đỏ (red); 77 Xanh (green); 78 Vàng (yellow); 79 Trắng (white); 80 đen (black); 81 To/Lớn (big); 82 Nhỏ/Bé (small); 83 Dài (long); 84 Nhiều (many); 85 Tròn (round)
f Nhóm còn lại
86 Một (one); 87 Hai (two); 88 Tôi (I); 89 Chúng tôi (we); 90 Anh/Bạn (you);
91 đây/Này (this); 92 Kia/đó (that); 93 Ai (who); 94 Gì/Cái gì (what); 95 Người (person); 96 đàn bà (woman); 97 đàn ông (man); 98 Tên (name); 99 Không (not);
100 đều/Toàn bộ (all)
4 Khảo sát sơ bộ sự tương ựồng giữa với tiếng Việt với các ngôn ngữ vùng ngữ hệ đông Nam Á trong Bảng 100 từ cơ bản
Trong quá trình tìm hiểu lịch sử tiếng Việt, có nhiều học giả ựã sử dụng lớp từ vựng cơ bản ựể nghiên cứu quan hệ thân thuộc giữa hai hay nhiều ngôn ngữ có liên quan, trong ựó ựại ựa số những từ cơ bản ựược ựề xuất ựều có xuất hiện trong Bảng 100
từ cơ bản của Swadesh
4.1 Chứng minh nguồn gốc Nam Á của tiếng Việt
H Maspéro trong công trình nổi tiếng Nghiên cứu lịch sử ngữ âm tiếng An Nam Những phụ âm ựầu khi xem xét về mặt từ vựng cơ bản ựã chỉ ra rất nhiều từ trong tiếng
Việt tương ứng với tiếng Môn-Khmer, vắ dụ các từ chỉ sự vật hiện tượng thiên nhiên
(ựất, núi, ựá, cát, mưa, gió, nướcẦ), bộ phận cơ thể (chân, cằm, mặt, mũi, tóc, răngẦ), tên súc vật, cỏ cây (cá, trâu, chắ, chim, chó, thịt, cây, rễ, gốc, lúaẦ); các từ liên quan ựến người (mẹ, bố, con, cháu, mày, nóẦ), các hành ựộng cơ bản (ựi, chạy, ngửi, chiên, thui, cầm, cắnẦ); hệ số ựếm (một, hai, ba, bốn, năm) Tổng cộng ông ựã so sánh tất cả
185 từ tiếng Việt với các ngôn ngữ Môn-Khmer và các ngôn ngữ Thái và ông ựưa ra kết luận có 87 từ là tương ựương với các ngôn ngữ Môn-Khmer và 98 từ còn lại thuộc ngôn ngữ Thái Giáo sư Trần Trắ Dõi cho rằng những từ ông Maspéro dẫn ra không thuần túy
là những từ thuộc lớp từ cơ bản, mà có rất nhiều từ thuộc lớp từ văn hóa Vì thế ông rút gọn lại chỉ còn 39 từ tương ứng với các ngôn ngữ Môn-Khmer và 21 từ tương ứng với các ngôn ngữ Thái, do ựó Ộchỉ có 60/187 từ ựược Maspéro sử dụng là những từ thuộc
Trang 7lớp từ cơ bản của ngôn ngữ.” [5, 83] Qua kiểm tra thì hầu hết 60 từ này ñều nằm trong Bảng 100 từ của Swadesh, rất thuận tiện cho chúng ta quy nạp, thống kê sau này
GS Nguyễn Ngọc San trong công trình Tìm hiểu tiếng Việt lịch sử từ trang 121
ñến 134 cũng ñã liệt kê ra hàng trăm từ có gốc Môn-Khmer qua các thời kỳ So sánh với Bảng 100 từ Swadesh (chưa tính các từ thuộc trường nghĩa) thì có ñến gần một nửa là gốc Môn-Khmer Kết quả này khá trùng khớp với khảo sát sơ bộ của chúng tôi với Bảng
100 từ sau khi so sánh ñối chiếu với rất nhiều ngôn ngữ thuộc nhóm Môn-Khmer là có ñến hơn 50% từ vựng cơ bản có nguồn gốc Môn-Khmer ðiều này càng củng cố thêm quan ñiểm cho rằng tiếng Việt thuộc dòng Môn-Khmer trong ngữ hệ Nam Á
4.2 Các từ có gốc Tày-Thái
Như ñã nói ở trên, Maspéro ñã chỉ ra trong tiếng Việt có khá nhiều từ cơ bản tương ñương với tiếng Thái, chính vì thế mà ông ñã ñưa ra một kết luận lưỡng lự về nguồn gốc tiếng Việt, ñó là “tiếng tiền Việt ñã sinh ra từ một sự hỗn hòa của một phương ngữ Môn-Khmer, một phương ngữ Thái và có thể của cả một ngôn ngữ thứ ba còn chưa biết, rồi sau ñó tiếng Việt ñã vay mượn một số lượng lớn những từ Hán Nhưng cái ngôn ngữ có ảnh hưởng quyết ñịnh ñể tạo ra cho tiếng Việt trạng thái hiện ñại của nó (tức là có thanh ñiệu như ông nghiên cứu) là chắc chắn, theo ý tôi, một ngôn ngữ Thái, và vì thế tôi nghĩ rằng tiếng Việt phải ñược xếp vào họ Thái” [5, trang 89] Mặc dù quan ñiểm của Maspéro sau này ñã ñược A.G.Haudricourt chứng minh lại còn nhiều khiếm khuyết nhưng ông cũng bước ñầu chỉ ra ñược một số từ gốc Thái trong tiếng Việt GS Nguyễn Ngọc San cũng nhận ñịnh rằng, “sự hòa ñúc giữa tiếng Mon-Khmer và tiếng Tày-Thái cổ ñã dần dần hình thành ra ngôn ngữ Việt Mường chung trong ñó lưu lại một cơ tầng Thái ñáng kể Tuy nhiên sự xác ñịnh nguồn gốc Tày-Thái của các từ tiếng Việt không dễ dàng gì” [8, trang 135]
Theo nhận ñịnh của nhiều nhà ngôn ngữ học và dân tộc học thì những từ tiếng Việt gốc Tày-Thái phần nhiều thuộc nền văn minh lúa nước Tiêu biểu cho quan ñiểm này là ý kiến của GS Phạm ðức Dương, ông cho rằng “một ñiều hết sức quan trọng cần nhấn mạnh là nếu nhìn vào lớp từ vựng cơ bản ngoài hệ thống từ chỉ các hoạt ñộng tự nhiên, cơ thể và hoạt ñộng của con người, số ñếm… thì trong các ngôn ngữ tiền Việt-Mường chỉ có từ chỉ văn hóa săn bắt, hái lượm và hệ thống canh tác nương rẫy, còn lớp
từ vựng về văn minh nông nghiệp lúa nước hoàn toàn không có Trong khi ñó hệ thống
từ này trong ngôn ngữ Việt-Mường lại có chung một gốc với các ngôn ngữ Tày-Thái” [10, trang 129-130]
Kết luận của GS Phạm ðức Dương tuy nhận ñược nhiều ý kiến ñồng tình ủng
hộ nhưng cũng có ý kiến cho rằng chưa thực sự thuyết phục Bởi vì ñể khẳng ñịnh từ vựng phản ánh nền văn minh nông nghiệp lúa nước hoàn toàn không có trong các ngôn ngữ thời kỳ tiền Việt-Mường thì cần phải thống kê ñầy ñủ và chứng minh thêm GS
Trần Trí Dõi cho rằng từ quan trọng nhất của văn mình lúa nước là từ “ruộng/ñồng” lại
Trang 8có gốc gác thời kỳ tiền Việt-Mường Từ việc phân tắch nhiều từ vựng cơ bản khác ông
ựã nhận ựịnh rằng Ộtiếng Việt ở giai ựoạn tiền Việt-Mường dường như ựã có lớp từ vựng
về văn minh nông nghiệp lúa nước Do ựó không thể chờ mãi ựến thời kỳ Việt-Mường chung cộng ựồng cư dân Việt mới biết ựến kỹ thuật canh tác này.Ợ [5, trang 230]
GS Nguyễn Ngọc San còn cho biết thêm, Ộtrong những bảng thống kê từ Tày-Thái trước ựây người ta còn ựưa vào ựó những từ gốc HánỢ [8, trang 137] Sau khi loại
ra những từ gốc Hán, ông ựã ựưa ra danh sách hơn 100 các từ Việt gốc Tày-Thái đối chiếu với Bảng 100 từ của Swadesh, thì số lượng từ trùng khớp chỉ có vài từ, vắ dụ:
này\ựây, chóc (chim chóc), nhận (ra)/nhìn (thấy), tất (cả)/sất/tuốt; một số từ chỉ quan hệ thân thuộc dùng cho xưng hô như: bố/bủ/bọ, mợẦ điều này cho thấy kết luận của
Maspéro tiếng Việt có gốc Thái là hoàn toàn không chắnh xác Chỉ có thể nói rằng, chắnh yếu tố Tày-Thái ựã góp phần làm thay ựổi sâu sắc diện mạo văn hóa của người Việt vào thời tiền sử và sơ sử, góp phần làm phong phú hơn những gì người Việt ựã có
từ thời kỳ văn hóa đông Sơn
4.3 Các từ có họ Nam đảo
Ngữ hệ Nam đảo (Austronesian) hay còn gọi là Mã Lai-đa ựảo (Malayo-Polynesian) là một trong những họ ngôn ngữ lớn, phân bố ở quần ựảo Indonesia, Philippines, một số khu vực ở đông Dương, đài Loan, Châu đại Dương Có khoảng
800 ngôn ngữ khác nhau thuộc họ Nam đảo Ở Việt Nam, ngôn ngữ của 5 dân tộc Chăm, Êựê, Gia Rai, Ra Glai, Churu cư trú ở các tỉnh Nam Trung Bộ và Cao nguyên Trung bộ thuộc ngữ hệ này Trong khi ựó ở khu vực này còn cư trú các dân tộc Kơ Ho, Mnông, Xtiêng, Mạ, Chơ Ro, Ba Na, Xơ đăng, HrêẦ, ngôn ngữ các dân tộc này lại thuộc họ Nam Á Chắnh vì ựịa bàn cư trú của các dân tộc ựan xen với nhau, vì thế có rất nhiều từ tương ựồng giữa chúng khiến cho việc phân ựịnh rạch ròi nguồn gốc ngôn ngữ hoàn toàn không hề ựơn giản
Như ựã nói ở phần 3, tiếng Việt ựã có quá trình tiếp xúc lâu dài với những ngôn ngữ Nam đảo lên ựến hàng ngàn năm, vị trắ ựịa lý gần nhau, cư dân sinh sống xen kẽ với nhau, vì thế những từ vay mượn giữa chúng không thể không có Ngoài số lượng
175 từ gốc Mã Lai do Bình Nguyên Lộc liệt kê và so sánh (nhưng ông không phân biệt
nhóm dân tộc nào là Nam đảo, nhóm nào là Nam Á), thì năm 1992, trong bài báo Từ Nam Á trong tiếng Việt, tác giả Hồ Lê với cách làm tương tự (cho rằng các từ thuần Việt
gồm các ngôn ngữ Môn-Khmer lẫn các ngôn ngữ Nam đảo và ngôn ngữ Thái) ựã liệt kê
ra 193 từ tiếng Việt mà theo ông ựều là từ thuần Việt, trong ựó có khá nhiều từ có trong
Bảng 100 từ Swadesh, vắ như: anh/eng (Danaw: êl, Riang: êq, Palaung: yêo, Wa: eql, Vu, Son Tailoi: êk); ăn (Khmer: chya, Palaung: ham, Sakai: chaa, Xơựăng, Kơho, Bahna: sa, Khasi: bsa, Laha: ăn/kuôn, Thái: kun, Li: khan, Indonesia: panganẦ) [11, trang 110]
Theo khảo sát sơ bộ của chúng tôi, trong Bảng 100 từ Swadesh, có ắt nhất 20-25
từ có nguồn gốc Nam đảo Một số vắ dụ tiêu biểu:
Trang 9Mặt trời (sun) Tiếng Indonesia: mata hari, tiếng Aceh: mata ur , tiếng Malay-Tagalog (PMT): mata harajẦ có ý nghĩa so sánh Ộmắt của trờiỢ [12, trang 116] ỘMặt trờiỢ trong tiếng Việt là một trong số ắt những từ cơ bản song tâm tiết, ựọc trại của Ộmắt trờiỢ, bảo lưu ý nghĩa của nhóm ngôn ngữ này Tiếng Kam-Tai (PKT) ựọc là *pra*blan, cũng vay mượn ý nghĩa Ộmắt trờiỢ từ tiếng Nam đảo [4, trang 248]
Mặt trăng (moon) ỘMặt trăngỢ trong tiếng Việt là cách nói dựa theo từ Ộmặt trờiỢ, thực ra nó vốn là từ ựơn âm tiết ỘtrăngỢ Tiếng Indonesia: bulan, tiếng Aceh: bul , tiếng Gialai: blan, PMT: bulan, PKT *C-blin [12, trang 117].GS Ngô An Kỳ sau khi phân tắch các âm song tiết *pl-, *bl-, *m-l- trong tiếng đồng đài và Nam đảo
cổ với âm ựơn *N- trong tiếng Hán Thượng cổ còn ựưa ra nhận ựịnh rằng Ộtừ 月*Nat (nguyệt, mặt trăng) có thể có nguồn gốc từ tiếng đồng đài, Nam đảoỢ, từ ựó rút ra kết
luận Ộtiếng Kam-Tai nguyên thủy *C-blin cũng có thể xuất phát từ âm tiếng Nam đảo
cổỢ [4, trang 315]
Ngoài ra, theo khảo sát của chúng tôi, còn có một từ cơ bản khác có thể có
nguồn gốc từ tiếng Nam đảo như: bụi, ựường, núi, ựêm, tai, mắt, lưỡi, bụng, trứng, uống, ăn, cắn, mất, ựứng, ni (này)Ầ Như vậy, số lượng từ gốc Nam đảo trong Bảng
100 từ Swadesh là khá lớn, có thể chiếm tới 20-25%, ựiều này phản ánh ựúng thực tế như GS Trần Trắ Dõi chứng minh là vào giai ựoạn phát triển ựầu tiên trong lịch sử tiếng Việt (cách ựây khoảng 1.000 năm trước Công nguyên cho ựến những thế kỷ ựầu sau Công nguyên), lúc tiếng tiền Việt-Mường tách ra khỏi khối Môn-Khmer ựể có một lịch
sử phát triển riêng, thì tiếng tiền Việt-Mường ựã có tiếp xúc với các ngôn ngữ thuộc họ Nam đảo Và ông có nhận ựịnh thêm là Ộtắnh chất nhập nhằng khiến người ta khó xác ựịnh ngôn ngữ nào vay mượn ngôn ngữ nào Trong tương lai, khi thuần túy xem xét từ vựng lịch sử tiếng Việt, chắc chắn ựây sẽ là một vấn ựề thú vị nhưng cũng sẽ ựầy rẫy khó khănỢ [5, trang 162]
4.4 Các từ gốc Hán
Như ựã nói ở trên, khi khảo sát nguồn gốc tiếng Việt, chúng ta không nên chỉ so sánh song ngữ mà phải ựặt nó trong mối quan hệ ựa ngữ, ựa chiều, ở ựây là các thứ tiếng Mon-Khmer, tiếng Tày-Thái, tiếng Nam đảo và thậm chắ cả tiếng Hán Tuy tiếng Hán cũng như tiếng Thái chỉ du nhập vào tiếng Việt ở thời kỳ thứ hai của lịch sử phát triển tiếng Việt (thế kỷ I sau Công nguyên cho ựến khoảng thế kỷ VIII-IX), nhưng cũng ựã hình thành một lớp từ mà ựược các nhà nghiên cứu gọi là từ Việt cổ hay cổ Hán-Việt, và Ộựiều cần chú ý là những từ vay mượn tiếng Hán vào thời kỳ này cũng dường
như là những từ khá cơ bản trong vốn từ tiếng Việt Chẳng hạn ựó là những từ như ựầu,
mả, mùa, mùi, buồng, bến, buồmẦỢ [5, trang 172]. Khảo sát trong Bảng 100 từ Swadesh thì chỉ có trên dưới 10 từ là có gốc Hán Vắ dụ khi khảo sát 2 ựại từ nhân xưng
Tôi (I) và Chúng tôi (we) trong bảng 100 từ, chúng tôi nhận thấy chúng có những mối
tương quan như sau:
Trang 10đại từ nhân xưng ngôi thứ nhất số ắt ỘIỢ trong tiếng Việt có những cách nói Ộtôi,
ta, tau, tớ Ợ Trong ựó ỘTôiỢ (ựọc trại ỘtuiỢ) tương ứng với [tai2]-[dai4] và ỘtớỢ
tương ứng với 卒[zu2], hai ựại từ nhân xưng ngôi thứ nhất trong tiếng Quảng đông (Cantonese) và tiếng Khách Gia (còn gọi tiếng Hẹ, Hakka), hai ngôn ngữ thuộc ngữ hệ
Hán Tạng Ý nghĩa của hai từ này cũng tương ựồng với ý nghĩa gốc của từ Ộtôi tớỢ trong
tiếng Việt địa bàn cư trú của những tộc người này cũng gần sát Việt Nam, nằm trong
mối tương quan Bách Việt ngày xưa Tiếng Mường ựọc là [thôi] (bật hơi), tiếng Hmong ựọc là [Tub] (b chỉ âm cao, tương tự dấu sắc trong tiếng Việt)
đại từ nhân xưng ngôi thứ nhất số nhiều ỘweỢ trong tiếng Việt có những cách
nói Ộchúng tôi, chúng ta, chúng tao, chúng tớỢ; Ộbọn tôi, bọn taoẦỢ; Ộtụi taoẦỢ Trong ựó các tiền tố như ỘchúngỢ, ỘbọnỢ và có thể cả ỘtụiỢ là có nguồn gốc từ tiếng Hán Chúng 众: tiếng Khách Gia [chung]; Bọn 帮: tiếng Quảng đông [bong]; Tụi 隊: tiếng
Khách Gia [tui]Ầ
Hay như các từ ựầu, tim, gan (ựọc trại từ tâm, can), ông (ựàn ông), bà (ựàn
bà)Ầ là những từ vay mượn gốc Hán, nhưng ựây rõ ràng là những từ thuộc lớp từ rất cơ bản Tuy nhiên khi xét về mặt trường nghĩa thì chúng ựều chưa mang tắnh hệ thống, ựối chiếu với Bảng 100 từ thì số lượng cũng rất ắt, vì vậy những nhận ựịnh tiếng Việt có nguồn gốc Hán-Tạng là hoàn toàn không chắnh xác, mặc dù trong tiếng Việt ngày nay
có hơn 70% số lượng từ vựng là từ Hán-Việt, nhưng những từ này rõ ràng thuộc lớp từ vựng văn hóa mới du nhập vào tiếng Việt ở những giai ựoạn muộn hơn, chứ không thuộc lớp từ vựng cơ bản
5 Kết luận
Do khuôn khổ bài báo có hạn nên chúng tôi không thể liệt kê và phân tắch chi tiết từ nguyên của 100 từ cơ bản trong Bảng từ Swadesh Tuy nhiên dựa vào kết quả nghiên cứu của các học giả ựi trước cũng như sự so sánh ựối chiếu mới nhất sau này, có thể tạm ựưa ra những nhận ựịnh như sau:
Với số lượng áp ựảo trên 50% từ cơ bản trong Bảng 100 từ Swadesh có gốc tắch
từ các ngôn ngữ trực hệ của dòng Môn-Khmer, những kết luận tiếng Việt có nguồn gốc chắnh thuộc họ Nam Á, dòng Môn-Khmer là hoàn toàn có cơ sở thuyết phục Mở rộng
ra nghiên cứu thêm Bảng 200 từ cơ bản của Swadesh, chúng ta có thể nhận thấy số lượng các từ này vẫn chiếm ựa số Có thể nói, những từ gốc Môn-Khmer trong lớp từ vựng cơ bản tiếng Việt hiện nay là khá nhiều và là nền tảng cơ bản của tiếng Việt GS Nguyễn Ngọc San còn nhận ựịnh thêm rằng, Ộựể tái lập nhằm khẳng ựịnh nguồn gốc những từ gốc Mon-Khme trong tiếng Việt, người ta có thể sử dụng ựến phương pháp Ngữ thời học, thậm chắ có thể ựi ngược nguồn gốc quá thời Mon-Khme lên tới Nam Á Tất nhiên số từ gốc Nam Á vừa chung cho Mon-Khme vừa chung cho các tiểu chi khác,
vắ dụ số ựếm như một, hai, ba, bốn và các từ như bay, bú, mũi, mắt, mày (ựại từ)ẦỢ [8,
trang 118].Như vậy GS Nguyễn Ngọc San cũng ựã bước ựầu áp dụng phương pháp