Ngành học này thường bao gồm, nhiều khi tương đương với minh væn học 銘文學/épigraphie - Cổ tịch học 古籍學/paléographie: ngành học nghiên cứu giám định các thư tịch cổ và các væn bản lịch sử
Trang 1VĂN TỰ HỌC VÀ
2020
Trang 2Ti ền ngôn
Væn tự học có vẻ là một ngành học chưa được chú ý nghiên cứu ở Việt Nam và trên thế giới
Một số nơi còn chưa phân định rạch ròi phân ngành này với ngôn ngữ học Trong giới bình dân thì gần như không phân biệt được “chữ” với “tiếng” và thường xuyên dùng lẫn lộn hai khái
niệm này trong các ngôn bản và væn bản thường ngày Sách này được soạn thảo nhằm mục đích
giới thiệu cho giới học thuật nước nhà những ý niệm cơ bản về væn tự học, cũng là mang hi
vọng ở phân ngành này chúng ta có thể đi trước và độc lập với thế giới phương tây, không bị lệ thuộc như ngôn ngữ học
Một điều có thể lý giải cho sự vắng mặt này là vì hiện nay vai trò của ngành học này vẫn chưa được xã hội xem trọng Chưa kể chữ viết đối với mỗi quốc gia, dân tộc là một cái gì đó mang tính thiêng liêng và bền vững, khó có thể lay chuyển, và cũng ít có ai dám ghé mắt vào tìm xem
những væn vật hiện dùng ấy có những khuyết điểm gì, hoặc giả có cũng không có ai dám lên
tiếng, vì họ biết rằng có lên tiếng cũng chưa chắc có thể thay đổi gì mà chắc chắn sẽ bị “ném đá” không thương tiếc bởi một dư luận sôi sục và một quần chúng lúc nào cũng giận dữ
Như vậy không có nghĩa là trước giờ chưa ai nghiên cứu ngành học này Sách vở về væn tự học tuy không nhiều nhưng vẫn có, cả tiếng Việt lẫn tiếng nước ngoài Tuy là hầu hết đều bị lồng ghép vào các công trình nghiên cứu của một bộ chữ, một hệ chữ cá biệt, như væn tự học chữ nôm, væn tự học chữ quốc ngữ, væn tự học chữ Latin Có nghĩa là chung quy vẫn chưa có một công trình nghiên cứu cụ thể, tách biệt cho ngành học này Đây là l{ do thứ hai của việc soạn
thảo sách này
Sách này có thể có những khái niệm không mới, những { tưởng đã được công bố đó đây và cả
những { tưởng do tác giả tự nghiệm ra mà cũng chưa chắc là trước giờ chưa có ai nghĩ tới Nó cũng có thể có cả những cách hiểu lệch lạc, những phát biểu hàm hồ của một sinh viên chưa
từng học qua lớp Kí hiệu học và Lịch sử chữ viết, nên tác giả rất mong mọi người không xem nó như một cuốn cẩm nang, vì nó thật ra chỉ là một quyển phác thảo của một hoạ sĩ nghiệp dư, và khi đọc sẽ rộng lòng đánh giá
Trên khắp các phương tiện truyền thông, người ta ai cũng nói thời đại này là thời đại của thông tin Trong thời đại ấy, ngôn ngữ và chữ viết hẳn sẽ có một vai trò quan trọng, và việc làm chủ được những công cụ đó sẽ cho một quốc gia, một dân tộc có những lợi thế nhất định
Trang 3Ph ần thứ nhất: Dẫn luận văn tự học
I Văn tự học – khái niệm, vai trò và phạm vi nghiên cứu
1 Khái niệm
Có thể hiểu nôm na, væn tự học là bộ môn nghiên cứ về chữ viết Cụ thể, ngành học này chuyên
khảo khảo cứu các loại hình væn tự, phân tích các đặc tính cấu trúc của chữ viết và mối liên hệ
giữa chữ viết với lời nói Ở phạm vi lớn hơn, ngành học này cũng bao gồm những nghiên cứu về
khả næng đọc hiểu, diễn đạt bằng kí hiệu của con người và tác động của chữ viết lên đời sống triết học, tôn giáo, khoa học, hành chính và các phương diện khác của một tổ chức xã hội Các phân ngành của væn tự học có thể bao gồm:
- Cổ tự học (古字學 ): ngành học chuyên nghiên cứu giải mã những hệ chữ viết cổ mà ngày nay không còn được sử dụng Ngành học này thường bao gồm, nhiều khi tương đương với minh væn học (銘文學/épigraphie)
- Cổ tịch học (古籍學/paléographie): ngành học nghiên cứu giám định các thư tịch cổ và các væn
bản lịch sử
- Tự pháp học (字法學/graphém(at)ic): nghiên cứu cấu thức của một kí tự ngữ tố hoặc các quy
tắc kết hợp giữa các chữ cái trong một hệ væn tự thuộc loại chữ cái và mối liên hệ giữa chúng
với ngữ âm
- Bút tích học (筆迹學/graphologie): ngành học nghiên cứu mối liên hệ giữa chữ viết tay với tâm l{ người viết
-
2 Vai trò và ph ạm vi nghiên cứu
Trước nay, các tác phẩm væn tự học thường chỉ nghiên cứu về lịch sử và cấu thức của một bộ
chữ viết cụ thể, như væn tự học chữ Hán, væn tự học chữ Latin Số khác quan tâm tới việc giải
mã { nghĩa của các bộ chữ viết cổ, cũng là væn tự học Nhưng những kết quả nghiên cứu đó thường chỉ áp dụng dụng được cho đúng một bộ chữ đó, hoặc một vài bộ chữ khác cùng hệ,
chứ không khái quát được các quy luật chung nhất của thành tựu væn minh này, do vậy không
có mấy ứng dụng trong việc nghiên cứu sự phát triển của chữ viết hiện đại
Trang 4Væn tự học phải là môn khoa học mà những thành quả nghiên cứu của nó có thể góp phần vào
việc định hướng phát triển của chữ viết của các ngôn ngữ hiện đại Vai trò của nó phải bao gồm:
- định hướng phát triển và bảo tồn hệ chữ viết thông qua việc nghiên cứu lịch sử hình thành và phát triển của nó
- đưa ra quy chuẩn cho những đề xuất về việc cải tiến chính tả cho chữ viết của một cộng đồng ngôn ngữ
- rộng hơn nếu có thể, là xây dựng định hướng phát triển cho một cộng đồng væn tự, nghĩa là cho tất cả các cộng đồng ngôn ngữ dùng chung hệ væn tự đó
3 Đối tượng nghiên cứu và mối liên hệ với ngôn ngữ học
Đối tượng nghiên cứu của væn tự học bao gồm:
- Chữ viết : cá hệ chữ viết; các cách phân loại chữ viết; các thành tố của chữ viết;mối liên hệ
giữa chữ viết và ngôn ngữ; khả næng biến đổi và quy luật biến đổi của nó
- Các yếu tố có khả næng tác động tới sự hình thành và biến đổi của chữ viết: các phương thức
tạo lập væn bản; các yếu tố ngôn ngữ, tâm lý; các yếu tố lịch sử-xã hội
- Khả næng tác động của chữ viết tới các mặt của tư duy và đời sống xã hội như ngôn ngữ, væn hoá, kinh tế, giáo dục
Nghiên cứu chữ viết không thể tách rời khỏi nghiên cứu ngôn ngữ, cho dù chữ viết có tính độc
lập tương đối với ngôn ngữ Và dù còn nhiều quan điểm khác nhau về mối liên hệ giữa chữ viết
với ngôn ngữ, tiểu luận này chỉ xem xét chữ viết trong phạm vi có liên hệ nhất định với ngôn
ngữ (mối liên hệ này sẽ được diễn giải rõ hơn ở phần sau) Vì lý do này, một số thuật ngữ và phương pháp nghiên cứu thuộc bộ môn ngôn ngữ học sẽ được sử dụng trong phần sau của tiểu
luận, bao gồm:
- các khái niệm: ngôn ngữ, lời nói, ký hiệu
- các thuật ngữ: âm vị, hình vị, âm tiết
- phương pháp luận: giải cấu trúc luận
Khả næng diễn đạt và kiến thức của người viết còn nhiều hạn chế Hi vọng phần này sẽ phần nào giúp bạn đọc định hướng được những gì người viết muốn mô tả
Trang 5II Chữ viết
1 M ối liên hệ giữa chữ viết với ngôn ngữ và lời nói
{từ “kí hiệu” trong các đoạn væn dưới đây là được dùng theo nghĩa là biểu vật (symbol/ signifiant) ch ứ không phải là dấu hiệu (signe)}
Theo quan điểm truyền thống, chữ viết, cùng với lời nói, là những hệ thống kí hiệu của ngôn
ngữ Chúng thực hiện công việc này bằng cách phù hiệu hoá cái khái niệm và đại biểu cho sự vật
khả kiến Một số quan điểm cũ còn đồng nhất ngôn ngữ với lời nói và cho rằng chữ viết là hệ
thống phái sinh của lời nói
Ngày nay (thật ra là từ thời F.Saussure), trong khi việc định nghĩa khái niệm “ngôn ngữ” còn chưa ngã ngũ, chúng ta vẫn thống nhất được rằng ngôn ngữ tách biệt với lời nói, vì có một số ngôn ngữ không có tiếng nói mà sử dụng một (số) hệ thống kí hiệu vật chất khác làm phương
tiện giao tiếp, trong đó có chữ viết Ví dụ như Væn Ngôn – ngôn ngữ chung của cõi Đông Á xưa –
là ngôn ngữ chỉ có chữ viết mà không có tiếng nói Hay các ngôn ngữ của người câm điếc, không
hề có tiếng nói, vẫn chưa có chữ viết mà chỉ lấy cử chỉ, điệu bộ làm hệ thống kí hiệu Hay như ngôn ngữ của làng Kuskoy ở Thổ Nhĩ Kz, kí hiệu của nó không phải là hệ thống âm vị hay chữ
viết mà là tiếng huýt sáo Điều này dẫn đến ý chữ viết không nhất thiết và không phải lúc nào cũng là hệ thống phái sinh từ lời nói
Ớ đây, tác giả cho rằng chữ viết là hệ thống kí hiệu bằng hình ảnh của 1 hoặc 2 trong 3 thực thể:
lời nói, { nghĩa hoặc ngôn ngữ Trong đó, chữ viết là kí hiệu của
Trang 6- lời nói (parole) khi nó ghi các thành tố của lời nói (ngữ âm): âm vị, âm tiết
- ngôn ngữ (langue) khi nó phù hiệu hoá các thành tố của ngôn ngữ: hình vị, từ,
- { nghĩa (sens) nếu nó là hình ảnh sao chép của sự vật-hiện tượng mà người sử dụng ngôn ngữ tham chiếu tới, hay nói cách khác, nó là hình ảnh hiện ra trong đầu của người truyền đạt và người tiếp nhận ngôn ngữ
Mỗi thực thể này là một hệ thống tương đối tách biệt nhau, mặc dù liên hệ nhau nhưng không
gắn kết với nhau 1-1 “như 2 mặt của tờ giấy” Mối liên hệ giữa chúng thực ra là do quy ước của con người kiến tạo nên chứ không có sự gắn kết tự nhiên nào giữa chúng Nó khá giống với mối liên hệ giữa kí hiệu và cái được biểu đạt Nghĩa là một đơn vị ở tầng này được biểu diễn ở tầng kia có khi bằng kí hiệu này, có khi bằng kí hiệu khác
Trang 7Trong khi mối quan hệ giữa ngôn ngữ và { nghĩa vẫn đang là chủ đề nghiên cứu của bộ môn ngữ nghĩa học, “bằng mắt thường” ta có thể dễ dàng nhận ra sự tách biệt giữa các hệ thống tiếng nói, chữ viết và ngôn ngữ Tiếng nói và chữ viết thì dễ phân biệt rồi, nhưng vẫn còn rất nhiều người (kể cả nhiều nhà ngôn ngữ học) vẫn thường đồng nhất tiếng nói với ngôn ngữ Tiếng nói tách biệt với ngôn ngữ ở chỗ cũng một từ, một đơn vị ở tầng ngôn ngữ, có thể có nhiều cách phát âm khác nhau ở tầng lời nói Khác nhau ở đây không phải chỉ là sự khác nhau do biến thể
âm vị (mỗi người nói một giọng khác nhau) mà có khi chúng hoàn toàn là tổ hợp của những âm
vị khác nhau (một người có thể phát âm một từ bằng những tổ hợp âm vị khác nhau, cũng như
những phương ngôn khác nhau của cùng một ngôn ngữ có cách phát âm ngữ vựng đó khác nhau) Ví dụ như “phúc” với “phước” là hai cách phát âm của cùng một từ, “bổn” với “bản”,
“nhựt” với “nhật”, “chân” với “chơn”, “chánh” với “chính”, “dung” với “dong”, “hoàn” với
“huờn”; “thực”, “thật” với “thiệc”, “thì” với “thời”, “kiếm” với “gươm” Chúng rõ ràng là tổ
hợp của những âm vị hoàn toàn khác nhau Một từ do vậy vẫn chỉ là một đơn vị ngôn ngữ chứ không bao gồm, không “liên quan gì” tới cách phát âm của nó ở tầng lời nói Tương tự, giữa chữ
viết với ngôn ngữ và lời nói cũng có sự cách biệt Một âm vị /a/ có thể được kí hiệu bằng chữ
<a>, cũng có thể được biểu diễn bằng <ア> hoặc <阿>, <א>, < > ; một ngôn ngữ do vậy có thể được kí hiệu bằng nhiều hệ chữ viết và ngược lại, một hệ chữ viết có thể làm kí hiệu cho nhiều ngôn ngữ Nhiều người không nhìn ra được sự tách biệt này là bởi ngôn ngữ hành chính của
mỗi nước thường chỉ viết bằng một hệ chữ, cả đời họ cũng chỉ sống và làm việc với một hệ chữ
đó, dần dần trong đầu họ hình thành nên mối liên hệ không thể thay thế giữa những phương
tiện giao tiếp đó
Tóm lại, khi nói đến một thứ tiếng, ví dụ tiếng Việt, thiết nghĩ người trình bày cần xác định rõ anh ta muốn nói tới hệ thống nào trong 3 hệ thống trên: hệ thống âm vị hay hệ thống từ vựng hay hệ thống { nghĩa Chữ viết không là ngôn ngữ, cũng không đại diện cho ngôn ngữ Chữ viết
có mối liên hệ với ngôn ngữ, đó là mối liên hệ giữa kí hiệu và nội dung mà nó biểu đạt
2 Các thành t ố của chữ viết
Tự vị (字位 chứ không phải 字彙) là đơn vị cấu thành nhỏ nhất của một hệ thống chữ viết Có nhiều quan điểm về định nghĩa của thành tố này ở nhiều lĩnh vực khác nhau, quan điểm nào cũng có hạn chế
Có quan điểm cho rằng, tự vị là nét giúp khu biệt các chữ với nhau Ví dụ: <h> trong chữ <shake>
là một tự vị vì nó giúp ta khu biệt <shake> và <snake> Quan điểm khác cho rằng, tự vị là đơn vị hình ảnh tương đương với một âm vị trong lời nói Theo cách hiểu này thì trong chữ <shake>, cả
<sh> mới là một tự vị, vì cả <sh> mới tương ứng với âm vị /ʃ/ trong lời nói Quan điểm thứ nhất
có vẻ thực tế hơn vì bản chất chữ viết là một thực thể hình ảnh, hay nói cách khác nó là thực
Trang 8thể có thể tri nhận bằng thị giác Quan điểm thứ hai xuất phát từ quan niệm lời nói là hệ thống
kí hiệu luôn luôn song hành của ngôn ngữ, điều này phần trên đã phủ nhận, vì có những ngôn
ngữ không có tiếng nói mà vẫn có chữ viết
Theo ý tác giả, vì chữ viết là hệ thống kí hiệu bằng hình ảnh nên tự vị phải là đơn vị hình ảnh
nhỏ nhất mà con người có thể tri nhận được Một tự vị khi đứng một mình phải gợi ra trong đầu người đọc một hình ảnh hoàn chỉnh, kiểu “o tròn như quả trứng gà, ô thì đội mũ ơ thì mang râu” Nhưng đó không nhất thiết phải là hình ảnh của một sự vật khả kiến ngoài đời, mà cũng
có thể là hình ảnh do chính nó tạo ra trong trí óc người học chữ, ví dụ “hình chữ T”, “hình chữ Y”
Về giá trị của tự vị, đa số quan điểm đều cho rằng mỗi tự vị đều có ít nhất một giá trị Với quan điểm này, tác giả không phản đối, cũng không đồng ý hoàn toàn Một tự vị, theo định nghĩa ở trên, nếu đứng riêng một mình thì đúng là sẽ luôn mang một giá trị có thể nhận biết hoặc dự đoán được Giá trị đó có thể thuộc 1 trong 3 hệ thống lời nói (âm vị, âm tiết), ngôn ngữ (hình vị,
từ, khái niệm) hoặc { nghĩa (hình ảnh).Tuy vậy, trong quá trình hành chức, tự vị có thể không có giá trị hoặc có giá trị tiềm tàng:
- Tự vị không có giá trị trong chữ khi nó có thể bị lược bỏ mà chỉnh hợp chứa nó vẫn giữ nguyên giá trị Ta có thể gọi nó là tự vị mang giá trị lịch sử vì nguyên nhân thường thấy của hiện tượng này là do nguyên tắc lịch sử trong chính tả (sẽ được giới thiệu ở phần sau) Ví dụ, xét chữ <rhym> trong tiếng Anh như là một chữ ghi lời nói, <h> là một tự vị nhưng nó không thể hiện âm vị /h/hay bất cứ giá trị ngôn ngữ, hình ảnh nào, ta nói tự vị <h> không có giá trị trong chữ này
- Tự vị có giá trị tiềm tàng trong chữ khi nó không thể bị lược bỏ hoặc thay thế mà không làm thay đổi giá trị của chỉnh hợp chứa nó Ví dụ chữ <shape> trong tiếng Anh, cả chỉnh hợp <sh>
mới có giá trị là âm vị /ʃ/, nhưng ta không thể lược bỏ hay thay thế một trong hai tự vị đó Ta nói <s> và <h> có giá trị tiềm tàng trong chữ này
Theo cách hiểu này, chữ <à> trong hệ thống chữ Latin ghi tiếng Pháp gồm có hai tự vị: <a> và <`> (dấu accent grave) Trong đó, giá trị của <a> là âm vị /a/, còn <`> mang giá trị hình vị, cụ thể nó giúp ta xác định kí tự này truyền tải giới từ «à» (chứ không phải động từ «a»-avoir)
Nhiều người coi mỗi kí tự chữ hán là một tự vị Điều này không phải lúc nào cũng đúng Chữ hán được chia làm 6 loại tuz theo đối tượng mà nó ghi (các đơn vị của 3 thực thể lời nói, ngôn
ngữ hình ảnh) Trong số đó thì chỉ có (một số) chữ thuộc loại tượng hình, giả tá, chỉ sự là có thể được coi là một tự vị Ví dụ <天>, <下>, <日>, <月> mỗi chữ này là một tự vị vì tổng thể nó
mới là một hình ảnh hoàn chỉnh, không bao gồm và do đó không thể được chia thành những bộ
phận nhỏ hơn Trong khi những chữ thuộc các loại hội ý, chuyển chú và đặc biệt là hình thanh thì không như vậy Chúng thường được ghép từ những tự vị là những hình ảnh riêng biệt và
Trang 9luôn có giá trị riêng trong những kí tự đó Ví dụ chữ <教> trong hệ thống chữ hán sẽ gồm 3 tự vị:
<爻>, <子> và <攵> Tự vị <爻> theo tự nguyên có giá trị ngữ âm, <子> và <攵> có giá trị hình ảnh, vì mỗi tự vị lần lượt là hình ảnh một đứa trẻ và bàn tay cầm cây thước
Một ví dụ khác, chữ <認> trong hệ thống chữ hán cũng có 3 tự vị: tự vị <言>, <刃> và <心> <言>
ở đây không ghi trực tiếp { nghĩa bằng hình ảnh mà nó đại diện cho một trường ngữ nghĩa (champs sémantique) giúp ta xác định kí tự <認> truyền tải một từ mang { nghĩa liên quan tới ngôn ngữ và lời nói <刃> và <心> mỗi tự vị đều mang giá trị tiềm tàng, và sự kết hợp của chúng thông qua tổ hợp <忍> cho ta gợi ý về âm tiết / n / (“nhận”) trong tiếng Việt Chung qui, <言> có giá trị { nghĩa, <刃> và <心> mang giá trị lời nói
Một tự vị khi hành chức còn có thể mang nhiều giá trị cùng lúc, thường là giá trị ngôn ngữ kèm theo giá trị ngữ âm Dựa trên mối quan hệ giữa các tự vị trong một hệ chữ, có thể chia tự vị ra làm hai loại: tự vị cơ sở (hay độc lập) và tự vị thứ cấp (hay phụ thuộc)
- Tự vị cơ sở là tự vị có ít nhất một giá trị riêng và giá trị đó được thể hiện kể cả khi nó đứng riêng một mình trong væn bản Ví dụ: trong hệ chữ Latin thì <a> là một tự vị cơ sở, vì kể cả khi đứng một mình nó vẫn có thể đại diện cho âm vị /a/, trong hệ chữ Latin ghi tiếng Anh, <a> còn truyền tải hình vị mạo từ «a», trong tiếng Pháp là động từ «avoir»
- Tự vị thứ cấp là tự vị thường không có giá trị riêng cố định mà giá trị của nó chỉ thể hiện khi nó được ghép chung với một tự vị cơ sở thành kí tự (Lưu { rằng đây không có nghĩa nó là tự vị có giá trị tềm tàng như trình bày ở trên) Ví dụ, trong hệ thống chữ Latin ghi tiếng Pháp, dấu accent grave <`> là một tự vị phụ thuộc vì giá trị ngôn ngữ của nó (giúp phân biệt hình vị «a» với
«à») chỉ thể hiện khi nó được ghép chung với <a> thành <à>; giá trị ngữ âm của nó cũng chỉ được thể hiện khi nó ghép chung với tự vị <e> tạo thành <è>, chỉ tại đây nó mới đánh dấu kí tự
<è> truyền tải âm vị /ɛ/
Tự vị đồng trị (同値) là các tự vị có hình dạng khác nhau nhưng có giá trị như nhau Ví dụ <a> và
<A>, <あ> và <ア>, <訁> và <讠>
Tự tố (hay kí tự) có thể là tự vị cơ sở hoặc tổ hợp của một tự vị cơ sở và các tự vị thứ cấp Ví dụ:
<a>, <á>, <à>, <â>, <æ>, <ä> mỗi tổ hợp này là một kí tự Trong khoa học máy tính, một kí tự là
một đơn vị thông tin được mã hoá bằng một điểm mã trong bảng mã (thường là unicode) và chiếm một đơn vị thông tin (bit) nhất định
Chữ là kí tự hoặc chỉnh hợp kí tự tương ứng với một đơn vị trong ngôn ngữ, thường là từ Ví dụ:
chỉnh hợp <literam> là một chữ; <テキスト> là một chữ; <文> là một chữ Một tự vị-kí tự <A>,
<キ> cũng có thể là một chữ khi trong væn cảnh nó đại diện cho chính nó, ví dụ trong câu “chữ cái đầu tiên trong bảng chữ cái latin là chữ A”
Trang 103 Dấu câu, chữ số và chữ ghi số
Mỗi hệ chữ viết thường đi kèm với một hệ thống chữ số và một hệ thống dấu câu Các tự vị này không có giá trị lời nói hay hình ảnh mà thể hiện những giá trị ngôn ngữ phổ quát Chính vì vậy các tiểu hệ thống này thường tương đối độc lập với hệ chữ mà từ đó nó được sinh ra và có thể
sử dụng trong bất kì hệ chữ nào, miễn là ngôn ngữ được ghi lúc đó cũng có các ngữ ý mà các tự
vị đó thể hiện
Lấy ví dụ như trong hệ chữ latin, ta có <,> đánh dấu kết thúc hoặc phân tách một ngữ đoạn, dấu
<?> thể hiện thái độ nghi vấn Những giá trị này có trong hầu hết các ngôn ngữ trên thế giới
hiện nay: người dùng tiếng Việt khi nói chuyện tới đoạn cần bổ sung một thành phần phụ chú cũng phải ngưng nghỉ một nhịp, đó là chỗ mà khi viết họ dùng dấu phẩy để kí hiệu; người Pháp khi đưa ra câu hỏi cũng thường hay lên giọng ở cuối câu, đó là nơi họ đặt dấu chấm hỏi Các
dấu câu này ngày nay được sử dụng trong rất nhiều hệ chữ trên thế giới, kể cả trong những hệ
chữ vốn ban đầu không có chúng, ví dụ như trong hệ chữ hán Hệ chữ hán vốn ban đầu là hệ
thống kí hiệu của Væn Ngôn – một ngôn ngữ không có tiếng nói, nghĩa là không có các ngữ khí như nghi vấn, cảm thán nên hệ thống dấu câu của nó lúc đầu chỉ gồm hai dấu <,> và <。>
Thế nhưng ngày nay, trong các væn bản chữ hán ghi các ngôn ngữ đương đại (đa phần đều có
tiếng nói), những dấu câu này, vẫn xuất hiện ở những nơi nó cần xuất hiện, kể cả khi viết dọc
kiểu truyền thống hay viết ngang kiểu hiện đại
Trang 11M ột số dấu câu dùng trong hệ chữ tengwar
Về phần chữ số, hệ thống các tự vị 1, 2, 3 là một ví dụ Đây vốn là các chữ số thuộc hệ chữ Ả
rập nhưng ngày nay nó đã trở thành một phần của gần như tất cả các hệ chữ khác trên thế giới,
trừ các ngôn ngữ mà người ta không thể đếm được nhiều hơn 2 Ở đây cần phân biệt chữ số và
chữ ghi số: chữ số là các tự vị chỉ mang giá trị ngôn ngữ hoặc hình ảnh, không có chữ số nào ghi
âm thanh Còn chữ ghi số là chữ có ghi cả phần giá trị âm thanh của từ chỉ số trong ngôn ngữ được dùng Ví dụ ūnus, duo là chữ ghi số, I,II, là các chữ số; او دح , نان ثإ là chữ ghi số, 1,2 là các chữ số; 壹, 弍 hay 沒, 𠄩 là chữ ghi số và 一, 二 là các chữ số Các chữ số được ghi bằng
chữ thường là trong lĩnh vực tài chính- kế toán: trên hoá đơn, trên tiền mặt để tránh bị nhầm
Các ch ữ số từ 1 đến 10 trong một số hệ chữ và chữ ghi số trong một số ngôn ngữ
Nhiều người coi 一 二 三 và 壹 弍 叄 trong hệ chữ hán cùng là chữ cả Thật ra, viết 一, 二, 三 nhìn vào vẫn có thể đọc-phát âm là một, hai, ba là un, deux, trois là один, два, три Với
những người coi 一, 二, 三 là chữ, khi bị buộc phải phân biệt chúng với 壹 弍 叄, họ phân biệt chúng qua cách dùng: 一 二 三 là chữ dùng trong các trường hợp mà ở những hệ chữ khác
Trang 12người ta dùng cái gọi là chữ số, còn 壹, 弍, 叄 là chữ dùng trong các trường hợp mà ở những hệ
chữ khác người ta dùng cái gọi là chữ ghi số Suy cho cùng thì nếu chữ hán không có cái gọi là
chữ số thì Trung Quốc đã không phải là nơi đầu tiên phát minh ra bảng cửu chương
Số 0, cùng với khái niệm “không” là một thành tựu vĩ đại của triết học væn minh Ấn Độ Không
có hệ chữ nào (mà người phương tây đã khám phá) trên thế giới có số 0 trong hệ số đếm của
nó Số 0 trong tất cả các hệ chữ trên thế giới ngày nay đều mượn từ số 0 trong các hệ chữ của
xứ sở Nam Á này Đây cũng là con số đã đưa chúng ta bước vào kỉ nguyên số
4 Phân loại chữ viết
Có nhiều cách phân loại chữ viết Cách phổ biến nhất là phân loại dựa trên giá trị của tự vị, còn
gọi là phân loại theo chức næng Như đã giới thiệu ở phần khái niệm, chữ viết có thể là kí hiệu
của lời nói, ngôn ngữ hoặc hình ảnh Nhưng vì ngôn ngữ là cái trừu tượng, không phải là một
thực thể vật chất dễ mô tả nên rất ít hệ thống có thể biểu đạt độc lập thực thể này Do vậy chữ
viết được chia thành hai loại lớn: loại ghi lời nói và loại ghi hình ảnh
- Loại ghi hình ảnh (logogramme): là chữ có đa số tự vị mang giá trị hình ảnh Mỗi kí tự thuộc
hệ này thường tương đương với một đơn vị ngôn ngữ (hình vị, khái niệm ) Trong đó
+ Chữ tượng hình (pictogramme): kí tự thuộc loại chữ này thường đại diện cho một danh từ chỉ
sự vật, trong đó tất cả các tự vị cấu thành đều mang giá trị hình ảnh
Thánh Minh(聖銘) văn tự của người Ai Cập
+ Ch ữ chỉ sự hay chữ biểu ý (idéogramme): kí tự thuộc loại chữ này thường tương đương với một khái
ni ệm, trong đó tất cả các tự vị cấu thành đều mang giá trị hình ảnh
Trang 13Hình dáng và nghĩa của một số kí tự trong bảng chữ LoCos
Emoji cũng có thể được sử dụng như một hệ thống chữ viết Trong hình này nó hoàn toàn ghi một ngôn
ng ữ mới, không phải tiếng Anh hay bất cứ ngôn ngữ tự nhiên nào
- Loại ghi lời nói: là chữ là chữ có mỗi kí tự tương đương với một đơn vị ngữ âm (âm vị, âm
tiết ) Trong đó:
Trang 14+ Chữ âm vị (alphabet): là hệ chữ có đa số mỗi tự vị đại diện cho 1 âm vị Các tự vị dù là đại diện cho nguyên âm hay phụ âm đều là tự vị cơ sở Mỗi tự vị này gọi là 1 chữ cái
API (H ệ thống phiên âm quốc tế - Alphabet Phonétique International) kí âm tiếng Anh
+ Chữ âm tiết (syllabaire): là chữ có mỗi tự vị cơ sở đại diện cho một âm tiết Tự vị thứ cấp nếu
có không đại diện cho nguyên âm hay âm vị nào khác
M ột đoạn tiếng Nhật viết bằng 2 bảng kana hỗn dụng
- Chữ phụ âm (abjad và abugida): là chữ chỉ ghi phụ âm, không ghi nguyên âm (abjad), hoặc nếu
có thì các tự vị ghi nguyên âm luôn là tự vị thứ cấp (dấu phụ, nét gạch, phẩy chân ) (abugida)
Trang 15Ch ữ Brahmi viết tiếng Prakit
Vẫn còn nhiều tiểu loại ghi âm khác sử dụng nhiều phương pháp khác để ghi âm, nhưng chung qui vẫn là kết hợp từ các phương pháp kể trên Ví dụ như chữ Hangul, mỗi tự vị ghi một âm vị nhưng mỗi kí tự lại ghi một âm tiết
Ch ữ hangul của bán đảo Triều tiên, “chữ cái” kí âm hoàn hảo nhất, đến nỗi suýt có cả một bảng API bằng
Trang 16hẳn loại ghi hình hay ghi âm, nghĩa là không thể nói “chữ hán thuộc loại ghi hình” hay “chữ latin thuộc loại ghi âm”
Chữ Hán ghi tiếng Việt, ta quen gọi là chữ nôm Ngoài cách phân loại trên, người ta còn phân loại chữ viết theo hình chữ Theo đó, chữ viết sẽ được chia làm 2 loại chính: chữ hình nét (linéaire, có người dịch là tuyến-tính) và chữ không-
phải-hình nét (non- linéaire, có người dịch là phi-tuyến-tính), gồm chữ hình nêm, chữ nổi Trong đó, tuz theo dụng cảnh, chữ hình nét có thể được chia thành các loại lớn:
- Chữ chân (真書): là chữ thể hiện rõ ràng nhất và chuẩn xác nhất hình dáng của các tự vị, thường được dùng trong in ấn Loại này còn có các tên gọi khác là chữ in, chữ chuẩn, chữ khải
Trang 17- Chữ hành (行書): thực chất là chữ khải ở dạng viết tay Chữ ở dạng này đặc trưng ở chỗ các tự
vị thường được viết dính liền hoặc nối liền nhau nhưng nhìn qua vẫn có thể nhận biết được các
Trang 18Trong væn tự học, người ta thường dùng cách phân loại theo chức næng Còn trong thiết kế in ấn (typographie) người ta thường dùng cách phân loại theo tự thể
4 Vai trò c ủa chữ viết
Chữ viết có hai chức næng cơ bản là lưu trữ và truyền đạt thông tin Thông tin này có thể ở dạng
âm thanh (lời nói) hoặc hình ảnh ({ nghĩa) So với lời nói, vốn là thực thể vật chất chỉ có thể được tri nhận ở nhất thời (“lời nói gió bay”), thì chữ viết tỏ ra là một hệ thống kí hiệu ưu việt hơn hẳn trong việc lưu trữ thông tin Lưu trữ thông tin, chính là khả næng bảo toàn được thông tin đó khỏi sự quên lãng của thời gian, nhất là khi những thông tin đó không thể truyền đạt cho người khác Chính nhờ những dòng nhật kí, những mẩu giấy ghi chú mà những suy nghĩ, { tưởng của chúng ta hôm nay được lưu giữ tới ngày mai, ngày kia, nhiều næm sau Cũng vì có
thể được bảo quản lâu hơn nên chữ viết còn giúp ngôn ngữ vượt qua được khoảng cách địa lý, giúp cho thông điệp được truyền tới đúng người nhận Trong xã hội, mỗi con người là một cá
thể độc lập, nghĩa là không thể tránh khỏi việc mỗi người có một không gian sống khác nhau Để giao tiếp với những người ở xa, người ta buộc phải dùng đến chữ viết Thông qua thư từ, tin
nhắn , người đi xa giữ liên lạc với người nhà; thông qua báo chí, sách vở, nhà nước thông tin
tới tất cả tỉnh thành, làng xã
Ngoài ra, chữ viết còn là hệ thống bổ trợ cho lời nói trong việc truyền đạt thông tin trong giao
tiếp Cụ thể, nó giúp “đính chính” những phát ngôn bị hiểu sai hoặc chưa rõ nghĩa Chữ viết thể
hiện chức næng này khi nó là hệ chữ thuộc loại có ghi { nghĩa, và thông tin được truyền đạt là thông tin thuộc loại hình ảnh Chúng ta đều biết, ngôn ngữ là một phương tiện giúp ta mô tả
thế giới khách quan Hình ảnh phản chiếu của thế giới khách quan đó trong tâm trí chúng ta chính là cái mà ta hay gọi là { nghĩa Giao tiếp là hoạt động truyền đạt cái { nghĩa đó trong đầu
ta với người khác thông qua ngôn ngữ và các kí hiệu của nó Trong hoạt động này, thông tin
Trang 19hình ảnh (hay { nghĩa) truyền tải tới người nhận có trọn vẹn chính xác được hay không chính là
do cách chúng ta sử dụng ngôn ngữ và các hệ thống kí hiệu của nó Có lẽ nhiều người không ít
lần trong sinh hoạt, mặc dù nghe rõ phát âm của người đối thoại, họ vẫn phải yêu cầu người đó
viết từ mà họ vừa phát âm ra Nói một cách dễ hiểu, chữ viết có thể giúp ta phân biệt hai từ vị
có phát âm (gần) giống nhau, giúp thông tin được truyền tải trọn vẹn chính xác và qua đó nâng cao hiệu quả giao tiếp
Việc sáng tạo ra một hệ chữ viết hay tiếp nhận một hệ chữ viết mới do vậy cần luôn qui chiếu
về hai mục đích: một là hệ chữ đó phải giúp mở rộng phạm vi sử dụng của ngôn ngữ, trong giao
tiếp địa lý (giữa các vùng dân cư với nhau) cũng như trong giao tiếp xã hội (giữa những người trong cùng một khu vực dân cư, bao gồm những người thuộc các thành phần xã hội khác nhau, các giai cấp khác nhau, hoạt động trong các lĩnh vực chuyên môn khác nhau ); hai là hệ chữ
phải giúp nâng cao hiệu quả giao tiếp trong phạm vi sử dụng ngôn ngữ nói trên qua việc tæng độ chính xác của thông tin được truyền tải
III H ệ chữ viết
1 Khái niệm
Nếu chữ viết là khái niệm chung chỉ các hệ thống thì mỗi hệ thống đó có thể được coi là một hệ
chữ viết Hệ chữ viết có thể được hiểu là tập hợp các tự vị mà khi được dùng kết hợp nhau có
thể biểu đạt được ngôn ngữ hoặc tiếng nói Các hệ chữ viết phân biệt nhau ở chỗ phần tử của
hệ này không thể được dùng lẫn được với phần tử của hệ kia Hay nói cách khác, phần tử nào thuộc hệ chữ này thì không có trong hệ kia và không thể kết hợp được với phần tử trong hệ kia
và ngược lại Nghĩa là chữ cái <a> trong hệ chữ Latin và chữ cái <a> trong hệ chữ Cyril vẫn là hai
phần tử riêng biệt, mặc dù có chung nguồn gốc, chúng chỉ tình cờ có hình dạng và giá trị giống nhau mà thôi
Một khái niệm được đặt ra để chỉ hệ thống dưới hệ chữ là bộ chữ Bộ chữ là một tập hợp con
của hệ chữ, bao gồm các thành tố của hệ chữ được áp dụng và vận dụng để ghi một ngôn ngữ
cụ thể Khái niệm này thường được cộng đồng ngôn ngữ sử dụng để gọi tên hệ thống chữ viết
của ngôn ngữ của họ Ví dụ chữ quốc ngữ thuộc hệ chữ Latin, chữ nôm thuộc hệ chữ hán, chữ jawi thuộc hệ chữ ả rập, chữ bengal thuộc hệ devanagari Bộ chữ khác hệ chữ ở chỗ các bộ
chữ không tách biệt nhau Phần tử của bộ này vẫn có thể xuất hiện trong væn bản được xác định
là viết bằng một bộ khác trong cùng hệ Ví dụ, bộ “chữ quốc ngữ” vốn không có những chữ j, z, w nhưng trong væn bản được xác định là viết bằng chữ quốc ngữ, những chữ này vẫn có thể
xuất hiện
Trang 202 Đặc điểm
A Tính kế thừa
Các tự vị trong một hệ chữ thường có chung một giá trị, bất kể hệ chữ đó được áp dụng lên ngôn ngữ nào Tuy vậy tính chất này không phải lúc nào cũng được thể hiện, nhất là ở các hệ
chữ thuộc loại ghi lời nói Tự vị <a> trong hệ chữ Latin, trong tiếng Việt lúc nào cũng truyền tải
âm vị /a/, trong tiếng Pháp cũng mang giá trị đó nhưng sang tiếng Anh thì chưa chắc: có khi nó đại diện cho âm vị /a/ có khi nó lại là âm /ei/, / / Ngay tên gọi của chữ cái cũng thay đổi: chữ cái <J> trong tiếng Pháp tên là /ʒiː/ nhưng trong tiếng Anh /ʒiː/ lại là tên gọi của chữ cái <G>
Vì vậy khi viết <to> hay <be> mà không nói rõ là đang viết tiếng nào thì cũng không ai biết mấy
chữ đó phát âm như thế nào, nghĩa lại càng mù tịt
Đối với các hệ chữ thuộc loại ghi { nghĩa thì tính chất này lại được bảo toàn khá nguyên vẹn Trong hệ chữ hán, bộ <水> hay <氵> dù ở ngôn ngữ nào, tiếng Nhật, tiếng Việt hay tiếng Đức,
tiếng Anh , cũng mang giá trị phạm trù nước, chất lỏng; bộ <火> hay <灬> cũng mang giá trị
phạm trù lửa, nhiệt Viết <高> dù không nói là tiếng nào nhìn vào ta cũng đoán ngay được chữ này có nghĩa “high”, “altum” hay viết <光> có thể nói ngay nó là “lumière”, “Licht”
M ột câu tiếng Thái/Lào viết bằng chữ hán
B Chính tả
Bất kì hệ chữ viết nào cũng tồn tại 3 loại chỉnh hợp tự vị:
- Chỉnh hợp tự nhiên: là chỉnh hợp của hai hay nhiều từ vị bất kì Có vô số khả næng kết hợp, tạo thành vô số chỉnh hợp loại này với vô số giá trị Loại chỉnh hợp này luôn tồn tại ở bất kì thời điểm nào, và sự tồn tại của nó là khả næng giúp hệ chữ đó có thể ghi bất kì ngôn ngữ mới nào:
chữ ả rập cũng có thể viết tiếng Việt, chữ hán cũng có thể ghi tiếng Tây Ban Nha
Trang 21- Chỉnh hợp tự do: là chỉnh hợp của các tự vị sau khi chúng đã được gán cho những giá trị nhất định Loại chỉnh hợp này là tập con của chỉnh hợp tự do, tồn tại khi một hệ chữ được áp dụng ghi một ngôn ngữ cụ thể Các tự vị của hệ chữ đó khi đó sẽ được gán cho những giá trị biệt trưng của ngôn ngữ đó, thường là ngữ âm, và như vậy, khả næng kết hợp của các tự vị sẽ bị giới
hạn trong phạm vi tồn tại của các thành tố ngữ âm trong ngôn ngữ đó Các chỉnh hợp này cho phép người sử dụng chữ viết có thể suy đoán (“đánh vần”) ra hình chữ và cách viết của từ hoặc
âm mà họ muốn viết Ví dụ, trong tiếng Việt, biết <ng> đại diện cho phụ âm [ŋ+, <iê> là nguyên
âm [i ], dấu <‘> ghi thanh sắc, ta có thể ghi âm tiết *ŋi ] là <ngiế>; cũng trong tiếng Việt, ta có
<女> chỉ phạm trù nữ giới, <巴> có âm đọc là [ba], ta có thể ghi từ “bà” là <妑> Đây gọi là
những chỉnh hợp tự nhiên của chữ latin và chữ hán khi ghi tiếng Việt
- Chỉnh hợp chính tả: là tập con của chỉnh hợp tự nhiên, được xác định khi hệ chữ đó được công
nhận bởi một nhà nước là hệ chữ chính thức của một cộng đồng ngôn ngữ Khi đó, sự kết hợp
của các tự vị trong hệ chữ phải tuân theo một số qui tắc gọi là luật chính tả Ví dụ như theo luật chính tả tiếng Việt, âm *ŋi ] phải được viết là <nghía> (chứ không phải là <ngía> hay <ngiế>), còn theo chính tả tiếng Hoa, từ chỉ người phụ nữ lớn tuổi có âm gần với [bɔː+ phải được viết là <婆> (chứ không được viết là <妑>) các chỉnh hợp khác sẽ được gọi là “chữ sai chính tả” hoặc như trong hệ chữ hán thì gọi là “dị thể”
Chính tả có các vai trò trước hết là đảm bảo thông tin ngôn ngữ được truyền đạt chính xác và
trọn vẹn hơn trong giao tiếp, sau là thống nhất ngôn ngữ về mặt kí hiệu trong cộng đồng Vai trò này có liên quan tới định nghĩa của các thao tác đọc và viết, sẽ được trình bày ở phần sau
Cơ bản là, thông qua việc quy ước giá trị của tự vị và các chỉnh hợp tự vị, người viết sẽ không
thể tự do lựa chọn một chỉnh hợp tự do bất kì để ghi làm kí hiệu cho thông tin mà họ muốn chuyển tải, người đọc nhờ đó cũng loại bỏ bớt được một lượng lớn khả næng phải suy đoán
Trang 22Những quy ước đó cũng giúp phân biệt những giá trị có thể bị trùng lặp của các chỉnh hợp tự vị, giúp hạn chế độ chênh lệch thông tin giữa kí hiệu và cái nó biểu đạt, dẫn đến việc người đọc
hiểu sai { người viết Chúng ta sẽ thấy rõ hơn tác hại của việc một cộng đồng ngôn ngữ không
có chính tả cho hệ chữ của họ ở phần sau
Nếu chính tả là tập hợp những nguyên tắc thì trong væn tự học cũng có những nguyên tắc của chính tả, nghĩa là những “nguyên tắc của những nguyên tắc” Để phân biệt, từ đây ta sẽ gọi
những nguyên tắc do chính tả đặt ra là quy tắc, còn những nguyên tắc đặt ra cho chính tả là nguyên tắc Ở thế giới phương tây, chính tả được soạn thảo dựa trên các nguyên tắc :
- Nguyên tắc ngữ âm: mỗi đơn vị lời nói chỉ nên được ghi bằng một tự vị hoặc một chỉnh hợp tự
vị Ví dụ trong tiếng Nga (chữ cyril) âm /k/ luôn chỉ được ghi bằng tự vị <к>, dù trong
<кириллица> hay trong <художник>; chữ cái <c> luôn chỉ tương đương với âm /s/, dù trong
<словар> hay <учась>
- Nguyên tắc hình vị: mỗi chữ phải thể hiện rõ các hình vị cấu tạo nên từ mà nó ghi Ví dụ trong
tiếng Rumani, nguyên âm /æ/ sau <ch> và <gh> phải được viết là <ea> đối với các từ có dạng
thức phái sinh (dérivé) hoặc biến thể (flexion) với hình vị gốc là <che-> và <ghe->, như <cheag>
(→ închega); <gheatæ> (→ ghete → ghetuță), nhưng phải viết là <ia> đối với các từ không có
biến thể (hình vị độc lập), như <chiar>, < ghiaur>
- Nguyên tắc cú pháp - từ loại: mỗi chữ phải thể hiện rõ loại từ và các đặc điểm từ loại ( thì, thế,
thức, giống, số ) của từ mà nó ghi Ví dụ từ “gặt hái” trong tiếng Pháp nếu được viết là
<cueillies> ta có thể biết được nó thuộc phân từ quá khứ giống cái số nhiều, từ “æn” nếu được
viết là <mangerions> ta sẽ biết nó đang là động từ chia ở thức điều kiện thì hiện tại với chủ ngữ
là ngôi thứ nhất số nhiều
- Nguyên tắc tiết kiệm: trong một chữ, tự vị nào không mang giá trị thì nên bị lược bỏ Ví dụ trong tiếng Serbie, “næm” và “mười” khi đứng riêng thì được viết là <pedet> và <deset> nhưng khi viết dính lại thành “mười læm” thì lại được viết là <pedeset>, tự vị <t> bị lược bỏ vì nó không
có giá trị tương ứng với âm vị nào trong từ này; trong tiếng Anh, “sự phán xét” được viết là
<judgment> dù nó là biến thể phái sinh của <judge> nhưng <e> bị lược bỏ vì nó không có giá trị trong chữ này
- Nguyên tắc lịch sử-từ nguyên (詞原 chứ không phải 字原): trong một chữ, tự vị nào mà thể
hiện được từ nguyên của từ mà chữ đó ghi thì dù tự vị đó ngày nay không còn giá trị ngữ âm hay ngôn ngữ thì vẫn nên giữ lại Ví dụ trong chính tả tiếng Pháp từ “con người” có âm đọc là /ɔ:m/ nhưng lại viết là <homme> chứ không phải <omme>, tự vị <h> dù không có giá trị gì nhưng vẫn được giữ lại, không phải vì trong quá khứ từ này đã luôn được viết là <homme> mà
là vì hai tự vị này cho ta biết rằng nguồn gốc của từ này trong Pháp là từ “homo” trong tiếng
Trang 23Latin; trong tiếng Anh từ “nợ” được ghi là <debt> chứ không phải <det> (<b> không có giá trị) không phải vì ngày xưa không có ai viết như vậy mà là để nhắc ta nhớ tới nguồn gốc của nó trong tiếng Latin là từ “debitum”
- Nguyên tắc phân biệt: hai từ đồng âm nên được viết khác nhau Ví dụ trong tiếng Pháp viết
<ça> là một từ khác với viết <sa> dù cùng phát âm là /sa/; <au>, <eau> và <ô> là kí hiệu của 3 từ hoàn toàn không liên quan gì nhau dù phát âm luôn là /o/
- Nguyên tắc biểu trưng (chỉ có ở hệ chữ song hệ tự vị - có chữ hoa và chữ thường): chữ cái hoa
và chữ cái thường phải được tận dụng để phân biệt nghĩa của từ Ví dụ viết <người> thì nghĩa khác với viết <Người>, <föld> thì nghĩa khác với <Föld>
Gọi là nguyên tắc nhưng chúng vẫn thường xuyên bị vi phạm, thường cái trên bị vi phạm để ưu tiên tuân thủ cái dưới
3 Các hệ chữ viết trên thế giới
Việc lựa chọn chữ viết phụ thuộc nhiều vào ngôn ngữ mà quốc gia đó sử dụng Mà ngôn ngữ
gắn với væn hoá, mà væn hoá thì trên thế giới có thể chia thành các khu vực væn minh Nên tạm
thời ta có thể chia bản đồ chữ viết trên thế giới theo các khu vực væn minh:
Các h ệ chữ viết tiêu biểu trên thế giới (Nguồn: wikipedia)
Trang 24- Khu vực chữ Latin: là khu vực væn minh Hi Lạp- La Mã Khu vực này có nguồn gốc địa lý ở Tây
Âu Đa số các ngôn ngữ ở khu vực này chịu ảnh hưởng bởi tiếng Latin - ngôn ngữ chính thức của
đế quốc La Mã xưa Chữ Latin là một hệ chữ thuộc loại chữ ghi lời nói và là chữ ghi âm vị (alphabet) Hệ chữ này gồm 24x2 tự vị cơ bản, chia làm chữ hoa (majuscule, tên thông dụng trong tiếng Việt là “chữ hoa”) và chữ cái nhỏ (minuscule, “chữ thường”) Chữ Latin có nguồn
gốc từ hệ chữ Hi Lạp
- Khu vực chữ Cyril: tương ứng với vùng væn hoá Slav Khu vực này nằm ở vùng Đông Âu, Bắc Á
và một phần Trung Á Ngôn ngữ vùng này thuộc nhiều nhánh khác nhau, đa số thuộc họ Slav
Chữ Cyril là chữ viết chính thức của đế quốc Bulgarie xưa, cũng được sáng tạo dựa trên chữ Hi
Lạp Chữ này cũng thuộc loại chữ ghi âm vị, gồm khoảng 33x2 tự vị cơ bản Các tự vị cơ sở thuộc
hệ này cũng được chia thành chữ hoa và chữ thường
Trang 25- Khu vực chữ Hán: tương đương với Đông Á và một phần Đông Nam Á về địa l{ Đa số ngôn
ngữ trong khu vực đều chịu ảnh hưởng bởi tiếng Hán thời Đường (Trung Quốc) Khu vực này đặc biệt chỗ là chữ Hán thường được dùng chung với một số hệ chữ bản địa, đa phần thuộc loại ghi tiếng Chữ Hán được xếp vào hệ chữ ghi hình, tuy nhiên trong đa số các ngôn ngữ sử dụng
chữ này, quá nửa số chữ là chữ ghi lời nói-ngôn ngữ (chữ hình-thanh) Rất khó xác định số lượng tự vị cơ bản của hệ này Nhiều người coi 214 bộ thủ của chữ này là các tự vị cơ bản Thực
chất nhiều bộ trong số đó lại do 2 hay nhiều bộ thủ khác ghép lại, với giá trị hình ảnh vẫn được
giữ nguyên Ví dụ trong bộ 見 có bộ 目, trong bộ 香 có bộ 禾
- Khu vực chữ Ả rập: so với những hệ chữ khác, chữ ả rập gắn bó mật thiết hơn cả với tôn giáo chính thức của vùng đất khai sinh ra nó- đạo Hồi Cũng chính vì thế mà phạm vi của nó trên bản
đồ thế giới rất rộng, từ Tây Á, Bắc Phi sang Trung-Nam Á và một phần Đông Nam Á, gần như ở đâu có đạo Hồi ở đó có sự tiếp nhận hệ chữ này làm chữ viết của ngôn ngữ bản địa Chữ Ả rập
có nơi dùng là chữ phụ âm, cũng có nơi nó là chữ âm vị Hệ chữ bao gồm 28 chữ cái cơ bản và khoảng 13 tự vị ghi nguyên âm cơ bản
Trang 26- Khu vực chữ Phạn và các hệ chữ phái sinh: tương ứng với vùng Nam Á và Đông Nam Á lục địa Tên gọi chính xác nhất của hệ chữ này là nagari và là hệ chữ viết của rất nhiều ngôn ngữ của Ấn
Độ xưa, nhưng vì chúng ta biết nó qua phiên bản ghi tiếng Phạn nên ta gọi nó là chữ Phạn Chữ này thuộc loại chữ phụ âm và là hình mẫu sáng tạo của rất nhiều hệ chữ khác ở vùng Đông Nam
Á Hệ này có khoảng 34 tự vị ghi phụ âm cơ bản và khoảng 18 tự vị ghi nguyên âm cơ bản
Trang 27Trên đây chỉ là những hệ chữ tiêu biểu tương ứng với các khu vực væn minh khác nhau Ngoài
ra, thế giới vẫn còn vô số hệ chữ viết khác Việc chia bản đồ chữ viết theo khu vực ảnh hưởng væn minh thật ra có liên quan tới khía cạnh væn hoá- xã hội của chữ viết mà phần sau của sách này sẽ đề cập tới
Trong lịch sử, việc một quốc gia thay đổi chữ viết để thích nghi với tình hình mới thật ra rất phổ
biến Ngay trong những næm gần đây, một loạt các quốc gia Trung Á- Đông Âu vẫn đang rục rịch chuyển từ chữ Cyril dùng từ thời Liên Xô sang chữ Latin Hầu hết các quốc gia khác có ngôn ngữ được ghi bằng nhiều hơn hai ba hệ chữ trong lịch sử khi tiến hành đổi sang chữ mới đều vẫn giữ
lại một, hai hệ chữ truyền thống, dùng song song chính thức hoặc dùng giới hạn trong một lĩnh
vực nào đó, hiếm có nơi nào bỏ hẳn chữ cũ Gần chúng ta nhất có Mông Cổ vừa đề ra lộ trình
10 næm chuyển từ chữ Cyril sang chữ Uyghur truyền thống của họ
Bi ển hiệu tiếng Bahasa của một cơ quan nhà nước ở tỉnh Aceh Darusalem, Indonesia, viết bằng cả chữ
Latin và chữ Ả rập (Jawi)
Nhiều người dự đoán trong tương lại cả thế giới sẽ dùng một hệ chữ chung nhất, hệ chữ đó có
khả næng cao sẽ là chữ Hán Thật ra tất cả những cái gọi là dự đoán tương lai đều mang tính
cảm tính, nhưng không phải là không có cơ sở Trong lịch sử, chữ hán đã từng được dùng để
viết nhiều tiếng châu Á không có mặt trên lãnh thổ Trung Quốc ngày nay như tiếng Thái, tiếng
Mã Lai, tiếng Phạn Gần đây, đã có nhiều phiên bản chữ hán cho các tiếng châu Âu như tiếng Anh, tiếng Đức, tiếng Pháp, tiếng Hoà Lan Trong đó, bản cho tiếng Anh và tiếng Đức đã được
Trang 28hoàn chỉnh và xuất bản Lưu { rằng các phiên bản chữ hán viết các tiếng này không phải chỉ là các cách chuyển âm (transliteration) mà nó thực sự ghi được cả âm lẫn nghĩa của từ trong các
tiếng này Vì chữ hán không sát sao việc ghi âm nên nó vượt qua được rào cản về cách biệt ngữ
âm giữa các tiếng, cộng với tính kế thừa cao như đã giải thích ở trên, nên khi áp dụng hệ chữ này lên các tiếng, từng chữ hoàn toàn có thể khớp cả ngữ âm lẫn ngữ nghĩa với tiếng mà nó ghi, nghĩa là ta thực sự có thể chỉ cần nhìn từng chữ hán là có thể không những phát âm mà còn đọc
ra được đúng tiếng Anh, Pháp, Đức
M ột đoạn tiếng Đức viết bằng chữ hán (ảnh chụp từ sách Deutsch in Sinnschrift)
4 Hệ chữ phái sinh và cái gọi là quy luật phát triển của chữ viết
Khác với bộ chữ, một hệ chữ viết phái sinh là hệ tự vị thành hình dựa trên một hệ tự vị đã có
sẵn trước đó nhưng hình dáng (và đôi khi giá trị) của các tự vị mới này thay đổi nhiều đến mức không còn có thể nhận ra được hình dáng ban đầu của chúng trong hệ chữ gốc Ta có chữ hi lạp
là hệ chữ phái sinh của chữ phoénicien, kế đó chữ latin và cyril là các hệ chữ phái sinh của chữ
hi lạp; ta có chữ phạn là hệ phái sinh từ chữ brahmi, chữ tạng là hệ phái sinh từ chữ phạn ;
chữ katakana, hiragana là hệ chữ phái sinh từ chữ hán
Các quá trình chuyển đổi kiểu như từ chữ hán giản phồn thể sang chữ hán giản thể, từ chữ hán
cổ truyền sang chữ tân tự thể hoàn toàn không phải là những biến đổi của hệ chữ mà chỉ là
những thay đổi về chính tả Tuy rằng một số tự vị cơ bản bị biến đổi hình dạng nhưng chúng không hề bị mất đi giá trị ban đầu <讠> vẫn mang giá trị của <言> dù nhìn có hơi khác, <车>
Trang 29vẫn mang giá trị của <車> dù nhìn nó không giống ban đầu, ngoài ra thì <氵>, <火>, <扌> tất cả
vẫn vậy, không thay đổi gì Những thay đổi này này cũng giống như việc lược bỏ một vài chữ cái
chữ Cyril trong các đợt cải cách chữ viết của Nga từ thế kỉ 17-18 đến sau thế chiến thứ nhất và hàng loạt các cuộc cải cách chính tả khác ở các nước nói các tiếng thuộc nhóm ngôn ngữ Slav trước và sau thời kì Xô Viết
Những bộ chữ nôm, chữ choang không phải là những hệ chữ phái sinh mà chỉ là các bộ chữ thuộc hệ chữ hán vì chúng vẫn sử dụng hệ tự vị của chữ hán, hoàn toàn không có sự thay đổi gì
về hình dáng và giá trị Về tên gọi “chữ nôm”, thiết nghĩ nó chỉ nên được dùng theo nghĩa hẹp,
chỉ những chữ được tạo mới để ghi từ tiếng Việt, trong trường hợp cần thiết phải phân loại nguồn gốc của từng chữ trong một væn bản Còn thông thường xét tổng thể một væn bản thì vẫn nên gọi chữ này là chữ hán, như cách các dân tộc Bách Việt khác gọi chữ viết của ngôn ngữ của
họ Nếu để xác định ngôn ngữ được ghi trong væn bản, nêu nói thẳng væn bản này viết bằng
tiếng Việt, væn bản kia viết bằng tiếng Hán, Quảng Đông, Quan Thoại Không nên nhập nhằng
giữa chữ, tiếng với ngôn ngữ Tránh trường hợp gặp væn bản viết toàn bằng “chữ hán” nhưng khi đọc vào lại phải nói nó đợc viết bằng “chữ nôm”!
Một đoạn văn có thể viết toàn bằng chữ hán mà khi đọc vào người ta lại nói nó được viết bằng chữ nôm! (ví dụ
của Nguyễn Trường An)
Trang 30Nếu xem những biến đổi của chữ viết bao gồm những thay đổi về hình dáng và giá trị của tự vị thì khi muốn đi tìm quy luật phát triển của chữ viết ta phải xem xét quá trình hình thành các hệ
chữ phái sinh Vấn đề gây tranh cãi ở đây là có hay không một cội nguồn chung của tất cả các hệ
chữ trên thế giới Tác giả thì cho là không Mỗi khu vực chữ viết trên thế giới có một khởi nguồn
chữ viết khác nhau, có thể hai, ba khu vực có chung một nguồn nhưng chắc chắn không phải tất
cả Từ các cội nguồn khác nhau đó, chữ viết sẽ biến đổi theo những chiều hướng khác nhau, độc lập nhau Không có một quy luật chung nhất nào cả Nhiều người chỉ nhìn vào nhánh từ chữ phoénicien ra chữ hy lạp, latin cho rằng chữ viết phát triển theo hướng từ ghi hình sang ghi âm
Nếu chiếu theo quy luật này thì ngày nay chữ hán, chữ nsibidi và các hệ chữ có chứa tự vị ghi hình-ngữ đã không còn tồn tại vì cả thế giới đã dùng chung một hệ API hết cả rồi
Quá trình bi ến đổi của chữ hình nêm qua các hệ chữ khác nhau của các dân tộc vùng Tây Á- Bắc Phi
Nhiều người lại cho rằng các quốc gia không bỏ được chữ hán vì ngôn ngữ của họ có không đủ
âm vị để phân biệt từ ngữ, như tiếng Hoa, tiếng Nhật bây giờ Còn ngôn ngữ nào có ngữ âm tương đối phức tạp, như tiếng Việt hiện nay, thì chuyển sang dùng chữ thuần ghi âm là hợp lý Quan điểm này còn nhiều điểm cần suy xét lại Thứ nhất, không phải cứ âm vị đủ nhiều là người
ta sẽ chuyển sang dùng chữ ghi âm Cách phát âm các từ hán việt trong tiếng Việt đương đại chính là phỏng theo cách phát âm của tiếng Hán đời Đường, mà ngữ âm của tiếng Hán cổ này
phức tạp hơn gấp nhiều lần các tiếng thuộc họ Tày-Thái hay Môn-Khmer ngày nay Thế nhưng
hệ chữ hán từ đó đến nay vẫn giữ nguyên các chữ tượng hình, hội ý, chỉ sự Hẳn là không phải người thời đó không biết đến loại chữ thuần ghi âm khi họ có một lô những chữ giả tá và một
hệ thống phiên-thiết (phiên âm) hoàn chỉnh dùng trong từ điển Ngày nay các dân tộc thuộc nhóm Bách Việt cũng vẫn không gặp nhiều khó khæn khi dùng chữ hán để viết ngôn ngữ của họ, trong khi các tiếng Quảng Đông, Phúc Kiến, Khách Gia của họ đều có số lượng âm vị ngang
ngửa tiếng Việt, có tiếng cả 7-8 thanh điệu Thứ hai, không phải cứ ít âm vị là không bỏ được
chữ hán Trên lý thuyết nếu væn bản tái tạo lại lời nói không thể đoược hiểu thông thì ngôn ngữ
đó cũng không thể thông hiểu qua giao tiếp bằng lời nói Tiểu thuyết Genji monogatari và hàng
loạt sáng tác væn chương của nữ giới Nhật Bản thời kì đó đều được viết gần như hoàn toàn chỉ
Trang 31bằng hiragana, và người Nhật vẫn không gặp khó khæn gì trong việc đọc hiểu chúng Tiếng Triều Tiên-Hàn Quốc vốn có ngữ âm gần giống tiếng Nhật, cũng ít âm vị như vậy, nhưng các quốc gia này vì nhiều lý do đã bỏ luôn được chữ hán trong giao tiếp ở nhiều lĩnh vực cho tới giờ này
Mà vậy thì, một hệ chữ kiểu an-pha-bê đâu phải là cứu cánh của tất cả mọi ngôn ngữ !
Một trang kana chép tay Truyện kể Genji từ hậu kz Heian, thế kỷ thứ 12
IV Khía cạnh xã hội của chữ viết
1 Đọc, viết, phát âm
Vi ết là quá trình dùng một hệ chữ để ghi lại lời nói hoặc { nghĩa Cách hiểu khác là quá trình mã
hoá các dạng thông tin trên bằng một chuỗi kí hiệu hình ảnh Sản phẩm của hoạt động này là
một væn bản chứa thông tin đã được mã hoá Để làm được việc này, người viết phải biết được hình dáng và giá trị của ít nhất là các tự vị cơ bản trong hệ chữ mà người đó đang dùng và kết
hợp chúng để tạo ra những chỉnh hợp tự nhiên mang đúng những giá trị mà người đó muốn ghi
Đọc là quá trình giải mã væn bản nhằm khôi phục lại toàn bộ thông tin hoặc phần thông tin ngôn
ngữ-{ nghĩa của væn bản về trạng thái ban đầu trước khi nó được mã hoá Quá trình này diễn ra trong trí óc người đọc Để làm được việc này, tối thiểu người đọc phải biết trước tiên là ngôn
ngữ mà væn bản đó ghi, kế đó là giá trị của các tự vị cơ bản mà còn các khả næng kết hợp của chúng, nghĩa là tất cả các chỉnh hợp có thể được tạo thành và giá trị của chúng Một tự vị hay
chỉnh hợp có thể có nhiều giá trị, mà người viết chỉ cần biết tới cái giá trị mà họ cần để viết, còn người đọc phải tự tìm ra đúng cái giá trị đó từ rất nhiều khả næng Vì vậy đọc khó hơn viết rất
Trang 32nhiều, nếu không có sự can thiệp của chính tả Cần lưu { rằng ở cách định nghĩa này, đọc không đồng ngĩa với phát âm Người ta có thể đọc được mà không phát âm được
Phát âm là quá trình chuyển thông tin trong væn bản thành lời nói Không giống như đọc, phát
âm không đòi hỏi việc giải mã toàn bộ thông tin trong væn bản mà chỉ phần thông tin âm thanh,
tức là lời nói được ghi trong væn bản Nghĩa là khi phát âm, người ta không cần hiểu hết nội dung væn bản Và trong khi việc đọc có thể thực hiện ở bất cứ ngôn ngữ nào thì phát âm chỉ có
thể thực hiện khi væn bản sử dụng ngôn ngữ có lời nói Phát âm được không có nghĩa là đọc được Nhiều người đồng nhất hoặc nhầm lẫn hai quá trình này, dẫn đến nhiều cách hiểu khác nhau của hiện tượng mù chữ-biết chữ
Biết chữ, theo cách hiểu thông thường, là khả næng một người có thể đọc (và viết, vì đọc đòi hỏi
nhiều kĩ næng hơn viết nên nếu đọc được là viết được) các væn bản được viết bằng một trong
những hệ chữ được dùng để ghi ngôn ngữ mà người đó đang sử dụng (thường đó là hệ chữ chính thức được nhà nước công nhận và áp dụng) Ngược lại, mù chữ là việc một người không
thể đọc được væn bản viết bằng hệ chữ đó Ngày nay, định nghĩa mở rộng của sự biết chữ còn liên quan tới bối cảnh sử dụng các công cụ tạo lập và trao đổi chữ viết
2 Có hay không việc một hệ chữ “khó học” hơn hệ chữ khác?
Có một định kiến đến từ thế giới phương tây cho rằng chữ hán “khó học” hơn chữ latin nói riêng và các hệ chữ thuộc loại ghi âm vị nói chung Đây thực sự chỉ là một nhận định cảm tính
mà không có cæn cứ khoa học nào, vì đối với họ, không chỉ chữ hán mà bất kì hệ chữ nào khác ngoài latin cũng ”khó học”!
Trước khi nói tới chuyện khó dễ, xin nhắc lại một tiên đề: như đã nói ở trên, các hệ chữ được
xếp vào loại ghi âm hay ghi { đều là dựa trên cách nó hoạt động khi nó.không hoạt động Trên
thực tế, đối với từng ngôn ngữ, thậm chí từng trường hợp cụ thể, một hệ chữ có thể ghi 1 hoặc
2 trong 3 đối tượng hình ảnh, ngôn ngữ và âm thanh Đa số các bộ chữ (hệ chữ khi áp dụng ghi
một ngôn ngữ) hiện nay đều ghi đồng thời ngôn ngữ và âm thanh, trong đó nhiều bộ chữ thuộc
hệ latin và chữ hán cũng có đa số trường hợp chữ ghi hai đối tượng này Điểm khác nhau duy
nhất là tự vị mang giá trị { nghĩa của chữ hán luôn giữ nguyên giá trị đó còn chữ latin thì không Như trong chữ <海>, tự vị <氵> luôn đại diện cho trường nghĩa liên quan tới trù nước-chất lỏng ,
dù trong chữ <漂> hay chữ <浪>, còn trong chữ <sea> (tiếng Anh), tự vị <a> chỉ mang giá trị ngữ
vị “biển” trong trường hợp này mà không phải trong <tea> hay <ate> Như vậy, nếu nói chữ hán khó học là do hệ đó toàn là chữ tượng hình là chưa chính xác
Kể cả khi xếp chữ hán vào loại “ghi hình” và chữ latin vào loại “ghi âm” cũng không thể kết luận
hệ này khó học hơn hệ kia Trong trường hợp này không những đối tượng ghi khác nhau mà cơ
Trang 33chế ghi thông tin của mỗi hệ cũng khác nhau Một bên gán hình ảnh (A) cho hình ảnh (A’) còn
một bên gán âm thanh (a) cho hình ảnh (A) Khó dễ ở đây sẽ là tuz vào thói quen tư duy của
mỗi người Có người sẽ thấy việc ghi nhớ giá trị của hình ảnh (A’) dễ hơn vì nó có liên hệ về hình ảnh với (A), trong khi giá trị âm thanh (a) của hình ảnh (A) sẽ khó nhớ hơn vì mối liên hệ giữa (a)
và (A) là hoàn toàn võ đoán, và ngược lại Mọi chuyện sẽ càng thêm rối rắm khi cả hai hệ chữ còn ghi thêm một đối tượng nữa là ngôn ngữ: việc một hình ảnh (N’) luôn mang một giá trị ngôn ngữ cố định là (N) so với việc (N’) có vô số giá trị (n) tuz trường hợp là khó nhớ hơn hay dễ
nhớ hơn? Kết luận chữ này khó học hơn chữ kia mà chỉ dựa vào kinh nghiệm cá nhân như vậy là không khái quát và do đó nó mang tính định kiến
Tuy khó dễ là chuyện cảm tính nhưng mức độ phức tạp của hai hệ chữ là có thể so sánh Nhiều người nói chữ hán phức tạp hơn vì nó nhiều nét hơn, trong khi nếu lấy chữ latin ra đếm nét thì
họ lại nói rằng chữ latin không thể đếm nét vì nó có dạng viết tay Thực tế, như đã trình bày ở
phần phân loại chữ viết, tất cả các hệ chữ thuộc loại hình nét đều tồn tại các dạng chữ in, chữ
viết tay, chữ khắc Chữ hán cũng có dạng viết tay, ta quen gọi đó là hành thư và thảo thư Khi
viết tay thì số nét đúng là không thể đo đếm vì tuz vào khả næng “viết đẹp” của mỗi người, do
vậy việc lấy nét làm đơn vị so sánh mức độ phức tạp của hai hệ chữ là không thể Nhưng nếu so sánh số lượng tự vị trong một chữ thì có thể thấy ngay là, những chữ thông dụng trong một bộ
chữ thuộc hệ chữ hán thường chỉ gồm 2, 3 tự vị, nhiều nhất là 5, 6 tự vị, trong khi một chữ thông dụng trong một bộ chữ thuộc hệ chữ latin có thể phải kết hợp tận mười mấy chữ cái…
Một thước đo khác của mức độ phức tạp, theo nhiều người, là số lượng chữ cần phải nhớ Việc
cần làm trước tiên là thống nhất lại định nghĩa các đơn vị: tự vị < kí tự < chữ 1 kí tự = 1 hoặc nhiều tự vị Chữ hán thì 1 chữ = 1 kí tự còn chữ latin thì 1 chữ = nhiều kí tự Kế đó là giới hạn
phạm vi tính Nếu xét trên phạm vi tất cả các ngôn ngữ được ghi bằng hệ chữ đó trên thế giới thì số kí tự-chữ hán lên tới hơn 9 vạn còn số chữ latin thì vô số Nhưng để một người có thể đọc-viết một ngôn ngữ thì chỉ cần nhớ một số lượng chữ nhất định thường dùng nhất trong ngôn ngữ đó Như vậy nếu chỉ tính riêng một bộ chữ của một ngôn ngữ cụ thể, ví dụ tiếng Hoa
và tiếng Anh, thì số chỉnh hợp tự vị mà một người phải học, nhắm mắt cũng có thể đoán ra, sẽ