Muốn thong tin hố, cấn phục chế và chụp tha nhỏ mới tiên sử dụng Phụ bản 4: Giới thiệu hệ chương trình quản lí chứ Nơm Việt Nam Hệ thống gồm nhiều tệp chương trình viết bằng ngơn ngũ Pas
Trang 1ĐỀ TÀI KHOA HỌC CẤP NHÀ NƯỚC
GIẢI DOAN 1991 ~ 4995
BUOC DAU
UNG DUNG TIN HOC
DE BAG TON VA KHAI THAC
THU TICH CO VIET NAM
(TIN HOC HAN NOm)
- Bao cdo tom tat
> Tong quan vé ky thuat
- Các phụ bản
CHỦ NHIÊM ; NCV NGỘ PHỦ LONG
CO QUAN VIEN NGHIEN CUU HAN NOM
TRUNG TAM KHOA HOC XA LOL
VANIIAN VAN QUOC GIA
HÀ NỘI - 1994
Trang 2
Hà Nội ngày 1ã tháng 04 nam 1994
BAO CAO TOM TAT
TONG KET DE TAL TIN HOC BAN NOM (1992 - 1994)
Để tài "Tín học Hản Nôm" có tên gọi đẩy dủ là" Bước đẩu ứng dung
Tia hoc để bảo tổn khai thác di sản thư tịch cổ Việt Nam”Là một để tới
nghiên cứu khoa học độc lập cấp nhà nước được thành lập từ thúng ¿ nàn,
1992, kết thúc vào quý 2 năm 1994, do Viên Hân Nórp đăng cai củ trì, dưới Khoa học xã hội và Nhân văn Quốc gia Sau hai năm
ni dã hoàn thành nhiệm vụ để ra Nay tổ chú
+ những kết quả đã đat được, nêu mớt số kính
sự chủ quản của Trung tâm
tiển hành nghiên cứu, để t
nghiệm thu và báo cáo tổng k
nghiệm và kiến nghị vrình các cơ quan quản Wi cấp trên
+ Học tập cỗi biến phần mềm đánh chữ Hán cho người Việt
2 Xây dụng cơ sở bạn đầu cho Ngăn bàng đũ liu [an Nom,
4 - Vẽ chữ Nôm trong máy, đưa chữ Nôm tbam gia bằng mã chuẩn Quốc tế
4, Soạn thảo hỗn hợp chit Han Nom với chứ Quốc ngữ
Quét ánh sách Hiần Nôm dể lưu trừ
Phần II: Một số kinh nghiệm và kiến thức thu được về khua học công nghệ và về quản b
Phân IIE:Kết luận kiến nghị về hướng triển khai và nghiên cứu tiếp tục
CÁC PHỤ BẢN
Phụ bản 1: Biểu thị cách vẽ một chữ rượng hình trong may Unb
Phụ bản 2; Phiếu mô tả một tấm bia để quản lí
Phụ bản 3: Thể hiện việc dùng công nghệ mới để phục chế một vẫn bia cỉ
Phụ bản 4: Giới thiệu hệ chương tình quản lí chữ Nôm Việt Nam
Thụ bản 5: Bảng chứ Nôm chuẩn Việt Nam được Quốc tế cũng nhánCTCVN- 3773
(Nop riêng như hổ sơ kĩ thuật kèm Bao cáo "Tổng hợp)
Phụ bản 6: Báo cáo {dụ kiến] về nhiệm vụ xảy dựng bóng chữ Nôm điện tử
Phụ bản 7: Mã hoá và thể hiện chứ Nôm trên máy tỉnh
(xem chương 11 Báo cáo Tổng hợp), Phụ bản 8: Yêu cầu đối với các ch/mình phẩn mềm sẽ viết trong nam 1993
Phụ bản 9Quyết định š3-CPcủa Chính phủ về chữ viết các đân tộc thiểu số
Pbụ bản 16: Bước đầu xây dựng Nuun hang do feu Han Nom
( xem chương ìIT Báo cáo Téng hyp)
Phụ: bản tl: Ban in thd một từ điều của Từ Điển Hán Việt dưới Winduee : Phụ bản 12: Bản ín 1 trang sách Hán Nom gốc quết lưu bằng Scanner
Trang 3
CHÚ THÍCH SƠ LƯỢC CAC PHU BẢN
phụ bản J: Biểu thị cách vẽ một chữ lượng hình trong máy tỉnh
(Trước khi vẽ trên máy, cần tạo đáng bằng thủ công trên giấy Kẻ
ô, để người thao tác theo đủ, xám chữ trên ma trận điểm Ma
trấn này do nhóm để tài viết chương trình tạo ro)
Phụ bản 2: Phiếu mô tả một tấm bia để quản lí
(Sơ đổ mô tả lược thuật thông tin theo đụ kiến của chương trình hợp tác khoa học giữa Việt Nam Trung Quốc và Pháp)
Phụ bản 3: Thể hiện việc dùng công nghệ mới để phục chế một văn bia cổ
(Khuôn khổ các tim bia thường to cao, chữ bị mờ, Kho doe Muốn thong tin hoá, cấn phục chế và chụp tha nhỏ mới tiên sử dụng) Phụ bản 4: Giới thiệu hệ chương trình quản lí chứ Nôm Việt Nam
(Hệ thống gồm nhiều tệp chương trình viết bằng ngôn ngũ Pascal va FoxPro
để quản ti, về thêm, nhập chứ, tra cứu và soạn thảo chử Nôm)
Phụ bản 5: Bang chit Nom chuẩn Việt Nam dược Quốc tế công nhận (TCVN
( Bảng này gồm hơn 2000 chứ Nôm của dân tộc Kinh đưa 74 xót đợt 1 Sau đây Việt Nam cũng như các nuớc khắc sẽ sưu tấm và bổ sung thêm),
5773)
Phụ bản 6: Báo cáo {du kiến) về nhiệm vụ xáy dựng, băng chữ Nôm điện tử
( Đây lí báo cáo dự kiến của nhóm để tài Hình bay tude Tiểu
ban Mã Chuẩn Quốc Gia, và gửi tới các nhà Khoa học và công
nghệ trong và ngoài nước để xin ý kiến), vào cuồi bổ: 1992.dau năm 1993 )„
Thụ bắn 7: Mã hoá và thể hiện chủ Nôm trên máy tỉnh
(Dây lì báo cáo thục tế khảo sắt thử nghiệm và triển khai vẻ chủ Nom bing công nghệ của Việt Nam để tham giá bảng mã chuẩn quốc
tế, và đã dược quốc tế chấp nhận)(Xem chương 1Í Báo cáo Tổng hop}
Phụ bản 8: Yếu cấu đối với các chitrinn phan mém sé viet trong năm 1993
(Đây lò thông báo nội bộ của nhóm để tài có tính chất gọi š và đất hồng cho các nhà lạp tinh Vier Nam gải quyết Kết god co thé ca sai lệch một chú so với dự kiến này, nhưng cuối cùng các chương tình đếu chạy tốt có môi số điểm vượt mức, và các
thuật giải có nhiều sáng {a0 so với du kiến)
Phụ bản #:Quyết định 53-CPcủa Chính phủ về chứ viết các dân tộc thiểu Số,
Hội đồng Chính phủ giao nhiệm vụ cho Uỹ Bạn Khoa học xã hội Bỏ Giáo dục, Bộ Văn hoá, phối hợp với Uỷ Ban Nhân dân các địu phương
trong việc giữ gìn và phát triển văn hoá chữ viết của các đân
tộc thiểu sé
Phụ bản 10; Báo cáo về bước đầu xây dưng Ngắn hàng dữ liệu Hán Nôm,
(O day chỉ nếu một số vấn để chưng, không trình bẩy kĩ thuật của
hé FoxPro, vi đã có nhiều tài liều giới thiếu vể hệ này)
Phụ bản 1L: Bản in thủ một từ điểu của Từ Diễn Hân Viết dưới Windows,
( Hiện nay chưa có bộ chứ Nom cho Windows, mdi chỉ có chữ Lm và
chủ Việt nhàng ương hệ này, Viên Hán Nôm dã dùng dể soạn thảo
và in Từ điện song ngữ Hián Việt)
Phụ bản 13; Bản in ! trang sách Hán Nôm gốc quét lưu bằng, Scanner
( Chúng tô: thử quế: Seanner và lưu các trang tho "Nhat ki trong
từ" để in wan anh vé chit trong Windows)
Trang 4
"
NOI DUNG BAO CÁO
PHAN 1: KIEM DIEM CAC HANG MUC DE TAL
1) VIỆC CẢI BIÊN PHAN MEM DE DANH DUOC CHE HAN TREN
MAY TINH CUA VIET NAM ;
(công việc này chú yếu được tiến hành trong năm 1992/à năm mở đẩu của dẻ tài
- Khi mới thành lập để tài, Việt Nam còn bị cấm vận, các cơ sở in ẩn xuất bản trong nước cẩn có chứ Hán nhưng không nơi nào làm dược trên máy
Lúc đó muốn có chữ lần phải mua máy tính với giá khoảng 3000 USD một dẫn,
và bị phụ thuộc vào cấu tạo phẩn cứng chế tao sẵn của nước ngoài (giá máy
tính Trường Thành của Trung Quốc đem sang tiển lâm chào bàng tại hội chợ
ở Việt Nam cũng tương đương như vậy) Có những cuốn từ điển rất cần in chữ Han nhưng vì không có chứ để in, nên Nhà xuất hản phải bỏ chứ Hán, chỉ in
toàn phiên âm chứ Việt ( như cuốn Từ điển của Giáo sư Nguyễn Lân)
Để tài đã đi đầu trong việc học tập và cải tạo phần mềm để phục vụ soạn
thao in dn chit Han ở trong nước (Đến nay không những Viện Hán Nôm sử dụng
kết quả này, mà nhiều nơi khác cũng dã sử dụng kết quả đó.Bỏ chữ Hán "mềm
hoàn toàn' đã đánh được trên eác máy tính nhỏ của Việt Nam như AT-286, chú
không bất buộc phải đừng các đần máy to, đất tiên )
Vì việc tạo kí tự 2 byte là một việc khó chỉ có một sẽ rước nám được
kĩ thuật này, vì vậy họ giữ độc quyển không phổ biển các chương tình
nguồn cho nên mục tiêu mà để ti đãng kí sẽ đạt tối là cải biên phần mềm
xản có tạo bô soạn thảo đưới DỌS, để tụo diểu kiên cho chữ Han vào được nhiều hệ ứng dung của Viết Nam, và có thể truyển thông, giao tiếp, hoà
nhập được, chứ không phải chỉ dùng trong một hệ soạn thảo với một có chứ š định (đo qhà sẵn xuất cùng cấp Dễ tài cũng không chủ Đương táo ra
môi hệ mới hoàn toàn, mà chỉ có người Việt Nam sử dụng Yêu cẩu cải biên
một hệ do người khác đã làm và nắm giữ bí mật là một việc khó đối với nhà
lập trình Thêm nữa vì là bước đầu, nên để tài định hướng làm tư liệu thô
là chỉnh (việc lam dep chi Han, chứ Nôm là cẩn thiết nhung sẽ nh
sau vì ta chưa có các công cụ đủ mạnh ( Tốc độ xử lí của hẻ Windows-3.0
con cham, tính năng chưa ổn định )} nên để tài chỉ đám nghỉ mở rộng úng
dụng tối vài hệ trong môi trường DOS cũng đã cẩn cố gắng nhiều Dởi với
hệ thống máy MAC là một hệ mạnh, tuy rất tiên tiến, những giá còn đất gấp
yuổi máy IBM ở Việt Nam rất hiếm người dùng Nếu tụ làm ra sản phẩm chỉ
ding được trong hệ này thì chắc sẽ không có ai sử dung, và nếu dàn máy của
tt bị “trục trac" sé không có người "cứu ứng" cho Đó là những khó khan
do cẩm vận, cỗ lập về công nghè thông tin gây ra
Tuy vậy, với sự nỗ lực cao của các nhà lập trình, chẳng những các yêu
cầu phục vụ làm tư liêu thô đểu dạt được, mà hiện nay chúng tôi thấy việc
làm cho các vân bản cổ điển của tổ tiên được in ra càng ngày càng đẹp củng
Tất cẩn thiết, vì nó cũng góp phẩn tích cực trong việc in ẩn bảo tổn và làm
tăng giá trị các mật của văn hoá phẩm Việt Nam, do đó chúng tôi cử gắng
đầu tư thêm công sức, bất đầu tiến vào Windows lí một hệ thống mới, phúc
tạp hơn ( Phụ bản I1 là in thử 1 từ điều của Từ điển song ngữ Hảãn Việt dưới
Windows)
Định hướng như vậy, cho nén từ đấu chúng tôi đã tổ chức khảo sát: rộng
rải các hệ phẩn mềm ứng dụng sau đây để tìm cho ra cơ chế tổ chức chữ Hản
trong may tinh, và để cải biên mở rộng ứng dung nó chứ không chỉ bú hép
ứng dụng như qui định của nhà sản xuất : các hệ đã khảo sát nhúng thử chữ
Trang 5-4-
MSWORD, NOR TON,NE,PCTOOLFOXRASE, FORTRAN, VENTURA SIDEKICK,
cộng hơn 10 hệ , và đã chọn 2 hệ cơ bản tính nâng trội để phát tiển là
Eoxbase và PE2, Đó là 2 hệ phù hợp với định hướng xây dụng cơ sở dứ liệu
Nhờ khảo sát mà trình độ kí thuật của người làm việc có tiến hộ từ chỗ
chưa hiểu cơ chế hoạt động của chữ tượng bình trong máy tính, hoặc chỉ sử
dụng mốt cách thụ động, nay đã biểu được mot phan cơ chế ấy, và sau một
năm nghiền cứu đã cải tiến bộ công cụ, làm tăng tốc đÓ soạn thảo, tạo ro
cách đánh chứ Hán dé dang cho người Việt Nam (dùng tiếng me để để gọj chữ
Hán); ban đầu bộ chữ Hán chỉ dùng được trong loại tệp công vấn (text Íil€), chỉ đùng trang một hệ soạn thảo đo nhà sản xuất cung cấp là hệ CWI, chi in được ra máy in kim, với dạng chứ thô, chưa iø ra mấy ín laser với đạng chữ
mịn, dep được đến nay đã có thể đánh trong tệp cơ sử đử liệu {Data
file), dánh tong vùi hệ khác nhau, kể cả trong Turbo Pascal và Norton 18
những hệ rất phổ biến và để dùng nhất ở Việt Nam, đồng thời in được ra máy
ín Laser dưới môi trường DOS Đá là những cải tiến tích cực nhằm phố cập
hod ung dung Tin hoc trong nude, gop phần làm tăng về đẹp các văn hoá phẩm
cỗ điển của Việt Nam
Cuối năm 1992,hệ điều hành DOS-5.0 được phổ biến vào Việt Nam.chúng tôi
đã tiếp nhận nó, vận dụng các kí xảo nhằm nâng cấp chữ Hán, đưa vào DOS 5.0, va tim cách khai thác vùng nhớ dự trữ 384 KB tại mé trên của bộ nhớ quy ước, đồng thời nghiên cứu áp dụng các biện pháp khác về tối ưu hoá bệ
thống để khai thác các tài nguyễn hệ thống do, DOS 3.0 ma ra
“Theo tài liệu của hãng sản xuất phần mềm Ÿ-Thiên thì chứ Hán do họ củng cấp khô sử dụng trong các hệ DOS cao ( sau version 3) [tiết ].ï của rải liên hướng dẫn có nói rõ điểu này], thục tế các hệ DÓ§ 40 và 4.1 mà nhiều nơi thử nghiệm khí đưa chứ Hán vào thì may bj treo và mất con trỏ Vì muốn khai thác những mặt mạnh của DOS-5.0 nên nhóm nghiền cứu để tài đã tìm cách nhúng chữ Hán vào DOS 5.0 và đã thành công nhờ phương pháp thay đổi tếp cẩu hình mới Như vậy là ta đã có thể chủ động đưa chit Han đi iên thee kip bước tiến của hệ điều hành mới, không phải mua thêm phiền bản mới củu nhà
Sản Xuất:
Cuối năm 1992 cũng hình thành định bướng, xác định yêu cầu kĩ thuật của các hạng mục can bản mà để tài sẽ phải làm trong năm 1993 là vẽ chứ Nôm, xây dung Ngan shang đứ liệu, soạn thảo song ngử Hán Việt đưới DOS đồng thời mua sim trang bị thích hợp để làm việc (Lúc này máy AT-486 ö Việt Nam còn rất hiếm, giá mộc đàn, theo tạp chí Thông tin Tín học, tới 14.000 LJSD), vì vậy chúng tôi chưa thể có nhứng công cụ tốt để nghiên cứu thủ nghiệm
- Sản phẩm phần mềm cän bản của giai doạn này là tếp y
đủ" gồm 13.900 chứ Hán với các cách má hoá khác nhau, dùng eu chữ Hán trong máy theo phiên âm lainh Bác Kinh, theo ám Hán Việt “tƒ điển" này ín ra được hơn 300 trang
Trong 2 nam qua, ngày 1ừ lúc để tài tìm được cách sử dụng hộ chữ llâm.d
có nhiều cơ quan đơn vị yêu :cầu phổ biến cho họ sử dụng, để tài đá hưởng dẫn và đáp ứng kịp thờiCho đến nay hệ này đã được cải biến nhiều vũ sỉ
dụng ổn định tại Viên Hán Nom, di duge ding để huấn luyện trong "Nỗi bộ
ẩn phẩm của Viện như soạn thảo bổ sung phản chữ lián các hò
sách "Di sản Hán Nêm'(3 tập): " Tổng tập van học Việt Nanf(Háp) Các nhà khoa hằng Việt Nam”, "Bằng tra chứ Hán" trong giáo trình dạy Hán ngủ "Thụ văn Hội Tan Dàn" in Tạp chí Lián Nôm, Tap chí Thương mại Tap chí Cộng sản,
à soạn thảo một sử hợp đồng vận thư trao đổi kinh tế và văn hoá giữa Viết
Nam và Trung Quốc Đài Loán được nhiều nguũi ưa chuông,
Trang 6
giận:
(Phần hướng dẫn sử dụng rất giản dị, ngắn gon, chủ yếu là hướng đẫn trực
tiếp thao tác trên máy các hệ soạn thân đã cổ)
2) XÂY ĐỰNG CƠ SỞ BẠN DẦU CHO NGÂN HÀNG DỮ LIỆU HÁN NOM
- Mụe tiêu cuối cùng nhằm tới là dùng Tin học để quản lí khai thác toàn
điện kho tư liệu viết bang chữ cổ của Việt Nam
-Trong 2 năm qua, để tài đã cho nhập máy hơn 4.500 bản mô tả tóm tất nội dung các đơn vị sách Hán Nôm hiện có mật tại kho sách chính của cả nước
là Viện Hán Nom (số này bao gồm các tác phẩm chủ yếu phản ảnh lịch sử văn hoá Việt Nam đã được sưu tầm từ trước nâm 1945 cho tới nay), và 11.000 đơn
vị vàn khắc [an Nom (hiến vật là các bia đá, chuông đồng, biế ral
rác trên khấp nước, có nơi thì biện vật còn giữ được, có nơi thì hiện vật
dã bị tiêu huỳ trong thời gian vài chục nảm chiên tranh vừa qua, ở Viện Hán Nôm chỉ giữ được bản in ráp lại trên giấy mỏng ) Tổng số văn bản thư tịch cổ có trong kho là 3 vạn đơn 3
văn khắc là hơn 3 vạn đơn vị dự
tính số lượng chưa sưu tẩm cũng tương dương số có trong kho Như vậy vẻ số lượng tư liệu còn chưa đưa vào máy để quản l nhiều gấp 8 lần số đã đưa
à chưa tính đến yêu cẩu đi sâu lược thuật "vét cạn" thông tín trong hàng triệu trang văn bắn,
Như vậy công việc mà để tài làm mới đạt mức độ thủ nghiệm quản lí, muốn
m khai thưc hiện quản lí cẩn phải làm nhiều các việc chuẩn bị hổ sơ
trước khi nhập máy, và việc nhập tư liệu vào máy Việc triển khai cuản lí
cẩn có một dự án riêng kéo đài trong nhiều nằm
- Tóm lại: về lĩnh vực này, dẻ tài đã đạt được kết quả như dư kiến dé ra
vỀ số lượng các tư liệu nhập máy, với 8 yếu tổ thông tin cơ bản „ tạo thành Version 1.0 (phiến bản đấu tiên) cho Ngắn hàng di Wu Tin Nom con Việt Nam)
- Cấu trúc kho đữ liệu được tổ chúc theo "hẻ thống mở" cho phép hổ sung them nhiều đơn vị văn bản mới sưu tầm thêm (gọi là nổi đài theo chiều doc), đẳng thời cho phép tích luỹ thêm (chèn thém) những thông tin của don
vị vân bản cũ mới khai thác hoc phát hiện thêm Cách làm này thích hợp với đối tượng quản lí là kho sách Hán Nôm, và cũng là điểm khác với cách
quân lí một kho sách hiện đại (chẳng hạn một ban ghi mô tả thông tin vẻ một
tấm bia của Viên Hán Nöm, như dự kiến ở phụ bản 2 sẽ không chỉ gầm 8 yếu tố
như bản mô tả về một cuốn sách hiện đại mà có thể sẽ có đẩy đủ các
tên người, tên quan trọng của Việt Nam được ghi trong bia, có thể có
cả ảnh chụp tấm bia, và danh mục các tài liêu các bài nghiên cứu đã viết tấm bia đó Hiện nay, trình độ quản lí và lược thuật của Viện Hán Nôm mới làm được 8 yến tổ, thì để tài hãy quản ií tới đó, sau này, có điể kiện sẽ lược thuật Kí thêm),
- Về kĩ thuật : Đã viết được một số chương trình rự động hoá từng phần trong công việc nhập liệu, xuất liệu, hiếu đính, sửa chữa, đổi mã, trụ cửu
- Đây là Jgại cơ sở đữ liệu cổ trung bình ở nước tả, qua thủ nghiêm chúng tôi có rút ra được những kinh nghiệm và các thông số vận hành cúc hè chương trình quản trị dữ liêu
Trang 7-6-
- Hệ phần mềm chính mà chúng tôi chọn và sử dụng cho Ngân hàng này
là FoxPro 20 So với hệ ORACLE mà Thư viện Bác Kinh sử dụng (chủ yếu dùng
cho sách chữ Hán), thì FoxPro khong manh bang, Tuy vậy chúng tôi van chon
FoxPro vi những lễ sau đây ;
Thứ nhất, ORACLE là hệ quản trị dữ liệu mạnh có dùng mạng, nhưng hệ này vàn Việt Nam cham va cing đòi hỏi trang thiết bị đất tiền (trị giá cài
đặt toàn bộ để có thể khai thác được là 5 triệu USD, lại cẩn dùng máy Mini,
là vượt quá xa khả năng đầu tư của nước ta cho một cơ sở như Viện ôm), trong khi đó hệ FoxPro ré tién hơn, đang được dùng phổ biển ở Việt Nam, và đến nay chúng ta đã dưa được chữ Quốc ngữ và chứ Hán Nôm vào đó Sau đây sẽ chỉ cẩn tăng cường thiết bị thêm một chút (dùng máy AT-
486}, ta cúng có thể quản lí và khai thác tư liệu có hiệu qua, dat được mục
đích,
Thứ bai: Hé FoxPro cing đang được cải tiến, mạnh đẩn lén để tương hợp
với các hê khác Như vậy ta có thể yên tâm sử dụng hệ này, nếu sau này cỏ
điều kiên nối kho dữ Hệu với mạng Quốc gia, cẩn chuyển sang dùng ORACL
thì cũng không đến nỗi xa lạ lắm,
(Tỉnh năng manh trong việc quản lí của hệ FoxPro cũng da được dùng để
thiết kế hệ quản lí chữ Nôm, được giới thiệu ở Phụ bản 4 kèm theo đáy)
- Những giải thữặt và kĩ nâng mà để tài tích luỹ được về xảy dựn khai thác Ngân hàng đứ liệu Hán Nôm có thể đồng góp vào quỹ kiến thức giải thuật về xử lí kí tự Quốc ngữ của Việt Nam Bởi vì để tài không phải chỉ cẩn giải quyết đơn thuần các vấn dé của chữ Hán mà còn phải giải quyết những vấn dẻ của chữ Việt trong quan hệ huà nhập với chứ Hán khi sử dụng trong Ngan hang di lieu (van dé hod nhập chữ Hián và chứ Việt trong một hẻ soạn thảo sẽ dược để cập ở mục dưới)
( Quá trình xảy dựng Ngân hàng dữ liệu Hán Nôm được nêu trong Phụ bán 10)
3) VÉ CHỮ NÊM TRONG MAY , ĐƯA CHỮ NÔM THAM GỊ
BANG MA CHUAN QUOC TE
- Chứ Năm là một thìa khoá quan trọng dể mở ra khai thác kho đi sản
vấn hoá thành văn mấy nghìn năm của dân tộc ta, nó chiếm tới 1/3 số chữ trong kho chữ tượng bình Biết bao nhiêu tên người, tên đất trong Jịch sử van hoá Việt Nam - những tên đất cổ Việt Nam như iàng Duổi, kẻ Gốm, làng
Me, lang Bậu, cẩu Đơ xuất hiển thường xuyến trong thư tịch
nhưng hiện nay không một hệ phẩn mềm nhập ngoại nào có du chit Nom cho
ta dùng để khai thác kho sich Han Nom, vi vay ta phải có chữ Nóm để sử dụng
„ Vì vậy việc nước ta bỏ phiếu ủng hộ ISO với yêu cầu đưa chữ Nôm của Việt Nam tham gia bang ma chudn quốc tế có 2 ý nghĩa :
giới thiệu di sản văn hoá truyền thống của Viết Nam ra
thế giới (từ chỗ thế giới công nhận chữ viết cổ tiến tới công nhân di sản
văn hoá của Việt Nam sẽ là 1 bước tất yếu); Bảo đảm quyền tổn tại bình đăng
của chữ viết cổ Việt Nam với các thứ chứ viết khác cả văn hoá nhân
loại.Việc này càng cấp thiết vì chứ Nôm dang bị nhịp sống hiện dai day vin quên lãng, trong khi chúng ta đang cẩn phục hưng nến văn hoá truyền thủng giàu tính nhân đạo của Dân tộc
bý Nhụ cấu về truyển thing biện đại đòi hỏi xoá bỏ cấm vận thông tin
"trên thực tế", và Việt Nam cẩn được sử dụng những tiến hộ về công nghẻ xử
Íí các thứ chủ của các nước lắng giểng trong máy của mình
Nếu tham giá được vào bảng mã chuẩn Quốc tế thì nước tá có thể đạt
Trang 8endif
- Kết quả boạt động khua học của để tài về lĩnh vực này là :
a/ Đề tài đã hoàn thành việc vẽ chữ đợc 1 (đồ là một yêu sầu bất, buộc nếu muốn tham gia chuẩn quốc tế Thực hiện yêu cầu này của ISO dé
chứng minh nước ta có khả năng làm được chứ tượng hình; và chứng minh rang
kho chứ UNICODE chưa đủ chữ, nước tú có thể đóng góp bổ sung), và làm thủ tịc đăng kí tham gia hé chudn UNICODE và ISO ( Muốn được tham gia th:
bang chữ Nôm phải được công nhận là chuẩn của Quốc gia, mọi yếu cầu bắt
buộc thứ 2) Bảng chữ Nôm phần 1 đưa ra đã được Hội nghị Quốc tế của nhóm công tác làm mã chuẩn họp lần thú 2 tại Hà Nội từ 28/2/1994 đến 4/3/1994 chính thức chấp nhận
Đây là một thành công chung của giới khoa học Việt Nam (có đóng gúp củu anh chị em Việt kiểu yêu nước, có sự hợp tắc tích cực của các chuyến giả Tin học và Ngữ học Việt Nam ở trong và ngoài nước, của Chương trình Diên tử Tím học KC-01 Các chuyên gia mã thám các cần bỏ của Tổng cục Tiêu chuẩn
Đo lường và chất lượng đã làm việc khẩn trường nhiệt tình, dưới sự chỉ dạo sát sao, kịp thời của Bộ Khoa học Công nghệ và Môi trường, của Trưng Tâm KHXH và Nhân văn Quốc gia, chuẩn bị kỉ càng, phối hợp chật chế, tổ chúc tốt hội nghị IRG-2 tại Hà Nội nên đạt được kết quả trên)
b¿ Ngoài ra để tài tồn tạo được mot hệ phẩn mềm dùng để tiếp tục sưu
tầm , vẽ thêm chữ Nôm , soạn thảo và in chế bản chữ Nêm
Thông qua việc chúng ta lấn đầu tiền tham gia hợp tác xảy dung thành công một chuẩn khoa học công nghệ Quốc tế, tr có thể rút ra những
kinh nghiệm bổ ích cho việc tham gia các chuẩn Quốc tế tiếp theo, dể hiện
đại hoá công nghệ và kinh tế Việt Nam
Sản phẩm nghiên cứu của khâu công việc này gồm ;
1/- Danh mục hơn 2000 ehử Nôm chuẩn được Hội nghị gu
2/-Hệ quản lí chit Nam (suu tam,bd sung, tra cứu, soạn thản chứ N
Việt Nam), Đây là tiền thân của Từ diễn điện tử chữ Nôm Hẻ phẩn mềm này
nằm trong máy gồm nhiều chương trình, dung lượng khoảng 4 MB
Tài liệu giới thiệu hệ này là phụ bản số 4 đính kèm
3/-Trước đó, để tranh thủ ý kiến các nhà khoa học trong và ngoài nước, chúng tôi cũng đưa ra bản báo cáo "Xác định nhiêm vụ xây dụng bang chit Nom chuẩn dang điện tử", gửi tới các nhà khoa học, và sau đó thu dược 27 ý kiến đóng góp để sửa chữa bảng Nẽm chuẩn 1 của Việt Nam trước khi trình Nhà nước
công bộ làm bảng chuẩn chính thức để tham gia vào bảng mã chuẩn quốc tổ
{van ban này được ghí trong Phụ bản 6 đính kèm)
4/- Kết quả nghiên cứu đặc thù chứ Nôm trên máy tính duge néu trong
Phu ban 7
lưu ý nh
1- Nhờ sự công nhận của Quốc tế lâm cha tì có tư cách pháp nhân,(Quốc tẻ công nhận và giành chỗ đứng hợp pháp cho chữ Nôm của Việt Nam) còn viết thể hiện các chứ viết của mình dưới dạng điện tử như thể nào thì các quốc
gia phải tự làm Để bảo đâm làm trọn vẹn công tác bảo tổn di sẵn văn hoá
của dan toc, chang tôi kiến nghị Nhà nước giao cho một cơ quan khoa học tiếp lục sưu tẩm "cạn kiệt " các chứ Nôm, không những của dân tộc Kinh, mà
cả chứ cổ của các dân tộc anh em khá để bảo vệ, Căn làm thành một Từ điển
chữ Nôm dạng điện tử, phát hành rộng rãi phối hợp với việc sử dụng hồ mã chuẩn Quổe tế trong các ứng dung để nóng cao chất lương công tác giáo dục,
Trang 9
nghién cuusuac bin va gidl thiew van hi
giới (Hiên này hệ mã chuẩn ISO đang ứng đụng toàn diễn)
- Quyết định $3-CP của Chỉnh phủ về ebữ viết của các dân tóc thiểu số coi tiếng nói và chữ viết của các đân tộc là tứ sản và vốn quý của cic
dan we Việt Nam: Chính phủ rất quan tâm tối công tác bảo vẽ khai thác phát huy di sẵn văn hoá chữ viết của các dân tộ giao nhiệm vụ cho ngành
Khoa học Xã hội ngành Giáo dục và Văn hoá phối hợp với Uỷ Ban Nhân dan các tỉnh thực hiện việc này Nhưng các ngành hữu quan chưa có điều kiêu sử
dụng nang luc manh mé của Tin học để phục vụ nhiệm vụ đó Chúng tới nhĩ
ring trong bối cảnh hiện nay các ngành liên quan nên xúc tiến việc ứng
dụng Tin hoe trong việc bồi sinh và phát triển vấn hoá của các đân tộc,
trong đó chử viết của các dân tộc cẩn được chuẩn hoá sớm trong avy tinh
(Quyết định 53-CP được dính kèm ở Phụ bản số 9),
ó truyền thống của Việt Nam rủ thể
n hoàn thiện và sip được triển khai
4) TẠO MỘT HỆ SOẠN THẢO HON HỢP CHỮ HÁN,
CHU NOM VÀ CHỮ QUỐC NGỦ,
~ Nhụ cẩu về in ẩm xuất bản từ điểnnhu cấu lưu trử tư liệu
trong mấy cẩn thiết có mộ hệ soạn thảo như vậy Để tài đã đạt chủ dẻ này thành một hạng mục nghiên cứu Qua nghiên cứu thử nghiệm đã dĩ điển xác định được rắng : muốn dea chit Che Hain, cht Nom vào máy, phải dùng hé mã chấp dõi (l6 bit),còn chữ Việt thì có thể dùng hệ mã Ế bic Nhưng tiếng Viet phổ thông và chữ các dân tộc thiểu số Viết Nam dã latinh hoá lại dùng các vẫn ghép nguyễn án và phu âm liển nhau do vậy mộc sổ kỉ tự Viết đúng sác nhan để thành vấn sẽ tạo ra tình thể 2 mã 8 bử đứng sát nhau tạo thành
1 mã l6 bit, trùng hợp với 1 mã 16 bít của 1 chứ Hán hoặc l cha Nom gay ra hiện tượng “dính chủ ", còn gọi là "kì bình quái tự" (chử kì quái xin xem
đẹp,mịn, cẩn dược cải tiến thẻm để cho việc in dược đẹp hơn, và thẻm chứ
Chúng tôi đặc tên "Lâm thời " là có ý chờ đợi một hệ mã 2 byke hoàn chỉnh gôm cả chữ Viết, chứ Nôm của Việt Nam đã vào chuẩn quốc tế ISO cũng với các thứ chứ khác của thể giới, có thể dùng dust moi he điều hành, chi không riêng gì dưới DOS
s) vic Quér ANH SACH ITAN NOM DE LUU TRU
~ Mục tiêu chung là lưu trử nguyên dang cdc văn bản cổ làm tài liệu tham
khảo cho các công trình khoa học liên quan tới lich sử vân hoá và lịch sử dân tộc Việt Nam ( Văn bản gồm chứ viế, bản đồ và các hoạ tiết),
- Khi thành lap để tài thì giá cả, thiết bị và công nghệ lưu ảnh bằng đĩa quang của thế giới còn đất (giá mộc hộ thiết bị phí tư liệu lớn đĩa quang CD-ROM tới vai tram nghìn USD, riéng mot đầu đọc trị giá gần 4000 USD) nền chưa phổ đọng Để tài mạnh đạn đặt vấn để thứ nghiệm lưu ơủ trong dia ti (ed đụng lượng nhỏ) để sao này có điểu kiện sẽ triển khai ứng dung wen dia quang có sức chứa lớn Việc lưu tử toàn bộ kho di sản cổ
Trang 10
~9-
bảng phương tiện Túi học là mộc nhú cầu cấp bách để vừa bảo vệ, vừa khai
thắc dí sản vận hoá theo phương pháp hiến đại (tiên lợi hơn, rẻ tiễn han
so với phương pháp thủ công kết hợp dùng Microfilm cổ điển Hiện này mết
bộ thiết bị giú tư liệu vào đỉa quang giá khoảng 15000 USD, và mat dae doe
giá 700 USD)
- Kết quả thử nghiệm cho thấy:
1/ Có thể lưu trử các nguyên bản thư tịch cổ theo phương pháp quét Scanner nguyên dạng các trung sách gốc
3⁄ Có thể lấy ra đọc và in ñ dang (in nguyéu dang hoặc biến tận sửa chữa thêm), có như vậy mới đâm bảo tính chân xác khoa học của các tư liệu
mà Việt Nam công hố,
3/ Muốn tìm kiếm cẩn thành làp được mốt liên hệ giữa hệ thông tư liệu
lạnh cả một kho sách rộng 750 mét vuông chúng tả phải tốn phí hàng trăm
triệu dồng tiến điện, nếu thu kho sách äy vào vai tram dĩa quang thị diện
PHAN U: MOT SỐ KINH NGHIỆM VÀ NHÂN THỨC MỚI
1) Dây là bước đầu đội ngũ cần bộ khoa học kỹ thuật Việt Nam tiếp căn với
ngành cũng nghệ hiện dại, đang tiến triển với tốc đò rất nhanh tuy ta chưa
đt dược các đình cao, nhưng cũng đã có được những hiểu biết cơ sở để ứng dụng có hiệu quả trong công tác, giải quyết được một SỐ vấn để của nước i Chúng tôi thấy cẩn tiếp tục theo tỏi sát
ác thông
tin tới nhất và cẩn tăng cường học tàp đào tạo để kịp thời nắm lấy những
tiến bỏ của ngành khoa học công nghệ này và ứng dụng ngày cảng có hiệu quảphục vụ sự nghiệp xảy dựng kinh tế và văn hoá của Tổ quốc trong giui
đoạn hiện nay
( Bài báo " Công nghệ thông tín, một thách thức nghiệt ngâ các nước nghều" của P1S Nguyễn Trọng đã nói lên nhụ cầu cấp bách của nước ta phải vượt lên
VỀ mặt công nghệ thông tín - xin đính kèm ở cuối báo cáo),
2) Chúng ta đang đi sau nhiều nước phát triển vì vậy cần có chiến lược
thích hợp, để có thể "đi tất, dé tn cong site, (chang han khong har kiếm lợi trong việc chế lạo phần cứng và phần mềm cơ sở, mà nền đầu tư nhiểu vào
nghiên cứu ứng dụng để đạt hiểu quả cao; Cẩn cố gắng tham gia vào cúc chuẩn
quốc tế để trắnh việc đi vòng, tốn kém
3) Da số các ứng dung Tin học vó giá trị thường là các ứng dụng liên nganh (ngân hàng, tài chính, ý tế, bàng không, bưu điện, địa chấu.) các ngành kinh tế vàn hoá khoa học liên quan sẽ được thụ hưởng thành quả về năng suất và chất lượng cao do Tín học dem lại Vì vậy các ngành ấy cẩn củ chuẩn bị tạo điệu kiến và hợp tác chat ché
Trang 11
-
4) "Phan mém là yếu tổ quyết định" các nhà sản xuất máy tính và các hãng sản xuất phẩn mềm lớn của thế giới chỉ làm được những công cụ rất chung, muốn phát triển rộng khấp bọ phải dưa vào đội ngủ phản mém "địa phương,
Chính nhờ ứng dụng vào những lĩnh vực cu thể, mới nảy ra các nhụ cầu và
các cải tiến hữu ích (Việc sắp xếp chứ Việt là đậc thù riêng của Việt Nam,
hệ thống chữ cải Viet, cha Nom và các chứ dân tộc khác của Việt Nam như chữ Thái Tây, chứ Khơme Nam Bộ cũng là những yêu cầu cụ thể mà như cầu khoa bọc Việt Nam đạt ra để Tín học bố trợ giải quyết) Năng lực của Tin Rọc vốn có tiểm tầng những khá năng lớn , nhưng nếu ta không “đặt hàng xhúng yêu cấu thì các nhà ký thuật Tìn học cũng không chế rao, không khái thác tới khả năng ấy Dây cũng chính là nguyễn nhân dân tối chủ trường của để tài sử dụng 1 phẩn kinh phí để "kích thích" sw phat triển của Tin học trong nước chứ không hoàn toàn "nhập ngoại" hoặc thuẻ nước ngoài làm phẩu m
Nhìn chung, trong 2 nám, thời gian ngắn, phải tập trung sức giải quyết
© vấn đè cấp bách, công tắc đào tạo mót đối ngũ chuyên gia có trình độ chuyên sâu vẻ chủ để này để cung cấp cho nhụ cầu chung, chúng tôi mới làm được ít Mong rằng sắp tới đây, Nhà nước chú ÿ đu tư chủ đào tạo ‘Tin học nói chung, trong đó có chú ý tới tin hoc Tan Nom
dể thăm gia bộ mã thông nhất toàn cẩu, chứ chưa có hợp tác để làm ra các công trình hoặc sản phẩm ứng dung cụ thể phát huy tiểm nang của Khoa hoe
xả hội và nhân văn
Chúng tôi cũng đã tiếp xúc và trao đổi sơ bộ với các giám đốc kỳ thuật
của vác thư viện sau:
Thư viện Quốc gia Uc:
Thư viên Quốc hội Mỹ
"Thư viện Viễn đông bác cổ Pháp
Thư viện trường Đại học Cornell My
Liên hiệp thư viên đại bọc Bắc Mỹ và Canada
Trang 12
`
PHẦN HI- KẾT LUẬN VÀ KIÊN NGHỊ :
{ Căn cứ trên những sản phẩm cụ thể và những kết qủa nghiên cứu đã dat dược, chúng tôi xin nẻu những kết luận và kiến nghị cụ thể như sau)
1 - Dây là lấn đầu tiên chúng ta chế tạo dược bộ chứ Nôm điện tử, đưa việc quản lý tư liệu Hán Nôm theo kịp trình độ của thể giới (sử dụng phương
tiện Tin học hiện đại, tử đây mở ra triển vọng mới vẻ trao đổi thong tin
van bản lần Nêm giữa nước ta với các quốc gia dùng chứ tượng hình trong khu vực, vù với thế giới( tử nay nói tới Ì hệ phẩn mềm xử lí chữ Nom là
có hàng vạn chữ Hán trong đó)
2 - Ban phím chứ Nôm đã giúp cho công việc soạn thảo văn ban [fin Nom
tiến kịp trình độ quốc tế vẻ soạn thảo bằng máy tính, kế thừa được những thành qua nghiên cứu của trong nước, bảo đảm tính sử dụng đế dàng phù hợp
với thôi quen của người Việt Nam, góp phần thúc đấy nhanh quá trình phổ cấp
đào tạo và ứng dụng Tin hye trang nud
3 - "Tự điển điện tử Han Nam" là một công cụ tốt dùng để tra cứu, nghiên cứu các tài liệu Hến Nôm Đến nay, các nhà nghiên cứu đã có trung tay một cuốn tự điển dễ đàng tra cứu, có nhiều công nâng độc đáo hơn hản
sở với tự điển bằng giấy muốc đ
biển nó thành một công cụ tra cúu sinh động, phục vụ các chương trình địch
nói Mặc đẩu là mot sản phẩm trọn vẹn của để tài, song do đặc thù của
công tác nghiên cứu sưu tẩm đồi hỏi những người làm tự điển vẫn đành cho các nhà sưu tắm nghiên cứu có điều kiện bổ sung cấp nhật những kiến thức mới, khám phá mới vào tự điển đó một cách để dàng
4 ~ Với bộ font chữ Nôm điện tử, để ti đã gây được một tiếng v
trên trường quốc tế : Lần đấu tiên thế giới biết được chúng ta hoàn toàn
có khả năng thông tin hoá kho đi sản van hod viết bằng chữ tượng hình của Việt Nam, một bộ phận kho tàng văn húá của nhân loại còn chưa được khai thác và giới thiệu rộng rãi,
Việc tổ chức chuẩn hoá quốc tế ISO công nhận bảng chit Nom 1 trong hồi
nghị IRG-2 tháng 3/1994 tại Hà Nội là một sự xác nhận thành công của để
tìi không chỉ ở phạm ví trong nước mà côn ở phạm vị quốc tế và khu vực
Sự cổ gắng này của để từ đã tạo được cơ sở kỹ thuật để kịp thời đưa
di sản chữ viết cổ của đân tộc vào kho tăng trí thúc của nhân loại, giành
chỗ đứng cho cha Nom ngang hàng với các hệ chữ viết của các nến văn mình
khác Kể từ nay, wong thoi dai phat triển của Tin học và truyền thông,
thế giới càng có diéu kiện tìm hiểu những giá trị tỉnh thần cao quý của dân tộc Việt Nam qua kho di sản ván hoá chứ viết cổ được thông tin hoá
Mặt khác Việt Nam được hưởng những tiến bộ kỹ thuật và, có quyển, có khả
năng thực tế để khai thác nguẩn thông tin trì thức to lớn mà nhân loại
tíh lu dưới dang cdc chứ viết tương hình (việc học tập tm hiểu vác nước lắng giếng đang là một yêu cẩu cấp bách đổi với dân tộc ta trong thời
kỳ mỏ cửa để xảy dựng và phát triển hiên nay, dé thi Tin hoe Han Nom ra doi
dp ứng tích cực nhủ cẩu này)
Trang 13
= Bs
Giải quyết thành công những vấn để kỹ thuật cơ bản như mã hoá, chuẩn
hoá, thể hiện cbứ viết trong máy là đã xoá bỏ trên thực tế những sự ngắn
cách vẻ truyền thông giửa nước ta với thế giới
§- Bộ khung Ngân hàng dứ liệu Hán Nôm với các tư tiêu ban đầu nhập vào, tạo nên Version 1.0 cia Ngân hàng, là một sản phẩm ?ìn học , lầu đầu
tiên được dùng để quản lý kho từng di sản thư tịch cổ Việt Nam.Tuy chưa
nhập máy đẩy đủ những dử liệu Hán Nôm hiện có ,nhưng bộ khung cũng đã báo quát được một bộ phận nòng cốt của kho di sản, đó là số sách côn bản của kho sách sưu tẩm được từ trước năm 194ã tới nay, và phần lớn các văn
ba rải rác trên mọi miển đất nước Tu đây ,các nhà khoa bọc cỏ thể bổ
sung.di sâunâng cao và khai thác kho di sản này bằng các nhường tiên
hiện đại
Các giải thuật, cách tổ chức đữ liệu để có thể xử lí tự động hod trong
việc quản lí một Ngân hàng dữ liệu Hán Nôm mà để tài xây dựng cũng được
vận dụng để quản lí Tự đến chứ Hản,tự điển chữ Nôm đạng điện tử
Các chương trình tiện ích khác như sắp xếp, đổi mã, biên tập hiệu đính
n bản chữ Việt là những chương trình tối, có ý nghiấ tăng năng suất lao động đáng kể, đồng góp vào kho kinh nghiệm xử lí chứ Việt
6- Hệ soạn thảo song ngữ Hần.Nôm/Việt là một sản phẩm có tính sáng tạo (lấy tiếng mẹ đẻ, tiếng Việt hiện đại lầm hệ quy chiếu số môi để xứ lí
chữ Hán chử Nôm) Đây là hệ soạn thâo đẩo tiên ở Việt Nam do để tải tạo 7ú,
có đặc điểm là một hệ "mềm hoàn toàn" ( không phu thuộc vào phần cứng cửa
nước ngoài), vừa đảm bảo hiển thị song ngữ trên màn hình, vừa dưa rủ máy
in kim vA may in laser lam chế bản được, vừa đánh dược trong các tếp văn bản (text file), vừa đánh được trong các tệp cơ sở dữ liệu (đãta file), Về bàn phim soạn thảo, nó kế thừa được cách gõ relex truyền thống dể soạn chữ
Việt, đồng thời cũng dùng cách gỗ telex để gọi chữ lián Nôm Cách sử dụng
không phúc tạp, đo vậy có súc phổ cập cao Việc nhúng chứ Việt với chủ Han chủ Nôm nhằm tạo công cụ phục vụ mục tiêu “kuỷnh hoá" kho dĩ sản |
Nếu được cải tiến nâng cao thêm, có thể dùng để soạn thảo các từ điển
có 7 thứ chữ khác nhau là : Trung Quốc, Nhật, Quốc ngữ, Anh, Pháp, Latinh
Bắc Kính, chú âm quốc tế), và có thể làm thêm TrueType font, sti dung wong
Windows để in chế bản với các kiểu chứ ngày cảng đẹp hơn
7-Hệ quản trị dứ liệu ảnh chụp sách Hán Nôm được xây dụng trén ngôn
ng Foxpro trong Windows là một bước nghiền cứu thử nghiệm thành côn
mỏ ra khả năng lưu trứ toàn bộ kho di sản với ảnh chụp nguyên đạng bản gốt của nó Nếu thục hiện được việc này chúng ta có phần yên tâm trong công tác bảo về di sản, vì khả năng chụp nguyên bản vào đĩa quang là nằm trong tim tay, Những vấn để đạt ra là: liệu có thể lấy ra nhanh và giữ được nguyên dạng để bảo đảm tính chán thực của các "chứng từ gốc" ấy hay không? Việc dọc bản chụp và bản in trên máy có thé thay cho tiếp xúc với hán gốc được không, đổi với các ban to như tấm bia thì xử lý ra sao ve Van
để đó đã bước đầu được trả lời qua thực nghiệm
Từ lâu Nhà nước đã quan tâm và có đầu tư cho việc sưu Tổm bảo vệ kho di sản vân hoá quý giá của đân tốc ta, và chú trọng tới các nhiệm vụ nhân hẳn
để bảo tổn (để phòng bất trấc xảy ra), và khai thác nội dụng thư tịch
(Latinh hoá toàn bộ kho đi sản ) với thời gian có gắng một vài thập kỷ
Tuy nhiên thời gian đã trôi qua, mà công viếc có dường như không
Trang 14-13-
điểm được Ngày nay với nhúng phương tiên mạnh, chúng ta có thể nghĩ tới
hoàn thành trọn vẹn công việc sưu tẩm quản lý nội dung kho dị sản quý gií trong khoảng 5-10 năm tới, nếu có trang bị đủ mạnh ( trước hết có thẻ sưu tẩm và nhân lên thành nhiều bản lưu trong CD-ROM, dé ở nhiều nơi để phòng
mất mát và để cho nhiều người, nhiều ngành có thể cùng khai thác Việc này
có thể làm được sớm Còn việc latinh boá toàn điện sẽ làm dan dan, va sé
thuận lợi hơn nhở khâu sưu được Tin học hoá, và các công
cụ phục vụ sau này cũng sẽ tốt bơn) (chẳng hạn : các nhà nghiên cứu khoa học có thể ngồi ở nhà đọc được toàn bộ kho sách khi nó đã nhập vàu mấy
và nổi với mạng thông tin quốc gia Như vậy hiệu quả khai thác sẽ cao hơn)
tốc độ nhanh, nhưng họ cũng bắt kịp những tiến bộ ấy, và đem kết quả phục
vụ cho phu cẩu phát triển của đất nuớc Năng lực và nhiệt tình của họ là không thể phủ nhận, chỉ cẩn có sự quan tâm thiết thực, sự Kinh dao và tổ chức đúng đán của Dảng và Nhà nuốc, sẽ tạo điều kiện tốt để họ tự đem những
tiểm năng chất xám phục vụ cho sự nghiệp đổi mới củu Đất nước do Pang lãnh
9- Mật khác, để tài cũng là nơi thử sứclà một " mảnh đất dụng vô", và
là ngọn cò tập hợp những cán bộ có núng lực và nhiệt tình cống hiến Thông qua công việc, đã làm cho họ nhận thức sâu thêm về ÿ nghĩa, giá trị lớn mũi
‘Tin hoe ¢d thé đem lại cho khoa học và công nghệ của đất nước : ngoài những
vấn để của thế giới kĩ thuật và kinh đoanh, còn có những việc cẩn làn để
phục vụ cho sự nghiệp phục hưng nền văn hoá của Dân tộc, do vậy Dể tài đã
được nhiều người làm khoa bọc xã hội cũng như khoa học công nghệ quan Lâm
‘Tiém năng Tin bục trong nước được kích thích nhữ hoạt động trao đổi,
khoa hoc va "đất hãng", yêu cẩu làm việc cụ thể,
Nhìn chưng tốc độ chuyển giao công nghệ là nhanh: khoảng thời gian từ
khi nghiên cứu tới khí đem kết quả ứng dụng vào thực tiễn công việc, rất
10 - Dây là Bảng tiêu chuẩn số 0] của Việt Nam được ISO chấp nhân,
tức là một sản phẩm khoa học đầu tiến của Việt Nam dạt tiêu chuẩn quốc tế
-S§ư kiện này cho phép các nhà quản lý khoa học công nghệ rút ra những kinh
nghiêm khi tổ chức xây dụng tiếu chuẩn khác tham gia với quốc tế, đẻ
hơà nhập, và nắng cao, hiện dại hoá nén kinh tế kỹ thuật nước nhà Trong việc xảy dựng chuẩn này, để tài đã có đóng góp tốt vẻ mất kỹ thuật
1] - Thành công này là một ví dụ về sự hợp tác của các lớp cán bộ
(mà và trẻ, am hiểu chữ viết cổ đại và Tìn học hiện đai), của các nhà
khoa học người Việt ở trong và ngoài nude, vi có sự chỉ đạu sát sao của các cơ quan quản lí và chức nãng nhà nước suốt quá trình từ khi thành lập
triển khai để tài,
12 -Sự ủng hộ của các ngành liên quan như quốc phòng, nội vụ, văn huá củng có tác dụng tích cực tới Hội nghị quốc tế IRO, Em cho ban hè thế giới hiểu ta hơn, đó là kết quả khách quan mà để tài có góp phan dem lai cho uy tín quốc giá
Trang 15
- 14-
KIẾN NGHỊ
Trong tình hình tiến bộ nhanh chống của công nghề thông tín, cần có dài
ngũ đồng đảo cán bộ chuyên gia đủ trđnh độ bất kịp những tiến bộ db, để
khai thác có hiệu quả mọi nguồn thong tin tri thức của thế giới nhàm xây dựng đất nước hiện đại Trên cơ sở những kết quả đã dạt được, và căn cứ vào những công việc cẩn tiếp tục hoàn chỉnh , chúng tôi dễ nghị với Trung tâm Khoa bọc Xã hội và Nhân Văn Quốc gia kiến nghị với Nhà Nước và cúc cũ quan pire quan:
1/-Để nghị Nhà nước, Bộ Khoa học Công nghệ và Môi trường có biện pháp khuyến khích ứng đụng ngay những kết quả của để tài vào việc suu tẩm, bin
vệ và khai thác thư tịch cổ, tiếp tục cải tiến hoàn thiện nâng cao chất
3/-Giao cho Viên lIán Nôm tở chúc nghiên cứu mã hoá chữ viết cổ của các dân tộc ở Việt Nam trang may tính, kịp thời đảng kí vào bảng mã chuẩn của thế giới, nhằm bảo vệ dĩ săn văn hoá quý báu của các dân tộc ở Việt Nam
Trang 16BE TAI TIN HOC HAN NOM - BAO CAO TONG KET TONG QUAN VE KY THUAT
(Bảo cáo này nẽu mạc tiêu chung, yêu cẩu chung,va một số giải pháp
đã vận đựng trong quá trình tiến hành nghiên cứu 1992-1994 ]
Xuất phát tờ hại MỤC TIE! lâu dài:
1) Ding tin hoc để bảo tổn quản lý và khai thác thư tịch cd (Han nom):
latinh hố kho sách Hán Nơm của Việt Nam
2) Tiến lên chia xế nguồn thơng tín của thế giới đặc biệt
ghi bằng chữ tượng hình
) Để tài đã để ra những VU] CÀ cơ bản nhụ sau, căn cứ vào
mục tiêu để ratrong hồn cảnh, mơi trường xã hội Việt nam đang địi hơi
xố bỏ sự cơ lặp, cảm vận, vươn ra hồ nhập với thế giới
; {để đáp ứng cả 2 mục tiều) cẩn cĩ hị ếu biết về cư chế xử lý chữ
tượng hình trong máy tính Cĩ hi cơ chế ấy mới cĩ thể thừa hưởng được kết quả nghiên cứư»của bên ngồi, chủ động cải tạo phần mềm theo yêu edu của mình và dùng nĩ để khai thác thơng tịn Nếu khơng hiểu rõ, hoặc chỉ biết sử dụng thụ dộng, thì tuy cũng cĩ thể soạn thâu được văn bản và
in ra, nhưng khơng thể cải tạo được Vì yêu cầu này nên để tài phải khảo sái các hệ phẩn mềm ng dụng và các hệ điều ban , cùng cơ chế xử lý chú tượng hình 2 byte trong các hệ đĩ
Muốn chía sẽ khai thác nguồn thơng tin của thế giới phải theo đõi sự phát triển của cơng nghệ thơng tin theo hướng xử lý ký tự tượng hình và dự đốn buộc đường tương lai của hướng này Vì khi thành lập để tài, những ứng Gung vẽ vấn để này chưa nhiều Nhìn tước những bước tiến và xu thể tie lời của xử lý ký tự 2 byte sẽ dan tới những quyết dịnh chọn lựa đủi
biện pháp cải tạo và những bước đi cĩ tính chất đĩn ưước hộc là "chà đợi chiến lược”
= CAU 2: Xuất phát từ mục tiêu tàng thư, lưu trữ, quản lý khai thác thư 6 Viel nam „ sẽ dẫn đến những dinh bưởng ưu tiền chọn lựa như sau
p Cẩn tạo được chứ nơm trong máy Dú là một yêu cầu tất yếu,khĩng thể coi ià cơng việccĩ cũng được, mà khơng cĩ cũng được" (Vị tên người tên đất trong văn bản Việt Nam cĩ rất nhiều chữ Năm Hiện nay khơng một sắn phẩm phần mềm nào nhập từ bên ngồi cĩ thể cung cấp đủ chữ Nơm đê thể hiện được đủ chữ Nơm trong văn bản của Việt Nam, mà nếu thiếu cái đồ thì khơng
nĩi tổi chuyện quản lý khai thác thư tịch cĩ bằng Tin hoc Mat khác, việc đưa chủ Nơm vào kho chữ tế cũng là mốt dip để giới thiệu và giành lấy cho chữ viết cố của Việt Nam cùng các di sản viết bãng thứ chứ đĩ một địa vì xứng đáng, ngang hàng với chữ viết của các nến vàn hố khác, đảng thời bảo tổn vinh viên các chữ viết cỏ đĩ trong "Bộ nhớ chung của thế giới, khiến cho nhân loại khơng lãng quên nĩ, trong khí nhịp sống hiện đại đang đấy chứ Nơm vào quên lãng Đây cũng được coi cúng
là một biền pháp "bảo tổn van hố quá khứ” Chữ Nom JA mt thia khố quan trọng để giải mũ kho "chứng từ gốc" về chủ quyển văn hố, của đân tộc ta trong lịch sử Các ngành khoa học xã hội và nhân vàn lâu nay thường khai thác và sử dụng kho tư liệu này )
Trang 17see
2) Hướng chủ đạo là xây dựng dẩn dần một ngân hàng đứ liệu Hán Nôm
(Ưu tiên nghiên cứu hê quản trị cơ sở dứ liệu thỏ chứ khỏng ưu tiền chủ trương mua font chữ dẹp để làm chế bản Việc làm đẹp chữ Nôm sẽ được tiến hành sau )
3) Đối tượng khai thác chủ yếu là kho sách cổ, dẫn tối ưu tiên chụn phẩm
mềm dùng chứ phổn thể chứ khỏng phải là chữ giản thể (chứ giản thể được phổ biến sau năm 1949)
YÊU CẬU 3:Xuất phát từ thực tế Việt nam hiện nay là: mợi hoạt động trao
ỗi thông tín văn bản đểu dùng chứ quốc ngử (Chử Việt hiển dại ) Vay mọi tin hiệu, mọi thông tin, muốn cho mọi người Việt nam sứ dụng dé đàng déu phải gán với chứ Quốc ngứ (Tức là các chữ Hán, Nôm phải có thể nhúng được
với chữ Quốc ngữ hay là các giao điện, đổi thoại với người dùng của chương
trình cần là chữ Quốc ngữ, hoã gẩn Quốc ngữ cho hợp thói quen của ngưừ
Việt nam) Dây cũng là yêu cẩu về ứnh phổ cập, dễ sử dung, để học, đối với các phần mềm tin học
Nhóng được chứ Quốc ngữ với chữ Hán, chứ Nôm là tạo được công cụ phụe vụ nhiệm vụ "Latinh hoá kho di sản Hán Nôm theu nhiều cấp độ của tạ, E
một nhiệm vụ lâu đài mà ta phải tự làm lấy,
-Nghiên cứu để úng dung trên nhúng máy nhỏ, do thưc tế "Bước đầu ứng dung
tin học "của nước tavà hoàn cảnh đang bị cẩm vắn,thiếu các thiết bị
cao cấp có tính nâng mạnh (Ví dụ đĩa quang ,bộ xử lý 486 còn rất đất,
hệ điều hành Windows chưa ổn định: các hệ ORACLE và UNIX chưa được nhập vào Việt Nam Tù đó dẫn đến việc "Quết ảnh sách Hán Nôm" nhưng lưu trự thủ vào đĩa cứng nhỏ chứ chưa có bộ đọc ghỉ trên CD-ROM
YEU CAU 5: "Thod man xu thế hoà nhập"
Tuy ra đời trong hoàn cảnh bị cấm vận và lac hau vé thông tn, nhưng chúng ta cũng nhìn thấy xu hướng tất yếu là Thông tn Tin học sẽ tiến túi
sự hoà nhập kỹ thuật ở cấp độ toàn cầu Vì vậy mọi cải tiến phải dí theo hướng đó , tất cả phải chuẩn bị cho ngày đó Chính vì thế mà ngay từ dấu
để tài đã nghĩ tới việc dang ký tham gia vào bảng mã chuẩn UNICODE va ISO dau rang lúc đó chựa hình dung hết công việc cụ thể sẽ phải làm những gi(trong quá trình tiến hành nghiên cứu chúng tôi thấy làm sẵn phẩm để ding trong nội bộ, so với sản phẩm làm để tham giá truyền thông quốc tế có
những yêu cầu và những phẩn việc cụ thể khác nhau Để tài đã phải tính toán
và thiết kế để có thể dung hoà, thoả mãn được các yêu cầu khác nhau, thám chí là đối nghịch nhau )
e số đrša MỘT SỐ GIẢI PHÁP ĐÃ THỰC HIỆN pf pAp ỨNg YÊU CẤU VÀ ĐẠT HỤC TIỂU ĐẾ Ra
Trang 18tiêu để, để mục hay câu văn thường [như trong hé CWI], VA nbit sin xuất cũng đặn rằng hệ này chỉ dòng dưới DOS thấp (DOS-3.2 hay 3.3)
Nhà sân xuất cũng khoá chật font chữ cơ bản, không cho phép bổ sung sửa chữa gì vào đó (vì xét ra font ấy củng đã to hết cố, chiếm gần | Mega bytes) Nhà sản xuất cũng tạo hộ gỗ theo các phương án thích hợp với ngưửi bản ngữ (Trung Quốc) là "cha Am phù hiệu" (bua, phua, mua, pua ), "Thường Hiệt, "Hàng hệt
Để tài đã làm được việc cải tiến một phẩn mềm chứ Hán để sử dụng như sau:
~ Viết chương trình can thiệp vào font: sửa chứ trong font, về lại,
vẽ thêm chữ
- Đưa chữ Hán tir trong 1 hé CWT ra DOS, vào các hệ phổ biển dế sử
dụng như Norton, Turbo Pascal 3, nhập vào DOS.5, đưa ra máy in lascr
- Tạa được cách đánh chữ Iián thích hợp với người Việt
- Chữ Hán dùng được trong máy nhỏ của Việt Nam (với máy AT- 286 cũng soạn thảo được)
2- VẤN ĐỂ vẽ cnt NOM VA DUA cui NOM
THAM GIÁ VÀO BĂNG MA CHUẨN quốc TẾ
Nhờ nắm được cơ chế làm chữ tượng hình, để tài đã viết các chường,
trình thâm nhập can thiệp vào font cơ hẳn, vẽ thêm chữ, tạo ra 2 font chi Nom cổ 15 để hiện hình và cớ 24 để điều khiến in, Hai loại trên có thể dùng
để chế bản; riêng font Nôm 24 còn dùng đẻ đăng ký giành chỗ trong UNICODE đợt đầu Nhờ sự giúp đỡ của các ph Tín học Việt kiểu lại Mỹ, và các cự quan, các nhà làm chuẩn kỹ thuật Thòng tìa trong nước nên việc đáng kí chứ
Nôm vào hãng mã chuẩn Quốc tế đã đạt được thành công bước đầu: Tiểu ban ma
chuẩn đồng ý kiến nghị IŠO mở rộng cột thứ 4 trung bảng mã chuẩn chu chữ Nôm của Việt Nam
Như trên đã nói: việc vẽ chữ Nom dé ding trong nước đã phải thoả mãn thêm các yêu cẩu 2 và 3 là : vào bệ quản trị đũ liệu và nhúng với chủ Việt Việc tham gia UNICODE, trên nguyên tắc đã có đáp úng yếu cẩu
thoả mãn xu thể hoà nhập Ở đây để tài phải giải quyết mâu thuần giữa yêu
ìu của ISO là sấp xếp toàn bộ theo trất tự số nét và trát tự 244 bo olin từ điển Khang ÏH, còn yếu cẩu của ta là xếp theo ABC vấn quốc ngũ; UNICODE dòi hỏi nộp sản phẩm trọn vẹn ngay một lúc, cồn ta thì s dan,tim thém được chữ mới tới đâu thì vẽ tới đó Vì vậy phải chia thành các version
để bổ sung đẩn cho phù hợp với đợt bổ sung của quốc tế Chủ trương
nghiên cứu ghép mã, ghép chữ vừa đáp ứng kịp thời yêu cẩu đưa ra xem xét của 1SQ, để chúng ta không bị lỡ thời cơ vừa giải quyết được vấn dé do thiểu điểm mã mà gây ra tình huống căng thẳng gay cấn khí ta mới xin gia nhập bảng mã UNICODE
- Dé dam bao via co sin phẩm nộp vừa có công cụ dùng, trong thời giản hệ mã UNICODE va iSO chưa được chính thúc phổ biến, để tủ đã giải quyết bằng cách gán tạm mã RJG-š cho các chứ Nôm, đồng thời gán lại mã
dưới dạng Decimal (kí mã thập phân) cho tất cả các chứ Hán và chữ Nom đã cổ; tạo nén một hệ má Hán Nôm thống nhất, liên tục có thể quản ii dược
trong kho (chờ tới khi ma ISO đã phổ biến thì ta sẽ chuyển má các sản phẩm sang hệ ISO), Việc tan một hệ mã riêng như vậy cũng đáp ứng cúc yêu cầu bổ gung chữ sẽ sưu tẩm về sau của tà Sở dĩ cẩn gan lại mã B1ö-5 dưới dang Decimai vì dưới hệ điểu hành DOS vốn có cơ chế nhập chữ vũo vị trỉ con trò bảng cách đánh phím Alt + con số trên bàn phím số, cho nên nếu tà
lỡ tay xoá mất một chú nào đỏ trong kho chữ thì 1a có thể khôi phục lại nó
một cách dé dang, hoặc có thể đánh dược một chữ khó tìm vào văn bản nhò sử
dụng một tù điển điện tử để "nhác vở ",
Trang 19
-4-
~ Trong Font chi Nom nay ta cing đành vị trí chủ chữ Quốc ngữ ở
những miễn nào mà vần Quốc ngữ đi qua
~ Dựa vào thói quen đánh chứ Quốc ngữ trên máy tính theo phường pháp
gỗ telex là phương pháp dễ học dễ làm nhất, dé rat đã dùng mã (ciex
xâu gọi các chứ Hán và Nâm Quy tắc này cũng cho phép sử dụng tiết kiệm hỗ nhớ (nếu khi nào ta không cần đánh chữ Quốc ngứ thì ta không tải bộ gỗ Quốc ngữ vào, nhưng vẫn đánh được chữ Hán chứ Nôm, và khi dó lượng bộ nhú
đồi hỏi cấp phát sẽ giảm di dành chỗ để chạy chương trình thường trú)
3-VẤN ĐỂ XÂY DỤNG NGÂN HÃNG DỮ LIỆU
~ Sau khi giải quyết được vấn để xử lý ký tự Hán Nôm trên tệp vấn
ban (text file) thi edn phat nghién cứu để đưa chủ tượng hình vào hệ quản
trị dữ liệu làm công cụ thể hiến, mô tả vàn bản, Việc dưa chữ Hán cha Nom vào hệ quản trị dữ liệu đồi hỏi kỹ xảo phúc tạp hơn là đưa vào hệ soan thảo
trén tép van ban (text file)
- Định hướng vào s Ie
những giới hạn co hẹp về sử dụng tài nguyên bộ nhớ Chẳng hạn:
+ Bỏ nhớ quy ước chỉ có 640 KB, nhưng phẩn dành cho hệ quản trị CSDL FoxPro tối thiểu đòi hỏi gẩn 300 KH bộ nhớ cho hệ chương trình ấy thường trú chứ Hán thường trú chiếm gén 200 KB, chữ Viết thường trú chiếm gần 20 KB; Khi vân hành còn có sự bành trướng thém ra ví đụ bộ nhớ
cẩn dành chỗ cho các menu, các cửa sổ v
+ Do đồ phải cất bớt một số tiên ích như: soái sửa lỗi chính tá chữ
Việt trong hệ cất bớt phẩn chữ hoa có đấu trong tiếng Viết và và bộ gõ chứ Nôm đưa vào phải là bộ gỗ ghép vì nó nhỏ bơn bộ gỗ tổ hợp sẵn các chữ
đã ghép
- Một nhu khác của vấn để lưu trữ sách cổ mà Tín học có thể
vươn tới là lưu ảnh sách cổ Diểu này thế giới phải giải quyết bang
công nghệ CD-ROM Dé thi đó nghiên cứu cả hai cách quản lý lưu trổ: báng
ky tr (Character) va phương pháp quét lưu ảnh
- Việc lưu trữ bằng kỹ tự có tác dụng quản lý tìm kiểm nhanh, khủi
thác những mặt mạnh của hệ quản trị dữ liều Vấn để là chọn hệ nào để làm,
dễ học, rẻ tiến, có thể cải tiến, cá thể đưa chứ Hán, chủ Quốc ngú vào dượ
Chúng tôi đã chọn hệ FoxPro thich hop với các yêu cẩu kể trên „xà trong bước đầu triển khai đã ứng dụng để quản lý được 4500 sách và 11.500 đơn vị văn khắc Hán Nôm.Iê này cũng đang được cải tiến cho mạnh hơn lên
- Về sử dụng ngôn ngứ lập trình ứng dụng
+ Hể tài đã giải quyết mối quan hệ giữa tệp cơ sở dứ liệu và tệp
vân bản Chuyển đữ liệu qua lại giửa tệp dự liệu và tệp văn bàn, viết
chương tình tìm kiếm và thay thé wong tép cơ sở dứ liệu, viết chương tình sửa lỗi, sửa mã cho các tếp cơ sở đứ liệu, viết các chương trình chuyến mã qua lai giứa các hé soạn thảo chữ Việt cho người dùng, và chương trình sắp xếp chứ Việt theo mã chuẩn quốc gia Việt Nam
Tóm lai:Là một đơn vị đẩu tiên thuộc ngành Khoa học xã hội nghiên cúu ứn: đụng Tìn học, trong hoàn cảnh thiếu kính nghiệm và bị cấm vận, với một th
bản của bước đầu ứng dụng Tin học để bảo vê và khai thác di sản Hán Nôm như
tạo chữ Nôm, xây dựng hệ soạn thảo Hán Nôm-Việt với bộ gõ thích bựp và
bộ mã nhúng bai ngữ an toàn dưới DOS, tao thuận lợi cho việc đưa ván
bản vào xử lý trong máy; xây dựng được khung ban đầu cho Ngân hàng đữ
liệu Hán Nôm Ngoài một số sản phẩm, còn thu được những kiến thúc cẩn thiết cho việc phát triển, khai thác thông tìn Hán Nôm bằng kí thuật Tin hục Trang cách làm việc đã có định hướng đúng, nghiêm túc và có hiểu quả
Trang 20
in phdm Jam thém nam
( Những thử nghiệm ứng dung dưới Windows là s
chỉ là hước đi rất ngắn,
ngoài kể hoạch, là 'vượt mức" đã đăng ký, và mị
chưa có nhiều kinh nghiệm.)
m VỀ TRIỀN VỌNG,VÀ CÁC VẤN ĐỀ TỔN TẠI : 1) Những sản phẩm cửa để tài có thể dem vào ứng dụng ngay trong nước:
af Dé soan thảo và in ẩn văn ban Han Nom Viet
b¿ Để làm các Từ dién co chd Han, cht Nom, che Vidi trong may tinh,
phục vụ tra cứu, nghiên cứu khoa học
cj Để dạy và học chữ Hán chữ Năm
gý Để lưu trữ bảo tổn thư tịch Han Nom
2) Đối với yêu cẩu giao tiếp quốc tế
a/Chúng ta đã có được công cụ dể có thể bước đầu hợp tác quủc tế trong nghiên cứu khoa hocnhư đồng góp thêm chữ vào kho chữ tượng bình của thế giới, đồng thời tranh thủ những tiến bộ về công nghệ thông tin của thế giới và cung cấp những luận chứng khoa bọc chủ sự nghiệp Tïn học hoá, hiện đại hoá kinh tế của quốc gia, nếu được nâng
cao thêm có thể đưa vào truyền thông liên quốc gia
b/Có thể đùng vào những ứng dụng cao cấp bơn, như làm dep chinhan
đang, dịch máy Việc này yêu cầu phải nâng cao thêm
3) Cần mở rộng ứng dụng và tiếp tục cải tiếu: Nhờ mở rộng ứng dụng có
thể phát hiện thêm những nhược điểm và yéu cẩu dé cải tiễn, nâng cao
chất lượng sản phẩm đã làm ra
4) Căn cứ trên các kết quá đã dat được, căn cứ trên hướng đi và nhiệm vụ
lâu đài có đối chiếu với tiến bò kí thuật Tin bục biện nay, sau khi
xuá bỏ cấm vận, chúng tôi xin nêu một gợi ý như sau :
a/~ Để nghị Trung tâm Khoa học Xã Hội và Nhân văn quốc gia kiến
nghị với Nhà Nước đầu tư chiều để tiếp tục nghiên cứu và khui
thác, ứng dụng những thành quả của Tin học Hián Nóm của trong nước
và thể giới vào nghiên cứu khoa học ( Hình thức có thể là môi dư án hoác một Uỷ Bạn dịch thuật liên quốc gia ) làm một đẩu mối thực hiện nghị quyết 49/CP của Chính phủ.Ở day sé tap hợp các chuyến gia của 2 ngành Tin hoc va Han Nom hoc để phối hợp hoạt động, vừa nghiên cứu vừa khai thác
b/-Những nhiệm vụ có thể triển khai tiếp |
+ Hoàn thành việc mã hoá chữ Nôm của người Kinh, chứ Nom Tay cht: Thái cổ, chữ Chàm cổ, bịp thời đăng bí vào bảng mã chuẩn của thé
giới
+ Lam đẹp cho các chữ viết cổ đó
+ Xây dựng các từ điển điền tử sang văn tự như Hán Việt Nôm-quốc
ngữ đưa vào sử đụng tra cứu, và phục vụ cho các chương trình dịch máy
+ Quết lưu toàn bộ kho sách Hản Nôm vào CD-R ø lưu nhân bản và khải thác theo kĩ thuật mới, để phòng mất mắt di sâu
+ Xây dụng các chương trình địch máy song văn tụ
cổ Trang bitể chức gọn nhẹ nhưng đủ sức để làm việc,
+ May tính Pentium hoặc Power P€ áp dụng công nghề RISC tốc dõ củo + Sử dụng cùng nghẻ "cum dẫu cứng" dạt tốc đồ cáo
+ May doc vi ghi CD-ROM + Kết hợp đội ngũ chuyến giá 2 ngành làm các chương trình dịch ngũ
Trang 21PHỤ BẢN SỐ 1
ngo lao giữa cưữ Hấn vÀ chữ Việt
khi những cHữ Việt trong
Trang 22PHU BAN SO 2
PHIẾU MO TA VAN BIA VIỆT NAM ĐỂ QUAR LE
1/-8ố: 20957 2/- Số cũ: - 3/- Loại: rên giáo, văn hoá
4/-Tên bia: (viết hoa đâm) CÀN NI SƠM HƯƠNG NGHIÊM TY BI MING
5/~ Niên đại: Ngày 10 tháng 1 năm 1325 (Năm Giáp thin, niên hiệu Thiên
Pha Dué Vi năm thứ 5, Tháng 12 ngày mồng 4}
6/-Tên cũ: như trên
7/-Tên Việt: Văn bia chùa Hương Nghiêm núi Cân Wi
8/-Người soạn: chưa rõ Theo noàng Xuân Hãn, người soạn là sư Pháp Bảo trên
thật, quê quán, nšm sinh, năm mất đếu chưa rỏ)
S/-Noi để(Địa điểm nay) : xá Thiệu rung,huyện Thiệu Hoá,tỉnh Thanh Hoa 10/-(BTA DANH CỔ : kể 4 cấp hành chính ghì trong hia)
11/-Wơ$ lưu giữ: Thác bản lưu giữ tại Viện nghiên cứu Han Nom
12/-Người viết chữ: cnua rõ
13/-Người khắc chữ: Ngưởi khác lại, vác năm 1126 -Ìa Lê Buán Danh,người xã
An Hoạch, huyện Đông Sơn, Thanh Hoá
„ 14/-Kiển chữ: chữ khải khắc châm, đọc tử trên xuống, từ phải sang trải Tình trạng thác bản: Ban rập tit bia khắc lại, bị mờ nhiều chữ 15/- Chất liệu: nả
16/-Hình thức: mhổ c#o Inge rong ams
‘TU THEN cHOT
17/-Tên người: bạo Dung, Le céaz, Đỉnh Tiên Hoàng, Lê Đại Hành, uy Thai Tông, Đạo Quang, Lưu công, [¬ý] Thanh Tong, Minh Hiểu Boang đế, Thuy Thành Công chúa, Lý Công, Thiếc, Tỏ, Lê Văn Nghỉ, tính Trạm, Lễ Huân Danh,
18/-Ten et: can wi, Heong nghiện, Gia Vệ, ái Châu, Cửu Chân, trinh Nghiêm, Minh Nghiên, Vũ Long, na za, Kim Cốc, NgẺ Huyện giang, Vương Thành, Thứu Đài, Lư Giang, Khải cise (thôn) niên Hào, (xã) An Hoạch, (thôn) Nhuê (cha); [giap) Bối Lý,(đấm) è L6i;tgiáp) Viên Đàm, 19/-8ự kiện: vam lại chua, Thời kỳ: Nhà tý (1016-1225)
20/-Tên quan tước: | cổu cÄ quan TƯỚC,DANH HIỆU VÀ THUẬT NGỮ cổ
Trấn quốc bộc xạ, ĐÓ quốc ¿ịnh sứ, Kim từ quang lộc đại phu, quản giới, Hoàng để, Thiến chủ, Trường iac, pai hình, Thải phố, Nhập nội nệi thị sảnh
a do +: phe, Cùng dịch gứ, Đại tướng quản,Thượng trụ quốc
khai quốc công, Thái Phê kỉ lang, Thiên Phủ Duệ Vũ, Bảo Thái, Thực ấp, Thực phong
21/-Chữ Hồm Khó
Thiển sự Dac Dung, xuấc thân từ đông họ lớn có uy vọng nhiều
Số dòng 31 Số chữ 1300,
dei,tro tri ở Kính đề,giác ngộ lẽ sắc không, vận động các nhân vật nổi tiếng Si như Thái
mh Bam, Thai ay Lý Thường Kiệt, Thuy Thanh
„ trùng tụ chủa Phật, soạn khắc van bia dé lim truyền mí 23/-Sách tham khảo: te¿a văn đã được chép lại trong cuốn “Bi_van“va cuốn “Ly Thương KÍết sau đã được phiên âm, và địch ra tiếng Việt 24/-Thy mic tham khảo
BỈ văn, bản sao chép ky hiéc vav 1167, sách đã mất,
LỰ,Thường Kiệt Tác giả Hcảng Xuân đến, nhà xb sông Nhị, gà fội
Trang 24PHỤ BẢN SỐ ¿
GIỚT THIỆU SƠ LƯỢC HỆ QUAN TRỊ CHỮ NÔM DẠNG ĐIỆN TỪ
(TIỀN THÂN CỦA TỪ ĐIEN CHỮ NÔM ĐIỆN TỪ )
điều hành Me.Dos, phần mếm để kiếm là ET2 (Ÿ Thiên) và Foxpro 2.0,Foxbase
- Mẫu chữ để vẽ :lấy trong các thư tịch cổ Việt Nan, bước đầu lấy ở hai tử điển xuất bản gần đây nhất và tương đối nhiều chữ là TĐCN (Từ điển chi Nom -Vũ Văn Kính) và BTCH (Bảng tra chữ Nôm - Nhả xuất bản Khoa học Kã hội,do
nhóm Hồ Lê biên soạn)
TIẾT 2 : GIỚI THIỆU SƠ LUỢE CẤU TRÚC DƯ LIỆU
(Cấu trúc - các trưởng của tẹp chủ đạo)
- Tên tệp : NOMDD.DBF (wam Gay 4a)
~ Có các trưởng sau: Kiếp độ rộng
le Mor (mã quốc tế) character
2- N (nguồn cũng cấp cht) € =—-
3— MARSC (mã ascii, Big 5) ¢
4- CHU (hinh choy c
5~ AHV (âm Hăn Việt - Ar némjc 1
TIẾT 3: GIẢI THÍCH Ý NGHĨA CÁC TRƯỜNG, TÁC DỤNG VÀ CÁCH XỬ LÝ
1/ MỘT (MÃ QUỐC TẾ): trường này ghi các mã U+ và V+ trong bảng mã DNICƠnI
giành cho chữ Hán và Nôm U là en3 Unicode đã có, V là chữ Năm thuẩn Viện, Trưởng này giữ quan hệ tương thông giữa mã Unicode và hệ riêng
dụng (bệ Ý THIÊN]
a ching tei
Trang 25~3~
2/ N (NGUỮM) trưởng ghỉ nguồn gốc các chữ trong các tử điển, gồm 1 chữ hoa
đứng đầu kèm san lá 4 kí tự số, chữ hoa đứng đầu là viết tất tên các tác
giả đã mô tả chữ Nôm trong từ điển của họ, cae chit sé la the tit che trong
từ điển đó “8' là chữ do nhóm ông Nguyễn Quang Hồng mô tả, 1° La chit do
nhóm ông Hồ 14 (Bảng tra chữ Nêm) mô tà "W' là chữ do ông Ngô Thanh Nhân
nô tả,trích chọn ở tử điển Vũ vấn Kính)
¬ Trường hợp Nhân và Lê cùng mô tả một chi thi dem kỹ hiểu N+ chứ số
chuyển sang trưởng AKHAC (vi trưởng ay rộng 40 kí tự, còn thửa ch}
~ Nếu Lê nô tả trúng lập thì cũng đem bớt l ký hiệu chuyển sang trưởng
AKHAC, ghi la ‘NL’
- Lêm nhự thế vì Bang tra chữ Nôm của zê có số lượng nhiều hơn cả, có đánh
sẽ liên cục, có thể đông làm văn bản nén (text de base) để khảo dị so sánh, kiểm tra để phông bổ sót chữ
- C6 65 record mA sau chữ số con thém chữ "b" ở do la cae vecerd lie,
vì 1 trưởng ARunc không đủ “chổ để ghỉ các ấm dọc khác nhau của chữ ấy, vậy
phải thêm 1 record nữa để có thén chỗ mà ghỉ am
3) MAASC: MA ASCII CUA CHI (gh: theo hệ thập phân, bằng sác can số từ ©
đến 9¡ Nếu lỡ tay lãm mất hình chữ, ta có thể khôi phục bang cach da phím
alt và đánh con số ở khu vực đách đã 2 con số Chỉ
= Ta có thể đếm xem trong tệp NOMDD.DEF có bao nhiều record cé chi lea!
ghép (4 bytes) bing lệnh Foxpre sau:
6) BỘ (BỘ NÓI CHUNG): cnủ ý rằng khả: niệm "bội
rộng, nó dùng để gh: am che toa chi “phan nghĩa'
toà gợi âm sủa chữ ấy (toa agi am được di trường “cum") thee thei quen
trao đểi miệng với nhau, muốa mô và mộc chữ, người te bay nói chữ ấy gốr
bộ gì ghếp với ám gì só hàn ý nắng "bộ ghỉ phẩn nghĩa, "âm" gai
gợi âm chỉ ra cach đọc của chit ay T6m Lai chúng xôi cố gàng phan «
‘gai cho ta dos ra am ‘cot ' mẻ chữ 8âo chứa cói te
chữ "lui" gốm “bO tdov,"am 16i" (iui là lui gát, là đi bằng chân,
nên có bộ "túc hữ 'lõi' gợi shớ ta dgc ra am ‘lui’ má chữ Hản chưa
Trang 26n 1ñ TH a.’ Gee vàng VỆ
Hi, nhưng đã thành quen và tiện dũng để mô tả chữ, nên cũng chấp nhận Ví
dụ chữ "nhẽ" được mô cd là "bộ lí, âm nhĩ", nhưng bệ '“Li' (chuẩn } thi
không có chữ "ngọc" ở bên Hoặc là chữ "Giúp" mô tả là "bộ trợ am chấp" „ thì thực ra không có bộ "trợ", trong phần ghỉ nghĩa chỉ có bộ "lực" là dang được ghỉ , vì vậy muốn sắp sắp xếp cho hợp lí ta phải để chữ "giúp" vào bộ
"tực" ĐỂ giải quyết việc sắp xếp này ta có trường BO9X (B6 sáp x xếp, làm,
nhiệm vụ đó (Chữ "giúp" sẽ được ghỉ BOSX của nó lá lực) * ted mgt
= Vige tach doi một chữ thánh BỘ (ghi nghia) vacwm (ghi am quen dung,
chợt nhận và đọc ngay được; sẽ tiện lợi cho việc tra cứu nhanh + - Khi cảm một văn bản hay một chữ mã người đọc chưa biết người sáng tác ra nở
định gán cho âm gì, nghĩa gì, thì có thể tra cứu trên cơ sở biết được am
của từng bộ phận của nó, mà việc này thì tương đối
= Chương trinh TRNOM.PRG (tranom.prg) lam theo cảnh công index va cho phép
để bộ trước cụm sau, hoặc cụm trước bộ sau đếu tìm ra chữ,
vé cach dua xâu gọi (xâu (Ầm kiếm) vào trong ở đây người sử dụng phải gõ ân telex của "bộ và cụm đính liễn nhau" (không để khoảng cách hay đấu cộng ở giữa)
Nhân, Hồng đã mÔ tả, mô tả thiếu ẩm, các ăm ấy đếu ghỉ vào đây, ghỉ các âm khac nhau của một chữ má Lá,
này» sôa đưa vào một số ấm "tiện đọc tức
Ngoài ra Long (ngư
thời" (trông thấy chit dé, người ta không cấp suy nghĩ nhiều, cớ thể đọc
ngay ra âm đối
Sự thêm thất này phẩm phục vụ cho việc tìm kiểm va go chữ vào Vấn bản
được nhanh, chử không phải là âm "chuẩn" mã một từ điển nào trước đã mê tả
= trong tuong lai, ed thé trata
bing truong atom, kiểu Memn,Šể cho độ lên của t
kiểu
vị kiếc trưởng Meme e
tự vẫn không chữa hế 4 cố 18 KỈ tự, cên wong Charac
9- BOSX (BỘ SẮP XẾP) nảy chính lá "bộ" theo quy địch của tử diển Khang
ai ma Ucicode và 1o đã lấy iar chads để sắp xếp kho chữ tượng bình
Đối với kho chit Nom ray, đầy lã trưởng ghi phiên âm tiên việc theo kiểu
telex cải Đệ Khang Hí đó
- Trưởng này quan hệ mật thiết với trưởng SHR (SẼ hiệu bội,
- Trong 214 bộ Khang Hỉ có ¡8 gặp bộ trúng âm Hán Việt với nhau nền phả
ghỉ thêm các chữ số kém sau để phan biệt (va chỉ ghỉ kỉ tự !1*' hoặc
eT Te
wehd2"(@) (chi cat déaj; "vat"(ÄMj (chỉ lông chím,phân biệt với “va2" oF)
{chi may, mtay v v Vé chi tiết xim xen trong tệp B214.đb£
Trang 27
~Sau khí chạy chương trình SUABOSX.PRG(sửa bộ sắp xếp) thì các cht wom trong tập NOMDD.DBT sẽ được phân loại và quy về số hiệu bộ Khang Hì của nó Chỉ côn chờ thêm yếu t6 số nét là có thể làm lệnh sORI để xếp các chit ay theo trật tự mà TSo quy định Lệnh sắp xếp ấy được viết như sau:
toàn chính xác, vì việc nây rất khỏ),
~:sau khi sắp xếp thì các bộ đặc biệt (dùng riêng trong chữ Nôm của việt
Nam) sẽ nổi lên trên vi nó không thuộc bộ nào trong 214 bộ Khang Bi
Tám (8) bộ đãc biệt của Việt Nam mà chúng tôi bước đầu phân lập được
xa là : Mháy'Œ#C Cự (phải)@B ,Cự (trên) ca Of, ving vai trái €
(vvt) —,Nhấy kếp phải (np) 22 ,Mháy trái (nk) >2 ,Kim trái (ct) YD
~ Tác giả hệ này ehưa muối
vet này ta có thể dễ đăng nhận biết khi muốn thống kẽ hoặc khi xếp loại,
khí chọn lọc cáo chữ Nôm chuẩn Việt , cho nên ching tei chua gan gi veo
trường BOSX của các chữ ấy Nếu muốn xếp Vào 8Ộ Khang Bí cản chữ ấy thí
quy các chữ này về bé Khang Hi, vi dya véo dâu
không gh:! Trường này củng với trường OSX va trường mọc (mã đầu cuối)
phục vụ cha việc tự động hóa một phẩn công việc đánh mã đầu cuối
= Đo cách xác định mã đấu cuối có đặc điển riêng, mộc bộ nào để nếu để ở đấu chữ'shì mã đấu của cá chữ được ghỉ bằng 1 kỷ hiệu này, ca nếu để ở cuối thi mã cuối của cả chữ ấy lại được ghỉ bằng 1 ký hiệt khac
W{ dạ cũng là bộ điểu, nhưng khi ghèp vàc với chữ khác :
~ Trường này có thể có 3 mã lá *d' (đểu) 'e“ (cuổi) hoặc bò trống
12) MDC (MÃ ĐẦU CUỔI): dã nói ở 1L
Việc quy nạp mã đầu cuối được ghi văn vất ở phụ luc 4
13) SNET (S6 NET), đã nói ở trưởng 9 Trưởng SMET nảy phục vụ việc sắp xếp
kho chữ theø trật tự do 1so quy định ac việc sưu tấm và vẽ chứ cẩn tiến
hành keo đải, khêng thể chờ eưu tấm đả nết mọi chữ xong rấi mới xếp trật
va ve vas font, vi vay trat ty trong font phải cho phép :4 ngẫu nhiên, chữ não sưu tấm dược trước chì vẽ trước, sưu tấm được sau thi vé sau, con việc
Trang 28-5-
14) VÀ 15): DZ VÀ DZ2 (DANE DAD, DANH DAU 2)
Mai trường này phục vụ nhu cấu hiệu đính, biên tập Khi làm thủ công, hoặc
chạy chương trình, tủy theo sự cẩn thiết, ta có thể cho đảnh đấu 1 số
œecord nào đó, rồi chọn phơi lên hoặc copy các record đánh dau ra tệp khác
v.v Huốn đảnh đấu thì trước khi làm việc cần xoá trường ấy bằng lệnh
Replace all dz with ‘ Muến phoi céc record da đánh dấu bing ‘+’ chẳng bạn ta dũng Lệnh
Brow norgri for dz = ‘*’
26) VA 17): THUC GHÉP VÀ TS (TỔNG SỐ) Hai trường nảy phục vụ công việc
thống kê nhanh các bộ thực ghép chương trình TRG2.PRG (thống kế chữ ghép
2 toa): chương trình này dung lénh Total cla Foxpro, chạy nhanh, che ra
ất quả thống kê số bộ nói chung và bộ thực ghép nói riêng trong vài phút
18) DỰ KIẾN CÓ THỂ SỬA CẤU TRÚC CHO HOP LY HOW có thể thêm trường FL
(phân loại) để ghi phân loại các toà : toà nảo chuyên để ghép trước , toa
nao chuyên ghép sau Lam như vậy để phục vụ cho việc mà hoa tu dang
GIỚI THIẾU SƠ LƯỢC VAI CHUUNG TRÌNH DỊCH VỤ, VA VAI TEP DBF
KIEM TRA DUNG PHU TRỢ CHO TEP CHỦ ĐẠO,
3) Do dac diém các trường (field) hữu quan trong tép DEF chủ (HOM.DBF-
déu dũng ký tự ascrt chuẩn để ghi sự sai sốt trong cach ding mã telex ¿
ghi âm Việt'1á khó tránh khỏi và khé kiểm tra được bằng mắt thương
„ và lại việc kiểm tra bằng
„ vi vậy cẩn có các tệp DBF ĐỔI CHIẾU dé gin
phát hiện đánh đấu các lỗi chỉnh tả telex Vi dụ chữ "tiến" đăng lẽ mã teios
phải ghí la "lieens", nhưng đánh nhấm vao 14 “lienx", tai chương trình kiểm
tra sé dank dau và phơi lên
Tép VCRUAN.DBF chita hon 6090 tir dot
như tệp B21£.DBFj, có các chương trình SORELA.prg, sobo.prg, Soatbo.prg
làm nhiệm vụ phát niện cac ché danh sai telex
Tệp Chương rrình RDATQUA.PRG phát hiện các xâu đài qua 8 #3 tự trong cả
trường đơn xáu và trường de xau ( Lu ý rằng một tử đơn âm của tiếng
Việt d¿ đảnh bằng mã telex cũng không tạo ra một xả đãi quả 8 kỉ tự, đỏ
là một dặc điết của "Tử" tiếng Việt khác với "tứ" trong sác ngôn ngữ chau Ba
thể vận đụng khi thiết kế câu trúc dit 2
2) Đo cẩn sắp xếp theo trật sự Khang HÍ nên có chương trinh B2:4.PRG
đi kem tẹp BZ14.DBE ,cac trường BOSX va SHE trong tập chủ đạc như đã kế ở tiết trị
3) Ngoài
a/ Các chương trình lấy chữ nản tử kho chữ Hàn để ghép thành chữ Nôm, he
lay chit nan dung vhẳng làm wôm (như chương trinh LVa.PRG va LVN PRG}
b/ Các chương trinh giữ quan hệ tương thông với mA UNICODE va =50 kai cáo
bằng mã ấy có điểu chỉnh thay đổi vị trí các điển
©/ po cách khai thắc Bộ nhớ của các bê soạn thảo dưới DOS và trong hệ Quần trị đữ liệu đôi hỏi dung lượng bộ nhớ có khác nhau, nếu đúng chang một
bộ 96 sẽ gây ra tỉnh trạng thiếu bộ nhớ , vá máy dừng bảo Lỗi, khiến không thể hoạt động được, vị vậy cán có các chương trình chon lọc dé đưa chữ ra
Trang 29
~6-
các bệ gỡ theo các yêu cầu khác nhau (tuỳ theo ta muốn soạn thảo một #ile DBF hay file TEXT ) Chương trình RATRBOX PRG, LOCTRBOX.PRG, LOCLAI.PRG
1 ¥a tập TRUOCBOX.DBE phục vụ cho mục dich nay
Tim lai: với tệp NOMDO.DBF lắm cơ sở, tạo thêm một số tệp DBF dich vụ
giữ nhiệm vụ kiểm tra, và một số chương trình PRG để làm việc, chúng ta
xẽ quản lý kho chữ Nêm theo hưởng tích cực, làm thêm được các công việc như 1~ sưu tấm, vẽ thêm, ghép thêm chữ wom
2- Mã hoá chúng theo các cách khác nhau để tra cửu cho nhanh, soát xét xem xem chữ não cấn vẽ thì sẽ vẽ bổ sung, tận dụng được chữ cũ để ghép được thành chữ mới thị ghép,
3 - Đặt tương thông với mã quốc tế 180
4 - Thống kê, nghiên cứu, phân tích,
5 - Đưa chữ vào bộ gõ để soạn thao va in ẩn,
+
Đó là những nhiệm vụ và ứng đụng mức thấp của hệ quản lỷ chữ Nôm, đướởi pos
CÁC TÁC GIẢ
1~/ Thiết kế hệ thống : Ngô Thể Long
2/- Tháo chương thực Chỉ + Nguyễn Vẫn Huôn ,Ngó TT
3/- Vẽ chữ + Ngê Thể tân ,Nguyễn Minh Khánh „
Nguyễn Thi Ha, Hoang Văn Ram 4/- cố vấn Tin học : Pạs Tiến Sĩ Nguyễn Xuân Huy
CĂN CỨ Cơ Sử
( Hệ này đựa trên nến tang và cho phép của các phần mềm sau day =}
1/-Hẽ điểu hành HS-DoS Version 3.0 dén Version 5.0
2/-Hê Quản trị cơ sở dữ lá:
3/-Fant chit Han của hệ Ý THIEN (E2)
4/ Chữ Nêm dược chọn vẽ theo các tải Liệu mó tả chủ yếu sau đây +
a/- mừ piển chữ Nêm - Vũ Văn Kinh Sài Gòn 1971
b/- Bang tha chữ Nêm -Nxb Khoa học xã hội - Hà Nội 1972
ảo và in an trên máy in kim và laser ( dưới DOS j
- Tra cứu thống kẽ phản tích về ngôn ngữ học
Trang 30TƯ LIỆU THAM KHAO
** — Thao thống kê chưa chính xác lắm , chỉ trong 13000 ch Hán của hệ
Ý Thiên, các bộ ghép đã được sử dụng với tấn số cao, như sau:
PHỤ LỤC '1 ; đưa ra 4 ví dụ (các cựn "âm! L4 ,"Bì"Ÿ,"Cạp»“Ê, ,"chuy"#)
chỉ cần 1 cụm ghép với các bộ khác có thể tạo ra hơn 20 chữ Hản khác nhau
Các nhà Lam code và lâm Font cân xem xẽt thực tế này va bạo điểu kiện
để người sử dụng có thể ghép chữ ,sáng tạo ra chữ mới,mà xhông đôi hỏi cấp
thêm mã Đó Là một để nghị xây dựng đổi với bộ code chuẩn của Iso
PHỤ LỤC 2 : đưa ra các Bộ có tấn số cao đã thực ghép hoặc có
kho chữ Nôm (Tệp NOMDD.PBF)
trong
PHỤ LỤC 3 : IN 13 TRƯỜNG CỦA TEP NOMDD.DBF DE GIỚI THIỆU CẤU TRÚC CÚA Tp
nảy và các chữ chọn ín là các chứ ghép 4 bytes)
PHU LUC 4 ; Gigi thiêu tốm tất cách mã hoá "ĐẤU có?” ,nột cách gọi
khác của "giản đị đu nhập pháp" trong phương án mã hoá Thuong Hist
giành cho những người khong biat phat am chit 1a gi vẫn đánh được chữ Hán
RAT MONG QUÝ VỊ GÓP Ỷ KIẾN ĐỂ HỆ NÀY HOẠT PONG TOT HON NHÓM TÁC GIẢ
XIN CHAN THANH CAM ON.