2 Mở ra khả năng chia xế, khai thác nguồn thĩng tin của thể giới ghi bảng chứ tượng hình phục vụ phụ cầu tao đổi kinh tế và văn hố với các nước " đồng văn " trạng khu vực, 3 Mở ra khả nă
Trang 1ĐỀ TÀI KHOA HỌC CẤP NHÀ NƯỚC
GIA! DOAN 1991 - 1985
De tai:
BUOC DAU UNG DUNG TIN HOC
DE BAO TON VA KHALI THẤC
THƯ TỊCH CỔ VIỆT NAM
kee
MASG CHỦ NHTEM : NCV, NGO THE TONG
CÓ QUAN — : VIÊN NGHIÊN CỨU HÁN NOM
LRUNG TÂM KHOA HỌC XÃ HỘI
VÀ NHÂN VĂN QUỐC GIÁ
1£/11/4
HÀ NỘI - 1994
Trang 2Phương pháp nghiên cứu cù
Kết quả cân phải dạt
Khả năng ứng dụng thực tế
Hiệu quả kính tế văn hoá
CHUONG | DAG DIEM CUA THU f1GH GỖ VÀ CHU VIET CO VIET NAM
- Thu tịch cổ chứa đựng vốn văn hoá truyền thống quí giá của dân tộc ta
Thực trạng hiện nay của kho
Ban phim soạn thảo văn hàn Hán Nôm
Ghép chữ Quốc ngít vào hệ soạn thảo văn bản Hân Nom
Kết luận
CHUONG Ill NGAN HANG DU LIEU HAN NOM
Sự tương thích với các hệ phần mềm của ngân hàng dũ liệu
“Thuật giải tìm kiếm, ứng dụng vào một ngàn hàng dĩ liệu Hán Nôm
Vi dụ áp cụng thuật giải xây dụng tệp quản ý văn khắc Hán Nôm
Quản lý ảnh thư tịch Hán Nom
Khả năng nén ngân hàng đữ liệu vio CD-Rom
20
2
22
26 27
Trang 3A BAO CÁO TONG KET DE TAL "BƯỚC ĐẦU ỨNG DỤNG TIN HOC
DE BAO TỔN VÀ KHAI THAC DI SAN THU TỊCH CỔ VIET NAAT" [ TIN HỌC HÁN NÔM ]
đủ khí thành lấp tới nay, Viện tiên hành các công tác sưu tim, quản lí,
khai thác theo phương pháp truyền thong, để cung cấp tư liêu cho các ngành
nghiền cứu khe học xã hội, nhưng với lao đông thủ công, hiệu đả và chả
lượng các sản phẩm đưa ra còn bị hàn chế do có sư c lâm chạp, Jang phi MỊ
Số ngành khác trong nước cú nhu cầu sử dưng bộ ckữ tượng hình để ià ứa các Sách y học, và tử điển phục vụ giáo dục và khoa học, nhưng trong nước không có nơi nàa nghiên cứu để đấp ứng, Trước tỉnh hình thức te đồi hải, ` cán bồ của Viên Hđán Nêm dã cùng với các chuyên viên am hiếu Tin hoe của các ngành khác rự nghiên cức tìm hiểu, với sự tre giúp của Rộ Khoa học cone nghệ và mỗi trường, và Chương trình Điện tứ Tâm học cấp Nhà rước
C 0L đã đi tới xảy dựng thành một để tài nghiên cứu kooa hoc va XẺ hoạch,
có tổ chức
l2 Khối di sin ma Wien Hin Nom có trách nhiệm quản lí và khai thi:
tài sản vẫn hoá của đân tộc tản mạn Khấp nơi, rất cấp phải thu thấp,
quốn và khat thác để phục vụ đường lỐi xây dưng niến vàn 10ủ mới, nhưng vì nhigu li do, trong do li do quan trọng la thư tích được việt bang thi chu
tổ về di hộ phân được định hình tren giây gỗ (cellulose), để quá làu
trong ciểu kiện bãn quản kém lại ñ người đoe đợc, nền dang bị hao môn hưý hai, mất mất, và lăng quêm' Nếu Khong làm kíp thời thì sẽ xây ra ngày
2) La mot quốc gia có vị trí quan trong trong kh vue Wong Nam Á nền văn
hod Mu dé của ta gắn bó với văn hoá của Khu vực Sáu nhiều thập kỳ đấu
tranh giảnh được độc lặp, thống nhết và giải phóng Tổ quốc, nước ta bước
vào “hời kì canh tân mó của đổ giáo lưu và xảy dụng Trao đói thông tin ;ä
một đùn bây quan trọng hồ trụ cho sự nghiệp phát triển của mọi quốc gia É vêO lắc nước ia cẩu cũ các công cụ giao lưu với khu vực, thì là bị hàng rào cấm vận ngân căn sự du n¡ập các công nghệ mũi nhơn Chính vị Hage Sheng ngudi làm Khoa hoc của Việt Nam phải "tự thân vận động" tìm
) Ngoai nhiing van dé ed tin chét toần quốc như trên xét vẻ ng lực
ol gl chuyến gia, và đổi trọng cẩn giải quyết, để tài sả tập hợp, huy
Hong ròng rãi cán bỏ thuộc các ngành khác nhau, nên sản được quan iam ở
cẩn độ quốc gia
Trang 4
IH- KHẢ NĂNG THỤỰC THỊ
Nhin tng quit, dưới con mất của Tỉ: học, tất of các công viec nghiên cứu của Viên đểu có thể qui về hai thao tác chính là " VÀO và RA "
{ INEUT và OUTPUT) của Ti học, nhưng dạng thức dữ liệu của "dâu vào" và
“dau ra' có nhiều chủng loại và cấp độ khác nhau, cần có sự phối-hợp của
chuyên gia ngành ngữ văn (Hán Nom) va chuyên gia Tin học thì sẽ dân dén giải quyết được Tin học phi fatin (non-latin)
thành, và đạt mội số thành tựu, ta đi sâu, có thể tt
và kinh nghiệm của người đi trước Thêm nda, những diéu ta mong muon làm cũng gần giống điểu mong muốn của các nhà nghiên cúu khoa học xã hỏi trên thể giới mà nhiều chuyên gia Khoa học Việt Nam đi ra nước ngoài
trau đổi đã từng biết ngũ trong nước ít nhiều cũng đã cd, Mi-cdc le trên, chúng tôi cho rằng để tài này có tình khả thi
thể giới mới hình
n thu những thành tựu
TV- MỤC TIẾT: CỦA ĐỂ TÀI:
Xay dung co sô ban đấu cho việc du nhấp và phát triển công nghệ tin học phí laiiuh ở Việt nam, eu thé:
i- Trang bị một e2 sở nghiên cứu ứng dụng tin học chuyên xử lí kỉ tụ tượng hình ở Việt Nam, đào tao đội ngũ cán bộ ban đầu cao việc này 2- Nghiên cửu dua chi Han,
chi Nom vio máy tính để soan thảu, ic ấn,
quan fi cing voi cha Viet hier dai
NOI DUNG NitFEM VU CUa DE TAL
tC Nghien cau dng dung x Ii van ban chy Han, ch Nom trên phương tiện
tin học ở Viết Nam
2- Bước đấu tin hoc hoá công tác nghiên cửu vàn bản cổ Việt Nam
â- Đào tạo đội ngũ cáu bộ có khả nàng lâm viếc chuyên xử E văn bản chữ
tượng hình
VI-PHƯƠNG PHÁP NGHIÊN CỨU CỦA ĐỂ TÀI;
- Kết hợp nghiên cúu cơ bản về văn từ Hán Nôm, với nghiên cứu cơ bản
về tin học, tiến thu kinh nghiệm và thành quả của thể giới Hẹp tác với
quốc tế để giải quyết những vấn để củn thiết,
VH- KẾT QUÁ CẨN PHẢI ĐẠT :
1) Sử dụng và cải tiến tiến phẩn mềm đánh chữ Hán trên máy tính,
2) Đưa chủ Nom cia Viet Nam vào kho từ vụng trong máy Lập trình để Soạn thảo và ín ẩn các joại chữ tượng hình (Hán + Nôm) cùng với chữ Việt hiện đại, tạ thành công cụ phần mềm cho các ứng dụng,
3) Bước đầu tin học hoá công tác nghiên cứu văn bản cổ Viết Nam ; dua
các nội dung thư tịch vào máy để quản lí và khai thác,
4) Đần tạo đội ngũ cán bỏ cô khả năng làm việc chuyên xử li văn bán chủ
tương hình
Trang 5
Vill- KHA NANG UNG DUNG THUC TE;
~ Trude mit : ung dụng để soạn thảo và lưu trữ các văn bản chứ Hản, chủ Nom
~ Tuong lai: mé réng ra cde vay dung Kae ngodi viee scan 1
2) Mở ra khả năng chia xế, khai thác nguồn thóng tin của thể giới ghi bảng chứ tượng hình phục vụ phụ cầu tao đổi kinh tế và văn hoá với các nước " đồng văn " trạng khu vực,
3) Mở ra khả năng hợp tác quốc tế về phát triển công nghệ thông tin
với các nước này,
Trang 6
CHƯƠNG I
DAC DIEM CUA THU TICH C6 VA CHU vier CỔ VIỆT NAM
1)» Thr tich cổ chứa đựng vốn văn hod truyén thống quý giá của dân tộc ta :
lệt Nam là đi sản của một nến văn hố ban dia
phát triển trắt hàng ngàn nêm, từng chíu ảnh hưởng của 3 nên vši hơi hin của thể giới đã cĩ chữ viết là Trung Hoa, Ấn Độ, Á-rân, cho nến chữ viết để lại trên thư tịch cổ của ta tới nay gồm 3 lnại là chứ Nêm (Nơm của người Kinh, Nom Tay, Nơm Dao), chủ Thái, chữ Khøme và chứ Chùm Tuy nhiên chủ Hán và chứ Nom là loại thư tịch chiếm lÿ trong lớn nhất
Nội dùng thư tịch chứa những giá trị tỉnh thẩn cao quý vẻ đạo lí làm
người, nhúng tr liêu về trì thức, kinh nghiệu đơàu kết xảy dựng và quản lý đất nước của tổ tiên ta Tổng số thư tịch sẽ là kho "chúng từ gốc" vẻ chủ
quyển đất nước của cơng đồng các dân tộc Việt Nam
~ Vừa qua thể giới cơng nhận một số danh nhân vất: hố của dân tĩc tú đã
cĩ cổng hiến tích cực với nền van hố nhản loaj như Nguyễn Iu, Nguyễn Trãi, Hổ Chí Minh Điểu đáng cné ý là
tác phẩm hay nhất của các vị ây sảng
tác bằng chữ Việt (Nơm và Quốc ngữ) Bằng sử liệu tử trong kho thư tịch rẻ, chúng tu dã chứng minh cho thế giới thấy rêng chủ nghĩa nhân đạo Việt Nam rất cau: từ cách đây 50U năm người Việt Nam đã tha bồng 10 van hàng binh:
vit “trai chiếu hoa" cbo đồn quản bại tị
tung gây rấi nhiều tội ác với đân tạ
lãng xĩm và cơng đồng cử đân được phi lại rất nhiều trên bi kỉ
~ Rất nhiều tên đất Việt Nam được ghi chép bằng chữ Nơm trong bi ki va
sách về,
{ Hàng ngàn mốc giới điển cau, trong bản đổ cĩ tên gọi kiểu Âu như
Béatrice, Hélene, Blisabete ma người Phép đã đổi đầt trong thời gián họ tạm chiếm, thì gần đây Nhà nước ta đã đổi lại để khẳng định chủ quyếi
bảo vệ tính dân tộc của các tên đất đĩ)
chủ Quốc ngữ thì tểng Việt, va do dé cht Nom [ cong cụ giao tiếp chung,
để đón kết cơng đồng các dân tộc Việt Nam
Trang 7+ be
- Với những truyền thống tất đẹp kể trên nếu được phát huy và bổi dưỡng,
nhất định đân tộc ta sẽ vượt qna được mọi thử thách để tiến lên, và sẽ có
vi trí xứng đáng trong nên văn mình cỏa nhân loại
2- Thực trạng hiện nay của kho đi sản thư tịch cổ :
Hiện nay, Viện Hán Nôm thực hiện nhiệm vụ được Nhà Nước giao cho: tiếp
tục sưu tầm, bảo quản và khai thắc khối di sản đó Những cái ngày nay còn
giớ được chỉ là một phẩn rất nhỏ còn sót lại của quá trình huỷ hoại do
n nhiên, đơ con người cố ý hoặc " vô ý" lãng quên
= Trong lịch sử, nhiều lẩn tài sản văn hoá chứ viết của nước ta đã bị
huỷ boại: thời Trấn, người Chiếm Thành đã sào đốt phá sinh thanh Thang _ Lang, sách vỏ ra tro ¡ sau kbi nhà Hồ bị thất bại vua Minh Thành Tổ ra
lệnh phả huỷ hết vạch mọi hiện và: mang chữ," không được để sốt lai một chữ
nào"; các cuộc nội chiến thời Lê thời Mạc đã bao lên thiếu huỳ cung
điện, kho sách, và " sách vũ hị vt đẩy đường phổ
~ Đến thửi cân đại, vì ngườ: ta mài theo Tây học, không
niên đem bản chủ người phất quat, làm khuôn đúc nội, vào làm bội giây; Dịa
để thì đập phá để nung vôi làm cổi , bắc cẩu ao
Nha nude tạ rất chú ý
bảo tổn và phát huy nhũng di sản văn hoá của dân
tóc Đã có những chính sách cụ thể Nhưng Ở một số nơi vẫn còn những hiên
tương vỏ ý thức phá huỷ di tích lịch sử, di val mang cht hoặc do thiên
tạ, địch boạ, sở di sản còn chưa thu thập vẫn tiếp tục bj hao mon, md:
mat
De vậy, yêu cầu củp bách dạ: ra Íà phải sưu tẩm những văn bản tản mát,
rải rác ở nhiều nơi, tập trung về một chỗ để bảo vệ giám định và khai thúc
Công viếc đó đối hổi kinh phí lớn, và nếu chỉ làm bảng sức lao động thủ
công như trước, thì khòng biết tới bao giờ mới xong, trong khí đó hiện
tương mất mắt cứ hàng ngày hàng giờ điền ra Một yêu cầu cần cấp nữa là
phải nhân bản những văn bản đã sưu tẩm duoc dem bảo quản ở nhiều nơi môi
mật để tao điểu kiên thuận lợi cho người nghiên cửu, khai thác, không phải
trực tiếp cấm vào hiên vật nhằm kếo dài tuổi thọ của nguyên bản, (vì
chủng đếu là giấy mông): một khác để để phòng tai hoa xảy ra, mất nơi này,
Chữ Hán được dùng khá nhiễu trong các thư tịch cổ Việt Nam, nhiều
chữ Hán được mượn dùng nguyên xi làm chữ Nôm Chit Nom thuộc cừng một loại
với chứ Hần, nhưng không phải chỉ là chữ Háa
~ Người Việt Nam xưa không xác định ring ho chi ding mot pin mio cia
chữ Háu để làm chữ Nôm, mà lấy tất cả những chứ có thể lấy, ngoài ra, chủ
nào chưa có thì vẽ thêm, Vì vậy mà kho chứ Nôm tuy có báo gồm nhiều chữ
Hán, nhưng không phải chỉ có chữ Hián là đủ Hiện nay không một phin mém
chữ Hán nhập ngoại nào có đủ số chữ cần thiết cho vie bin Han Nôm (Tổng số
chit Nom hiện chưa sưu tẩm hết, đã có tối 6000 mặt chứ mới cẩn về thêm)
Trang 8
s6
T3à đã biết chứ Hân, nhưng các nhà khoa học đến phải học thêm chữ Nôm thì mới hiểu được văn bản cổ của Việt Nam, bởi vì hàng vạn các chữ tượng hình trong văn bản đã được dùng với tự cách là chữ Nôm, phải hiểu theo nghĩa
Nam
~ Tuy đôi với quốc gia ta hiện nay chứ Hán không còn được dùng tùm công
cụ giao tế chính thức và quan trọng như thời trước, nhưng 6 tong auc
vùng đồng bào gốc Hoa, hay ở một số quốc gia lắng giếng với tạ,,Chứ Hián
vẫn còn là một công cụ giao tiếp Vì vậy, ta cẩn phát triển công cụ này để khi cẩn cú thể sử dụng phục vụ việc trao đổi văn hoá và kinh tế với một số nước trong khu vực, tuy sổ quốc gia không nhiều nhưng sổ đãn lại chiếm tới
1/3 thế giới, vừa có nhiều điểm tương đồng với ta, vừa có thể là bạn hang
và thị trường lớn của tạ
4) Đặc thù về yêu cẩu bảo lưu, khai thác băng tin học :
Để có thể đem sức mạnh của Tín học phuc vụ nghiên cúu, khai thác các
tài liệu ghỉ bằng chữ Hán, chi? Nom, trong tình hình hiện nay, cẩn chú trọng
vào 2 vấn để sau đây
s/- Vấn để mã chứ và hình chữ :
~- Muốn dimg máy tính đễ xử lí, nghiên cứu văn bản Hún Nôm thì phải thể hiến được chữ Hán và chit Nom trong máy únh ( vàn bản Việt Nam có nhiều tên người, tên đất bảng chứ Nôm, vì vậy ngoài chủ Hán, phải vẽ chữ Nêm)
- Các chữ Nâm vẽ thêm phải cồng cớ với chứ Hán có sẵn trong khó,
vì chúng thường được đùng xen lẫn với nhau,
~ Muốn bảo về về khai thác lâu đài di sản văn hoá của đân tộc, và giới
thiệu với quốc tế, chứ Nôm phải tham gia vào bảng mn chuẩn quốc tế để được
tôn trọng, đành chỗ Trình độ thông tin của quốc tế cũng không như trước nữa
bi- VỀ mặt tầng thư, lưu trấ +
- Trên cơ sử các công cụ xây dựng được, phải xây dựng Ngân hàng dữ liệu
Han Nom dé quan lí cà hiện vật, cÁ nội dung, đồng thời lưu trú, tìm kiểm và khai-thác theo phương pháp hiện đai{Ngân bàng sẽ gồm nội dòng thư tịch Han Nom và các bộ công cụ dạng điện toán, bảng tra tham khảo, phục vụ việc khai thắc đi sản đó.)
~ Phải có cách luu trữ ảnh chụp nguyên bản để bảo lưu đi sản như báo
vệ các "chứng từ gốc"
5) Kết luận chương :
Di sản thư tịch cổ có nhiều loại chữ, nhưng chu [lan va chit Nom chiếm
tỷ lẽ lớn nhất và cẩn giải quyết trước, Việc nảo vệ di sản thư tịch cổ để bảo vẹ vốn vàn hoá truyền thống là cấp bách
Hải việc vẽ chứ Nôm và xây dựng Ngân hàng đỡ liệu là 2 việc cơ bản cẩn lam trong bude dau ing dung Tin ho
Một điều lưu ý là : dây là lấn đầu Tin hoc đước ứ
xã hội Ấp đụng một công nghệ mới bao giờ
niệp đá quen làm việc với phong cách củ
sụ mới cẩn dưa vào đẩn đẩn, phải dé sử dụng,
mí
g đụng vào Khoa hoe
ũng khó khăn, lớp cần bộ trung
được đào tạo lại những sông
Ó sự giao tiếp thên thiên giữa
về người, đến mức "trong suốt" đối với người dùng Đó là những việc khó
Trang 9
ofa
CHƯƠNG H
MÃ HOÁ VÀ THỂ HIỆN CHỮ NÒM TRÊN MÁY TÍNH
[ Chương này có 5 tiết nhỏ như sau :
1~Các thể chữ Hán và chứ Nôm
2-Phương án tạo bộ chớ Nôm điện tử
3-Mã hoá chữ Nôm
4- Bàn phím suạn thảo văn bản Hán Nôm
§-Ghếp chữ Quốc ngữ vàu hệ soạn thảo văn bản Hán nôm
6-Kết luận chương.]
1/-CÁC THẺ CHỮ HÁN VÀ CHỮ NÔM
Lịch sử phát triển của các thể chứ Hán trên sơ sở chữ tượng hình Ở
Trung Quốc trải qua hàng nghìn với nhiều cách viết khác nhau Cho đến nay có thể khái quát thành 4 thể chính là Chân thể, Thửo thể, Triện thể và
Lệ thể Trên cơ sở 4 thể chính này đã nảy sinh ra nhiểu thể phụ như: kiấc thể, phỏng Tống thể, Hành khải thể vv (Xem hình 1) Đại đa số các văn bản viết bằng bút lòng đều có thể qui về Khi hoặc tương tự : Minh thể ;
Lê thể thường thấy trong các van bản có tính chất bat doa, thi boa, Cac đấu ẩn thường ding thé rien
Tuy nhiên có thể thấy rằng kể từ khi việc ăn oat trở thành công
đẹp hơn, mềm mại hơn, Về mật thể hiện thì Minh thể không những vẫn dâm bảo
viết bằng hút lông từ nghìn đời mà cồn
# (bàng ngang cột dọc) trên toàn hộ vã bản Những người thợ khắc gỗ thì cầm thấy dễ khắc chứ Minh thể hơn là chứ
Khải thể, trang khi đó aig, búi lắng viết chữ Minh thể lại quá khó khăn vì
chữ Khải thì thật là thuận Gen
trong thời kỉ Pháp thuộc (Bia công đức, văn tự điển thể các làng
đều thể hiện thea dang thể Khải và các thể tương tự, mặc dù thời kì đó người Việt Nam đã biết tới thể Minh thể đang thỉnh hành ở Trung Quốc Sung điểu co bản là các văn ban Han Nom ở ta nầu hết là số lượng nhàn ban ít, chưa cẩn tới một công nghệ ín ấn đúc chứ chì sản xuất hàng loạt như ở Trung Quốc Như vậy có thể thấy nét khác biệt co bản trong việc xuất bản các vàn tự ở Trung Quốc và các văn tụ Hán Nôm ở Việt Nam là: Các văn tự cú Trung Quốc đã chuyển từ ín giấy gió, in khắc gỗ sang dúc chứ chì: còn
văn ban Han Nom của ta cho đến nay
khắc ván cổ điển mà chưa được đúc chữ chì
ác
Í dừng lại đ mức chép tay hoặc
Trang 10aR
2/-PHƯƠNG ÁN TẠO BỘ CHỮ NÔM ĐIỆN TH
Thập kỉ cuối cùng của thế kỈ 20 này tiến bộ kĩ thuật thế giới được
đánh đấu bang một cuộc cách mạng vĩ đại trong ngành in ấn: đố là việc
chuyển từ công nghệ xếp chứ chì sang công nghệ xếp chứ điện tử Mộ: danh
mục nghề nghiệp - nghé xếp chứ chì - rất độc hại đã sớm cướp đi tuổi đời,
tuổi nghề của mấy thế hệ người lao động cha truyển con nối mà các Khoa học
về bảo hộ lao dộng tiên tiến nhất mới cách đây vài ba năm còn gian khổ
Gm biện pháp chống nhiễm độc cho ngành inathì đến ay đã bị xoá số „Ngành
ín ở các nước sà cả ở Việt Nam đã rất nhanh chóng chuyển từ công nghệ đúc chứ chì sang công nghệ "đúc chứ điên tủ” Chính trong hoàn cảnh này, đổi với thể hiện in ấn chứ Nom, sé that là điên rổ nếu như có ý định thu lại đồng chì cũ để bất dầu dic chit Nom chỉ Con đường đã vạch ra rõ ràng
la: ch Nom cia ống bà ta sẽ phải bỏ qua giai đoạn đúc chứ chì mà tỉ
Như đã nêu trên, chứ Nôm trong các văn bản Hán Nôm đe số là chữ Khải
thư (kiểu chữ viết bút lông), do đó công việc định thể cho chữ Nôm trong
khuôn khổ để tài này được dat ra la kin dau tiên, Để bảo đảm cho việc un
ấn tải hiên tốt rác vấn bản và để đăng cho việc làm chữ diện tử, ngay từ
đầu để tài đã chọn thể Minh thể để thể hiện chư Nôm,
Như vậy bộ chữ Nôm điện tử đầu tiền của nước ta sẻ có dang Minh thé
Chúng tôi thấy cẩn phải nhãn mạnh rằng cụm từ "Chữ Nôm điện tử” nều ra
ở đây không phải là ngẫu nhiên tùy tiện lý do là vì đây là lẫn đẩu tien chúng ta tạo ra một bộ chữ Nóm để đành cho việc in ẩn hàng loạt Thời điểm tiến hành tạo chữ lụi điển ra trong thập kỷ hế mạc ngành đúc chử chì, do
đó việc tạo chữ Nôm hiện nay không có cứ may được kế thừa kinh nghiệm đúc chữ Nöm chì mà vốn dĩ là không có Như vậy là chỉ có chế tạa chữ Nam ma cy thể là chữ Nôm điện tử chứ không có việc chế tạo chữ Nôm chỉ
1-Phân tích các radical tạo thành chứ Nôm
2-Xác định các bộ, cụm, thành tố co bản của chữ Hán có thể ghép thêm để
Tạo thành rừng chữ Nôm hoàn chỉnh
3-Ghép các bộ, cụm, thành tố của một hay nhiều chứ Hán để tạo thùnh từng ch? Nom Như vậy sơ đổ khối để tạo 1 chứ Nôm là như sau:
( xem sơ đổ khối ở hình vẽ 2_ }
Bướ 1 và bước 2 hoàn toàn phải làm trén giấy bút với tư duy của con người (đây là giai đoạn trước máy vì máy tính không có khả nang trợ giúp các nghiên cứu viên phải có kình nghiệm và hiểu biết cả về Hán lẫn Nom để xác định radical chính sẽ sử dụng) Các bước tiếp theo có thể đùng chương trình tự động hoá từng p5ẩn (có kết hợp sử dung con tố và hàn phim trong việc xâm hình chứ, tỉa sửa các nét chưa vừa ý}
Chương trình vẽ font 24 là chương trình cơ bản để hoàn thành nhiệm
Trang 11
9-
Quá trình nghiên cứu ïỉ mỉ cấu woe fort 24 nay dB cho phép dé tai trực tiếp can thiệp thẳng tới các thành tố của từng chữ lián (Xác định vị trí
sửa chứ đó trong font để truy nhập, trích từng nưành hoặc copy ra màn hình
cả chú) để cất sửa và lắp ghép, tạo thành một chứ Nôm
Hình số 3 nêu một ví du về việc tạo chữ Nôm từ hai thành tổ chứ Hún
~ Nhìn vào hình vẽ này mà phản tích ta thấy: ie #
ca Nom BEF (mối) được hợp thành tù chữ Trùng, XS và chữ A Midi
Nhưng
từ mảnh ch
1⁄2 ma trận,
Qua kinh nghiệm sử dụng và phản tích thấy rầng nên Jay chd Trang 1/3
ghép với chữ Mỗi 2/3 la via dep
( Cae hình 4, 5, 6 Ja phin DEMO ce ban cha ede bude ghép cae Radical, stra font chứ và kiếm tra font chủ trên mấy tink.)
ứ Trằng to bay Trùng bé (lấy từ mảnh chiếm 1/2 ma trận Bay 1/4 ma trân ?) Chủ Mỗi Hỹ từ MỖI 3/3 m trận hay lấy từ
Đi với font 15, vì đã số lont 24 nèn dé đấy nhanh lốc độ vẽ font,
để từi là sử dụng một thủ thuật sáng tạo là sửa chứa từ font 24 bảng một biện pháp được gọi là phương pháp 'tút mành fonL 24.Chương trình tra so
Độ font 15 bằng phương pháp rút mành nói trên (Phụ lục ) đã cho phép tac được một bộ font 15 nhấp, tuy không gọn đẹp, song văn bảo đảm hình dạng
"hao hao" của một chữ Nôm có thể nhận biết được trên mãn hình Một chương trình sửa fent Lễ (Phụ lục _.)đưa các chữ đó phóng te ra mân hình và cho
phép các nghiên cứu viên sử dụng cou Đỏ, ban phim để tín sửa từng chứ đã
vẽ,nháp đó Cách làm này có thuận ¿ợi hơn là vẽ toàn điện một chứ trên một
ma trần trông rỗng, chữa có một nét phác thảo sơ bộ làm chỗ dựa,
Phương pháp "Rút mãnh font 24" được nêu ở phụ lục Số
J, Theo số nết (từ ít tối nhiều)
2, Theo bộ, cụm (giống cách chía bộ thủ của chứ Hán),
3, Theo vấn chữ quốc ngữ (đủ phát âm của Việt nam mà thành)
'fuy nhiễn một văn để rất quan trong dạt ra cho để tài là: hẻ soạn tháo Hán Nôm của chúng ta sẽ phải bảo đảm cho việc sắp xếp trung cư sở dữ liệu được thông nhất Nếu chưa nấm được bản chất của van ty Han Nom trong máy tích thì tuổng như ở đây không có gì phải lưu tâm tớ: cả Sơng về thục
Trang 12~10-
chất vấn đế này đã nãy sinh và việc giải quyết là không đơn giản
Nếu như chúng ta chế mới hoàn toàn hộ chữ Hến & Nôm thì việc gần má cho
từng chữ Hán và chữ Nom sẽ hoàn toàn da ta bố trí Song vì thứ nhất là
khuôn khổ và kinh phí để tài có han, thú hai là văn tự Nom của ta sẽ phải
hoà nhập trao đổi với các văn tư thưển Hán ở trong và ngoài nước, chính vì
vay chiing ta đã thừa nhận cách gán mã của hệ Ý Thiên cho J3094 chữ Hán, Như
vậy để nghiên cứu phương án gần ma cho chit Nom để tài đã phải nghiên cứu
trất tự gần mã của người Trung Quốc
Khác với việc sắp xếp các ký tư 8 bít là theo vấn tiếng Anh ABCD việc
sấp xếp các chữ tượng hình 16 bịt thuộc vế khuôn khổ sắp xếp trật tự của
mã 2 byte Sử dụng chương Irình tự viết để kiếm tra trật tự sắp xếp mã
byte theo thi ty tang din (ir A440 trở đị chúng tôi thấy chữ Hân được số
xếp theo trật tự bộ thủ và số nét chứ không phải theo trật tự phát âm
Bang 1a trích 1 phần kết quả nghiên cu tat ty sap xếp chứ Hán do
chương trình cung cấp
Từ sự phát hiện này, lúc đầu chúng tôi nghĩ rằng có lễ việc sắp xếp chữ
Nôm của chúng ta cũng sẽ nên tuân theo cách sắp xếp chữ Hán là gọn hơn cả
Nhưng nếu lam như vậy thì sẽ gây khó khăn cho việc xuất bản các tÈ điển
Nêm - Quốc ngữ của ta sau này, bởi vì từ sau khi có chứ Quốc ngữ, các từ
điển của ta thường xếp theo vấn quốc ngữ kể cả từ điển Hán Việt ( Ví dụ Từ
n liắn Việt của Đào Duy Anb, Nguyễn Văn Khôn đếu sắp xếp theo
Quốc ngữ Các sách khác, nếu không xếp theo vấn quốc ngữ thì bọ cũng,
có J hãng tra Quốc ngữ kèm theo) Việc này đã thành mộ: :hối quen, thành truyền thông sắp xếp trong các Thư viện ở Việt Nam Nếu then ám Quốc ngử
thì chữ, Số: (họ Ngô) và chữ Z*ố, (cấy Ngô) phật được sấp xếp cạnh nhau rất
dễ tim những nếu sắp xếp bỏ thủ, sẽ làm cho hai chữ này phải cách xa nhau
hàng trăm trăng giấy
“Trang khi đó vì vùng chữ Nêm nằm riêng biệt khổi vùng chữ Hán nên cho
dù nếu tuân theo cách sắp xếp của chứ Hán thì chữ nói én cing khong có cách nào đứng liễn với nhau được,
Để dung hoà 2 giải pháp sắp xếp nêu trên và tìm lời thoát cho vấn để SORT cơ sở dữ liệu văn tự Hản Nôm: trong tương lại, để tài đã đi tới cách
giải quyết như sau:
Sắp xếp vùng chứ Nôm theo bộ tnủ vii cum (phương án 1)
Sắp xếp vững chữ Nôm theo phát âm Quốc ngứ (phương ấn 2)
- Tạo một ñle DBF gồm tập hợp các chứ Hán và chữ Nôm theo các tường cụm, bộ, phát &n để giúp cho viếc SORT cơ sở dử liệu sau này
của để tài nhằm đâm bảo cho kếi quả của để tài được ứng dụng nhanh chúng
ai
Tóm lạt
Trật tụ căn bản cũu khú chữ Hán Nôm mù UNICODE vũ SO cong bd He tt ty
Trang 13xi»
214 bộ thủ của Trung Quốc Dựa vào trật tự này để người ta kiểm tra từng chữ của các nước đưa vào hệ thống mã chuẩn quốc tế, Cồn trật tự trình bài
và sử dụng của Việt Nam là vấn quốc ngữ của các chứ Nôm và chữ Hiền Trại
tự trong font giành riêng cho chứ Môm mới sưu tẩm là trật tự truy nhập ngấu nhiên FIFO Dé dung hoà và đáp ứng được 3 yếu cẩu trên, chúng tôi
tổ chức một hệ quản lí chú Nôm (với các chương trình tiện ích) phuc vụ
(Xin xem trong phụ bản số _4_— giới thiệu về hệ này.)
4i- BẦN PHÍM SOẠN THẢO VĂN RẤN HẤN NÔM
So với việc soạn (hảo văn bản Quốc ngữ trên máy tính thì vấn để lựa chọn một phương pháp soạn thảo văn bản Hán Nêm trên máy tính có nhiều vấn
để phải cứu xét Người Trung Quốc gọi vấn dé này là "Trung vận du nhập
pháp": đó là qui tắc phim cho hé soạn thảo chứ tượng bình
Chữ quốc ngữ của ta chỉ gồm các chứ cái latin ghép vấn lai với nhau
Song từ ? năm qua đã tổn tại và lưu bành tới hàng chục qui tắc bàn phím
của nhiều nhóm tắc giả khác nhau, lun cho việc phổ cập tin học của tả nhiều lúc, nhiều nơi dã vấp phải nhứng khó khăn đáng kể Thực chất của sự "trăn trố" về qui tae ban phím tiếng Việt chỉ là ở chủ đặt các đấu tượng than những phường án khác nhau được nêu ra như "đánh đẩu trước, đánh dấu sau" (Hệ soạn thảo VnLab) "đánh chứ trước, bỏ đấu sau (Hệ soàn thảo VNI) và
‘Luy vay cho đến nay thì qui tắc bàn phím đánh theo mã điện 1n là được
ta chuông nhất Có lẻ đây vẽ là gui tác tối ưu và là cuối cùng ch hệ soạn thấp tiếng Viet
Nói như vậy để thấ
phải ngay từ đấu đã
nhiều năm thử nghiệm
rằng tuy chi | vấn để đơn giản như vậy nhưng không
định được cách giải quyết tối ưu, mà phải trải qua
Về phía chữ tượng hình thì "Hang liệt du nhập pháp" được người Trung Hoa ra chuộng hơn cả, nhất là các nhân viên dánh máy Bản chất của "du nhập pháp" này là việc dùng các mổ số toạ độ của bàn phím tiếng Ảnh gán cho các thành tố của chữ Hán Khi đánh thì gõ phim đưa chữ ra cửa số ở đáy mòn hình, rối chọn chứ đặt vào "vãn bản" (trong máy) So với các "du nhập pháp" khác như "Chủ âm du nhập pháp", "Ihủ vĩ má du nhập pháp" v.v thì "Hàng, liệt du nhập pháp" bảo đảm tỷ lệ đơn trị cao, người soạn thảo chỉ phải lựa chụn mỗi lần một chứ trong số 4,5 chữ được đưa ra dưới dầy màn hình để đặt vàn văn bản Còn các phương án kháctrung bình họ phải chon tới 25 chủ
n tượng đổng mã (tức là lệ đơn trị của các phương ấn này
dựng qui tắc ban phim chứ Nôm :heo quy tốc Hàng liệt của người Trung Quốc
vì đó là cách tân tiến hơn cả Tuy nhiên qua một thời gian thử nghiệm than
dò của để thí về phương pháp này lại cho thấy kết quả ngược lai: nhiều em lọc sinh hệ Trung văn và ngay cả những người làm công tác nghiên cúu có liêu quan tối chữ Hán cũng cảm thấy "mệt mỏi" khi sử đụng phương pháp Hùng
liệt Như vậy có thể kết bán được rằng phương pháp gắn mã Hàng liệt chỉ
thich hop với người bản ngữ Trung l]oa mà thôi còn người Việt Nam học Hán Noi, whi chúi quen viết chữ Quốc ngữ thì phương pháp này là khế chẩn nhàn
Trang 14
-12-
“Chem vao dó sự arn hiểu vổ cách viết chữ Han của người Việt Nam Đình thường
và ngay cả 1 số nhà nghiên cứu có kinh nghiệm Ta chug đẩy đủ, chưa có thôi
quen viết theo tự chuẩn mực, cho nên khi viết chữ lián thường xây ra
Hien tượng viết “rải cựa" (Cách viết bằng bút trên giấy, dù cho có
viết "trái cựa" đị nữa, người tạ vẫn có thể tạo được chữ trên giấy, nhưng
dùng bàn phím máy tính, nếu "gõ trái cựa" sẽ không cho ta hình chữ mong muốn
mà máy lại đưa ra những chủ khác hoặc máy báo rằng không só chữ dy Bang
cho thấy kết quả của việc "gỗ chủ trếi của" qua ví dụ chữ Bè) nếu
Số Theo mã thành (5 'ngoài trước trong sau’ <H?L>thi được chứ Phong, nếu
fo ma than w "trong trước ngoài sau '<l?H> thì khong 12 chữ Như vậy vấn để còn lại là phải tan đụng phương pháp gỗ Telcx của hàn ấy,
phím chữ Việt để thể hiện chữ Nom Song vi cac vin bản không đơn thuần chỉ
Thứ Nóm mà còn thường có cả chit Han lâu với chi Nom, vi vay cẩn phải lầm qui lắc bàn phím cho cả 1A094 chu Han mia Cong viée dược giải quyết theo 3 bước:
1 Làm theo qui tắc với bàn phin cho 3000 chế Nôm phổ biế:
2 Làm qui tác với bàn phim cho 7000 chữ Hán phổ biến trong van tự Liên Nẽm
3 Tổng hợp cả 2 qui
trên thành qui tắc bàn phím Han Nom
VỆ mặt kỳ thuật Tin học,công việc cân bản để tạo bàn phím đánh chữ
Han Nom là ở chỗ tạo lập một fle có cấu trúc (file of record), fife này
được tài ngay vào từ đấu kbi khỏi dòng hệ soạn thảo Han Nôm, Các dn
hiệu nhập vào từ bàn phím sé tham chiếu tới file này để xác định tổ hợp mã,
thiên và hộ Font chữ Nom cha dé tai tuo ra
Mặc dù về mặt kỹ thuật để xây dựng quy tắc bản phím chữ Nöm khôog phải
là coá phức tập, song ý tưởng xây dụng guy tắc Dan phím chữ Nom theo phuong én g6 telex Ja mot § trig Adc dao, rat phis hop vo! cong te soan thio Han Ném Uu diém ci qui tac ban phim nay 1a:
Quấc không có, vì vậy, nếu dùng tổng số âm Hán Việt để phân phổi cùng miệt
sổ lượng hình chứ Hân thì tỉ lệ số chứ Sng âm đưa ra cửa sẽ để lựa chọn
mỗi lấn sẽ dược giảm bốt }
3 Người không biết nói tiếng Trung Ó\
Trung Quốc, và không giỏi chứ Nòm ce
phiên âm và hiết so mẫu, nhất chữ
%, hoặc ngay cả không biểu chữ
nh được văn bản nếu có
§ị- GHÉP CHỮ QUỐC NGỮ VÀO HỆ SOẠN THẢO VĂN BẢN HAN NOM
Mác dù việc ghép chữ Viết vào hệ s áo van ban Han Nom chi ia mot
bước mở rộng của để tài, song ngày từ đầu để tài vẫn coi đầy là 1 nhiệm vụ cán phải hoàn thành
Trang 15
-13-
Thực vậy, các vấn bia Hần Nôm cổ ra đời từ trước khi có chứ Quốc ngữ
do đó không hể tổn tại các hình thức ghép quốc ngữ với chit Han Nom Mat 86 văn bản Hán Nôm ra đời vào những ngày đấu của sự bành trướng của nr ba phương Tây vào Việt Nam (thí dụ như các văn bản trao đổi giữa tiểu Nguyi với các quan chức nước Pháp, hoặc các thương gia nước Anh ) thì việc ghép các văn tự tiếng Pháp, Anh (văn tự Latin) voi -chd tượng hình là không có gì phải quan tâm, bởi vì theo bằng ASCH thì tất cả*tõ họp các chữ lan với nhau không bể trùng với bất kỳ tổ hợp 2 byte của chữ tượng hình theo mã BIG-5,
Trong máy ứnh, hệ chứ Việt (Quốc ngữ) 8 bít ngoài "24 chữ
tiếng Anh sẵn có trên bàn phim lại có tới 134 kí tự mang dấu (dấu mũ và
dấu thanh) cần phải được gán mã thếm( tức là cẩn gianh thêm chỗ Các nhà Tin học Việt Ngữ đã tôn trọng bảng mã ASCI chuẩn, không cải biên, không sửa chứa gì vào các chữ cái ở đây(mặc dấu ở đồ có vài kí tự ít đùng boặc nấu như không dùng tới trong Việt ngữ), sở đĩ như vậy la vì họ muốn tận
dụng các mã kỉ Lự ấy trong soan thảo và trong điểu khiển máy ( để làm cá lệnh cho máy hiểu") Như vậy chỉ còn vùng ASCII mổ rông (có mã từ 128 đến
255)là có thể sử dụng để tạa chữ mới Vùng ấy lại chỉ còn có 128 vị trí mã,
do đó các nhóm chuyên gia Tín bọc người Viết phải đã gần tất các cả các mâ
ở vùng ASCH mở rộng cho chữ Việt (Đương nhiên họ phải bố tất cả các ký tư
đổ họa) mà vẫn không đủ chỗ Vì vậy Diệt số hệ soan thảo chứ Việt đã phải bổ trí chủ Việt xâm phạm vào vùng má điểu khiển có trị số nhỏ hơn 32 Trong trưởng hợp như vậy các hệ này chỉ đùng được trong một giới hạn rể: hẹp trong một hệ soạn thảo ván bản nhất định, hoàn toim không cho phếp hoà nhập chữ Việt với chữ Hán Nôm, bởi vì luôn luôn xảy ra hiện tượng mội vấn ghép 2 kỹ tự tiếng Việt sẽ có mã 2 byte trùng với 1 chữ tượng linh nào dấy,
Nếu như Driver màn hìmh chỉ phục vụ cho việc thể hiện chữ 2 byte thì rô
vùng số không thể biện được chữ Việt đối với máy in cũng vậy, mặc đủ đế
có lont chữ Việt cho mền hình và cho mấy im
“1/- thiết kế lại phần mếm driver màn hình của hệ Ý Thiên để đảm bảu hiện
đủ các vấn ghép tiếng Việt có vị trí lớn bơn 128 wong bảng mã ASCH 2/- Tan bo Font chữ Việt 2 by
3/- Gán lai vj tri ASCII cho các chữ Viết có đấu để đảm bảo cho các vin ghép tếng Việt không trùng với chữ Har 2 byte
Phương án thứ nhất chúng tôi loại bỏ ngay từ đấu vì lí do việc tạo một drwe màn hình đồi hỏi khả nbiểu công sức can thiệp vào hệ thống nhằm khiú
thác một đối tượng chưa hể biết Hơn nữa, cho dù có dé cong site dé fins
bang được, thị chỉ giúp ích cho khả nang thé hiện, mà không giúp chư khả
ming nghiên cứu tiếp tục trong các bẻ cơ sở dữ liệu, mà điểu này mới là
căn hắn
Phương ấn thứ 2 có lẽ hay hơn cả, vi trong tương lai, kho chữ điện tử quốc tế chắc chấn sẽ quản lí các mã 2 byte này là chính, Phương án này khá
dễ làm về mặt ,kĩ thuật, tiện cho cá việc thể hiện trén mãn kình và may in
“Thế nluang, cũng như phương án 1, phường án này khó đảm bảo cho việc đi vào
cơ sử dữ Hệu, hởi vì hảng chữ Viết chuẩn của chúng ta lại là chữ 8 hú
Trang 16-14-
các chữ Việt có dấu, Về thực chất còa phương pháp này là xảy dựng một hộ
*ASCI tiếng Việt nhằm đấm bảo trước hết các yêu cấu tối thiểu của để tài
t
- Hiện rõ chữ Nôm và chữ Quốc ngữ trên màn hình
- In được ra các loại máy Ín
7 Bho đầm cho vấn để tìm kiếm dễ dàng trong các cơ sở dữ liệu Hán Nom
Tuy nhiên, trong giai đoạn hiện nay, khi mà các vị trÌ trong pang ma
chuẩn quốc tế của cá chữ Nôm và cbứ Việt vẫn còn chưa được xác định cụ thể,
thì bộ (ASCI chứ Việt mà để tài tạo ra chủ có ý nghĩa lâm thời (vấn vì đụng được để hoà nhập với chứ Hảm, cũng là làm thời trong Khí mã, UNICODF
Và HO chưa được phổ biến chính thức), vi vậy mà chúng tôi goi Đằng này là
bộ mà "Lâm thei 1", Song song voi việc biên tap bo ma Lam thời 1, để tài
lộ làm sấn các chương trình dich ma (Convert) dé cho phép biến đổi mềm đếu
từ hệ mã Lâm thời J sang các hệ mã khác như mã Chuẩn Quốc gia, mã Bked, mã VNI mã 1SO nhằm dé dang cho việc xử lí các văn bản đã đưa vào máy tỉnh
bằng các hệ soạn thảo khác nhau,
6- KET LUAN CHUONG :
|e Dé tat di wo duce mot bộ công cụ vẽ chữ Nôm và gần mã chữ Nôm ding
trong khuôn khổ để tài và có thể tiếp tục sử dụng cho bước triển khai ứng
dụng để tài (vẽ thèm chữ, và gán thêm mã)
2- Quy tốc soạn thảo bằng bàn phim theơ âm Hún Việt là hết sức thuận Déo cho người Viết sử dụng CỔ thể ứng dụng ngay từ báy giờ chương trình san
thảo này vn cổng việc khổng lồ của Viện là due tư Hệu bị kí sách Han
Nom vao Inu tris 6 dia từ
3- Số chit Nom da vé (hon 2000 chi) cia để tài chỉ là nhằm phục vụ cấp,
tốc cho hội nghị IRG-2 để quốc tế công nhận clr Nom của Việt Nam, là bước
đấu ứng dụng thể hiện chữ Nôm trên máy tính điện tử và phù hợp với yêu cầu
để tài đất ra Dể tiếp tục bổ sung kho chữ điện tử nay cẩn phải sửa lai khá nhiều chữ, nhất là các chứ thuộc dạng ghép trái phải tỉ lệ rađiczl wai = 1/3, radical phai= 2/3
có sự tham Khảo với các chuyên gia Hán Nôm vế dạng và nét bộ chủ Nôm điện tử đấu tiên này Bước này không cầu phải thực hiện trước khi tiên hành triển khai ứng dụng, vì quy tắc gắn má của đế tài đã hoàn toàn cho pháp 2 việc nói trên có thể tiến hành độc lập với nhau, không ai phải chữ
ai
Trang 17
A ~ Với mục tiêu thông tin boá kho dí sản Hón Nôm của Việt Nam là
chính, kết bợp chuẩn bị kiến thức và công cụ để có thể chỉa vẻ khai :hấc
cguổn thông Ho của thể giới ghi bằng chứ tượng hình và hình ảnh, để tài
từng bước khảo sát nghiên cứu đặc thù của đối tượng mà mình cẩn quản lý
và tìm hiểu các giải thuật khả dĩ áp dụng
những nghiên cứu lý luận về quản trị e1
số dữ liệu của Xô cũ và gấn đây các hang phản mềm
lớn của Mỹ đã cho ra đòi các hệ quản tị dỡ liệu trên máy nhỏ Các hệ này
càng ngày cồng được cải tiếu, như Dbase 2, IDpase 3, Dhase 4, Foxbase,
Foxplus, Clipper, Rbas, Foxpro 1, Foxpro 2.x, Superbase, Paradox, Oracle,
vv la những hệ có thế đùng trên máy vi tính độc lập va sau, G6 din
đẩn chúng được cải tiến dùng trong mạng máy vi tính Tổ chức văn
hoá giáo dục của liên bựp quốc(UNISCƠ) cũng cho ra đời hệ quản lý thu viện
fe CDS/ISIS dễ sử dụng và " không phải trả tiến bản quyển ”
Qua nghiên cứu thực tế đối tượng kho sách Hún Nôm và tham khảo so sánh
tính năng của các hệ quản trị dữ liệu, chúng tôi thấy như sau :
= Di lieu Tin Nêm bao gồm nhiều loi
pha các dồng họ và các đơn vị hành chính có cấu trúc hình
mỏ hình "phân cấp", sách vở bi ký chứa nhiều tư liệu có thể vi
tích ra các tếp có cẩu trúc ứa đạng Mếu sử dụng ở mức thấp có th
mô hình quan hệ " (1/1) để quản ly, nhưng lén rức cao thì nảy
" môt nhiều "và "nhiều một " { ví dụ một cuốn sách có nhiều tác giả, - một
tấm bia ghi tên nhiều người ) Ngoài ra việc quản lý cả kho sách cổ nếu
đã thông tin hoá triệt để thì có yêu cẩu chụp nguyên dạng tất củ các trang
sách đó để bảo tổn, ời sử dụng cẩn thể dọc ục Hiếp mọi trang trên
máy tính Hiện nay dử liệu FoxPro 2.5 đùng trường kiểu GEN
(general) dé chia cde dữ Héu Ảnh]
- Từ hoàn lệt Nam (lúc để tài bất đấu cho tới hiện
nay) chỉ có các máy nhỏ (thường là AT-286, nay có 1 máy AT 386 chn AT-486
chưa có), công tác phản tích dữ iiệu trước khí nhập máy mới làm được ít
Vì vậy, việc chọn hệ nào cho thich hợp với ứng dụng bước đầu, va tac
điều kiên mổ rộng di sâu về sau là cẩn thiết Chúng tôi phải chọn một hệ
mềm đéo để sửa đổi cấu trúa, dễ bổ sung đử liệu, để khai tÌ dể sử đụng
và lại rẻ tiền
- Sau Khi so sánh, khảo sát chúng tỏi đã chọn hệ FoxPro 2x làm hệ cơ
dụng, Hệ này có mấy ưu điểm nổi bật sau đây ¡
à một trong các hệ mạnh nhất cho đến thời điểm gần đáy (1992-1993) | tap chỉ PO-Wold), b) Giá cả không đất lắm (toàn bỏ ró 490 USD) trong khi OBACLE gá tới
500.006 USD (giá mới của hệ mạng, năm 1994 gin day moi nhap vier Vier
a)
(Qua su đánh giá sản phẩm hàng năm củ
Trang 18sim
©) FoxPro Luơn được cải tiến, cĩ kế thừa thành tựu cũ từ Dbase, Foxbasc
và nâng cao lên dẩn Việc này làm che chỉ phí học tập, đào tạo đỡ tốn kém
người sử dụng cĩ thể tự họ, nâng cao kiến thức lên đấn,
đ) Nĩ hứa hẹn cho phép lưu trử ảnh chụp sốc trang
lý kèm tiếng nĩi khi đưa vào Windows (version 2.5) đ) Ngơn ngữ lập trình dễ bọc, (các lớp đào tạo ở Việt Nam đều cĩ dụy
hệ này) e) Cài đặt gà sử dụng khơng phức tập
Ä Việc "rất" dữ liệu qua hú từ hệ này với các hệ khác được thị
kế tốt do đĩ đâm bảo để đàng trong việc trao chuyển đứ liệu giữa cde he
quản trị dữ liêu ( ví dụ cĩ thể chuyển tài liệu qua hạ giữa FoxPro 2x
với các hệ Lotus 12.3, Visical, Arees hofic Oracle, hoac CDS/ISIS)
Sơ với cáo hệ liển thấu của nĩ mà người Việ: Nam quen sử dụng như
Dbase, Foxbase thủ đã cĩ những cải tiến rất rõ rệt như ;
- Tăng khả năng xứ lý và tìm kiếm trong trường memo (trudng memo
của FoxPre cĩ thể chia ra từng dịng, cĩ thể liệu trong đủ,
trong khỉ Foxbase thì khơng làm được như vậy)
~ Tiết kiệm vùng nhớ nhờ trường Memo được tổ chức theo kiểu mới: cần
tối đâu cấp phát tới đỏ (ở Foxnase, mỗi xhi dung trường memo, thì hệ thống
cấp phát tối thiểu là 512 byte, mặc cầu chỉ để ghí vài ký tự )
- Cĩ thể dưa ra mãn hình vài cửa sổ khác nhau, để người sử dụng
được dọc nhiều trang tư liệu khác nhau trưc tiếp trên màn hình trịng mor
lúc trong khí đĩ hệ CDS/ISIS chưa chờ phép thực hiện điều đĩ một cách dễ
đăng
- Tốc dộ xử lí đã dược cải tiến rõ rệt nhờ áp dụng kỹ thuật Rhussnorc „
- Và điểu quan trọng là hiện nay để tài đã nghiên cứu dua duce cht
Hán chữ Nom vao-trong EoxPro 20
1/~ THUẬT GIẢI TÌM KIEM UNG DUNG VAO MOT NGAN HANG DU LIBU HAN Wor
[Vi du quản }i văn khắc Hán Nom ]
1/- Viện Hán Nơm cẩn quản lý hơn 2 vạn bản rập văn bia mà hiện vật
(bía đá khắc chữ Hân Nám nằm rải rác ở các địa phương) Những hiệp vật là
chứng từ gốc về văn hố Nội dung của chúng được in rập trên giấy mỏng đem
về lưu trủ tại Viên Hán Nom, Các bản rập này vừa là đối tượng nghiên cúu
khai thác, vừa là tài liệu, là bản im của hiện vật trên giấy (cĩ thể gấp
lại cha gor)
2/- Các nhà khoa học và quản lý thường cẩn tìm hiểu nội dung của
chúng (hoặc các địa phương cẩn khai thác đi sân đã mất của họ, đơi khi cẩn
tìm hiểu từng chứ, tùng hoa văn của các thế kỳ trước để lại trên tấm bị
) Người tới mượn đọc cần đưa vào các thơng từ ban dau, vi du: yeu
cho xem 1 tém bia Ư nơi nào đĩ (cĩ tên xã, huyện, rỉnh); hộc yêu cầu chủ
xem 1 tấm bia do tác giả nàn đú (đã hiết tên) soạn, hoặc yên cẩu chủ xen
lại một tẩm bia cĩ phí nièn hiệu nào đĩ Cũng cĩ khi củn in ra 1 danh mục
tốm tắt nội dung của tất cả các bia đị: Tây Sơn (iừ năm 1789 đến 1402)
chẳng hạn Tuỳ yêu cẩu, mà người quản lí kho sách sẽ đáp ứng,
3/- Một cơ sở dứ liệu như vậy cẩn khơng gian nhớ khống 12 Mega byte trên
địa từ nên để ở 1 tệp duy nhất thì quan lí thuận tiện nhất “Tuy nhién do
điểu kiện hạn chế về rmấy nhơ, mơt máy tỉnh thường sử dụng vùo nhiều viếc
khác nhàu, các ở đĩa thường "đẩy cúng" đở liệu, muốn cổ riột khoảng trống
như vậy để làm việc cẩn phải nên thưởng xuyên các tếp để dễ sao lưuxoi