1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bước đầu ứng dụng tin học để bảo tồn và khai thác thư tịch cổ việt nam

36 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bước đầu ứng dụng tin học để bảo tồn và khai thác thư tịch cổ Việt Nam
Trường học Viện Nghiên Cứu Hán Nôm
Chuyên ngành Tin học Hán Nôm
Thể loại Đề tài khoa học
Năm xuất bản 1994
Thành phố Hà Nội
Định dạng
Số trang 36
Dung lượng 5,47 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

2 Mở ra khả năng chia xế, khai thác nguồn thĩng tin của thể giới ghi bảng chứ tượng hình phục vụ phụ cầu tao đổi kinh tế và văn hố với các nước " đồng văn " trạng khu vực, 3 Mở ra khả nă

Trang 1

ĐỀ TÀI KHOA HỌC CẤP NHÀ NƯỚC

GIA! DOAN 1991 - 1985

De tai:

BUOC DAU UNG DUNG TIN HOC

DE BAO TON VA KHALI THẤC

THƯ TỊCH CỔ VIỆT NAM

kee

MASG CHỦ NHTEM : NCV, NGO THE TONG

CÓ QUAN — : VIÊN NGHIÊN CỨU HÁN NOM

LRUNG TÂM KHOA HỌC XÃ HỘI

VÀ NHÂN VĂN QUỐC GIÁ

1£/11/4

HÀ NỘI - 1994

Trang 2

Phương pháp nghiên cứu cù

Kết quả cân phải dạt

Khả năng ứng dụng thực tế

Hiệu quả kính tế văn hoá

CHUONG | DAG DIEM CUA THU f1GH GỖ VÀ CHU VIET CO VIET NAM

- Thu tịch cổ chứa đựng vốn văn hoá truyền thống quí giá của dân tộc ta

Thực trạng hiện nay của kho

Ban phim soạn thảo văn hàn Hán Nôm

Ghép chữ Quốc ngít vào hệ soạn thảo văn bản Hân Nom

Kết luận

CHUONG Ill NGAN HANG DU LIEU HAN NOM

Sự tương thích với các hệ phần mềm của ngân hàng dũ liệu

“Thuật giải tìm kiếm, ứng dụng vào một ngàn hàng dĩ liệu Hán Nôm

Vi dụ áp cụng thuật giải xây dụng tệp quản ý văn khắc Hán Nôm

Quản lý ảnh thư tịch Hán Nom

Khả năng nén ngân hàng đữ liệu vio CD-Rom

20

2

22

26 27

Trang 3

A BAO CÁO TONG KET DE TAL "BƯỚC ĐẦU ỨNG DỤNG TIN HOC

DE BAO TỔN VÀ KHAI THAC DI SAN THU TỊCH CỔ VIET NAAT" [ TIN HỌC HÁN NÔM ]

đủ khí thành lấp tới nay, Viện tiên hành các công tác sưu tim, quản lí,

khai thác theo phương pháp truyền thong, để cung cấp tư liêu cho các ngành

nghiền cứu khe học xã hội, nhưng với lao đông thủ công, hiệu đả và chả

lượng các sản phẩm đưa ra còn bị hàn chế do có sư c lâm chạp, Jang phi MỊ

Số ngành khác trong nước cú nhu cầu sử dưng bộ ckữ tượng hình để ià ứa các Sách y học, và tử điển phục vụ giáo dục và khoa học, nhưng trong nước không có nơi nàa nghiên cứu để đấp ứng, Trước tỉnh hình thức te đồi hải, ` cán bồ của Viên Hđán Nêm dã cùng với các chuyên viên am hiếu Tin hoe của các ngành khác rự nghiên cức tìm hiểu, với sự tre giúp của Rộ Khoa học cone nghệ và mỗi trường, và Chương trình Điện tứ Tâm học cấp Nhà rước

C 0L đã đi tới xảy dựng thành một để tài nghiên cứu kooa hoc va XẺ hoạch,

có tổ chức

l2 Khối di sin ma Wien Hin Nom có trách nhiệm quản lí và khai thi:

tài sản vẫn hoá của đân tộc tản mạn Khấp nơi, rất cấp phải thu thấp,

quốn và khat thác để phục vụ đường lỐi xây dưng niến vàn 10ủ mới, nhưng vì nhigu li do, trong do li do quan trọng la thư tích được việt bang thi chu

tổ về di hộ phân được định hình tren giây gỗ (cellulose), để quá làu

trong ciểu kiện bãn quản kém lại ñ người đoe đợc, nền dang bị hao môn hưý hai, mất mất, và lăng quêm' Nếu Khong làm kíp thời thì sẽ xây ra ngày

2) La mot quốc gia có vị trí quan trong trong kh vue Wong Nam Á nền văn

hod Mu dé của ta gắn bó với văn hoá của Khu vực Sáu nhiều thập kỳ đấu

tranh giảnh được độc lặp, thống nhết và giải phóng Tổ quốc, nước ta bước

vào “hời kì canh tân mó của đổ giáo lưu và xảy dụng Trao đói thông tin ;ä

một đùn bây quan trọng hồ trụ cho sự nghiệp phát triển của mọi quốc gia É vêO lắc nước ia cẩu cũ các công cụ giao lưu với khu vực, thì là bị hàng rào cấm vận ngân căn sự du n¡ập các công nghệ mũi nhơn Chính vị Hage Sheng ngudi làm Khoa hoc của Việt Nam phải "tự thân vận động" tìm

) Ngoai nhiing van dé ed tin chét toần quốc như trên xét vẻ ng lực

ol gl chuyến gia, và đổi trọng cẩn giải quyết, để tài sả tập hợp, huy

Hong ròng rãi cán bỏ thuộc các ngành khác nhau, nên sản được quan iam ở

cẩn độ quốc gia

Trang 4

IH- KHẢ NĂNG THỤỰC THỊ

Nhin tng quit, dưới con mất của Tỉ: học, tất of các công viec nghiên cứu của Viên đểu có thể qui về hai thao tác chính là " VÀO và RA "

{ INEUT và OUTPUT) của Ti học, nhưng dạng thức dữ liệu của "dâu vào" và

“dau ra' có nhiều chủng loại và cấp độ khác nhau, cần có sự phối-hợp của

chuyên gia ngành ngữ văn (Hán Nom) va chuyên gia Tin học thì sẽ dân dén giải quyết được Tin học phi fatin (non-latin)

thành, và đạt mội số thành tựu, ta đi sâu, có thể tt

và kinh nghiệm của người đi trước Thêm nda, những diéu ta mong muon làm cũng gần giống điểu mong muốn của các nhà nghiên cúu khoa học xã hỏi trên thể giới mà nhiều chuyên gia Khoa học Việt Nam đi ra nước ngoài

trau đổi đã từng biết ngũ trong nước ít nhiều cũng đã cd, Mi-cdc le trên, chúng tôi cho rằng để tài này có tình khả thi

thể giới mới hình

n thu những thành tựu

TV- MỤC TIẾT: CỦA ĐỂ TÀI:

Xay dung co sô ban đấu cho việc du nhấp và phát triển công nghệ tin học phí laiiuh ở Việt nam, eu thé:

i- Trang bị một e2 sở nghiên cứu ứng dụng tin học chuyên xử lí kỉ tụ tượng hình ở Việt Nam, đào tao đội ngũ cán bộ ban đầu cao việc này 2- Nghiên cửu dua chi Han,

chi Nom vio máy tính để soan thảu, ic ấn,

quan fi cing voi cha Viet hier dai

NOI DUNG NitFEM VU CUa DE TAL

tC Nghien cau dng dung x Ii van ban chy Han, ch Nom trên phương tiện

tin học ở Viết Nam

2- Bước đấu tin hoc hoá công tác nghiên cửu vàn bản cổ Việt Nam

â- Đào tạo đội ngũ cáu bộ có khả nàng lâm viếc chuyên xử E văn bản chữ

tượng hình

VI-PHƯƠNG PHÁP NGHIÊN CỨU CỦA ĐỂ TÀI;

- Kết hợp nghiên cúu cơ bản về văn từ Hán Nôm, với nghiên cứu cơ bản

về tin học, tiến thu kinh nghiệm và thành quả của thể giới Hẹp tác với

quốc tế để giải quyết những vấn để củn thiết,

VH- KẾT QUÁ CẨN PHẢI ĐẠT :

1) Sử dụng và cải tiến tiến phẩn mềm đánh chữ Hán trên máy tính,

2) Đưa chủ Nom cia Viet Nam vào kho từ vụng trong máy Lập trình để Soạn thảo và ín ẩn các joại chữ tượng hình (Hán + Nôm) cùng với chữ Việt hiện đại, tạ thành công cụ phần mềm cho các ứng dụng,

3) Bước đầu tin học hoá công tác nghiên cứu văn bản cổ Viết Nam ; dua

các nội dung thư tịch vào máy để quản lí và khai thác,

4) Đần tạo đội ngũ cán bỏ cô khả năng làm việc chuyên xử li văn bán chủ

tương hình

Trang 5

Vill- KHA NANG UNG DUNG THUC TE;

~ Trude mit : ung dụng để soạn thảo và lưu trữ các văn bản chứ Hản, chủ Nom

~ Tuong lai: mé réng ra cde vay dung Kae ngodi viee scan 1

2) Mở ra khả năng chia xế, khai thác nguồn thóng tin của thể giới ghi bảng chứ tượng hình phục vụ phụ cầu tao đổi kinh tế và văn hoá với các nước " đồng văn " trạng khu vực,

3) Mở ra khả năng hợp tác quốc tế về phát triển công nghệ thông tin

với các nước này,

Trang 6

CHƯƠNG I

DAC DIEM CUA THU TICH C6 VA CHU vier CỔ VIỆT NAM

1)» Thr tich cổ chứa đựng vốn văn hod truyén thống quý giá của dân tộc ta :

lệt Nam là đi sản của một nến văn hố ban dia

phát triển trắt hàng ngàn nêm, từng chíu ảnh hưởng của 3 nên vši hơi hin của thể giới đã cĩ chữ viết là Trung Hoa, Ấn Độ, Á-rân, cho nến chữ viết để lại trên thư tịch cổ của ta tới nay gồm 3 lnại là chứ Nêm (Nơm của người Kinh, Nom Tay, Nơm Dao), chủ Thái, chữ Khøme và chứ Chùm Tuy nhiên chủ Hán và chứ Nom là loại thư tịch chiếm lÿ trong lớn nhất

Nội dùng thư tịch chứa những giá trị tỉnh thẩn cao quý vẻ đạo lí làm

người, nhúng tr liêu về trì thức, kinh nghiệu đơàu kết xảy dựng và quản lý đất nước của tổ tiên ta Tổng số thư tịch sẽ là kho "chúng từ gốc" vẻ chủ

quyển đất nước của cơng đồng các dân tộc Việt Nam

~ Vừa qua thể giới cơng nhận một số danh nhân vất: hố của dân tĩc tú đã

cĩ cổng hiến tích cực với nền van hố nhản loaj như Nguyễn Iu, Nguyễn Trãi, Hổ Chí Minh Điểu đáng cné ý là

tác phẩm hay nhất của các vị ây sảng

tác bằng chữ Việt (Nơm và Quốc ngữ) Bằng sử liệu tử trong kho thư tịch rẻ, chúng tu dã chứng minh cho thế giới thấy rêng chủ nghĩa nhân đạo Việt Nam rất cau: từ cách đây 50U năm người Việt Nam đã tha bồng 10 van hàng binh:

vit “trai chiếu hoa" cbo đồn quản bại tị

tung gây rấi nhiều tội ác với đân tạ

lãng xĩm và cơng đồng cử đân được phi lại rất nhiều trên bi kỉ

~ Rất nhiều tên đất Việt Nam được ghi chép bằng chữ Nơm trong bi ki va

sách về,

{ Hàng ngàn mốc giới điển cau, trong bản đổ cĩ tên gọi kiểu Âu như

Béatrice, Hélene, Blisabete ma người Phép đã đổi đầt trong thời gián họ tạm chiếm, thì gần đây Nhà nước ta đã đổi lại để khẳng định chủ quyếi

bảo vệ tính dân tộc của các tên đất đĩ)

chủ Quốc ngữ thì tểng Việt, va do dé cht Nom [ cong cụ giao tiếp chung,

để đón kết cơng đồng các dân tộc Việt Nam

Trang 7

+ be

- Với những truyền thống tất đẹp kể trên nếu được phát huy và bổi dưỡng,

nhất định đân tộc ta sẽ vượt qna được mọi thử thách để tiến lên, và sẽ có

vi trí xứng đáng trong nên văn mình cỏa nhân loại

2- Thực trạng hiện nay của kho đi sản thư tịch cổ :

Hiện nay, Viện Hán Nôm thực hiện nhiệm vụ được Nhà Nước giao cho: tiếp

tục sưu tầm, bảo quản và khai thắc khối di sản đó Những cái ngày nay còn

giớ được chỉ là một phẩn rất nhỏ còn sót lại của quá trình huỷ hoại do

n nhiên, đơ con người cố ý hoặc " vô ý" lãng quên

= Trong lịch sử, nhiều lẩn tài sản văn hoá chứ viết của nước ta đã bị

huỷ boại: thời Trấn, người Chiếm Thành đã sào đốt phá sinh thanh Thang _ Lang, sách vỏ ra tro ¡ sau kbi nhà Hồ bị thất bại vua Minh Thành Tổ ra

lệnh phả huỷ hết vạch mọi hiện và: mang chữ," không được để sốt lai một chữ

nào"; các cuộc nội chiến thời Lê thời Mạc đã bao lên thiếu huỳ cung

điện, kho sách, và " sách vũ hị vt đẩy đường phổ

~ Đến thửi cân đại, vì ngườ: ta mài theo Tây học, không

niên đem bản chủ người phất quat, làm khuôn đúc nội, vào làm bội giây; Dịa

để thì đập phá để nung vôi làm cổi , bắc cẩu ao

Nha nude tạ rất chú ý

bảo tổn và phát huy nhũng di sản văn hoá của dân

tóc Đã có những chính sách cụ thể Nhưng Ở một số nơi vẫn còn những hiên

tương vỏ ý thức phá huỷ di tích lịch sử, di val mang cht hoặc do thiên

tạ, địch boạ, sở di sản còn chưa thu thập vẫn tiếp tục bj hao mon, md:

mat

De vậy, yêu cầu củp bách dạ: ra Íà phải sưu tẩm những văn bản tản mát,

rải rác ở nhiều nơi, tập trung về một chỗ để bảo vệ giám định và khai thúc

Công viếc đó đối hổi kinh phí lớn, và nếu chỉ làm bảng sức lao động thủ

công như trước, thì khòng biết tới bao giờ mới xong, trong khí đó hiện

tương mất mắt cứ hàng ngày hàng giờ điền ra Một yêu cầu cần cấp nữa là

phải nhân bản những văn bản đã sưu tẩm duoc dem bảo quản ở nhiều nơi môi

mật để tao điểu kiên thuận lợi cho người nghiên cửu, khai thác, không phải

trực tiếp cấm vào hiên vật nhằm kếo dài tuổi thọ của nguyên bản, (vì

chủng đếu là giấy mông): một khác để để phòng tai hoa xảy ra, mất nơi này,

Chữ Hán được dùng khá nhiễu trong các thư tịch cổ Việt Nam, nhiều

chữ Hán được mượn dùng nguyên xi làm chữ Nôm Chit Nom thuộc cừng một loại

với chứ Hần, nhưng không phải chỉ là chữ Háa

~ Người Việt Nam xưa không xác định ring ho chi ding mot pin mio cia

chữ Háu để làm chữ Nôm, mà lấy tất cả những chứ có thể lấy, ngoài ra, chủ

nào chưa có thì vẽ thêm, Vì vậy mà kho chứ Nôm tuy có báo gồm nhiều chữ

Hán, nhưng không phải chỉ có chữ Hián là đủ Hiện nay không một phin mém

chữ Hán nhập ngoại nào có đủ số chữ cần thiết cho vie bin Han Nôm (Tổng số

chit Nom hiện chưa sưu tẩm hết, đã có tối 6000 mặt chứ mới cẩn về thêm)

Trang 8

s6

T3à đã biết chứ Hân, nhưng các nhà khoa học đến phải học thêm chữ Nôm thì mới hiểu được văn bản cổ của Việt Nam, bởi vì hàng vạn các chữ tượng hình trong văn bản đã được dùng với tự cách là chữ Nôm, phải hiểu theo nghĩa

Nam

~ Tuy đôi với quốc gia ta hiện nay chứ Hán không còn được dùng tùm công

cụ giao tế chính thức và quan trọng như thời trước, nhưng 6 tong auc

vùng đồng bào gốc Hoa, hay ở một số quốc gia lắng giếng với tạ,,Chứ Hián

vẫn còn là một công cụ giao tiếp Vì vậy, ta cẩn phát triển công cụ này để khi cẩn cú thể sử dụng phục vụ việc trao đổi văn hoá và kinh tế với một số nước trong khu vực, tuy sổ quốc gia không nhiều nhưng sổ đãn lại chiếm tới

1/3 thế giới, vừa có nhiều điểm tương đồng với ta, vừa có thể là bạn hang

và thị trường lớn của tạ

4) Đặc thù về yêu cẩu bảo lưu, khai thác băng tin học :

Để có thể đem sức mạnh của Tín học phuc vụ nghiên cúu, khai thác các

tài liệu ghỉ bằng chữ Hán, chi? Nom, trong tình hình hiện nay, cẩn chú trọng

vào 2 vấn để sau đây

s/- Vấn để mã chứ và hình chữ :

~- Muốn dimg máy tính đễ xử lí, nghiên cứu văn bản Hún Nôm thì phải thể hiến được chữ Hán và chit Nom trong máy únh ( vàn bản Việt Nam có nhiều tên người, tên đất bảng chứ Nôm, vì vậy ngoài chủ Hán, phải vẽ chữ Nêm)

- Các chữ Nâm vẽ thêm phải cồng cớ với chứ Hán có sẵn trong khó,

vì chúng thường được đùng xen lẫn với nhau,

~ Muốn bảo về về khai thác lâu đài di sản văn hoá của đân tộc, và giới

thiệu với quốc tế, chứ Nôm phải tham gia vào bảng mn chuẩn quốc tế để được

tôn trọng, đành chỗ Trình độ thông tin của quốc tế cũng không như trước nữa

bi- VỀ mặt tầng thư, lưu trấ +

- Trên cơ sử các công cụ xây dựng được, phải xây dựng Ngân hàng dữ liệu

Han Nom dé quan lí cà hiện vật, cÁ nội dung, đồng thời lưu trú, tìm kiểm và khai-thác theo phương pháp hiện đai{Ngân bàng sẽ gồm nội dòng thư tịch Han Nom và các bộ công cụ dạng điện toán, bảng tra tham khảo, phục vụ việc khai thắc đi sản đó.)

~ Phải có cách luu trữ ảnh chụp nguyên bản để bảo lưu đi sản như báo

vệ các "chứng từ gốc"

5) Kết luận chương :

Di sản thư tịch cổ có nhiều loại chữ, nhưng chu [lan va chit Nom chiếm

tỷ lẽ lớn nhất và cẩn giải quyết trước, Việc nảo vệ di sản thư tịch cổ để bảo vẹ vốn vàn hoá truyền thống là cấp bách

Hải việc vẽ chứ Nôm và xây dựng Ngân hàng đỡ liệu là 2 việc cơ bản cẩn lam trong bude dau ing dung Tin ho

Một điều lưu ý là : dây là lấn đầu Tin hoc đước ứ

xã hội Ấp đụng một công nghệ mới bao giờ

niệp đá quen làm việc với phong cách củ

sụ mới cẩn dưa vào đẩn đẩn, phải dé sử dụng,

g đụng vào Khoa hoe

ũng khó khăn, lớp cần bộ trung

được đào tạo lại những sông

Ó sự giao tiếp thên thiên giữa

về người, đến mức "trong suốt" đối với người dùng Đó là những việc khó

Trang 9

ofa

CHƯƠNG H

MÃ HOÁ VÀ THỂ HIỆN CHỮ NÒM TRÊN MÁY TÍNH

[ Chương này có 5 tiết nhỏ như sau :

1~Các thể chữ Hán và chứ Nôm

2-Phương án tạo bộ chớ Nôm điện tử

3-Mã hoá chữ Nôm

4- Bàn phím suạn thảo văn bản Hán Nôm

§-Ghếp chữ Quốc ngữ vàu hệ soạn thảo văn bản Hán nôm

6-Kết luận chương.]

1/-CÁC THẺ CHỮ HÁN VÀ CHỮ NÔM

Lịch sử phát triển của các thể chứ Hán trên sơ sở chữ tượng hình Ở

Trung Quốc trải qua hàng nghìn với nhiều cách viết khác nhau Cho đến nay có thể khái quát thành 4 thể chính là Chân thể, Thửo thể, Triện thể và

Lệ thể Trên cơ sở 4 thể chính này đã nảy sinh ra nhiểu thể phụ như: kiấc thể, phỏng Tống thể, Hành khải thể vv (Xem hình 1) Đại đa số các văn bản viết bằng bút lòng đều có thể qui về Khi hoặc tương tự : Minh thể ;

Lê thể thường thấy trong các van bản có tính chất bat doa, thi boa, Cac đấu ẩn thường ding thé rien

Tuy nhiên có thể thấy rằng kể từ khi việc ăn oat trở thành công

đẹp hơn, mềm mại hơn, Về mật thể hiện thì Minh thể không những vẫn dâm bảo

viết bằng hút lông từ nghìn đời mà cồn

# (bàng ngang cột dọc) trên toàn hộ vã bản Những người thợ khắc gỗ thì cầm thấy dễ khắc chứ Minh thể hơn là chứ

Khải thể, trang khi đó aig, búi lắng viết chữ Minh thể lại quá khó khăn vì

chữ Khải thì thật là thuận Gen

trong thời kỉ Pháp thuộc (Bia công đức, văn tự điển thể các làng

đều thể hiện thea dang thể Khải và các thể tương tự, mặc dù thời kì đó người Việt Nam đã biết tới thể Minh thể đang thỉnh hành ở Trung Quốc Sung điểu co bản là các văn ban Han Nom ở ta nầu hết là số lượng nhàn ban ít, chưa cẩn tới một công nghệ ín ấn đúc chứ chì sản xuất hàng loạt như ở Trung Quốc Như vậy có thể thấy nét khác biệt co bản trong việc xuất bản các vàn tự ở Trung Quốc và các văn tụ Hán Nôm ở Việt Nam là: Các văn tự cú Trung Quốc đã chuyển từ ín giấy gió, in khắc gỗ sang dúc chứ chì: còn

văn ban Han Nom của ta cho đến nay

khắc ván cổ điển mà chưa được đúc chữ chì

ác

Í dừng lại đ mức chép tay hoặc

Trang 10

aR

2/-PHƯƠNG ÁN TẠO BỘ CHỮ NÔM ĐIỆN TH

Thập kỉ cuối cùng của thế kỈ 20 này tiến bộ kĩ thuật thế giới được

đánh đấu bang một cuộc cách mạng vĩ đại trong ngành in ấn: đố là việc

chuyển từ công nghệ xếp chứ chì sang công nghệ xếp chứ điện tử Mộ: danh

mục nghề nghiệp - nghé xếp chứ chì - rất độc hại đã sớm cướp đi tuổi đời,

tuổi nghề của mấy thế hệ người lao động cha truyển con nối mà các Khoa học

về bảo hộ lao dộng tiên tiến nhất mới cách đây vài ba năm còn gian khổ

Gm biện pháp chống nhiễm độc cho ngành inathì đến ay đã bị xoá số „Ngành

ín ở các nước sà cả ở Việt Nam đã rất nhanh chóng chuyển từ công nghệ đúc chứ chì sang công nghệ "đúc chứ điên tủ” Chính trong hoàn cảnh này, đổi với thể hiện in ấn chứ Nom, sé that là điên rổ nếu như có ý định thu lại đồng chì cũ để bất dầu dic chit Nom chỉ Con đường đã vạch ra rõ ràng

la: ch Nom cia ống bà ta sẽ phải bỏ qua giai đoạn đúc chứ chì mà tỉ

Như đã nêu trên, chứ Nôm trong các văn bản Hán Nôm đe số là chữ Khải

thư (kiểu chữ viết bút lông), do đó công việc định thể cho chữ Nôm trong

khuôn khổ để tài này được dat ra la kin dau tiên, Để bảo đảm cho việc un

ấn tải hiên tốt rác vấn bản và để đăng cho việc làm chữ diện tử, ngay từ

đầu để tài đã chọn thể Minh thể để thể hiện chư Nôm,

Như vậy bộ chữ Nôm điện tử đầu tiền của nước ta sẻ có dang Minh thé

Chúng tôi thấy cẩn phải nhãn mạnh rằng cụm từ "Chữ Nôm điện tử” nều ra

ở đây không phải là ngẫu nhiên tùy tiện lý do là vì đây là lẫn đẩu tien chúng ta tạo ra một bộ chữ Nóm để đành cho việc in ẩn hàng loạt Thời điểm tiến hành tạo chữ lụi điển ra trong thập kỷ hế mạc ngành đúc chử chì, do

đó việc tạo chữ Nôm hiện nay không có cứ may được kế thừa kinh nghiệm đúc chữ Nöm chì mà vốn dĩ là không có Như vậy là chỉ có chế tạa chữ Nam ma cy thể là chữ Nôm điện tử chứ không có việc chế tạo chữ Nôm chỉ

1-Phân tích các radical tạo thành chứ Nôm

2-Xác định các bộ, cụm, thành tố co bản của chữ Hán có thể ghép thêm để

Tạo thành rừng chữ Nôm hoàn chỉnh

3-Ghép các bộ, cụm, thành tố của một hay nhiều chứ Hán để tạo thùnh từng ch? Nom Như vậy sơ đổ khối để tạo 1 chứ Nôm là như sau:

( xem sơ đổ khối ở hình vẽ 2_ }

Bướ 1 và bước 2 hoàn toàn phải làm trén giấy bút với tư duy của con người (đây là giai đoạn trước máy vì máy tính không có khả nang trợ giúp các nghiên cứu viên phải có kình nghiệm và hiểu biết cả về Hán lẫn Nom để xác định radical chính sẽ sử dụng) Các bước tiếp theo có thể đùng chương trình tự động hoá từng p5ẩn (có kết hợp sử dung con tố và hàn phim trong việc xâm hình chứ, tỉa sửa các nét chưa vừa ý}

Chương trình vẽ font 24 là chương trình cơ bản để hoàn thành nhiệm

Trang 11

9-

Quá trình nghiên cứu ïỉ mỉ cấu woe fort 24 nay dB cho phép dé tai trực tiếp can thiệp thẳng tới các thành tố của từng chữ lián (Xác định vị trí

sửa chứ đó trong font để truy nhập, trích từng nưành hoặc copy ra màn hình

cả chú) để cất sửa và lắp ghép, tạo thành một chứ Nôm

Hình số 3 nêu một ví du về việc tạo chữ Nôm từ hai thành tổ chứ Hún

~ Nhìn vào hình vẽ này mà phản tích ta thấy: ie #

ca Nom BEF (mối) được hợp thành tù chữ Trùng, XS và chữ A Midi

Nhưng

từ mảnh ch

1⁄2 ma trận,

Qua kinh nghiệm sử dụng và phản tích thấy rầng nên Jay chd Trang 1/3

ghép với chữ Mỗi 2/3 la via dep

( Cae hình 4, 5, 6 Ja phin DEMO ce ban cha ede bude ghép cae Radical, stra font chứ và kiếm tra font chủ trên mấy tink.)

ứ Trằng to bay Trùng bé (lấy từ mảnh chiếm 1/2 ma trận Bay 1/4 ma trân ?) Chủ Mỗi Hỹ từ MỖI 3/3 m trận hay lấy từ

Đi với font 15, vì đã số lont 24 nèn dé đấy nhanh lốc độ vẽ font,

để từi là sử dụng một thủ thuật sáng tạo là sửa chứa từ font 24 bảng một biện pháp được gọi là phương pháp 'tút mành fonL 24.Chương trình tra so

Độ font 15 bằng phương pháp rút mành nói trên (Phụ lục ) đã cho phép tac được một bộ font 15 nhấp, tuy không gọn đẹp, song văn bảo đảm hình dạng

"hao hao" của một chữ Nôm có thể nhận biết được trên mãn hình Một chương trình sửa fent Lễ (Phụ lục _.)đưa các chữ đó phóng te ra mân hình và cho

phép các nghiên cứu viên sử dụng cou Đỏ, ban phim để tín sửa từng chứ đã

vẽ,nháp đó Cách làm này có thuận ¿ợi hơn là vẽ toàn điện một chứ trên một

ma trần trông rỗng, chữa có một nét phác thảo sơ bộ làm chỗ dựa,

Phương pháp "Rút mãnh font 24" được nêu ở phụ lục Số

J, Theo số nết (từ ít tối nhiều)

2, Theo bộ, cụm (giống cách chía bộ thủ của chứ Hán),

3, Theo vấn chữ quốc ngữ (đủ phát âm của Việt nam mà thành)

'fuy nhiễn một văn để rất quan trong dạt ra cho để tài là: hẻ soạn tháo Hán Nôm của chúng ta sẽ phải bảo đảm cho việc sắp xếp trung cư sở dữ liệu được thông nhất Nếu chưa nấm được bản chất của van ty Han Nom trong máy tích thì tuổng như ở đây không có gì phải lưu tâm tớ: cả Sơng về thục

Trang 12

~10-

chất vấn đế này đã nãy sinh và việc giải quyết là không đơn giản

Nếu như chúng ta chế mới hoàn toàn hộ chữ Hến & Nôm thì việc gần má cho

từng chữ Hán và chữ Nom sẽ hoàn toàn da ta bố trí Song vì thứ nhất là

khuôn khổ và kinh phí để tài có han, thú hai là văn tự Nom của ta sẽ phải

hoà nhập trao đổi với các văn tư thưển Hán ở trong và ngoài nước, chính vì

vay chiing ta đã thừa nhận cách gán mã của hệ Ý Thiên cho J3094 chữ Hán, Như

vậy để nghiên cứu phương án gần ma cho chit Nom để tài đã phải nghiên cứu

trất tự gần mã của người Trung Quốc

Khác với việc sắp xếp các ký tư 8 bít là theo vấn tiếng Anh ABCD việc

sấp xếp các chữ tượng hình 16 bịt thuộc vế khuôn khổ sắp xếp trật tự của

mã 2 byte Sử dụng chương Irình tự viết để kiếm tra trật tự sắp xếp mã

byte theo thi ty tang din (ir A440 trở đị chúng tôi thấy chữ Hân được số

xếp theo trật tự bộ thủ và số nét chứ không phải theo trật tự phát âm

Bang 1a trích 1 phần kết quả nghiên cu tat ty sap xếp chứ Hán do

chương trình cung cấp

Từ sự phát hiện này, lúc đầu chúng tôi nghĩ rằng có lễ việc sắp xếp chữ

Nôm của chúng ta cũng sẽ nên tuân theo cách sắp xếp chữ Hán là gọn hơn cả

Nhưng nếu lam như vậy thì sẽ gây khó khăn cho việc xuất bản các tÈ điển

Nêm - Quốc ngữ của ta sau này, bởi vì từ sau khi có chứ Quốc ngữ, các từ

điển của ta thường xếp theo vấn quốc ngữ kể cả từ điển Hán Việt ( Ví dụ Từ

n liắn Việt của Đào Duy Anb, Nguyễn Văn Khôn đếu sắp xếp theo

Quốc ngữ Các sách khác, nếu không xếp theo vấn quốc ngữ thì bọ cũng,

có J hãng tra Quốc ngữ kèm theo) Việc này đã thành mộ: :hối quen, thành truyền thông sắp xếp trong các Thư viện ở Việt Nam Nếu then ám Quốc ngử

thì chữ, Số: (họ Ngô) và chữ Z*ố, (cấy Ngô) phật được sấp xếp cạnh nhau rất

dễ tim những nếu sắp xếp bỏ thủ, sẽ làm cho hai chữ này phải cách xa nhau

hàng trăm trăng giấy

“Trang khi đó vì vùng chữ Nêm nằm riêng biệt khổi vùng chữ Hán nên cho

dù nếu tuân theo cách sắp xếp của chứ Hán thì chữ nói én cing khong có cách nào đứng liễn với nhau được,

Để dung hoà 2 giải pháp sắp xếp nêu trên và tìm lời thoát cho vấn để SORT cơ sở dữ liệu văn tự Hản Nôm: trong tương lại, để tài đã đi tới cách

giải quyết như sau:

Sắp xếp vùng chứ Nôm theo bộ tnủ vii cum (phương án 1)

Sắp xếp vững chữ Nôm theo phát âm Quốc ngứ (phương ấn 2)

- Tạo một ñle DBF gồm tập hợp các chứ Hán và chữ Nôm theo các tường cụm, bộ, phát &n để giúp cho viếc SORT cơ sở dử liệu sau này

của để tài nhằm đâm bảo cho kếi quả của để tài được ứng dụng nhanh chúng

ai

Tóm lạt

Trật tụ căn bản cũu khú chữ Hán Nôm mù UNICODE vũ SO cong bd He tt ty

Trang 13

xi»

214 bộ thủ của Trung Quốc Dựa vào trật tự này để người ta kiểm tra từng chữ của các nước đưa vào hệ thống mã chuẩn quốc tế, Cồn trật tự trình bài

và sử dụng của Việt Nam là vấn quốc ngữ của các chứ Nôm và chữ Hiền Trại

tự trong font giành riêng cho chứ Môm mới sưu tẩm là trật tự truy nhập ngấu nhiên FIFO Dé dung hoà và đáp ứng được 3 yếu cẩu trên, chúng tôi

tổ chức một hệ quản lí chú Nôm (với các chương trình tiện ích) phuc vụ

(Xin xem trong phụ bản số _4_— giới thiệu về hệ này.)

4i- BẦN PHÍM SOẠN THẢO VĂN RẤN HẤN NÔM

So với việc soạn (hảo văn bản Quốc ngữ trên máy tính thì vấn để lựa chọn một phương pháp soạn thảo văn bản Hán Nêm trên máy tính có nhiều vấn

để phải cứu xét Người Trung Quốc gọi vấn dé này là "Trung vận du nhập

pháp": đó là qui tắc phim cho hé soạn thảo chứ tượng bình

Chữ quốc ngữ của ta chỉ gồm các chứ cái latin ghép vấn lai với nhau

Song từ ? năm qua đã tổn tại và lưu bành tới hàng chục qui tắc bàn phím

của nhiều nhóm tắc giả khác nhau, lun cho việc phổ cập tin học của tả nhiều lúc, nhiều nơi dã vấp phải nhứng khó khăn đáng kể Thực chất của sự "trăn trố" về qui tae ban phím tiếng Việt chỉ là ở chủ đặt các đấu tượng than những phường án khác nhau được nêu ra như "đánh đẩu trước, đánh dấu sau" (Hệ soạn thảo VnLab) "đánh chứ trước, bỏ đấu sau (Hệ soàn thảo VNI) và

‘Luy vay cho đến nay thì qui tắc bàn phím đánh theo mã điện 1n là được

ta chuông nhất Có lẻ đây vẽ là gui tác tối ưu và là cuối cùng ch hệ soạn thấp tiếng Viet

Nói như vậy để thấ

phải ngay từ đấu đã

nhiều năm thử nghiệm

rằng tuy chi | vấn để đơn giản như vậy nhưng không

định được cách giải quyết tối ưu, mà phải trải qua

Về phía chữ tượng hình thì "Hang liệt du nhập pháp" được người Trung Hoa ra chuộng hơn cả, nhất là các nhân viên dánh máy Bản chất của "du nhập pháp" này là việc dùng các mổ số toạ độ của bàn phím tiếng Ảnh gán cho các thành tố của chữ Hán Khi đánh thì gõ phim đưa chữ ra cửa số ở đáy mòn hình, rối chọn chứ đặt vào "vãn bản" (trong máy) So với các "du nhập pháp" khác như "Chủ âm du nhập pháp", "Ihủ vĩ má du nhập pháp" v.v thì "Hàng, liệt du nhập pháp" bảo đảm tỷ lệ đơn trị cao, người soạn thảo chỉ phải lựa chụn mỗi lần một chứ trong số 4,5 chữ được đưa ra dưới dầy màn hình để đặt vàn văn bản Còn các phương án kháctrung bình họ phải chon tới 25 chủ

n tượng đổng mã (tức là lệ đơn trị của các phương ấn này

dựng qui tắc ban phim chứ Nôm :heo quy tốc Hàng liệt của người Trung Quốc

vì đó là cách tân tiến hơn cả Tuy nhiên qua một thời gian thử nghiệm than

dò của để thí về phương pháp này lại cho thấy kết quả ngược lai: nhiều em lọc sinh hệ Trung văn và ngay cả những người làm công tác nghiên cúu có liêu quan tối chữ Hán cũng cảm thấy "mệt mỏi" khi sử đụng phương pháp Hùng

liệt Như vậy có thể kết bán được rằng phương pháp gắn mã Hàng liệt chỉ

thich hop với người bản ngữ Trung l]oa mà thôi còn người Việt Nam học Hán Noi, whi chúi quen viết chữ Quốc ngữ thì phương pháp này là khế chẩn nhàn

Trang 14

-12-

“Chem vao dó sự arn hiểu vổ cách viết chữ Han của người Việt Nam Đình thường

và ngay cả 1 số nhà nghiên cứu có kinh nghiệm Ta chug đẩy đủ, chưa có thôi

quen viết theo tự chuẩn mực, cho nên khi viết chữ lián thường xây ra

Hien tượng viết “rải cựa" (Cách viết bằng bút trên giấy, dù cho có

viết "trái cựa" đị nữa, người tạ vẫn có thể tạo được chữ trên giấy, nhưng

dùng bàn phím máy tính, nếu "gõ trái cựa" sẽ không cho ta hình chữ mong muốn

mà máy lại đưa ra những chủ khác hoặc máy báo rằng không só chữ dy Bang

cho thấy kết quả của việc "gỗ chủ trếi của" qua ví dụ chữ Bè) nếu

Số Theo mã thành (5 'ngoài trước trong sau’ <H?L>thi được chứ Phong, nếu

fo ma than w "trong trước ngoài sau '<l?H> thì khong 12 chữ Như vậy vấn để còn lại là phải tan đụng phương pháp gỗ Telcx của hàn ấy,

phím chữ Việt để thể hiện chữ Nom Song vi cac vin bản không đơn thuần chỉ

Thứ Nóm mà còn thường có cả chit Han lâu với chi Nom, vi vay cẩn phải lầm qui lắc bàn phím cho cả 1A094 chu Han mia Cong viée dược giải quyết theo 3 bước:

1 Làm theo qui tắc với bàn phin cho 3000 chế Nôm phổ biế:

2 Làm qui tác với bàn phim cho 7000 chữ Hán phổ biến trong van tự Liên Nẽm

3 Tổng hợp cả 2 qui

trên thành qui tắc bàn phím Han Nom

VỆ mặt kỳ thuật Tin học,công việc cân bản để tạo bàn phím đánh chữ

Han Nom là ở chỗ tạo lập một fle có cấu trúc (file of record), fife này

được tài ngay vào từ đấu kbi khỏi dòng hệ soạn thảo Han Nôm, Các dn

hiệu nhập vào từ bàn phím sé tham chiếu tới file này để xác định tổ hợp mã,

thiên và hộ Font chữ Nom cha dé tai tuo ra

Mặc dù về mặt kỹ thuật để xây dựng quy tắc bản phím chữ Nöm khôog phải

là coá phức tập, song ý tưởng xây dụng guy tắc Dan phím chữ Nom theo phuong én g6 telex Ja mot § trig Adc dao, rat phis hop vo! cong te soan thio Han Ném Uu diém ci qui tac ban phim nay 1a:

Quấc không có, vì vậy, nếu dùng tổng số âm Hán Việt để phân phổi cùng miệt

sổ lượng hình chứ Hân thì tỉ lệ số chứ Sng âm đưa ra cửa sẽ để lựa chọn

mỗi lấn sẽ dược giảm bốt }

3 Người không biết nói tiếng Trung Ó\

Trung Quốc, và không giỏi chứ Nòm ce

phiên âm và hiết so mẫu, nhất chữ

%, hoặc ngay cả không biểu chữ

nh được văn bản nếu có

§ị- GHÉP CHỮ QUỐC NGỮ VÀO HỆ SOẠN THẢO VĂN BẢN HAN NOM

Mác dù việc ghép chữ Viết vào hệ s áo van ban Han Nom chi ia mot

bước mở rộng của để tài, song ngày từ đầu để tài vẫn coi đầy là 1 nhiệm vụ cán phải hoàn thành

Trang 15

-13-

Thực vậy, các vấn bia Hần Nôm cổ ra đời từ trước khi có chứ Quốc ngữ

do đó không hể tổn tại các hình thức ghép quốc ngữ với chit Han Nom Mat 86 văn bản Hán Nôm ra đời vào những ngày đấu của sự bành trướng của nr ba phương Tây vào Việt Nam (thí dụ như các văn bản trao đổi giữa tiểu Nguyi với các quan chức nước Pháp, hoặc các thương gia nước Anh ) thì việc ghép các văn tự tiếng Pháp, Anh (văn tự Latin) voi -chd tượng hình là không có gì phải quan tâm, bởi vì theo bằng ASCH thì tất cả*tõ họp các chữ lan với nhau không bể trùng với bất kỳ tổ hợp 2 byte của chữ tượng hình theo mã BIG-5,

Trong máy ứnh, hệ chứ Việt (Quốc ngữ) 8 bít ngoài "24 chữ

tiếng Anh sẵn có trên bàn phim lại có tới 134 kí tự mang dấu (dấu mũ và

dấu thanh) cần phải được gán mã thếm( tức là cẩn gianh thêm chỗ Các nhà Tin học Việt Ngữ đã tôn trọng bảng mã ASCI chuẩn, không cải biên, không sửa chứa gì vào các chữ cái ở đây(mặc dấu ở đồ có vài kí tự ít đùng boặc nấu như không dùng tới trong Việt ngữ), sở đĩ như vậy la vì họ muốn tận

dụng các mã kỉ Lự ấy trong soan thảo và trong điểu khiển máy ( để làm cá lệnh cho máy hiểu") Như vậy chỉ còn vùng ASCII mổ rông (có mã từ 128 đến

255)là có thể sử dụng để tạa chữ mới Vùng ấy lại chỉ còn có 128 vị trí mã,

do đó các nhóm chuyên gia Tín bọc người Viết phải đã gần tất các cả các mâ

ở vùng ASCH mở rộng cho chữ Việt (Đương nhiên họ phải bố tất cả các ký tư

đổ họa) mà vẫn không đủ chỗ Vì vậy Diệt số hệ soan thảo chứ Việt đã phải bổ trí chủ Việt xâm phạm vào vùng má điểu khiển có trị số nhỏ hơn 32 Trong trưởng hợp như vậy các hệ này chỉ đùng được trong một giới hạn rể: hẹp trong một hệ soạn thảo ván bản nhất định, hoàn toim không cho phếp hoà nhập chữ Việt với chữ Hán Nôm, bởi vì luôn luôn xảy ra hiện tượng mội vấn ghép 2 kỹ tự tiếng Việt sẽ có mã 2 byte trùng với 1 chữ tượng linh nào dấy,

Nếu như Driver màn hìmh chỉ phục vụ cho việc thể hiện chữ 2 byte thì rô

vùng số không thể biện được chữ Việt đối với máy in cũng vậy, mặc đủ đế

có lont chữ Việt cho mền hình và cho mấy im

“1/- thiết kế lại phần mếm driver màn hình của hệ Ý Thiên để đảm bảu hiện

đủ các vấn ghép tiếng Việt có vị trí lớn bơn 128 wong bảng mã ASCH 2/- Tan bo Font chữ Việt 2 by

3/- Gán lai vj tri ASCII cho các chữ Viết có đấu để đảm bảo cho các vin ghép tếng Việt không trùng với chữ Har 2 byte

Phương án thứ nhất chúng tôi loại bỏ ngay từ đấu vì lí do việc tạo một drwe màn hình đồi hỏi khả nbiểu công sức can thiệp vào hệ thống nhằm khiú

thác một đối tượng chưa hể biết Hơn nữa, cho dù có dé cong site dé fins

bang được, thị chỉ giúp ích cho khả nang thé hiện, mà không giúp chư khả

ming nghiên cứu tiếp tục trong các bẻ cơ sở dữ liệu, mà điểu này mới là

căn hắn

Phương ấn thứ 2 có lẽ hay hơn cả, vi trong tương lai, kho chữ điện tử quốc tế chắc chấn sẽ quản lí các mã 2 byte này là chính, Phương án này khá

dễ làm về mặt ,kĩ thuật, tiện cho cá việc thể hiện trén mãn kình và may in

“Thế nluang, cũng như phương án 1, phường án này khó đảm bảo cho việc đi vào

cơ sử dữ Hệu, hởi vì hảng chữ Viết chuẩn của chúng ta lại là chữ 8 hú

Trang 16

-14-

các chữ Việt có dấu, Về thực chất còa phương pháp này là xảy dựng một hộ

*ASCI tiếng Việt nhằm đấm bảo trước hết các yêu cấu tối thiểu của để tài

t

- Hiện rõ chữ Nôm và chữ Quốc ngữ trên màn hình

- In được ra các loại máy Ín

7 Bho đầm cho vấn để tìm kiếm dễ dàng trong các cơ sở dữ liệu Hán Nom

Tuy nhiên, trong giai đoạn hiện nay, khi mà các vị trÌ trong pang ma

chuẩn quốc tế của cá chữ Nôm và cbứ Việt vẫn còn chưa được xác định cụ thể,

thì bộ (ASCI chứ Việt mà để tài tạo ra chủ có ý nghĩa lâm thời (vấn vì đụng được để hoà nhập với chứ Hảm, cũng là làm thời trong Khí mã, UNICODF

Và HO chưa được phổ biến chính thức), vi vậy mà chúng tôi goi Đằng này là

bộ mà "Lâm thei 1", Song song voi việc biên tap bo ma Lam thời 1, để tài

lộ làm sấn các chương trình dich ma (Convert) dé cho phép biến đổi mềm đếu

từ hệ mã Lâm thời J sang các hệ mã khác như mã Chuẩn Quốc gia, mã Bked, mã VNI mã 1SO nhằm dé dang cho việc xử lí các văn bản đã đưa vào máy tỉnh

bằng các hệ soạn thảo khác nhau,

6- KET LUAN CHUONG :

|e Dé tat di wo duce mot bộ công cụ vẽ chữ Nôm và gần mã chữ Nôm ding

trong khuôn khổ để tài và có thể tiếp tục sử dụng cho bước triển khai ứng

dụng để tài (vẽ thèm chữ, và gán thêm mã)

2- Quy tốc soạn thảo bằng bàn phim theơ âm Hún Việt là hết sức thuận Déo cho người Viết sử dụng CỔ thể ứng dụng ngay từ báy giờ chương trình san

thảo này vn cổng việc khổng lồ của Viện là due tư Hệu bị kí sách Han

Nom vao Inu tris 6 dia từ

3- Số chit Nom da vé (hon 2000 chi) cia để tài chỉ là nhằm phục vụ cấp,

tốc cho hội nghị IRG-2 để quốc tế công nhận clr Nom của Việt Nam, là bước

đấu ứng dụng thể hiện chữ Nôm trên máy tính điện tử và phù hợp với yêu cầu

để tài đất ra Dể tiếp tục bổ sung kho chữ điện tử nay cẩn phải sửa lai khá nhiều chữ, nhất là các chứ thuộc dạng ghép trái phải tỉ lệ rađiczl wai = 1/3, radical phai= 2/3

có sự tham Khảo với các chuyên gia Hán Nôm vế dạng và nét bộ chủ Nôm điện tử đấu tiên này Bước này không cầu phải thực hiện trước khi tiên hành triển khai ứng dụng, vì quy tắc gắn má của đế tài đã hoàn toàn cho pháp 2 việc nói trên có thể tiến hành độc lập với nhau, không ai phải chữ

ai

Trang 17

A ~ Với mục tiêu thông tin boá kho dí sản Hón Nôm của Việt Nam là

chính, kết bợp chuẩn bị kiến thức và công cụ để có thể chỉa vẻ khai :hấc

cguổn thông Ho của thể giới ghi bằng chứ tượng hình và hình ảnh, để tài

từng bước khảo sát nghiên cứu đặc thù của đối tượng mà mình cẩn quản lý

và tìm hiểu các giải thuật khả dĩ áp dụng

những nghiên cứu lý luận về quản trị e1

số dữ liệu của Xô cũ và gấn đây các hang phản mềm

lớn của Mỹ đã cho ra đòi các hệ quản tị dỡ liệu trên máy nhỏ Các hệ này

càng ngày cồng được cải tiếu, như Dbase 2, IDpase 3, Dhase 4, Foxbase,

Foxplus, Clipper, Rbas, Foxpro 1, Foxpro 2.x, Superbase, Paradox, Oracle,

vv la những hệ có thế đùng trên máy vi tính độc lập va sau, G6 din

đẩn chúng được cải tiến dùng trong mạng máy vi tính Tổ chức văn

hoá giáo dục của liên bựp quốc(UNISCƠ) cũng cho ra đời hệ quản lý thu viện

fe CDS/ISIS dễ sử dụng và " không phải trả tiến bản quyển ”

Qua nghiên cứu thực tế đối tượng kho sách Hún Nôm và tham khảo so sánh

tính năng của các hệ quản trị dữ liệu, chúng tôi thấy như sau :

= Di lieu Tin Nêm bao gồm nhiều loi

pha các dồng họ và các đơn vị hành chính có cấu trúc hình

mỏ hình "phân cấp", sách vở bi ký chứa nhiều tư liệu có thể vi

tích ra các tếp có cẩu trúc ứa đạng Mếu sử dụng ở mức thấp có th

mô hình quan hệ " (1/1) để quản ly, nhưng lén rức cao thì nảy

" môt nhiều "và "nhiều một " { ví dụ một cuốn sách có nhiều tác giả, - một

tấm bia ghi tên nhiều người ) Ngoài ra việc quản lý cả kho sách cổ nếu

đã thông tin hoá triệt để thì có yêu cẩu chụp nguyên dạng tất củ các trang

sách đó để bảo tổn, ời sử dụng cẩn thể dọc ục Hiếp mọi trang trên

máy tính Hiện nay dử liệu FoxPro 2.5 đùng trường kiểu GEN

(general) dé chia cde dữ Héu Ảnh]

- Từ hoàn lệt Nam (lúc để tài bất đấu cho tới hiện

nay) chỉ có các máy nhỏ (thường là AT-286, nay có 1 máy AT 386 chn AT-486

chưa có), công tác phản tích dữ iiệu trước khí nhập máy mới làm được ít

Vì vậy, việc chọn hệ nào cho thich hợp với ứng dụng bước đầu, va tac

điều kiên mổ rộng di sâu về sau là cẩn thiết Chúng tôi phải chọn một hệ

mềm đéo để sửa đổi cấu trúa, dễ bổ sung đử liệu, để khai tÌ dể sử đụng

và lại rẻ tiền

- Sau Khi so sánh, khảo sát chúng tỏi đã chọn hệ FoxPro 2x làm hệ cơ

dụng, Hệ này có mấy ưu điểm nổi bật sau đây ¡

à một trong các hệ mạnh nhất cho đến thời điểm gần đáy (1992-1993) | tap chỉ PO-Wold), b) Giá cả không đất lắm (toàn bỏ ró 490 USD) trong khi OBACLE gá tới

500.006 USD (giá mới của hệ mạng, năm 1994 gin day moi nhap vier Vier

a)

(Qua su đánh giá sản phẩm hàng năm củ

Trang 18

sim

©) FoxPro Luơn được cải tiến, cĩ kế thừa thành tựu cũ từ Dbase, Foxbasc

và nâng cao lên dẩn Việc này làm che chỉ phí học tập, đào tạo đỡ tốn kém

người sử dụng cĩ thể tự họ, nâng cao kiến thức lên đấn,

đ) Nĩ hứa hẹn cho phép lưu trử ảnh chụp sốc trang

lý kèm tiếng nĩi khi đưa vào Windows (version 2.5) đ) Ngơn ngữ lập trình dễ bọc, (các lớp đào tạo ở Việt Nam đều cĩ dụy

hệ này) e) Cài đặt gà sử dụng khơng phức tập

Ä Việc "rất" dữ liệu qua hú từ hệ này với các hệ khác được thị

kế tốt do đĩ đâm bảo để đàng trong việc trao chuyển đứ liệu giữa cde he

quản trị dữ liêu ( ví dụ cĩ thể chuyển tài liệu qua hạ giữa FoxPro 2x

với các hệ Lotus 12.3, Visical, Arees hofic Oracle, hoac CDS/ISIS)

Sơ với cáo hệ liển thấu của nĩ mà người Việ: Nam quen sử dụng như

Dbase, Foxbase thủ đã cĩ những cải tiến rất rõ rệt như ;

- Tăng khả năng xứ lý và tìm kiếm trong trường memo (trudng memo

của FoxPre cĩ thể chia ra từng dịng, cĩ thể liệu trong đủ,

trong khỉ Foxbase thì khơng làm được như vậy)

~ Tiết kiệm vùng nhớ nhờ trường Memo được tổ chức theo kiểu mới: cần

tối đâu cấp phát tới đỏ (ở Foxnase, mỗi xhi dung trường memo, thì hệ thống

cấp phát tối thiểu là 512 byte, mặc cầu chỉ để ghí vài ký tự )

- Cĩ thể dưa ra mãn hình vài cửa sổ khác nhau, để người sử dụng

được dọc nhiều trang tư liệu khác nhau trưc tiếp trên màn hình trịng mor

lúc trong khí đĩ hệ CDS/ISIS chưa chờ phép thực hiện điều đĩ một cách dễ

đăng

- Tốc dộ xử lí đã dược cải tiến rõ rệt nhờ áp dụng kỹ thuật Rhussnorc „

- Và điểu quan trọng là hiện nay để tài đã nghiên cứu dua duce cht

Hán chữ Nom vao-trong EoxPro 20

1/~ THUẬT GIẢI TÌM KIEM UNG DUNG VAO MOT NGAN HANG DU LIBU HAN Wor

[Vi du quản }i văn khắc Hán Nom ]

1/- Viện Hán Nơm cẩn quản lý hơn 2 vạn bản rập văn bia mà hiện vật

(bía đá khắc chữ Hân Nám nằm rải rác ở các địa phương) Những hiệp vật là

chứng từ gốc về văn hố Nội dung của chúng được in rập trên giấy mỏng đem

về lưu trủ tại Viên Hán Nom, Các bản rập này vừa là đối tượng nghiên cúu

khai thác, vừa là tài liệu, là bản im của hiện vật trên giấy (cĩ thể gấp

lại cha gor)

2/- Các nhà khoa học và quản lý thường cẩn tìm hiểu nội dung của

chúng (hoặc các địa phương cẩn khai thác đi sân đã mất của họ, đơi khi cẩn

tìm hiểu từng chứ, tùng hoa văn của các thế kỳ trước để lại trên tấm bị

) Người tới mượn đọc cần đưa vào các thơng từ ban dau, vi du: yeu

cho xem 1 tém bia Ư nơi nào đĩ (cĩ tên xã, huyện, rỉnh); hộc yêu cầu chủ

xem 1 tấm bia do tác giả nàn đú (đã hiết tên) soạn, hoặc yên cẩu chủ xen

lại một tẩm bia cĩ phí nièn hiệu nào đĩ Cũng cĩ khi củn in ra 1 danh mục

tốm tắt nội dung của tất cả các bia đị: Tây Sơn (iừ năm 1789 đến 1402)

chẳng hạn Tuỳ yêu cẩu, mà người quản lí kho sách sẽ đáp ứng,

3/- Một cơ sở dứ liệu như vậy cẩn khơng gian nhớ khống 12 Mega byte trên

địa từ nên để ở 1 tệp duy nhất thì quan lí thuận tiện nhất “Tuy nhién do

điểu kiện hạn chế về rmấy nhơ, mơt máy tỉnh thường sử dụng vùo nhiều viếc

khác nhàu, các ở đĩa thường "đẩy cúng" đở liệu, muốn cổ riột khoảng trống

như vậy để làm việc cẩn phải nên thưởng xuyên các tếp để dễ sao lưuxoi

Ngày đăng: 05/10/2023, 21:14

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w