1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bước đầu ứng dụng tin học để bảo vệ và khai thác di sản thư tịch cổ việt nam tin học hán nôm

61 1 0
Tài liệu được quét OCR, nội dung có thể không chính xác

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bước đầu ứng dụng tin học để bảo vệ và khai thác di sản thư tịch cổ Việt Nam
Trường học Viện Nghiên Cứu Hán Nôm
Chuyên ngành Tin học Hán Nôm
Thể loại Báo cáo
Năm xuất bản 1994
Thành phố Hà Nội
Định dạng
Số trang 61
Dung lượng 11,11 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Muốn thong tin hố, cấn phục chế và chụp tha nhỏ mới tiên sử dụng Phụ bản 4: Giới thiệu hệ chương trình quản lí chứ Nơm Việt Nam Hệ thống gồm nhiều tệp chương trình viết bằng ngơn ngũ Pas

Trang 1

ĐỀ TÀI KHOA HỌC CẤP NHÀ NƯỚC

GIẢI DOAN 1991 ~ 4995

BUOC DAU

UNG DUNG TIN HOC

DE BAG TON VA KHAI THAC

THU TICH CO VIET NAM

(TIN HOC HAN NOm)

- Bao cdo tom tat

> Tong quan vé ky thuat

- Các phụ bản

CHỦ NHIÊM ; NCV NGỘ PHỦ LONG

CO QUAN VIEN NGHIEN CUU HAN NOM

TRUNG TAM KHOA HOC XA LOL

VANIIAN VAN QUOC GIA

HÀ NỘI - 1994

Trang 2

Hà Nội ngày 1ã tháng 04 nam 1994

BAO CAO TOM TAT

TONG KET DE TAL TIN HOC BAN NOM (1992 - 1994)

Để tài "Tín học Hản Nôm" có tên gọi đẩy dủ là" Bước đẩu ứng dung

Tia hoc để bảo tổn khai thác di sản thư tịch cổ Việt Nam”Là một để tới

nghiên cứu khoa học độc lập cấp nhà nước được thành lập từ thúng ¿ nàn,

1992, kết thúc vào quý 2 năm 1994, do Viên Hân Nórp đăng cai củ trì, dưới Khoa học xã hội và Nhân văn Quốc gia Sau hai năm

ni dã hoàn thành nhiệm vụ để ra Nay tổ chú

+ những kết quả đã đat được, nêu mớt số kính

sự chủ quản của Trung tâm

tiển hành nghiên cứu, để t

nghiệm thu và báo cáo tổng k

nghiệm và kiến nghị vrình các cơ quan quản Wi cấp trên

+ Học tập cỗi biến phần mềm đánh chữ Hán cho người Việt

2 Xây dụng cơ sở bạn đầu cho Ngăn bàng đũ liu [an Nom,

4 - Vẽ chữ Nôm trong máy, đưa chữ Nôm tbam gia bằng mã chuẩn Quốc tế

4, Soạn thảo hỗn hợp chit Han Nom với chứ Quốc ngữ

Quét ánh sách Hiần Nôm dể lưu trừ

Phần II: Một số kinh nghiệm và kiến thức thu được về khua học công nghệ và về quản b

Phân IIE:Kết luận kiến nghị về hướng triển khai và nghiên cứu tiếp tục

CÁC PHỤ BẢN

Phụ bản 1: Biểu thị cách vẽ một chữ rượng hình trong may Unb

Phụ bản 2; Phiếu mô tả một tấm bia để quản lí

Phụ bản 3: Thể hiện việc dùng công nghệ mới để phục chế một vẫn bia cỉ

Phụ bản 4: Giới thiệu hệ chương tình quản lí chữ Nôm Việt Nam

Thụ bản 5: Bảng chứ Nôm chuẩn Việt Nam được Quốc tế cũng nhánCTCVN- 3773

(Nop riêng như hổ sơ kĩ thuật kèm Bao cáo "Tổng hợp)

Phụ bản 6: Báo cáo {dụ kiến] về nhiệm vụ xảy dựng bóng chữ Nôm điện tử

Phụ bản 7: Mã hoá và thể hiện chứ Nôm trên máy tỉnh

(xem chương 11 Báo cáo Tổng hợp), Phụ bản 8: Yêu cầu đối với các ch/mình phẩn mềm sẽ viết trong nam 1993

Phụ bản 9Quyết định š3-CPcủa Chính phủ về chữ viết các đân tộc thiểu số

Pbụ bản 16: Bước đầu xây dựng Nuun hang do feu Han Nom

( xem chương ìIT Báo cáo Téng hyp)

Phụ: bản tl: Ban in thd một từ điều của Từ Điển Hán Việt dưới Winduee : Phụ bản 12: Bản ín 1 trang sách Hán Nom gốc quết lưu bằng Scanner

Trang 3

CHÚ THÍCH SƠ LƯỢC CAC PHU BẢN

phụ bản J: Biểu thị cách vẽ một chữ lượng hình trong máy tỉnh

(Trước khi vẽ trên máy, cần tạo đáng bằng thủ công trên giấy Kẻ

ô, để người thao tác theo đủ, xám chữ trên ma trận điểm Ma

trấn này do nhóm để tài viết chương trình tạo ro)

Phụ bản 2: Phiếu mô tả một tấm bia để quản lí

(Sơ đổ mô tả lược thuật thông tin theo đụ kiến của chương trình hợp tác khoa học giữa Việt Nam Trung Quốc và Pháp)

Phụ bản 3: Thể hiện việc dùng công nghệ mới để phục chế một văn bia cổ

(Khuôn khổ các tim bia thường to cao, chữ bị mờ, Kho doe Muốn thong tin hoá, cấn phục chế và chụp tha nhỏ mới tiên sử dụng) Phụ bản 4: Giới thiệu hệ chương trình quản lí chứ Nôm Việt Nam

(Hệ thống gồm nhiều tệp chương trình viết bằng ngôn ngũ Pascal va FoxPro

để quản ti, về thêm, nhập chứ, tra cứu và soạn thảo chử Nôm)

Phụ bản 5: Bang chit Nom chuẩn Việt Nam dược Quốc tế công nhận (TCVN

( Bảng này gồm hơn 2000 chứ Nôm của dân tộc Kinh đưa 74 xót đợt 1 Sau đây Việt Nam cũng như các nuớc khắc sẽ sưu tấm và bổ sung thêm),

5773)

Phụ bản 6: Báo cáo {du kiến) về nhiệm vụ xáy dựng, băng chữ Nôm điện tử

( Đây lí báo cáo dự kiến của nhóm để tài Hình bay tude Tiểu

ban Mã Chuẩn Quốc Gia, và gửi tới các nhà Khoa học và công

nghệ trong và ngoài nước để xin ý kiến), vào cuồi bổ: 1992.dau năm 1993 )„

Thụ bắn 7: Mã hoá và thể hiện chủ Nôm trên máy tỉnh

(Dây lì báo cáo thục tế khảo sắt thử nghiệm và triển khai vẻ chủ Nom bing công nghệ của Việt Nam để tham giá bảng mã chuẩn quốc

tế, và đã dược quốc tế chấp nhận)(Xem chương 1Í Báo cáo Tổng hop}

Phụ bản 8: Yếu cấu đối với các chitrinn phan mém sé viet trong năm 1993

(Đây lò thông báo nội bộ của nhóm để tài có tính chất gọi š và đất hồng cho các nhà lạp tinh Vier Nam gải quyết Kết god co thé ca sai lệch một chú so với dự kiến này, nhưng cuối cùng các chương tình đếu chạy tốt có môi số điểm vượt mức, và các

thuật giải có nhiều sáng {a0 so với du kiến)

Phụ bản #:Quyết định 53-CPcủa Chính phủ về chứ viết các dân tộc thiểu Số,

Hội đồng Chính phủ giao nhiệm vụ cho Uỹ Bạn Khoa học xã hội Bỏ Giáo dục, Bộ Văn hoá, phối hợp với Uỷ Ban Nhân dân các địu phương

trong việc giữ gìn và phát triển văn hoá chữ viết của các đân

tộc thiểu sé

Phụ bản 10; Báo cáo về bước đầu xây dưng Ngắn hàng dữ liệu Hán Nôm,

(O day chỉ nếu một số vấn để chưng, không trình bẩy kĩ thuật của

hé FoxPro, vi đã có nhiều tài liều giới thiếu vể hệ này)

Phụ bản 1L: Bản in thủ một từ điểu của Từ Diễn Hân Viết dưới Windows,

( Hiện nay chưa có bộ chứ Nom cho Windows, mdi chỉ có chữ Lm và

chủ Việt nhàng ương hệ này, Viên Hán Nôm dã dùng dể soạn thảo

và in Từ điện song ngữ Hián Việt)

Phụ bản 13; Bản in ! trang sách Hán Nôm gốc quét lưu bằng, Scanner

( Chúng tô: thử quế: Seanner và lưu các trang tho "Nhat ki trong

từ" để in wan anh vé chit trong Windows)

Trang 4

"

NOI DUNG BAO CÁO

PHAN 1: KIEM DIEM CAC HANG MUC DE TAL

1) VIỆC CẢI BIÊN PHAN MEM DE DANH DUOC CHE HAN TREN

MAY TINH CUA VIET NAM ;

(công việc này chú yếu được tiến hành trong năm 1992/à năm mở đẩu của dẻ tài

- Khi mới thành lập để tài, Việt Nam còn bị cấm vận, các cơ sở in ẩn xuất bản trong nước cẩn có chứ Hán nhưng không nơi nào làm dược trên máy

Lúc đó muốn có chữ lần phải mua máy tính với giá khoảng 3000 USD một dẫn,

và bị phụ thuộc vào cấu tạo phẩn cứng chế tao sẵn của nước ngoài (giá máy

tính Trường Thành của Trung Quốc đem sang tiển lâm chào bàng tại hội chợ

ở Việt Nam cũng tương đương như vậy) Có những cuốn từ điển rất cần in chữ Han nhưng vì không có chứ để in, nên Nhà xuất hản phải bỏ chứ Hán, chỉ in

toàn phiên âm chứ Việt ( như cuốn Từ điển của Giáo sư Nguyễn Lân)

Để tài đã đi đầu trong việc học tập và cải tạo phần mềm để phục vụ soạn

thao in dn chit Han ở trong nước (Đến nay không những Viện Hán Nôm sử dụng

kết quả này, mà nhiều nơi khác cũng dã sử dụng kết quả đó.Bỏ chữ Hán "mềm

hoàn toàn' đã đánh được trên eác máy tính nhỏ của Việt Nam như AT-286, chú

không bất buộc phải đừng các đần máy to, đất tiên )

Vì việc tạo kí tự 2 byte là một việc khó chỉ có một sẽ rước nám được

kĩ thuật này, vì vậy họ giữ độc quyển không phổ biển các chương tình

nguồn cho nên mục tiêu mà để ti đãng kí sẽ đạt tối là cải biên phần mềm

xản có tạo bô soạn thảo đưới DỌS, để tụo diểu kiên cho chữ Han vào được nhiều hệ ứng dung của Viết Nam, và có thể truyển thông, giao tiếp, hoà

nhập được, chứ không phải chỉ dùng trong một hệ soạn thảo với một có chứ š định (đo qhà sẵn xuất cùng cấp Dễ tài cũng không chủ Đương táo ra

môi hệ mới hoàn toàn, mà chỉ có người Việt Nam sử dụng Yêu cẩu cải biên

một hệ do người khác đã làm và nắm giữ bí mật là một việc khó đối với nhà

lập trình Thêm nữa vì là bước đầu, nên để tài định hướng làm tư liệu thô

là chỉnh (việc lam dep chi Han, chứ Nôm là cẩn thiết nhung sẽ nh

sau vì ta chưa có các công cụ đủ mạnh ( Tốc độ xử lí của hẻ Windows-3.0

con cham, tính năng chưa ổn định )} nên để tài chỉ đám nghỉ mở rộng úng

dụng tối vài hệ trong môi trường DOS cũng đã cẩn cố gắng nhiều Dởi với

hệ thống máy MAC là một hệ mạnh, tuy rất tiên tiến, những giá còn đất gấp

yuổi máy IBM ở Việt Nam rất hiếm người dùng Nếu tụ làm ra sản phẩm chỉ

ding được trong hệ này thì chắc sẽ không có ai sử dung, và nếu dàn máy của

tt bị “trục trac" sé không có người "cứu ứng" cho Đó là những khó khan

do cẩm vận, cỗ lập về công nghè thông tin gây ra

Tuy vậy, với sự nỗ lực cao của các nhà lập trình, chẳng những các yêu

cầu phục vụ làm tư liêu thô đểu dạt được, mà hiện nay chúng tôi thấy việc

làm cho các vân bản cổ điển của tổ tiên được in ra càng ngày càng đẹp củng

Tất cẩn thiết, vì nó cũng góp phẩn tích cực trong việc in ẩn bảo tổn và làm

tăng giá trị các mật của văn hoá phẩm Việt Nam, do đó chúng tôi cử gắng

đầu tư thêm công sức, bất đầu tiến vào Windows lí một hệ thống mới, phúc

tạp hơn ( Phụ bản I1 là in thử 1 từ điều của Từ điển song ngữ Hảãn Việt dưới

Windows)

Định hướng như vậy, cho nén từ đấu chúng tôi đã tổ chức khảo sát: rộng

rải các hệ phẩn mềm ứng dụng sau đây để tìm cho ra cơ chế tổ chức chữ Hản

trong may tinh, và để cải biên mở rộng ứng dung nó chứ không chỉ bú hép

ứng dụng như qui định của nhà sản xuất : các hệ đã khảo sát nhúng thử chữ

Trang 5

-4-

MSWORD, NOR TON,NE,PCTOOLFOXRASE, FORTRAN, VENTURA SIDEKICK,

cộng hơn 10 hệ , và đã chọn 2 hệ cơ bản tính nâng trội để phát tiển là

Eoxbase và PE2, Đó là 2 hệ phù hợp với định hướng xây dụng cơ sở dứ liệu

Nhờ khảo sát mà trình độ kí thuật của người làm việc có tiến hộ từ chỗ

chưa hiểu cơ chế hoạt động của chữ tượng bình trong máy tính, hoặc chỉ sử

dụng mốt cách thụ động, nay đã biểu được mot phan cơ chế ấy, và sau một

năm nghiền cứu đã cải tiến bộ công cụ, làm tăng tốc đÓ soạn thảo, tạo ro

cách đánh chứ Hán dé dang cho người Việt Nam (dùng tiếng me để để gọj chữ

Hán); ban đầu bộ chữ Hán chỉ dùng được trong loại tệp công vấn (text Íil€), chỉ đùng trang một hệ soạn thảo đo nhà sản xuất cung cấp là hệ CWI, chi in được ra máy in kim, với dạng chứ thô, chưa iø ra mấy ín laser với đạng chữ

mịn, dep được đến nay đã có thể đánh trong tệp cơ sử đử liệu {Data

file), dánh tong vùi hệ khác nhau, kể cả trong Turbo Pascal và Norton 18

những hệ rất phổ biến và để dùng nhất ở Việt Nam, đồng thời in được ra máy

ín Laser dưới môi trường DOS Đá là những cải tiến tích cực nhằm phố cập

hod ung dung Tin hoc trong nude, gop phần làm tăng về đẹp các văn hoá phẩm

cỗ điển của Việt Nam

Cuối năm 1992,hệ điều hành DOS-5.0 được phổ biến vào Việt Nam.chúng tôi

đã tiếp nhận nó, vận dụng các kí xảo nhằm nâng cấp chữ Hán, đưa vào DOS 5.0, va tim cách khai thác vùng nhớ dự trữ 384 KB tại mé trên của bộ nhớ quy ước, đồng thời nghiên cứu áp dụng các biện pháp khác về tối ưu hoá bệ

thống để khai thác các tài nguyễn hệ thống do, DOS 3.0 ma ra

“Theo tài liệu của hãng sản xuất phần mềm Ÿ-Thiên thì chứ Hán do họ củng cấp khô sử dụng trong các hệ DOS cao ( sau version 3) [tiết ].ï của rải liên hướng dẫn có nói rõ điểu này], thục tế các hệ DÓ§ 40 và 4.1 mà nhiều nơi thử nghiệm khí đưa chứ Hán vào thì may bj treo và mất con trỏ Vì muốn khai thác những mặt mạnh của DOS-5.0 nên nhóm nghiền cứu để tài đã tìm cách nhúng chữ Hán vào DOS 5.0 và đã thành công nhờ phương pháp thay đổi tếp cẩu hình mới Như vậy là ta đã có thể chủ động đưa chit Han đi iên thee kip bước tiến của hệ điều hành mới, không phải mua thêm phiền bản mới củu nhà

Sản Xuất:

Cuối năm 1992 cũng hình thành định bướng, xác định yêu cầu kĩ thuật của các hạng mục can bản mà để tài sẽ phải làm trong năm 1993 là vẽ chứ Nôm, xây dung Ngan shang đứ liệu, soạn thảo song ngử Hán Việt đưới DOS đồng thời mua sim trang bị thích hợp để làm việc (Lúc này máy AT-486 ö Việt Nam còn rất hiếm, giá mộc đàn, theo tạp chí Thông tin Tín học, tới 14.000 LJSD), vì vậy chúng tôi chưa thể có nhứng công cụ tốt để nghiên cứu thủ nghiệm

- Sản phẩm phần mềm cän bản của giai doạn này là tếp y

đủ" gồm 13.900 chứ Hán với các cách má hoá khác nhau, dùng eu chữ Hán trong máy theo phiên âm lainh Bác Kinh, theo ám Hán Việt “tƒ điển" này ín ra được hơn 300 trang

Trong 2 nam qua, ngày 1ừ lúc để tài tìm được cách sử dụng hộ chữ llâm.d

có nhiều cơ quan đơn vị yêu :cầu phổ biến cho họ sử dụng, để tài đá hưởng dẫn và đáp ứng kịp thờiCho đến nay hệ này đã được cải biến nhiều vũ sỉ

dụng ổn định tại Viên Hán Nom, di duge ding để huấn luyện trong "Nỗi bộ

ẩn phẩm của Viện như soạn thảo bổ sung phản chữ lián các hò

sách "Di sản Hán Nêm'(3 tập): " Tổng tập van học Việt Nanf(Háp) Các nhà khoa hằng Việt Nam”, "Bằng tra chứ Hán" trong giáo trình dạy Hán ngủ "Thụ văn Hội Tan Dàn" in Tạp chí Lián Nôm, Tap chí Thương mại Tap chí Cộng sản,

à soạn thảo một sử hợp đồng vận thư trao đổi kinh tế và văn hoá giữa Viết

Nam và Trung Quốc Đài Loán được nhiều nguũi ưa chuông,

Trang 6

giận:

(Phần hướng dẫn sử dụng rất giản dị, ngắn gon, chủ yếu là hướng đẫn trực

tiếp thao tác trên máy các hệ soạn thân đã cổ)

2) XÂY ĐỰNG CƠ SỞ BẠN DẦU CHO NGÂN HÀNG DỮ LIỆU HÁN NOM

- Mụe tiêu cuối cùng nhằm tới là dùng Tin học để quản lí khai thác toàn

điện kho tư liệu viết bang chữ cổ của Việt Nam

-Trong 2 năm qua, để tài đã cho nhập máy hơn 4.500 bản mô tả tóm tất nội dung các đơn vị sách Hán Nôm hiện có mật tại kho sách chính của cả nước

là Viện Hán Nom (số này bao gồm các tác phẩm chủ yếu phản ảnh lịch sử văn hoá Việt Nam đã được sưu tầm từ trước nâm 1945 cho tới nay), và 11.000 đơn

vị vàn khắc [an Nom (hiến vật là các bia đá, chuông đồng, biế ral

rác trên khấp nước, có nơi thì biện vật còn giữ được, có nơi thì hiện vật

dã bị tiêu huỳ trong thời gian vài chục nảm chiên tranh vừa qua, ở Viện Hán Nôm chỉ giữ được bản in ráp lại trên giấy mỏng ) Tổng số văn bản thư tịch cổ có trong kho là 3 vạn đơn 3

văn khắc là hơn 3 vạn đơn vị dự

tính số lượng chưa sưu tẩm cũng tương dương số có trong kho Như vậy vẻ số lượng tư liệu còn chưa đưa vào máy để quản l nhiều gấp 8 lần số đã đưa

à chưa tính đến yêu cẩu đi sâu lược thuật "vét cạn" thông tín trong hàng triệu trang văn bắn,

Như vậy công việc mà để tài làm mới đạt mức độ thủ nghiệm quản lí, muốn

m khai thưc hiện quản lí cẩn phải làm nhiều các việc chuẩn bị hổ sơ

trước khi nhập máy, và việc nhập tư liệu vào máy Việc triển khai cuản lí

cẩn có một dự án riêng kéo đài trong nhiều nằm

- Tóm lại: về lĩnh vực này, dẻ tài đã đạt được kết quả như dư kiến dé ra

vỀ số lượng các tư liệu nhập máy, với 8 yếu tổ thông tin cơ bản „ tạo thành Version 1.0 (phiến bản đấu tiên) cho Ngắn hàng di Wu Tin Nom con Việt Nam)

- Cấu trúc kho đữ liệu được tổ chúc theo "hẻ thống mở" cho phép hổ sung them nhiều đơn vị văn bản mới sưu tầm thêm (gọi là nổi đài theo chiều doc), đẳng thời cho phép tích luỹ thêm (chèn thém) những thông tin của don

vị vân bản cũ mới khai thác hoc phát hiện thêm Cách làm này thích hợp với đối tượng quản lí là kho sách Hán Nôm, và cũng là điểm khác với cách

quân lí một kho sách hiện đại (chẳng hạn một ban ghi mô tả thông tin vẻ một

tấm bia của Viên Hán Nöm, như dự kiến ở phụ bản 2 sẽ không chỉ gầm 8 yếu tố

như bản mô tả về một cuốn sách hiện đại mà có thể sẽ có đẩy đủ các

tên người, tên quan trọng của Việt Nam được ghi trong bia, có thể có

cả ảnh chụp tấm bia, và danh mục các tài liêu các bài nghiên cứu đã viết tấm bia đó Hiện nay, trình độ quản lí và lược thuật của Viện Hán Nôm mới làm được 8 yến tổ, thì để tài hãy quản ií tới đó, sau này, có điể kiện sẽ lược thuật Kí thêm),

- Về kĩ thuật : Đã viết được một số chương trình rự động hoá từng phần trong công việc nhập liệu, xuất liệu, hiếu đính, sửa chữa, đổi mã, trụ cửu

- Đây là Jgại cơ sở đữ liệu cổ trung bình ở nước tả, qua thủ nghiêm chúng tôi có rút ra được những kinh nghiệm và các thông số vận hành cúc hè chương trình quản trị dữ liêu

Trang 7

-6-

- Hệ phần mềm chính mà chúng tôi chọn và sử dụng cho Ngân hàng này

là FoxPro 20 So với hệ ORACLE mà Thư viện Bác Kinh sử dụng (chủ yếu dùng

cho sách chữ Hán), thì FoxPro khong manh bang, Tuy vậy chúng tôi van chon

FoxPro vi những lễ sau đây ;

Thứ nhất, ORACLE là hệ quản trị dữ liệu mạnh có dùng mạng, nhưng hệ này vàn Việt Nam cham va cing đòi hỏi trang thiết bị đất tiền (trị giá cài

đặt toàn bộ để có thể khai thác được là 5 triệu USD, lại cẩn dùng máy Mini,

là vượt quá xa khả năng đầu tư của nước ta cho một cơ sở như Viện ôm), trong khi đó hệ FoxPro ré tién hơn, đang được dùng phổ biển ở Việt Nam, và đến nay chúng ta đã dưa được chữ Quốc ngữ và chứ Hán Nôm vào đó Sau đây sẽ chỉ cẩn tăng cường thiết bị thêm một chút (dùng máy AT-

486}, ta cúng có thể quản lí và khai thác tư liệu có hiệu qua, dat được mục

đích,

Thứ bai: Hé FoxPro cing đang được cải tiến, mạnh đẩn lén để tương hợp

với các hê khác Như vậy ta có thể yên tâm sử dụng hệ này, nếu sau này cỏ

điều kiên nối kho dữ Hệu với mạng Quốc gia, cẩn chuyển sang dùng ORACL

thì cũng không đến nỗi xa lạ lắm,

(Tỉnh năng manh trong việc quản lí của hệ FoxPro cũng da được dùng để

thiết kế hệ quản lí chữ Nôm, được giới thiệu ở Phụ bản 4 kèm theo đáy)

- Những giải thữặt và kĩ nâng mà để tài tích luỹ được về xảy dựn khai thác Ngân hàng đứ liệu Hán Nôm có thể đồng góp vào quỹ kiến thức giải thuật về xử lí kí tự Quốc ngữ của Việt Nam Bởi vì để tài không phải chỉ cẩn giải quyết đơn thuần các vấn dé của chữ Hán mà còn phải giải quyết những vấn dẻ của chữ Việt trong quan hệ huà nhập với chứ Hán khi sử dụng trong Ngan hang di lieu (van dé hod nhập chữ Hián và chứ Việt trong một hẻ soạn thảo sẽ dược để cập ở mục dưới)

( Quá trình xảy dựng Ngân hàng dữ liệu Hán Nôm được nêu trong Phụ bán 10)

3) VÉ CHỮ NÊM TRONG MAY , ĐƯA CHỮ NÔM THAM GỊ

BANG MA CHUAN QUOC TE

- Chứ Năm là một thìa khoá quan trọng dể mở ra khai thác kho đi sản

vấn hoá thành văn mấy nghìn năm của dân tộc ta, nó chiếm tới 1/3 số chữ trong kho chữ tượng bình Biết bao nhiêu tên người, tên đất trong Jịch sử van hoá Việt Nam - những tên đất cổ Việt Nam như iàng Duổi, kẻ Gốm, làng

Me, lang Bậu, cẩu Đơ xuất hiển thường xuyến trong thư tịch

nhưng hiện nay không một hệ phẩn mềm nhập ngoại nào có du chit Nom cho

ta dùng để khai thác kho sich Han Nom, vi vay ta phải có chữ Nóm để sử dụng

„ Vì vậy việc nước ta bỏ phiếu ủng hộ ISO với yêu cầu đưa chữ Nôm của Việt Nam tham gia bang ma chudn quốc tế có 2 ý nghĩa :

giới thiệu di sản văn hoá truyền thống của Viết Nam ra

thế giới (từ chỗ thế giới công nhận chữ viết cổ tiến tới công nhân di sản

văn hoá của Việt Nam sẽ là 1 bước tất yếu); Bảo đảm quyền tổn tại bình đăng

của chữ viết cổ Việt Nam với các thứ chứ viết khác cả văn hoá nhân

loại.Việc này càng cấp thiết vì chứ Nôm dang bị nhịp sống hiện dai day vin quên lãng, trong khi chúng ta đang cẩn phục hưng nến văn hoá truyền thủng giàu tính nhân đạo của Dân tộc

bý Nhụ cấu về truyển thing biện đại đòi hỏi xoá bỏ cấm vận thông tin

"trên thực tế", và Việt Nam cẩn được sử dụng những tiến hộ về công nghẻ xử

Íí các thứ chủ của các nước lắng giểng trong máy của mình

Nếu tham giá được vào bảng mã chuẩn Quốc tế thì nước tá có thể đạt

Trang 8

endif

- Kết quả boạt động khua học của để tài về lĩnh vực này là :

a/ Đề tài đã hoàn thành việc vẽ chữ đợc 1 (đồ là một yêu sầu bất, buộc nếu muốn tham gia chuẩn quốc tế Thực hiện yêu cầu này của ISO dé

chứng minh nước ta có khả năng làm được chứ tượng hình; và chứng minh rang

kho chứ UNICODE chưa đủ chữ, nước tú có thể đóng góp bổ sung), và làm thủ tịc đăng kí tham gia hé chudn UNICODE và ISO ( Muốn được tham gia th:

bang chữ Nôm phải được công nhận là chuẩn của Quốc gia, mọi yếu cầu bắt

buộc thứ 2) Bảng chữ Nôm phần 1 đưa ra đã được Hội nghị Quốc tế của nhóm công tác làm mã chuẩn họp lần thú 2 tại Hà Nội từ 28/2/1994 đến 4/3/1994 chính thức chấp nhận

Đây là một thành công chung của giới khoa học Việt Nam (có đóng gúp củu anh chị em Việt kiểu yêu nước, có sự hợp tắc tích cực của các chuyến giả Tin học và Ngữ học Việt Nam ở trong và ngoài nước, của Chương trình Diên tử Tím học KC-01 Các chuyên gia mã thám các cần bỏ của Tổng cục Tiêu chuẩn

Đo lường và chất lượng đã làm việc khẩn trường nhiệt tình, dưới sự chỉ dạo sát sao, kịp thời của Bộ Khoa học Công nghệ và Môi trường, của Trưng Tâm KHXH và Nhân văn Quốc gia, chuẩn bị kỉ càng, phối hợp chật chế, tổ chúc tốt hội nghị IRG-2 tại Hà Nội nên đạt được kết quả trên)

b¿ Ngoài ra để tài tồn tạo được mot hệ phẩn mềm dùng để tiếp tục sưu

tầm , vẽ thêm chữ Nôm , soạn thảo và in chế bản chữ Nêm

Thông qua việc chúng ta lấn đầu tiền tham gia hợp tác xảy dung thành công một chuẩn khoa học công nghệ Quốc tế, tr có thể rút ra những

kinh nghiệm bổ ích cho việc tham gia các chuẩn Quốc tế tiếp theo, dể hiện

đại hoá công nghệ và kinh tế Việt Nam

Sản phẩm nghiên cứu của khâu công việc này gồm ;

1/- Danh mục hơn 2000 ehử Nôm chuẩn được Hội nghị gu

2/-Hệ quản lí chit Nam (suu tam,bd sung, tra cứu, soạn thản chứ N

Việt Nam), Đây là tiền thân của Từ diễn điện tử chữ Nôm Hẻ phẩn mềm này

nằm trong máy gồm nhiều chương trình, dung lượng khoảng 4 MB

Tài liệu giới thiệu hệ này là phụ bản số 4 đính kèm

3/-Trước đó, để tranh thủ ý kiến các nhà khoa học trong và ngoài nước, chúng tôi cũng đưa ra bản báo cáo "Xác định nhiêm vụ xây dụng bang chit Nom chuẩn dang điện tử", gửi tới các nhà khoa học, và sau đó thu dược 27 ý kiến đóng góp để sửa chữa bảng Nẽm chuẩn 1 của Việt Nam trước khi trình Nhà nước

công bộ làm bảng chuẩn chính thức để tham gia vào bảng mã chuẩn quốc tổ

{van ban này được ghí trong Phụ bản 6 đính kèm)

4/- Kết quả nghiên cứu đặc thù chứ Nôm trên máy tính duge néu trong

Phu ban 7

lưu ý nh

1- Nhờ sự công nhận của Quốc tế lâm cha tì có tư cách pháp nhân,(Quốc tẻ công nhận và giành chỗ đứng hợp pháp cho chữ Nôm của Việt Nam) còn viết thể hiện các chứ viết của mình dưới dạng điện tử như thể nào thì các quốc

gia phải tự làm Để bảo đâm làm trọn vẹn công tác bảo tổn di sẵn văn hoá

của dan toc, chang tôi kiến nghị Nhà nước giao cho một cơ quan khoa học tiếp lục sưu tẩm "cạn kiệt " các chứ Nôm, không những của dân tộc Kinh, mà

cả chứ cổ của các dân tộc anh em khá để bảo vệ, Căn làm thành một Từ điển

chữ Nôm dạng điện tử, phát hành rộng rãi phối hợp với việc sử dụng hồ mã chuẩn Quổe tế trong các ứng dung để nóng cao chất lương công tác giáo dục,

Trang 9

nghién cuusuac bin va gidl thiew van hi

giới (Hiên này hệ mã chuẩn ISO đang ứng đụng toàn diễn)

- Quyết định $3-CP của Chỉnh phủ về ebữ viết của các dân tóc thiểu số coi tiếng nói và chữ viết của các đân tộc là tứ sản và vốn quý của cic

dan we Việt Nam: Chính phủ rất quan tâm tối công tác bảo vẽ khai thác phát huy di sẵn văn hoá chữ viết của các dân tộ giao nhiệm vụ cho ngành

Khoa học Xã hội ngành Giáo dục và Văn hoá phối hợp với Uỷ Ban Nhân dan các tỉnh thực hiện việc này Nhưng các ngành hữu quan chưa có điều kiêu sử

dụng nang luc manh mé của Tin học để phục vụ nhiệm vụ đó Chúng tới nhĩ

ring trong bối cảnh hiện nay các ngành liên quan nên xúc tiến việc ứng

dụng Tin hoe trong việc bồi sinh và phát triển vấn hoá của các đân tộc,

trong đó chử viết của các dân tộc cẩn được chuẩn hoá sớm trong avy tinh

(Quyết định 53-CP được dính kèm ở Phụ bản số 9),

ó truyền thống của Việt Nam rủ thể

n hoàn thiện và sip được triển khai

4) TẠO MỘT HỆ SOẠN THẢO HON HỢP CHỮ HÁN,

CHU NOM VÀ CHỮ QUỐC NGỦ,

~ Nhụ cẩu về in ẩm xuất bản từ điểnnhu cấu lưu trử tư liệu

trong mấy cẩn thiết có mộ hệ soạn thảo như vậy Để tài đã đạt chủ dẻ này thành một hạng mục nghiên cứu Qua nghiên cứu thử nghiệm đã dĩ điển xác định được rắng : muốn dea chit Che Hain, cht Nom vào máy, phải dùng hé mã chấp dõi (l6 bit),còn chữ Việt thì có thể dùng hệ mã Ế bic Nhưng tiếng Viet phổ thông và chữ các dân tộc thiểu số Viết Nam dã latinh hoá lại dùng các vẫn ghép nguyễn án và phu âm liển nhau do vậy mộc sổ kỉ tự Viết đúng sác nhan để thành vấn sẽ tạo ra tình thể 2 mã 8 bử đứng sát nhau tạo thành

1 mã l6 bit, trùng hợp với 1 mã 16 bít của 1 chứ Hán hoặc l cha Nom gay ra hiện tượng “dính chủ ", còn gọi là "kì bình quái tự" (chử kì quái xin xem

đẹp,mịn, cẩn dược cải tiến thẻm để cho việc in dược đẹp hơn, và thẻm chứ

Chúng tôi đặc tên "Lâm thời " là có ý chờ đợi một hệ mã 2 byke hoàn chỉnh gôm cả chữ Viết, chứ Nôm của Việt Nam đã vào chuẩn quốc tế ISO cũng với các thứ chứ khác của thể giới, có thể dùng dust moi he điều hành, chi không riêng gì dưới DOS

s) vic Quér ANH SACH ITAN NOM DE LUU TRU

~ Mục tiêu chung là lưu trử nguyên dang cdc văn bản cổ làm tài liệu tham

khảo cho các công trình khoa học liên quan tới lich sử vân hoá và lịch sử dân tộc Việt Nam ( Văn bản gồm chứ viế, bản đồ và các hoạ tiết),

- Khi thành lap để tài thì giá cả, thiết bị và công nghệ lưu ảnh bằng đĩa quang của thế giới còn đất (giá mộc hộ thiết bị phí tư liệu lớn đĩa quang CD-ROM tới vai tram nghìn USD, riéng mot đầu đọc trị giá gần 4000 USD) nền chưa phổ đọng Để tài mạnh đạn đặt vấn để thứ nghiệm lưu ơủ trong dia ti (ed đụng lượng nhỏ) để sao này có điểu kiện sẽ triển khai ứng dung wen dia quang có sức chứa lớn Việc lưu tử toàn bộ kho di sản cổ

Trang 10

~9-

bảng phương tiện Túi học là mộc nhú cầu cấp bách để vừa bảo vệ, vừa khai

thắc dí sản vận hoá theo phương pháp hiến đại (tiên lợi hơn, rẻ tiễn han

so với phương pháp thủ công kết hợp dùng Microfilm cổ điển Hiện này mết

bộ thiết bị giú tư liệu vào đỉa quang giá khoảng 15000 USD, và mat dae doe

giá 700 USD)

- Kết quả thử nghiệm cho thấy:

1/ Có thể lưu trử các nguyên bản thư tịch cổ theo phương pháp quét Scanner nguyên dạng các trung sách gốc

3⁄ Có thể lấy ra đọc và in ñ dang (in nguyéu dang hoặc biến tận sửa chữa thêm), có như vậy mới đâm bảo tính chân xác khoa học của các tư liệu

mà Việt Nam công hố,

3/ Muốn tìm kiếm cẩn thành làp được mốt liên hệ giữa hệ thông tư liệu

lạnh cả một kho sách rộng 750 mét vuông chúng tả phải tốn phí hàng trăm

triệu dồng tiến điện, nếu thu kho sách äy vào vai tram dĩa quang thị diện

PHAN U: MOT SỐ KINH NGHIỆM VÀ NHÂN THỨC MỚI

1) Dây là bước đầu đội ngũ cần bộ khoa học kỹ thuật Việt Nam tiếp căn với

ngành cũng nghệ hiện dại, đang tiến triển với tốc đò rất nhanh tuy ta chưa

đt dược các đình cao, nhưng cũng đã có được những hiểu biết cơ sở để ứng dụng có hiệu quả trong công tác, giải quyết được một SỐ vấn để của nước i Chúng tôi thấy cẩn tiếp tục theo tỏi sát

ác thông

tin tới nhất và cẩn tăng cường học tàp đào tạo để kịp thời nắm lấy những

tiến bỏ của ngành khoa học công nghệ này và ứng dụng ngày cảng có hiệu quảphục vụ sự nghiệp xảy dựng kinh tế và văn hoá của Tổ quốc trong giui

đoạn hiện nay

( Bài báo " Công nghệ thông tín, một thách thức nghiệt ngâ các nước nghều" của P1S Nguyễn Trọng đã nói lên nhụ cầu cấp bách của nước ta phải vượt lên

VỀ mặt công nghệ thông tín - xin đính kèm ở cuối báo cáo),

2) Chúng ta đang đi sau nhiều nước phát triển vì vậy cần có chiến lược

thích hợp, để có thể "đi tất, dé tn cong site, (chang han khong har kiếm lợi trong việc chế lạo phần cứng và phần mềm cơ sở, mà nền đầu tư nhiểu vào

nghiên cứu ứng dụng để đạt hiểu quả cao; Cẩn cố gắng tham gia vào cúc chuẩn

quốc tế để trắnh việc đi vòng, tốn kém

3) Da số các ứng dung Tin học vó giá trị thường là các ứng dụng liên nganh (ngân hàng, tài chính, ý tế, bàng không, bưu điện, địa chấu.) các ngành kinh tế vàn hoá khoa học liên quan sẽ được thụ hưởng thành quả về năng suất và chất lượng cao do Tín học dem lại Vì vậy các ngành ấy cẩn củ chuẩn bị tạo điệu kiến và hợp tác chat ché

Trang 11

-

4) "Phan mém là yếu tổ quyết định" các nhà sản xuất máy tính và các hãng sản xuất phẩn mềm lớn của thế giới chỉ làm được những công cụ rất chung, muốn phát triển rộng khấp bọ phải dưa vào đội ngủ phản mém "địa phương,

Chính nhờ ứng dụng vào những lĩnh vực cu thể, mới nảy ra các nhụ cầu và

các cải tiến hữu ích (Việc sắp xếp chứ Việt là đậc thù riêng của Việt Nam,

hệ thống chữ cải Viet, cha Nom và các chứ dân tộc khác của Việt Nam như chữ Thái Tây, chứ Khơme Nam Bộ cũng là những yêu cầu cụ thể mà như cầu khoa bọc Việt Nam đạt ra để Tín học bố trợ giải quyết) Năng lực của Tin Rọc vốn có tiểm tầng những khá năng lớn , nhưng nếu ta không “đặt hàng xhúng yêu cấu thì các nhà ký thuật Tìn học cũng không chế rao, không khái thác tới khả năng ấy Dây cũng chính là nguyễn nhân dân tối chủ trường của để tài sử dụng 1 phẩn kinh phí để "kích thích" sw phat triển của Tin học trong nước chứ không hoàn toàn "nhập ngoại" hoặc thuẻ nước ngoài làm phẩu m

Nhìn chung, trong 2 nám, thời gian ngắn, phải tập trung sức giải quyết

© vấn đè cấp bách, công tắc đào tạo mót đối ngũ chuyên gia có trình độ chuyên sâu vẻ chủ để này để cung cấp cho nhụ cầu chung, chúng tôi mới làm được ít Mong rằng sắp tới đây, Nhà nước chú ÿ đu tư chủ đào tạo ‘Tin học nói chung, trong đó có chú ý tới tin hoc Tan Nom

dể thăm gia bộ mã thông nhất toàn cẩu, chứ chưa có hợp tác để làm ra các công trình hoặc sản phẩm ứng dung cụ thể phát huy tiểm nang của Khoa hoe

xả hội và nhân văn

Chúng tôi cũng đã tiếp xúc và trao đổi sơ bộ với các giám đốc kỳ thuật

của vác thư viện sau:

Thư viện Quốc gia Uc:

Thư viên Quốc hội Mỹ

"Thư viện Viễn đông bác cổ Pháp

Thư viện trường Đại học Cornell My

Liên hiệp thư viên đại bọc Bắc Mỹ và Canada

Trang 12

`

PHẦN HI- KẾT LUẬN VÀ KIÊN NGHỊ :

{ Căn cứ trên những sản phẩm cụ thể và những kết qủa nghiên cứu đã dat dược, chúng tôi xin nẻu những kết luận và kiến nghị cụ thể như sau)

1 - Dây là lấn đầu tiên chúng ta chế tạo dược bộ chứ Nôm điện tử, đưa việc quản lý tư liệu Hán Nôm theo kịp trình độ của thể giới (sử dụng phương

tiện Tin học hiện đại, tử đây mở ra triển vọng mới vẻ trao đổi thong tin

van bản lần Nêm giữa nước ta với các quốc gia dùng chứ tượng hình trong khu vực, vù với thế giới( tử nay nói tới Ì hệ phẩn mềm xử lí chữ Nom là

có hàng vạn chữ Hán trong đó)

2 - Ban phím chứ Nôm đã giúp cho công việc soạn thảo văn ban [fin Nom

tiến kịp trình độ quốc tế vẻ soạn thảo bằng máy tính, kế thừa được những thành qua nghiên cứu của trong nước, bảo đảm tính sử dụng đế dàng phù hợp

với thôi quen của người Việt Nam, góp phần thúc đấy nhanh quá trình phổ cấp

đào tạo và ứng dụng Tin hye trang nud

3 - "Tự điển điện tử Han Nam" là một công cụ tốt dùng để tra cứu, nghiên cứu các tài liệu Hến Nôm Đến nay, các nhà nghiên cứu đã có trung tay một cuốn tự điển dễ đàng tra cứu, có nhiều công nâng độc đáo hơn hản

sở với tự điển bằng giấy muốc đ

biển nó thành một công cụ tra cúu sinh động, phục vụ các chương trình địch

nói Mặc đẩu là mot sản phẩm trọn vẹn của để tài, song do đặc thù của

công tác nghiên cứu sưu tẩm đồi hỏi những người làm tự điển vẫn đành cho các nhà sưu tắm nghiên cứu có điều kiện bổ sung cấp nhật những kiến thức mới, khám phá mới vào tự điển đó một cách để dàng

4 ~ Với bộ font chữ Nôm điện tử, để ti đã gây được một tiếng v

trên trường quốc tế : Lần đấu tiên thế giới biết được chúng ta hoàn toàn

có khả năng thông tin hoá kho đi sản van hod viết bằng chữ tượng hình của Việt Nam, một bộ phận kho tàng văn húá của nhân loại còn chưa được khai thác và giới thiệu rộng rãi,

Việc tổ chức chuẩn hoá quốc tế ISO công nhận bảng chit Nom 1 trong hồi

nghị IRG-2 tháng 3/1994 tại Hà Nội là một sự xác nhận thành công của để

tìi không chỉ ở phạm ví trong nước mà côn ở phạm vị quốc tế và khu vực

Sự cổ gắng này của để từ đã tạo được cơ sở kỹ thuật để kịp thời đưa

di sản chữ viết cổ của đân tộc vào kho tăng trí thúc của nhân loại, giành

chỗ đứng cho cha Nom ngang hàng với các hệ chữ viết của các nến văn mình

khác Kể từ nay, wong thoi dai phat triển của Tin học và truyền thông,

thế giới càng có diéu kiện tìm hiểu những giá trị tỉnh thần cao quý của dân tộc Việt Nam qua kho di sản ván hoá chứ viết cổ được thông tin hoá

Mặt khác Việt Nam được hưởng những tiến bộ kỹ thuật và, có quyển, có khả

năng thực tế để khai thác nguẩn thông tin trì thức to lớn mà nhân loại

tíh lu dưới dang cdc chứ viết tương hình (việc học tập tm hiểu vác nước lắng giếng đang là một yêu cẩu cấp bách đổi với dân tộc ta trong thời

kỳ mỏ cửa để xảy dựng và phát triển hiên nay, dé thi Tin hoe Han Nom ra doi

dp ứng tích cực nhủ cẩu này)

Trang 13

= Bs

Giải quyết thành công những vấn để kỹ thuật cơ bản như mã hoá, chuẩn

hoá, thể hiện cbứ viết trong máy là đã xoá bỏ trên thực tế những sự ngắn

cách vẻ truyền thông giửa nước ta với thế giới

§- Bộ khung Ngân hàng dứ liệu Hán Nôm với các tư tiêu ban đầu nhập vào, tạo nên Version 1.0 cia Ngân hàng, là một sản phẩm ?ìn học , lầu đầu

tiên được dùng để quản lý kho từng di sản thư tịch cổ Việt Nam.Tuy chưa

nhập máy đẩy đủ những dử liệu Hán Nôm hiện có ,nhưng bộ khung cũng đã báo quát được một bộ phận nòng cốt của kho di sản, đó là số sách côn bản của kho sách sưu tẩm được từ trước năm 194ã tới nay, và phần lớn các văn

ba rải rác trên mọi miển đất nước Tu đây ,các nhà khoa bọc cỏ thể bổ

sung.di sâunâng cao và khai thác kho di sản này bằng các nhường tiên

hiện đại

Các giải thuật, cách tổ chức đữ liệu để có thể xử lí tự động hod trong

việc quản lí một Ngân hàng dữ liệu Hán Nôm mà để tài xây dựng cũng được

vận dụng để quản lí Tự đến chứ Hản,tự điển chữ Nôm đạng điện tử

Các chương trình tiện ích khác như sắp xếp, đổi mã, biên tập hiệu đính

n bản chữ Việt là những chương trình tối, có ý nghiấ tăng năng suất lao động đáng kể, đồng góp vào kho kinh nghiệm xử lí chứ Việt

6- Hệ soạn thảo song ngữ Hần.Nôm/Việt là một sản phẩm có tính sáng tạo (lấy tiếng mẹ đẻ, tiếng Việt hiện đại lầm hệ quy chiếu số môi để xứ lí

chữ Hán chử Nôm) Đây là hệ soạn thâo đẩo tiên ở Việt Nam do để tải tạo 7ú,

có đặc điểm là một hệ "mềm hoàn toàn" ( không phu thuộc vào phần cứng cửa

nước ngoài), vừa đảm bảo hiển thị song ngữ trên màn hình, vừa dưa rủ máy

in kim vA may in laser lam chế bản được, vừa đánh dược trong các tếp văn bản (text file), vừa đánh được trong các tệp cơ sở dữ liệu (đãta file), Về bàn phim soạn thảo, nó kế thừa được cách gõ relex truyền thống dể soạn chữ

Việt, đồng thời cũng dùng cách gỗ telex để gọi chữ lián Nôm Cách sử dụng

không phúc tạp, đo vậy có súc phổ cập cao Việc nhúng chứ Việt với chủ Han chủ Nôm nhằm tạo công cụ phục vụ mục tiêu “kuỷnh hoá" kho dĩ sản |

Nếu được cải tiến nâng cao thêm, có thể dùng để soạn thảo các từ điển

có 7 thứ chữ khác nhau là : Trung Quốc, Nhật, Quốc ngữ, Anh, Pháp, Latinh

Bắc Kính, chú âm quốc tế), và có thể làm thêm TrueType font, sti dung wong

Windows để in chế bản với các kiểu chứ ngày cảng đẹp hơn

7-Hệ quản trị dứ liệu ảnh chụp sách Hán Nôm được xây dụng trén ngôn

ng Foxpro trong Windows là một bước nghiền cứu thử nghiệm thành côn

mỏ ra khả năng lưu trứ toàn bộ kho di sản với ảnh chụp nguyên đạng bản gốt của nó Nếu thục hiện được việc này chúng ta có phần yên tâm trong công tác bảo về di sản, vì khả năng chụp nguyên bản vào đĩa quang là nằm trong tim tay, Những vấn để đạt ra là: liệu có thể lấy ra nhanh và giữ được nguyên dạng để bảo đảm tính chán thực của các "chứng từ gốc" ấy hay không? Việc dọc bản chụp và bản in trên máy có thé thay cho tiếp xúc với hán gốc được không, đổi với các ban to như tấm bia thì xử lý ra sao ve Van

để đó đã bước đầu được trả lời qua thực nghiệm

Từ lâu Nhà nước đã quan tâm và có đầu tư cho việc sưu Tổm bảo vệ kho di sản vân hoá quý giá của đân tốc ta, và chú trọng tới các nhiệm vụ nhân hẳn

để bảo tổn (để phòng bất trấc xảy ra), và khai thác nội dụng thư tịch

(Latinh hoá toàn bộ kho đi sản ) với thời gian có gắng một vài thập kỷ

Tuy nhiên thời gian đã trôi qua, mà công viếc có dường như không

Trang 14

-13-

điểm được Ngày nay với nhúng phương tiên mạnh, chúng ta có thể nghĩ tới

hoàn thành trọn vẹn công việc sưu tẩm quản lý nội dung kho dị sản quý gií trong khoảng 5-10 năm tới, nếu có trang bị đủ mạnh ( trước hết có thẻ sưu tẩm và nhân lên thành nhiều bản lưu trong CD-ROM, dé ở nhiều nơi để phòng

mất mát và để cho nhiều người, nhiều ngành có thể cùng khai thác Việc này

có thể làm được sớm Còn việc latinh boá toàn điện sẽ làm dan dan, va sé

thuận lợi hơn nhở khâu sưu được Tin học hoá, và các công

cụ phục vụ sau này cũng sẽ tốt bơn) (chẳng hạn : các nhà nghiên cứu khoa học có thể ngồi ở nhà đọc được toàn bộ kho sách khi nó đã nhập vàu mấy

và nổi với mạng thông tin quốc gia Như vậy hiệu quả khai thác sẽ cao hơn)

tốc độ nhanh, nhưng họ cũng bắt kịp những tiến bộ ấy, và đem kết quả phục

vụ cho phu cẩu phát triển của đất nuớc Năng lực và nhiệt tình của họ là không thể phủ nhận, chỉ cẩn có sự quan tâm thiết thực, sự Kinh dao và tổ chức đúng đán của Dảng và Nhà nuốc, sẽ tạo điều kiện tốt để họ tự đem những

tiểm năng chất xám phục vụ cho sự nghiệp đổi mới củu Đất nước do Pang lãnh

9- Mật khác, để tài cũng là nơi thử sứclà một " mảnh đất dụng vô", và

là ngọn cò tập hợp những cán bộ có núng lực và nhiệt tình cống hiến Thông qua công việc, đã làm cho họ nhận thức sâu thêm về ÿ nghĩa, giá trị lớn mũi

‘Tin hoe ¢d thé đem lại cho khoa học và công nghệ của đất nước : ngoài những

vấn để của thế giới kĩ thuật và kinh đoanh, còn có những việc cẩn làn để

phục vụ cho sự nghiệp phục hưng nền văn hoá của Dân tộc, do vậy Dể tài đã

được nhiều người làm khoa bọc xã hội cũng như khoa học công nghệ quan Lâm

‘Tiém năng Tin bục trong nước được kích thích nhữ hoạt động trao đổi,

khoa hoc va "đất hãng", yêu cẩu làm việc cụ thể,

Nhìn chưng tốc độ chuyển giao công nghệ là nhanh: khoảng thời gian từ

khi nghiên cứu tới khí đem kết quả ứng dụng vào thực tiễn công việc, rất

10 - Dây là Bảng tiêu chuẩn số 0] của Việt Nam được ISO chấp nhân,

tức là một sản phẩm khoa học đầu tiến của Việt Nam dạt tiêu chuẩn quốc tế

-S§ư kiện này cho phép các nhà quản lý khoa học công nghệ rút ra những kinh

nghiêm khi tổ chức xây dụng tiếu chuẩn khác tham gia với quốc tế, đẻ

hơà nhập, và nắng cao, hiện dại hoá nén kinh tế kỹ thuật nước nhà Trong việc xảy dựng chuẩn này, để tài đã có đóng góp tốt vẻ mất kỹ thuật

1] - Thành công này là một ví dụ về sự hợp tác của các lớp cán bộ

(mà và trẻ, am hiểu chữ viết cổ đại và Tìn học hiện đai), của các nhà

khoa học người Việt ở trong và ngoài nude, vi có sự chỉ đạu sát sao của các cơ quan quản lí và chức nãng nhà nước suốt quá trình từ khi thành lập

triển khai để tài,

12 -Sự ủng hộ của các ngành liên quan như quốc phòng, nội vụ, văn huá củng có tác dụng tích cực tới Hội nghị quốc tế IRO, Em cho ban hè thế giới hiểu ta hơn, đó là kết quả khách quan mà để tài có góp phan dem lai cho uy tín quốc giá

Trang 15

- 14-

KIẾN NGHỊ

Trong tình hình tiến bộ nhanh chống của công nghề thông tín, cần có dài

ngũ đồng đảo cán bộ chuyên gia đủ trđnh độ bất kịp những tiến bộ db, để

khai thác có hiệu quả mọi nguồn thong tin tri thức của thế giới nhàm xây dựng đất nước hiện đại Trên cơ sở những kết quả đã dạt được, và căn cứ vào những công việc cẩn tiếp tục hoàn chỉnh , chúng tôi dễ nghị với Trung tâm Khoa bọc Xã hội và Nhân Văn Quốc gia kiến nghị với Nhà Nước và cúc cũ quan pire quan:

1/-Để nghị Nhà nước, Bộ Khoa học Công nghệ và Môi trường có biện pháp khuyến khích ứng đụng ngay những kết quả của để tài vào việc suu tẩm, bin

vệ và khai thác thư tịch cổ, tiếp tục cải tiến hoàn thiện nâng cao chất

3/-Giao cho Viên lIán Nôm tở chúc nghiên cứu mã hoá chữ viết cổ của các dân tộc ở Việt Nam trang may tính, kịp thời đảng kí vào bảng mã chuẩn của thế giới, nhằm bảo vệ dĩ săn văn hoá quý báu của các dân tộc ở Việt Nam

Trang 16

BE TAI TIN HOC HAN NOM - BAO CAO TONG KET TONG QUAN VE KY THUAT

(Bảo cáo này nẽu mạc tiêu chung, yêu cẩu chung,va một số giải pháp

đã vận đựng trong quá trình tiến hành nghiên cứu 1992-1994 ]

Xuất phát tờ hại MỤC TIE! lâu dài:

1) Ding tin hoc để bảo tổn quản lý và khai thác thư tịch cd (Han nom):

latinh hố kho sách Hán Nơm của Việt Nam

2) Tiến lên chia xế nguồn thơng tín của thế giới đặc biệt

ghi bằng chữ tượng hình

) Để tài đã để ra những VU] CÀ cơ bản nhụ sau, căn cứ vào

mục tiêu để ratrong hồn cảnh, mơi trường xã hội Việt nam đang địi hơi

xố bỏ sự cơ lặp, cảm vận, vươn ra hồ nhập với thế giới

; {để đáp ứng cả 2 mục tiều) cẩn cĩ hị ếu biết về cư chế xử lý chữ

tượng hình trong máy tính Cĩ hi cơ chế ấy mới cĩ thể thừa hưởng được kết quả nghiên cứư»của bên ngồi, chủ động cải tạo phần mềm theo yêu edu của mình và dùng nĩ để khai thác thơng tịn Nếu khơng hiểu rõ, hoặc chỉ biết sử dụng thụ dộng, thì tuy cũng cĩ thể soạn thâu được văn bản và

in ra, nhưng khơng thể cải tạo được Vì yêu cầu này nên để tài phải khảo sái các hệ phẩn mềm ng dụng và các hệ điều ban , cùng cơ chế xử lý chú tượng hình 2 byte trong các hệ đĩ

Muốn chía sẽ khai thác nguồn thơng tin của thế giới phải theo đõi sự phát triển của cơng nghệ thơng tin theo hướng xử lý ký tự tượng hình và dự đốn buộc đường tương lai của hướng này Vì khi thành lập để tài, những ứng Gung vẽ vấn để này chưa nhiều Nhìn tước những bước tiến và xu thể tie lời của xử lý ký tự 2 byte sẽ dan tới những quyết dịnh chọn lựa đủi

biện pháp cải tạo và những bước đi cĩ tính chất đĩn ưước hộc là "chà đợi chiến lược”

= CAU 2: Xuất phát từ mục tiêu tàng thư, lưu trữ, quản lý khai thác thư 6 Viel nam „ sẽ dẫn đến những dinh bưởng ưu tiền chọn lựa như sau

p Cẩn tạo được chứ nơm trong máy Dú là một yêu cầu tất yếu,khĩng thể coi ià cơng việccĩ cũng được, mà khơng cĩ cũng được" (Vị tên người tên đất trong văn bản Việt Nam cĩ rất nhiều chữ Năm Hiện nay khơng một sắn phẩm phần mềm nào nhập từ bên ngồi cĩ thể cung cấp đủ chữ Nơm đê thể hiện được đủ chữ Nơm trong văn bản của Việt Nam, mà nếu thiếu cái đồ thì khơng

nĩi tổi chuyện quản lý khai thác thư tịch cĩ bằng Tin hoc Mat khác, việc đưa chủ Nơm vào kho chữ tế cũng là mốt dip để giới thiệu và giành lấy cho chữ viết cố của Việt Nam cùng các di sản viết bãng thứ chứ đĩ một địa vì xứng đáng, ngang hàng với chữ viết của các nến vàn hố khác, đảng thời bảo tổn vinh viên các chữ viết cỏ đĩ trong "Bộ nhớ chung của thế giới, khiến cho nhân loại khơng lãng quên nĩ, trong khí nhịp sống hiện đại đang đấy chứ Nơm vào quên lãng Đây cũng được coi cúng

là một biền pháp "bảo tổn van hố quá khứ” Chữ Nom JA mt thia khố quan trọng để giải mũ kho "chứng từ gốc" về chủ quyển văn hố, của đân tộc ta trong lịch sử Các ngành khoa học xã hội và nhân vàn lâu nay thường khai thác và sử dụng kho tư liệu này )

Trang 17

see

2) Hướng chủ đạo là xây dựng dẩn dần một ngân hàng đứ liệu Hán Nôm

(Ưu tiên nghiên cứu hê quản trị cơ sở dứ liệu thỏ chứ khỏng ưu tiền chủ trương mua font chữ dẹp để làm chế bản Việc làm đẹp chữ Nôm sẽ được tiến hành sau )

3) Đối tượng khai thác chủ yếu là kho sách cổ, dẫn tối ưu tiên chụn phẩm

mềm dùng chứ phổn thể chứ khỏng phải là chữ giản thể (chứ giản thể được phổ biến sau năm 1949)

YÊU CẬU 3:Xuất phát từ thực tế Việt nam hiện nay là: mợi hoạt động trao

ỗi thông tín văn bản đểu dùng chứ quốc ngử (Chử Việt hiển dại ) Vay mọi tin hiệu, mọi thông tin, muốn cho mọi người Việt nam sứ dụng dé đàng déu phải gán với chứ Quốc ngứ (Tức là các chữ Hán, Nôm phải có thể nhúng được

với chữ Quốc ngữ hay là các giao điện, đổi thoại với người dùng của chương

trình cần là chữ Quốc ngữ, hoã gẩn Quốc ngữ cho hợp thói quen của ngưừ

Việt nam) Dây cũng là yêu cẩu về ứnh phổ cập, dễ sử dung, để học, đối với các phần mềm tin học

Nhóng được chứ Quốc ngữ với chữ Hán, chứ Nôm là tạo được công cụ phụe vụ nhiệm vụ "Latinh hoá kho di sản Hán Nôm theu nhiều cấp độ của tạ, E

một nhiệm vụ lâu đài mà ta phải tự làm lấy,

-Nghiên cứu để úng dung trên nhúng máy nhỏ, do thưc tế "Bước đầu ứng dung

tin học "của nước tavà hoàn cảnh đang bị cẩm vắn,thiếu các thiết bị

cao cấp có tính nâng mạnh (Ví dụ đĩa quang ,bộ xử lý 486 còn rất đất,

hệ điều hành Windows chưa ổn định: các hệ ORACLE và UNIX chưa được nhập vào Việt Nam Tù đó dẫn đến việc "Quết ảnh sách Hán Nôm" nhưng lưu trự thủ vào đĩa cứng nhỏ chứ chưa có bộ đọc ghỉ trên CD-ROM

YEU CAU 5: "Thod man xu thế hoà nhập"

Tuy ra đời trong hoàn cảnh bị cấm vận và lac hau vé thông tn, nhưng chúng ta cũng nhìn thấy xu hướng tất yếu là Thông tn Tin học sẽ tiến túi

sự hoà nhập kỹ thuật ở cấp độ toàn cầu Vì vậy mọi cải tiến phải dí theo hướng đó , tất cả phải chuẩn bị cho ngày đó Chính vì thế mà ngay từ dấu

để tài đã nghĩ tới việc dang ký tham gia vào bảng mã chuẩn UNICODE va ISO dau rang lúc đó chựa hình dung hết công việc cụ thể sẽ phải làm những gi(trong quá trình tiến hành nghiên cứu chúng tôi thấy làm sẵn phẩm để ding trong nội bộ, so với sản phẩm làm để tham giá truyền thông quốc tế có

những yêu cầu và những phẩn việc cụ thể khác nhau Để tài đã phải tính toán

và thiết kế để có thể dung hoà, thoả mãn được các yêu cầu khác nhau, thám chí là đối nghịch nhau )

e số đrša MỘT SỐ GIẢI PHÁP ĐÃ THỰC HIỆN pf pAp ỨNg YÊU CẤU VÀ ĐẠT HỤC TIỂU ĐẾ Ra

Trang 18

tiêu để, để mục hay câu văn thường [như trong hé CWI], VA nbit sin xuất cũng đặn rằng hệ này chỉ dòng dưới DOS thấp (DOS-3.2 hay 3.3)

Nhà sân xuất cũng khoá chật font chữ cơ bản, không cho phép bổ sung sửa chữa gì vào đó (vì xét ra font ấy củng đã to hết cố, chiếm gần | Mega bytes) Nhà sản xuất cũng tạo hộ gỗ theo các phương án thích hợp với ngưửi bản ngữ (Trung Quốc) là "cha Am phù hiệu" (bua, phua, mua, pua ), "Thường Hiệt, "Hàng hệt

Để tài đã làm được việc cải tiến một phẩn mềm chứ Hán để sử dụng như sau:

~ Viết chương trình can thiệp vào font: sửa chứ trong font, về lại,

vẽ thêm chữ

- Đưa chữ Hán tir trong 1 hé CWT ra DOS, vào các hệ phổ biển dế sử

dụng như Norton, Turbo Pascal 3, nhập vào DOS.5, đưa ra máy in lascr

- Tạa được cách đánh chữ Iián thích hợp với người Việt

- Chữ Hán dùng được trong máy nhỏ của Việt Nam (với máy AT- 286 cũng soạn thảo được)

2- VẤN ĐỂ vẽ cnt NOM VA DUA cui NOM

THAM GIÁ VÀO BĂNG MA CHUẨN quốc TẾ

Nhờ nắm được cơ chế làm chữ tượng hình, để tài đã viết các chường,

trình thâm nhập can thiệp vào font cơ hẳn, vẽ thêm chữ, tạo ra 2 font chi Nom cổ 15 để hiện hình và cớ 24 để điều khiến in, Hai loại trên có thể dùng

để chế bản; riêng font Nôm 24 còn dùng đẻ đăng ký giành chỗ trong UNICODE đợt đầu Nhờ sự giúp đỡ của các ph Tín học Việt kiểu lại Mỹ, và các cự quan, các nhà làm chuẩn kỹ thuật Thòng tìa trong nước nên việc đáng kí chứ

Nôm vào hãng mã chuẩn Quốc tế đã đạt được thành công bước đầu: Tiểu ban ma

chuẩn đồng ý kiến nghị IŠO mở rộng cột thứ 4 trung bảng mã chuẩn chu chữ Nôm của Việt Nam

Như trên đã nói: việc vẽ chữ Nom dé ding trong nước đã phải thoả mãn thêm các yêu cẩu 2 và 3 là : vào bệ quản trị đũ liệu và nhúng với chủ Việt Việc tham gia UNICODE, trên nguyên tắc đã có đáp úng yếu cẩu

thoả mãn xu thể hoà nhập Ở đây để tài phải giải quyết mâu thuần giữa yêu

ìu của ISO là sấp xếp toàn bộ theo trất tự số nét và trát tự 244 bo olin từ điển Khang ÏH, còn yếu cẩu của ta là xếp theo ABC vấn quốc ngũ; UNICODE dòi hỏi nộp sản phẩm trọn vẹn ngay một lúc, cồn ta thì s dan,tim thém được chữ mới tới đâu thì vẽ tới đó Vì vậy phải chia thành các version

để bổ sung đẩn cho phù hợp với đợt bổ sung của quốc tế Chủ trương

nghiên cứu ghép mã, ghép chữ vừa đáp ứng kịp thời yêu cẩu đưa ra xem xét của 1SQ, để chúng ta không bị lỡ thời cơ vừa giải quyết được vấn dé do thiểu điểm mã mà gây ra tình huống căng thẳng gay cấn khí ta mới xin gia nhập bảng mã UNICODE

- Dé dam bao via co sin phẩm nộp vừa có công cụ dùng, trong thời giản hệ mã UNICODE va iSO chưa được chính thúc phổ biến, để tủ đã giải quyết bằng cách gán tạm mã RJG-š cho các chứ Nôm, đồng thời gán lại mã

dưới dạng Decimal (kí mã thập phân) cho tất cả các chứ Hán và chữ Nom đã cổ; tạo nén một hệ má Hán Nôm thống nhất, liên tục có thể quản ii dược

trong kho (chờ tới khi ma ISO đã phổ biến thì ta sẽ chuyển má các sản phẩm sang hệ ISO), Việc tan một hệ mã riêng như vậy cũng đáp ứng cúc yêu cầu bổ gung chữ sẽ sưu tẩm về sau của tà Sở dĩ cẩn gan lại mã B1ö-5 dưới dang Decimai vì dưới hệ điểu hành DOS vốn có cơ chế nhập chữ vũo vị trỉ con trò bảng cách đánh phím Alt + con số trên bàn phím số, cho nên nếu tà

lỡ tay xoá mất một chú nào đỏ trong kho chữ thì 1a có thể khôi phục lại nó

một cách dé dang, hoặc có thể đánh dược một chữ khó tìm vào văn bản nhò sử

dụng một tù điển điện tử để "nhác vở ",

Trang 19

-4-

~ Trong Font chi Nom nay ta cing đành vị trí chủ chữ Quốc ngữ ở

những miễn nào mà vần Quốc ngữ đi qua

~ Dựa vào thói quen đánh chứ Quốc ngữ trên máy tính theo phường pháp

gỗ telex là phương pháp dễ học dễ làm nhất, dé rat đã dùng mã (ciex

xâu gọi các chứ Hán và Nâm Quy tắc này cũng cho phép sử dụng tiết kiệm hỗ nhớ (nếu khi nào ta không cần đánh chữ Quốc ngứ thì ta không tải bộ gỗ Quốc ngữ vào, nhưng vẫn đánh được chữ Hán chứ Nôm, và khi dó lượng bộ nhú

đồi hỏi cấp phát sẽ giảm di dành chỗ để chạy chương trình thường trú)

3-VẤN ĐỂ XÂY DỤNG NGÂN HÃNG DỮ LIỆU

~ Sau khi giải quyết được vấn để xử lý ký tự Hán Nôm trên tệp vấn

ban (text file) thi edn phat nghién cứu để đưa chủ tượng hình vào hệ quản

trị dữ liệu làm công cụ thể hiến, mô tả vàn bản, Việc dưa chữ Hán cha Nom vào hệ quản trị dữ liệu đồi hỏi kỹ xảo phúc tạp hơn là đưa vào hệ soan thảo

trén tép van ban (text file)

- Định hướng vào s Ie

những giới hạn co hẹp về sử dụng tài nguyên bộ nhớ Chẳng hạn:

+ Bỏ nhớ quy ước chỉ có 640 KB, nhưng phẩn dành cho hệ quản trị CSDL FoxPro tối thiểu đòi hỏi gẩn 300 KH bộ nhớ cho hệ chương trình ấy thường trú chứ Hán thường trú chiếm gén 200 KB, chữ Viết thường trú chiếm gần 20 KB; Khi vân hành còn có sự bành trướng thém ra ví đụ bộ nhớ

cẩn dành chỗ cho các menu, các cửa sổ v

+ Do đồ phải cất bớt một số tiên ích như: soái sửa lỗi chính tá chữ

Việt trong hệ cất bớt phẩn chữ hoa có đấu trong tiếng Viết và và bộ gõ chứ Nôm đưa vào phải là bộ gỗ ghép vì nó nhỏ bơn bộ gỗ tổ hợp sẵn các chữ

đã ghép

- Một nhu khác của vấn để lưu trữ sách cổ mà Tín học có thể

vươn tới là lưu ảnh sách cổ Diểu này thế giới phải giải quyết bang

công nghệ CD-ROM Dé thi đó nghiên cứu cả hai cách quản lý lưu trổ: báng

ky tr (Character) va phương pháp quét lưu ảnh

- Việc lưu trữ bằng kỹ tự có tác dụng quản lý tìm kiểm nhanh, khủi

thác những mặt mạnh của hệ quản trị dữ liều Vấn để là chọn hệ nào để làm,

dễ học, rẻ tiến, có thể cải tiến, cá thể đưa chứ Hán, chủ Quốc ngú vào dượ

Chúng tôi đã chọn hệ FoxPro thich hop với các yêu cẩu kể trên „xà trong bước đầu triển khai đã ứng dụng để quản lý được 4500 sách và 11.500 đơn vị văn khắc Hán Nôm.Iê này cũng đang được cải tiến cho mạnh hơn lên

- Về sử dụng ngôn ngứ lập trình ứng dụng

+ Hể tài đã giải quyết mối quan hệ giữa tệp cơ sở dứ liệu và tệp

vân bản Chuyển đữ liệu qua lại giửa tệp dự liệu và tệp văn bàn, viết

chương tình tìm kiếm và thay thé wong tép cơ sở dứ liệu, viết chương tình sửa lỗi, sửa mã cho các tếp cơ sở đứ liệu, viết các chương trình chuyến mã qua lai giứa các hé soạn thảo chữ Việt cho người dùng, và chương trình sắp xếp chứ Việt theo mã chuẩn quốc gia Việt Nam

Tóm lai:Là một đơn vị đẩu tiên thuộc ngành Khoa học xã hội nghiên cúu ứn: đụng Tìn học, trong hoàn cảnh thiếu kính nghiệm và bị cấm vận, với một th

bản của bước đầu ứng dụng Tin học để bảo vê và khai thác di sản Hán Nôm như

tạo chữ Nôm, xây dựng hệ soạn thảo Hán Nôm-Việt với bộ gõ thích bựp và

bộ mã nhúng bai ngữ an toàn dưới DOS, tao thuận lợi cho việc đưa ván

bản vào xử lý trong máy; xây dựng được khung ban đầu cho Ngân hàng đữ

liệu Hán Nôm Ngoài một số sản phẩm, còn thu được những kiến thúc cẩn thiết cho việc phát triển, khai thác thông tìn Hán Nôm bằng kí thuật Tin hục Trang cách làm việc đã có định hướng đúng, nghiêm túc và có hiểu quả

Trang 20

in phdm Jam thém nam

( Những thử nghiệm ứng dung dưới Windows là s

chỉ là hước đi rất ngắn,

ngoài kể hoạch, là 'vượt mức" đã đăng ký, và mị

chưa có nhiều kinh nghiệm.)

m VỀ TRIỀN VỌNG,VÀ CÁC VẤN ĐỀ TỔN TẠI : 1) Những sản phẩm cửa để tài có thể dem vào ứng dụng ngay trong nước:

af Dé soan thảo và in ẩn văn ban Han Nom Viet

b¿ Để làm các Từ dién co chd Han, cht Nom, che Vidi trong may tinh,

phục vụ tra cứu, nghiên cứu khoa học

cj Để dạy và học chữ Hán chữ Năm

gý Để lưu trữ bảo tổn thư tịch Han Nom

2) Đối với yêu cẩu giao tiếp quốc tế

a/Chúng ta đã có được công cụ dể có thể bước đầu hợp tác quủc tế trong nghiên cứu khoa hocnhư đồng góp thêm chữ vào kho chữ tượng bình của thế giới, đồng thời tranh thủ những tiến bộ về công nghệ thông tin của thế giới và cung cấp những luận chứng khoa bọc chủ sự nghiệp Tïn học hoá, hiện đại hoá kinh tế của quốc gia, nếu được nâng

cao thêm có thể đưa vào truyền thông liên quốc gia

b/Có thể đùng vào những ứng dụng cao cấp bơn, như làm dep chinhan

đang, dịch máy Việc này yêu cầu phải nâng cao thêm

3) Cần mở rộng ứng dụng và tiếp tục cải tiếu: Nhờ mở rộng ứng dụng có

thể phát hiện thêm những nhược điểm và yéu cẩu dé cải tiễn, nâng cao

chất lượng sản phẩm đã làm ra

4) Căn cứ trên các kết quá đã dat được, căn cứ trên hướng đi và nhiệm vụ

lâu đài có đối chiếu với tiến bò kí thuật Tin bục biện nay, sau khi

xuá bỏ cấm vận, chúng tôi xin nêu một gợi ý như sau :

a/~ Để nghị Trung tâm Khoa học Xã Hội và Nhân văn quốc gia kiến

nghị với Nhà Nước đầu tư chiều để tiếp tục nghiên cứu và khui

thác, ứng dụng những thành quả của Tin học Hián Nóm của trong nước

và thể giới vào nghiên cứu khoa học ( Hình thức có thể là môi dư án hoác một Uỷ Bạn dịch thuật liên quốc gia ) làm một đẩu mối thực hiện nghị quyết 49/CP của Chính phủ.Ở day sé tap hợp các chuyến gia của 2 ngành Tin hoc va Han Nom hoc để phối hợp hoạt động, vừa nghiên cứu vừa khai thác

b/-Những nhiệm vụ có thể triển khai tiếp |

+ Hoàn thành việc mã hoá chữ Nôm của người Kinh, chứ Nom Tay cht: Thái cổ, chữ Chàm cổ, bịp thời đăng bí vào bảng mã chuẩn của thé

giới

+ Lam đẹp cho các chữ viết cổ đó

+ Xây dựng các từ điển điền tử sang văn tự như Hán Việt Nôm-quốc

ngữ đưa vào sử đụng tra cứu, và phục vụ cho các chương trình dịch máy

+ Quết lưu toàn bộ kho sách Hản Nôm vào CD-R ø lưu nhân bản và khải thác theo kĩ thuật mới, để phòng mất mắt di sâu

+ Xây dụng các chương trình địch máy song văn tụ

cổ Trang bitể chức gọn nhẹ nhưng đủ sức để làm việc,

+ May tính Pentium hoặc Power P€ áp dụng công nghề RISC tốc dõ củo + Sử dụng cùng nghẻ "cum dẫu cứng" dạt tốc đồ cáo

+ May doc vi ghi CD-ROM + Kết hợp đội ngũ chuyến giá 2 ngành làm các chương trình dịch ngũ

Trang 21

PHỤ BẢN SỐ 1

ngo lao giữa cưữ Hấn vÀ chữ Việt

khi những cHữ Việt trong

Trang 22

PHU BAN SO 2

PHIẾU MO TA VAN BIA VIỆT NAM ĐỂ QUAR LE

1/-8ố: 20957 2/- Số cũ: - 3/- Loại: rên giáo, văn hoá

4/-Tên bia: (viết hoa đâm) CÀN NI SƠM HƯƠNG NGHIÊM TY BI MING

5/~ Niên đại: Ngày 10 tháng 1 năm 1325 (Năm Giáp thin, niên hiệu Thiên

Pha Dué Vi năm thứ 5, Tháng 12 ngày mồng 4}

6/-Tên cũ: như trên

7/-Tên Việt: Văn bia chùa Hương Nghiêm núi Cân Wi

8/-Người soạn: chưa rõ Theo noàng Xuân Hãn, người soạn là sư Pháp Bảo trên

thật, quê quán, nšm sinh, năm mất đếu chưa rỏ)

S/-Noi để(Địa điểm nay) : xá Thiệu rung,huyện Thiệu Hoá,tỉnh Thanh Hoa 10/-(BTA DANH CỔ : kể 4 cấp hành chính ghì trong hia)

11/-Wơ$ lưu giữ: Thác bản lưu giữ tại Viện nghiên cứu Han Nom

12/-Người viết chữ: cnua rõ

13/-Người khắc chữ: Ngưởi khác lại, vác năm 1126 -Ìa Lê Buán Danh,người xã

An Hoạch, huyện Đông Sơn, Thanh Hoá

„ 14/-Kiển chữ: chữ khải khắc châm, đọc tử trên xuống, từ phải sang trải Tình trạng thác bản: Ban rập tit bia khắc lại, bị mờ nhiều chữ 15/- Chất liệu: nả

16/-Hình thức: mhổ c#o Inge rong ams

‘TU THEN cHOT

17/-Tên người: bạo Dung, Le céaz, Đỉnh Tiên Hoàng, Lê Đại Hành, uy Thai Tông, Đạo Quang, Lưu công, [¬ý] Thanh Tong, Minh Hiểu Boang đế, Thuy Thành Công chúa, Lý Công, Thiếc, Tỏ, Lê Văn Nghỉ, tính Trạm, Lễ Huân Danh,

18/-Ten et: can wi, Heong nghiện, Gia Vệ, ái Châu, Cửu Chân, trinh Nghiêm, Minh Nghiên, Vũ Long, na za, Kim Cốc, NgẺ Huyện giang, Vương Thành, Thứu Đài, Lư Giang, Khải cise (thôn) niên Hào, (xã) An Hoạch, (thôn) Nhuê (cha); [giap) Bối Lý,(đấm) è L6i;tgiáp) Viên Đàm, 19/-8ự kiện: vam lại chua, Thời kỳ: Nhà tý (1016-1225)

20/-Tên quan tước: | cổu cÄ quan TƯỚC,DANH HIỆU VÀ THUẬT NGỮ cổ

Trấn quốc bộc xạ, ĐÓ quốc ¿ịnh sứ, Kim từ quang lộc đại phu, quản giới, Hoàng để, Thiến chủ, Trường iac, pai hình, Thải phố, Nhập nội nệi thị sảnh

a do +: phe, Cùng dịch gứ, Đại tướng quản,Thượng trụ quốc

khai quốc công, Thái Phê kỉ lang, Thiên Phủ Duệ Vũ, Bảo Thái, Thực ấp, Thực phong

21/-Chữ Hồm Khó

Thiển sự Dac Dung, xuấc thân từ đông họ lớn có uy vọng nhiều

Số dòng 31 Số chữ 1300,

dei,tro tri ở Kính đề,giác ngộ lẽ sắc không, vận động các nhân vật nổi tiếng Si như Thái

mh Bam, Thai ay Lý Thường Kiệt, Thuy Thanh

„ trùng tụ chủa Phật, soạn khắc van bia dé lim truyền mí 23/-Sách tham khảo: te¿a văn đã được chép lại trong cuốn “Bi_van“va cuốn “Ly Thương KÍết sau đã được phiên âm, và địch ra tiếng Việt 24/-Thy mic tham khảo

BỈ văn, bản sao chép ky hiéc vav 1167, sách đã mất,

LỰ,Thường Kiệt Tác giả Hcảng Xuân đến, nhà xb sông Nhị, gà fội

Trang 24

PHỤ BẢN SỐ ¿

GIỚT THIỆU SƠ LƯỢC HỆ QUAN TRỊ CHỮ NÔM DẠNG ĐIỆN TỪ

(TIỀN THÂN CỦA TỪ ĐIEN CHỮ NÔM ĐIỆN TỪ )

điều hành Me.Dos, phần mếm để kiếm là ET2 (Ÿ Thiên) và Foxpro 2.0,Foxbase

- Mẫu chữ để vẽ :lấy trong các thư tịch cổ Việt Nan, bước đầu lấy ở hai tử điển xuất bản gần đây nhất và tương đối nhiều chữ là TĐCN (Từ điển chi Nom -Vũ Văn Kính) và BTCH (Bảng tra chữ Nôm - Nhả xuất bản Khoa học Kã hội,do

nhóm Hồ Lê biên soạn)

TIẾT 2 : GIỚI THIỆU SƠ LUỢE CẤU TRÚC DƯ LIỆU

(Cấu trúc - các trưởng của tẹp chủ đạo)

- Tên tệp : NOMDD.DBF (wam Gay 4a)

~ Có các trưởng sau: Kiếp độ rộng

le Mor (mã quốc tế) character

2- N (nguồn cũng cấp cht) € =—-

3— MARSC (mã ascii, Big 5) ¢

4- CHU (hinh choy c

5~ AHV (âm Hăn Việt - Ar némjc 1

TIẾT 3: GIẢI THÍCH Ý NGHĨA CÁC TRƯỜNG, TÁC DỤNG VÀ CÁCH XỬ LÝ

1/ MỘT (MÃ QUỐC TẾ): trường này ghi các mã U+ và V+ trong bảng mã DNICƠnI

giành cho chữ Hán và Nôm U là en3 Unicode đã có, V là chữ Năm thuẩn Viện, Trưởng này giữ quan hệ tương thông giữa mã Unicode và hệ riêng

dụng (bệ Ý THIÊN]

a ching tei

Trang 25

~3~

2/ N (NGUỮM) trưởng ghỉ nguồn gốc các chữ trong các tử điển, gồm 1 chữ hoa

đứng đầu kèm san lá 4 kí tự số, chữ hoa đứng đầu là viết tất tên các tác

giả đã mô tả chữ Nôm trong từ điển của họ, cae chit sé la the tit che trong

từ điển đó “8' là chữ do nhóm ông Nguyễn Quang Hồng mô tả, 1° La chit do

nhóm ông Hồ 14 (Bảng tra chữ Nêm) mô tà "W' là chữ do ông Ngô Thanh Nhân

nô tả,trích chọn ở tử điển Vũ vấn Kính)

¬ Trường hợp Nhân và Lê cùng mô tả một chi thi dem kỹ hiểu N+ chứ số

chuyển sang trưởng AKHAC (vi trưởng ay rộng 40 kí tự, còn thửa ch}

~ Nếu Lê nô tả trúng lập thì cũng đem bớt l ký hiệu chuyển sang trưởng

AKHAC, ghi la ‘NL’

- Lêm nhự thế vì Bang tra chữ Nôm của zê có số lượng nhiều hơn cả, có đánh

sẽ liên cục, có thể đông làm văn bản nén (text de base) để khảo dị so sánh, kiểm tra để phông bổ sót chữ

- C6 65 record mA sau chữ số con thém chữ "b" ở do la cae vecerd lie,

vì 1 trưởng ARunc không đủ “chổ để ghỉ các ấm dọc khác nhau của chữ ấy, vậy

phải thêm 1 record nữa để có thén chỗ mà ghỉ am

3) MAASC: MA ASCII CUA CHI (gh: theo hệ thập phân, bằng sác can số từ ©

đến 9¡ Nếu lỡ tay lãm mất hình chữ, ta có thể khôi phục bang cach da phím

alt và đánh con số ở khu vực đách đã 2 con số Chỉ

= Ta có thể đếm xem trong tệp NOMDD.DEF có bao nhiều record cé chi lea!

ghép (4 bytes) bing lệnh Foxpre sau:

6) BỘ (BỘ NÓI CHUNG): cnủ ý rằng khả: niệm "bội

rộng, nó dùng để gh: am che toa chi “phan nghĩa'

toà gợi âm sủa chữ ấy (toa agi am được di trường “cum") thee thei quen

trao đểi miệng với nhau, muốa mô và mộc chữ, người te bay nói chữ ấy gốr

bộ gì ghếp với ám gì só hàn ý nắng "bộ ghỉ phẩn nghĩa, "âm" gai

gợi âm chỉ ra cach đọc của chit ay T6m Lai chúng xôi cố gàng phan «

‘gai cho ta dos ra am ‘cot ' mẻ chữ 8âo chứa cói te

chữ "lui" gốm “bO tdov,"am 16i" (iui là lui gát, là đi bằng chân,

nên có bộ "túc hữ 'lõi' gợi shớ ta dgc ra am ‘lui’ má chữ Hản chưa

Trang 26

n 1ñ TH a.’ Gee vàng VỆ

Hi, nhưng đã thành quen và tiện dũng để mô tả chữ, nên cũng chấp nhận Ví

dụ chữ "nhẽ" được mô cd là "bộ lí, âm nhĩ", nhưng bệ '“Li' (chuẩn } thi

không có chữ "ngọc" ở bên Hoặc là chữ "Giúp" mô tả là "bộ trợ am chấp" „ thì thực ra không có bộ "trợ", trong phần ghỉ nghĩa chỉ có bộ "lực" là dang được ghỉ , vì vậy muốn sắp sắp xếp cho hợp lí ta phải để chữ "giúp" vào bộ

"tực" ĐỂ giải quyết việc sắp xếp này ta có trường BO9X (B6 sáp x xếp, làm,

nhiệm vụ đó (Chữ "giúp" sẽ được ghỉ BOSX của nó lá lực) * ted mgt

= Vige tach doi một chữ thánh BỘ (ghi nghia) vacwm (ghi am quen dung,

chợt nhận và đọc ngay được; sẽ tiện lợi cho việc tra cứu nhanh + - Khi cảm một văn bản hay một chữ mã người đọc chưa biết người sáng tác ra nở

định gán cho âm gì, nghĩa gì, thì có thể tra cứu trên cơ sở biết được am

của từng bộ phận của nó, mà việc này thì tương đối

= Chương trinh TRNOM.PRG (tranom.prg) lam theo cảnh công index va cho phép

để bộ trước cụm sau, hoặc cụm trước bộ sau đếu tìm ra chữ,

vé cach dua xâu gọi (xâu (Ầm kiếm) vào trong ở đây người sử dụng phải gõ ân telex của "bộ và cụm đính liễn nhau" (không để khoảng cách hay đấu cộng ở giữa)

Nhân, Hồng đã mÔ tả, mô tả thiếu ẩm, các ăm ấy đếu ghỉ vào đây, ghỉ các âm khac nhau của một chữ má Lá,

này» sôa đưa vào một số ấm "tiện đọc tức

Ngoài ra Long (ngư

thời" (trông thấy chit dé, người ta không cấp suy nghĩ nhiều, cớ thể đọc

ngay ra âm đối

Sự thêm thất này phẩm phục vụ cho việc tìm kiểm va go chữ vào Vấn bản

được nhanh, chử không phải là âm "chuẩn" mã một từ điển nào trước đã mê tả

= trong tuong lai, ed thé trata

bing truong atom, kiểu Memn,Šể cho độ lên của t

kiểu

vị kiếc trưởng Meme e

tự vẫn không chữa hế 4 cố 18 KỈ tự, cên wong Charac

9- BOSX (BỘ SẮP XẾP) nảy chính lá "bộ" theo quy địch của tử diển Khang

ai ma Ucicode và 1o đã lấy iar chads để sắp xếp kho chữ tượng bình

Đối với kho chit Nom ray, đầy lã trưởng ghi phiên âm tiên việc theo kiểu

telex cải Đệ Khang Hí đó

- Trưởng này quan hệ mật thiết với trưởng SHR (SẼ hiệu bội,

- Trong 214 bộ Khang Hỉ có ¡8 gặp bộ trúng âm Hán Việt với nhau nền phả

ghỉ thêm các chữ số kém sau để phan biệt (va chỉ ghỉ kỉ tự !1*' hoặc

eT Te

wehd2"(@) (chi cat déaj; "vat"(ÄMj (chỉ lông chím,phân biệt với “va2" oF)

{chi may, mtay v v Vé chi tiết xim xen trong tệp B214.đb£

Trang 27

~Sau khí chạy chương trình SUABOSX.PRG(sửa bộ sắp xếp) thì các cht wom trong tập NOMDD.DBT sẽ được phân loại và quy về số hiệu bộ Khang Hì của nó Chỉ côn chờ thêm yếu t6 số nét là có thể làm lệnh sORI để xếp các chit ay theo trật tự mà TSo quy định Lệnh sắp xếp ấy được viết như sau:

toàn chính xác, vì việc nây rất khỏ),

~:sau khi sắp xếp thì các bộ đặc biệt (dùng riêng trong chữ Nôm của việt

Nam) sẽ nổi lên trên vi nó không thuộc bộ nào trong 214 bộ Khang Bi

Tám (8) bộ đãc biệt của Việt Nam mà chúng tôi bước đầu phân lập được

xa là : Mháy'Œ#C Cự (phải)@B ,Cự (trên) ca Of, ving vai trái €

(vvt) —,Nhấy kếp phải (np) 22 ,Mháy trái (nk) >2 ,Kim trái (ct) YD

~ Tác giả hệ này ehưa muối

vet này ta có thể dễ đăng nhận biết khi muốn thống kẽ hoặc khi xếp loại,

khí chọn lọc cáo chữ Nôm chuẩn Việt , cho nên ching tei chua gan gi veo

trường BOSX của các chữ ấy Nếu muốn xếp Vào 8Ộ Khang Bí cản chữ ấy thí

quy các chữ này về bé Khang Hi, vi dya véo dâu

không gh:! Trường này củng với trường OSX va trường mọc (mã đầu cuối)

phục vụ cha việc tự động hóa một phẩn công việc đánh mã đầu cuối

= Đo cách xác định mã đấu cuối có đặc điển riêng, mộc bộ nào để nếu để ở đấu chữ'shì mã đấu của cá chữ được ghỉ bằng 1 kỷ hiệu này, ca nếu để ở cuối thi mã cuối của cả chữ ấy lại được ghỉ bằng 1 ký hiệt khac

W{ dạ cũng là bộ điểu, nhưng khi ghèp vàc với chữ khác :

~ Trường này có thể có 3 mã lá *d' (đểu) 'e“ (cuổi) hoặc bò trống

12) MDC (MÃ ĐẦU CUỔI): dã nói ở 1L

Việc quy nạp mã đầu cuối được ghi văn vất ở phụ luc 4

13) SNET (S6 NET), đã nói ở trưởng 9 Trưởng SMET nảy phục vụ việc sắp xếp

kho chữ theø trật tự do 1so quy định ac việc sưu tấm và vẽ chứ cẩn tiến

hành keo đải, khêng thể chờ eưu tấm đả nết mọi chữ xong rấi mới xếp trật

va ve vas font, vi vay trat ty trong font phải cho phép :4 ngẫu nhiên, chữ não sưu tấm dược trước chì vẽ trước, sưu tấm được sau thi vé sau, con việc

Trang 28

-5-

14) VÀ 15): DZ VÀ DZ2 (DANE DAD, DANH DAU 2)

Mai trường này phục vụ nhu cấu hiệu đính, biên tập Khi làm thủ công, hoặc

chạy chương trình, tủy theo sự cẩn thiết, ta có thể cho đảnh đấu 1 số

œecord nào đó, rồi chọn phơi lên hoặc copy các record đánh dau ra tệp khác

v.v Huốn đảnh đấu thì trước khi làm việc cần xoá trường ấy bằng lệnh

Replace all dz with ‘ Muến phoi céc record da đánh dấu bing ‘+’ chẳng bạn ta dũng Lệnh

Brow norgri for dz = ‘*’

26) VA 17): THUC GHÉP VÀ TS (TỔNG SỐ) Hai trường nảy phục vụ công việc

thống kê nhanh các bộ thực ghép chương trình TRG2.PRG (thống kế chữ ghép

2 toa): chương trình này dung lénh Total cla Foxpro, chạy nhanh, che ra

ất quả thống kê số bộ nói chung và bộ thực ghép nói riêng trong vài phút

18) DỰ KIẾN CÓ THỂ SỬA CẤU TRÚC CHO HOP LY HOW có thể thêm trường FL

(phân loại) để ghi phân loại các toà : toà nảo chuyên để ghép trước , toa

nao chuyên ghép sau Lam như vậy để phục vụ cho việc mà hoa tu dang

GIỚI THIẾU SƠ LƯỢC VAI CHUUNG TRÌNH DỊCH VỤ, VA VAI TEP DBF

KIEM TRA DUNG PHU TRỢ CHO TEP CHỦ ĐẠO,

3) Do dac diém các trường (field) hữu quan trong tép DEF chủ (HOM.DBF-

déu dũng ký tự ascrt chuẩn để ghi sự sai sốt trong cach ding mã telex ¿

ghi âm Việt'1á khó tránh khỏi và khé kiểm tra được bằng mắt thương

„ và lại việc kiểm tra bằng

„ vi vậy cẩn có các tệp DBF ĐỔI CHIẾU dé gin

phát hiện đánh đấu các lỗi chỉnh tả telex Vi dụ chữ "tiến" đăng lẽ mã teios

phải ghí la "lieens", nhưng đánh nhấm vao 14 “lienx", tai chương trình kiểm

tra sé dank dau và phơi lên

Tép VCRUAN.DBF chita hon 6090 tir dot

như tệp B21£.DBFj, có các chương trình SORELA.prg, sobo.prg, Soatbo.prg

làm nhiệm vụ phát niện cac ché danh sai telex

Tệp Chương rrình RDATQUA.PRG phát hiện các xâu đài qua 8 #3 tự trong cả

trường đơn xáu và trường de xau ( Lu ý rằng một tử đơn âm của tiếng

Việt d¿ đảnh bằng mã telex cũng không tạo ra một xả đãi quả 8 kỉ tự, đỏ

là một dặc điết của "Tử" tiếng Việt khác với "tứ" trong sác ngôn ngữ chau Ba

thể vận đụng khi thiết kế câu trúc dit 2

2) Đo cẩn sắp xếp theo trật sự Khang HÍ nên có chương trinh B2:4.PRG

đi kem tẹp BZ14.DBE ,cac trường BOSX va SHE trong tập chủ đạc như đã kế ở tiết trị

3) Ngoài

a/ Các chương trình lấy chữ nản tử kho chữ Hàn để ghép thành chữ Nôm, he

lay chit nan dung vhẳng làm wôm (như chương trinh LVa.PRG va LVN PRG}

b/ Các chương trinh giữ quan hệ tương thông với mA UNICODE va =50 kai cáo

bằng mã ấy có điểu chỉnh thay đổi vị trí các điển

©/ po cách khai thắc Bộ nhớ của các bê soạn thảo dưới DOS và trong hệ Quần trị đữ liệu đôi hỏi dung lượng bộ nhớ có khác nhau, nếu đúng chang một

bộ 96 sẽ gây ra tỉnh trạng thiếu bộ nhớ , vá máy dừng bảo Lỗi, khiến không thể hoạt động được, vị vậy cán có các chương trình chon lọc dé đưa chữ ra

Trang 29

~6-

các bệ gỡ theo các yêu cầu khác nhau (tuỳ theo ta muốn soạn thảo một #ile DBF hay file TEXT ) Chương trình RATRBOX PRG, LOCTRBOX.PRG, LOCLAI.PRG

1 ¥a tập TRUOCBOX.DBE phục vụ cho mục dich nay

Tim lai: với tệp NOMDO.DBF lắm cơ sở, tạo thêm một số tệp DBF dich vụ

giữ nhiệm vụ kiểm tra, và một số chương trình PRG để làm việc, chúng ta

xẽ quản lý kho chữ Nêm theo hưởng tích cực, làm thêm được các công việc như 1~ sưu tấm, vẽ thêm, ghép thêm chữ wom

2- Mã hoá chúng theo các cách khác nhau để tra cửu cho nhanh, soát xét xem xem chữ não cấn vẽ thì sẽ vẽ bổ sung, tận dụng được chữ cũ để ghép được thành chữ mới thị ghép,

3 - Đặt tương thông với mã quốc tế 180

4 - Thống kê, nghiên cứu, phân tích,

5 - Đưa chữ vào bộ gõ để soạn thao va in ẩn,

+

Đó là những nhiệm vụ và ứng đụng mức thấp của hệ quản lỷ chữ Nôm, đướởi pos

CÁC TÁC GIẢ

1~/ Thiết kế hệ thống : Ngô Thể Long

2/- Tháo chương thực Chỉ + Nguyễn Vẫn Huôn ,Ngó TT

3/- Vẽ chữ + Ngê Thể tân ,Nguyễn Minh Khánh „

Nguyễn Thi Ha, Hoang Văn Ram 4/- cố vấn Tin học : Pạs Tiến Sĩ Nguyễn Xuân Huy

CĂN CỨ Cơ Sử

( Hệ này đựa trên nến tang và cho phép của các phần mềm sau day =}

1/-Hẽ điểu hành HS-DoS Version 3.0 dén Version 5.0

2/-Hê Quản trị cơ sở dữ lá:

3/-Fant chit Han của hệ Ý THIEN (E2)

4/ Chữ Nêm dược chọn vẽ theo các tải Liệu mó tả chủ yếu sau đây +

a/- mừ piển chữ Nêm - Vũ Văn Kinh Sài Gòn 1971

b/- Bang tha chữ Nêm -Nxb Khoa học xã hội - Hà Nội 1972

ảo và in an trên máy in kim và laser ( dưới DOS j

- Tra cứu thống kẽ phản tích về ngôn ngữ học

Trang 30

TƯ LIỆU THAM KHAO

** — Thao thống kê chưa chính xác lắm , chỉ trong 13000 ch Hán của hệ

Ý Thiên, các bộ ghép đã được sử dụng với tấn số cao, như sau:

PHỤ LỤC '1 ; đưa ra 4 ví dụ (các cựn "âm! L4 ,"Bì"Ÿ,"Cạp»“Ê, ,"chuy"#)

chỉ cần 1 cụm ghép với các bộ khác có thể tạo ra hơn 20 chữ Hản khác nhau

Các nhà Lam code và lâm Font cân xem xẽt thực tế này va bạo điểu kiện

để người sử dụng có thể ghép chữ ,sáng tạo ra chữ mới,mà xhông đôi hỏi cấp

thêm mã Đó Là một để nghị xây dựng đổi với bộ code chuẩn của Iso

PHỤ LỤC 2 : đưa ra các Bộ có tấn số cao đã thực ghép hoặc có

kho chữ Nôm (Tệp NOMDD.PBF)

trong

PHỤ LỤC 3 : IN 13 TRƯỜNG CỦA TEP NOMDD.DBF DE GIỚI THIỆU CẤU TRÚC CÚA Tp

nảy và các chữ chọn ín là các chứ ghép 4 bytes)

PHU LUC 4 ; Gigi thiêu tốm tất cách mã hoá "ĐẤU có?” ,nột cách gọi

khác của "giản đị đu nhập pháp" trong phương án mã hoá Thuong Hist

giành cho những người khong biat phat am chit 1a gi vẫn đánh được chữ Hán

RAT MONG QUÝ VỊ GÓP Ỷ KIẾN ĐỂ HỆ NÀY HOẠT PONG TOT HON NHÓM TÁC GIẢ

XIN CHAN THANH CAM ON.

Ngày đăng: 05/10/2023, 21:14

HÌNH ẢNH LIÊN QUAN

Hình  trông  cũng  hài  hoà,  không  xây  ra  hiện  tượng  xô  lệch  về  một  phía  hoà - Bước đầu ứng dụng tin học để bảo vệ và khai thác di sản thư tịch cổ việt nam tin học hán nôm
nh trông cũng hài hoà, không xây ra hiện tượng xô lệch về một phía hoà (Trang 40)

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w