TTTL So 4 2007 qxd NNNNghiïn cûáu TTTTrao àöíi THÖNG TIN vaâ TÛ LIÏÅU 4/2007 15 I Giúái thiïåu Àaãng vaâ nhaâ nûúác ta àang rêët quan têm àïën viïåc caãi thiïån vaâ nêng cao chêët lûúång àúâi söëng cuãa ngûúâi dên caác vuâng nöng thön, vuâng sêu, vuâng xa Taåo àiïìu kiïån cho ngûúâi dên truy cêåp thöng tin laâ möåt trong nhûäng phûúng phaáp giuáp ngûúâi dên nêng cao hiïíu biïët, tiïëp cêån vúái caác phûúng phaáp saãn xuêët kinh doanh tiïn tiïën, goáp phêìn phaát triïín kinh tïë xaä höåi nöng thö[.]
Trang 1I Giúâi thiïơu
Ăaêng vađ nhađ nûúâc ta ăang ríịt quan tím
ăïịn viïơc caêi thiïơn vađ níng cao chíịt lûúơng
ăúđi söịng cuêa ngûúđi dín caâc vuđng nöng thön,
vuđng síu, vuđng xa Taơo ăiïìu kiïơn cho ngûúđi
dín truy cíơp thöng tin lađ möơt trong nhûông
phûúng phaâp giuâp ngûúđi dín níng cao hiïíu
biïịt, tiïịp cíơn vúâi caâc phûúng phaâp saên xuíịt
kinh doanh tiïn tiïịn, goâp phíìn phaât triïín
kinh tïị - xaô höơi nöng thön, miïìn nuâi Tuy
nhiïn, coâ möơt thûơc tïị lađ ngûúđi dín nhûông
vuđng nađy híìu nhû khöng coâ ăiïìu kiïơn tiïịp
cíơn vúâi caâc loaơi thöng tin, ăùơc biïơt lađ thöng
tin khoa hoơc vađ cöng nghïơ Do ăoâ, ûâng duơng
cöng nghïơ thöng tin vađ truýìn thöng
(CNTT-TT) ặúơc coi lađ giaêi phaâp hûôu hiïơu
ăïí giuâp ngûúđi dín coâ khaê nùng truy cíơp vađo
caâc nguöìn tin trïn Vò ngûúđi dín úê caâc vuđng
nöng thön, vuđng síu, vuđng xa thûúđng coâ haơn
chïị vïì nùng lûơc sûê duơng CNTT-TT nïn cíìn
phaêi taơo ra nhûông cöng cuơ dïî sûê duơng, dïî
tiïịp cíơn Trong khuön khöí dûơ aân “Xíy dûơng
cöng trònh míîu vïì ûâng duơng cöng nghïơ
thöng tin vađ truýìn thöng nöng thön”, nhoâm
thûơc hiïơn dûơ aân ăaô xíy dûơng möơt sûu tíơp söị
vïì cöng nghïơ thñch húơp nöng thön ăïí giuâp
ngûúđi dín caâc vuđng nöng thön tiïịp cíơn vúâi caâc nguöìn tin KH&CN, phuơc vuơ saên xuíịt kinh doanh cuêa caâc ắa phûúng
Trong bađi viïịt nađy, chuâng töi trònh bađy quaâ trònh nghiïn cûâu lûơa choơn vađ ûâng duơng phíìn mïìm thû viïơn söị Greenstone Digital Library (GSDL) ăïí xíy dûơng sûu tíơp söị cho nöng thön
II Lûơa choơn phíìn mïìm
1 CDS/ISIS CDS/ISIS lađ phíìn mïìm lûu trûô vađ tòm kiïịm thöng tin vùn baên do UNESCO phaât triïín CSDL xíy dûơng bùìng CDS/ISIS coâ thïí ặúơc ặa lïn maơng Internet bùìng nhûông cöng cuơ ặúơc cung cíịp búêi möơt söị töí chûâc sûê duơng ISIS Thñ duơ, Thû viïơn Khoa hoơc Ăiïơn tûê Trûơc tuýịn (SciELO) ăaô xíy dûơng thû viïơn söị toađn vùn caâc taơp chñ khoa hoơc dûơa trïn caâc cöng cuơ ISIS ặúơc phaât triïín búêi Trung tím Thöng tin Y hoơc Myô Latin vađ Ca-ri-bï (BIREME) [4] Töí chûâc Nöng lûúng Thïị giúâi (FAO) cuông sûê duơng CDS/ISIS ăïí töí chûâc caâc CSDL thû muơc cuêa mònh trïn Web [5]
Taơi Viïơt Nam, CDS/ISIS ặúơc sûê duơng röơng raôi taơi caâc trung tím thöng tin vađ thû
LÛƠA CHOƠN PHÍÌN MÏÌM VAĐ KHÖÍ MÍÎU DÛÔ LIÏƠU SÖỊ
PHUƠC VUƠ XÍY DÛƠNG SÛU TÍƠP SÖỊ PHUƠC VUƠ NÖNG THÖN MIÏÌN NUÂI
Ths Cao Minh Kiïím, Ths Ăađo Maơnh Thùưng
Trung tím Thöng tin KH&CN Quöịc gia
Trònh bađy kïịt quaê ăaânh giaâ lûơa choơn phíìn mïìm, khöí míîu dûô liïơu söị vađ siïu dûô liïơu ăïí xíy dûơng sûu tíơp söị vïì cöng nghïơ kyô thuíơt nöng nghiïơp thñch húơp trong khuön khöí möơt dûơ aân ûâng duơng cöng nghïơ thöng tin vađ truýìn thöng phuơc vuơ phaât triïín kinh tïị - xaô höơi nöng thön miïìn nuâi Phíìn mïìm thû viïơn söị Greenstone Digital Library ăaô ặúơc choơn sûê duơng ăïí taơo líơp vađ phöí biïịn sûu tíơp söị vïì cöng nghïơ thñch húơp nöng thön
Trang 2viïơn trong thíơp kyê 90 cuêa thïị kyê trûúâc Thñ
duơ, Trung tím Thöng tin KH&CN Quöịc gia
(NACESTI) ăaô xíy dûơng CSDL toađn vùn
baâo caâo kïịt quaê nghiïn cûâu (KQNC) bùìng
phíìn mïìm CDS/ISIS dađnh cho Windows
(phiïn baên 1.52)
2 Greenstone Digital Library
Greenstone Digital Library (GSDL) lađ
phíìn mïìm duđng ăïí xíy dûơng vađ phöí biïịn
caâc böơ sûu tíơp söị GSDL ặúơc phaât triïín búêi
Dûơ aân Thû viïơn söị New Zealand taơi trûúđng
Ăaơi hoơc Waikato vúâi sûơ húơp taâc cuêa
UNESCO vađ Human Info NGO GSDL lađ
phíìn mïìm nguöìn múê, ăa ngön ngûô, tuín
theo giíịy pheâp sûê duơng cöng cöơng chung
GNU (General Public License) [6] Muơc
ăñch chñnh cuêa phíìn mïìm GSDL lađ nhùìm
cung cíịp cho ngûúđi duđng möơt cöng cuơ maơnh
vađ miïîn phñ ăïí xíy dûơng vađ phöí biïịn caâc
sûu tíơp söị
GSDL ríịt dïî cađi ăùơt Noâ coâ thïí chaơy trïn
híìu hïịt caâc phiïn baên cuêa nhiïìu hïơ ăiïìu
hađnh Windows, Unix/Linux vađ Mac OS-X
Nhiïìu töí chûâc trïn thïị giúâi ăaô sûê duơng
GSDL ăïí taơo vađ xuíịt baên caâc böơ sûu tíơp trïn
web Noâ cuông coâ thïí ặúơc sûê duơng cho cöng
taâc lûu trûô ăiïơn tûê cuêa caâc ăún võ [7] Taơi Viïơt Nam, möơt söị núi ăaô sûê duơng GSDL ăïí taơo caâc böơ sûu tíơp söị cuêa mònh Thñ duơ, Ăaơi hoơc Quöịc gia Tp Höì Chñ Minh ăaô sûê duơng GSDL ăïí taơo möơt söị böơ sûu tíơp söị theo nhûông chuê ăïì khaâc nhau [8]
3 So saânh giûôa CDS/SIS vađ GSDL Ăïí lûơa choơn phíìn phïìm, chuâng töi xem xeât theo möơt söị tiïu chñ sau: höî trúơ tiïịng Viïơt; höî trúơ ặa CSDL lïn World Wide Web; quaên lyâ toađn vùn; quaên lyâ siïu dûô liïơu; chûâc nùng tòm kiïịm; chûâc nùng duýơt tađi liïơu; lûu kïịt quaê tòm kiïịm; in tađi liïơu tûđ cú súê dûô liïơu Kïịt quaê so saânh ặúơc toâm tùưt trong Baêng 1
Hiïơn taơi, möơt söị chuýn gia ăaô ặa ra möơt söị phûúng thûâc ăïí chuýín ăöíi CSDL CDS/ISIS sang GSDL vađ ặa lïn INTERNET [9,10] Tuy nhiïn, trong khuön khöí dûơ aân ăiïìu nađy khöng thïí thûơc hiïơn ặúơc vò do dûô liïơu tiïịng Viïơt trong CDS/ISIS ặúơc lûu trïn böơ maô kyâ tûơ 8 bit (TCVN 5712-1999), vađ khöng thïí chuýín ăöíi chñnh xaâc bùìng cöng cuơ coâ sùĩn cuêa GSDL sang maô UTF-8 cuêa dûô liïơu lûu trûô trong CSDL cuêa GSDL
Höî trúơ
tiïịng
Viïơt
- Höî trúơ tiïịng Viïơt ASCII 8-bit (TCVN
5712-1999)
- Cíìn phaât triïín böí sung caâc chûâc nùng cho pheâp
hiïín thõ thanh taâc vuơ vađ caâc thöng baâo bùìng tiïịng
Viïơt
- Ăïí truy cíơp Internet, cíìn coâ maây chuê
Webisis, möơt maây chuê proxy ăùơc biïơt ăïí thûơc
hiïơn chuýín ăöíi tûđ maô ASCII sang Unicode
(TCVN 6909-2001) vađ ngûúơc laơi
- Höî trúơ Unicode (TCVN 6909-2001);
- Coâ sùĩn giao diïơn tiïịng Viïơt
- Khöng cíìn chuýín ăöíi böơ maô kyâ tûơ, GSDL mùơc ắnh sûê duơng Unicode
- Dûô liïơu bïn trong GSDL lûu trûô theo UTF-8
Baêng 1 So saânh caâc tñnh nùng cuêa CDS/ISIS vađ GSDL
Trang 3Tiïu chñ CDS/ISIS GSDL
Höî trúơ
xuíịt baên
CSDL
trïn web
- CDS/ISIS tûơ thín khöng coâ tñnh nùng cađi
ăùơt chaơy trïn Internet mađ cíìn phaêi coâ cöng
cuơ ăùơc biïơt (Webisis, WWW-ISIS,
Genisis, )
- Coâ thïí cađi ăùơt chaơy trïn Internet
Quaên lyâ
toađn vùn
- Möơt biïíu ghi CDS/ISIS coâ töịi ăa 200
trûúđng, vađ coâ thïí chûâa túâi 32.000 kyâ tûơ;
- Khöng coâ sùĩn khaê nùng quaên lyâ toađn vùn
- Sûê duơng liïn kïịt siïu vùn baên ăïí kïịt nöịi túâi
tïơp tin toađn vùn (Thñ duơ tïơp tin PDF hay MS
Word);
- Khöng giúâi haơn söị kyâ tûơ trong möơt biïíu ghi
- Coâ khaê nùng quaên lyâ toađn vùn Taơo chó muơc toađn vùn, do ăoâ coâ thïí tòm kiïịm toađn vùn
- Coâ thïí sûê duơng liïn kïịt siïu vùn baên ăïí kïịt nöịi ăïịn tïơp tin toađn vùn
Quaên lyâ
siïu dûô
liïơu
- Ngûúđi duđng phaêi taơo Baêng Ăõnh nghôa caâc
trûúđng (FDT) ăïí ắnh nghôa cíịu truâc (caâc ýịu
töị mö taê) cuêa biïíu ghi thû muơc
- Coâ sùĩn möơt söị böơ siïu dûô liïơu ăïí lûơa choơn (Thñ duơ: Dublin Core)
- Ngûúđi duđng coâ thïí taơo ra böơ siïu dûô liïơu riïng cuêa mònh Tòm kiïịm - CDS/ISIS coâ khaê nùng tòm kiïịm maơnh meô
sûê duơng caâc loaơi toaân tûê khaâc nhau (toaân tûê
Bool, tòm lín cíơn, chùơt cuơt, )
- Hai hònh thûâc tòm kiïịm: tòm níng cao vađ
tòm ăún giaên coâ hûúâng díîn;
- Ăöịi vúâi Webisis, cíìn taơo míîu tòm kiïịm,
möơt viïơc khöng ăún giaên ăöịi vúâi nhûông
ngûúđi khöng phaêi lađ líơp trònh viïn
- Khaê nùng tòm kiïịm maơnh meô sûê duơng toaân tûê Bool vađ kyâ hiïơu chùơt cuơt
- Hai hònh thûâc tòm kiïịm: tòm ăún giaên vađ tòm theo míîu
- Dïî dađng taơo míîu tòm kiïịm sûê duơng caâc cöng cuơ sùĩn coâ
Duýơt tađi
liïơu
- CDS/ISIS coâ giao diïơn duýơt tađi liïơu riïng
cuêa mònh Ngûúđi duđng coâ thïí duýơt líìn lûúơt
tûđ ăíìu hoùơc tûđ bíịt kyđ möơt biïíu ghi nađo
- Khöng coâ chûâc nùng duýơt theo hïơ thöịng
thûâ bíơc hoùơc duýơt theo chuê ăïì
- GSDL sûê duơng trònh duýơt web (Thñ duơ: Internet Explorer, Netscape) ăïí duýơt böơ sûu tíơp
- Cho pheâp duýơt böơ sûu tíơp theo caâc caâch khaâc nhau (sùưp sïịp theo danh saâch, theo hïơ thöịng thûâ bíơc, theo chuê ăïì, theo thúđi gian, )
Lûu kïịt
quaê tòm
kiïịm vađ
in CSDL
- Sûê duơng caâc cöng cuơ lûu kïịt quaê vađ in tađi
liïơu riïng cuêa mònh
- Ngûúđi duđng cíìn ặúơc ăađo taơo ăïí sûê duơng
caâc chûâc nùng nađy cuêa ISIS
- Sûê duơng tñnh nùng lûu kïịt quaê vađ in íịn mùơc ắnh cuêa caâc trònh duýơt Internet
Trang 4Dûơa trïn so saânh nađy, nhoâm dûơ aân ăaô
choơn GSDL ăïí tiïịn hađnh xíy dûơng sûu tíơp
söị dađnh cho nöng thön búêi tñnh ăún giaên, dïî
sûê duơng, ăöìng thúđi coâ nhiïìu tñnh nùng maơnh
III Lûơa choơn khöí míîu dûô liïơu söị vađ
phûúng phaâp nhíơp siïu dûô liïơu
1 Lûơa choơn khöí míîu dûô liïơu söị
Viïơc lûơa choơn khöí míîu tïơp tin cuêa böơ sûu
tíơp söị cíìn phaêi tñnh ăïịn caâc chuíín dûô liïơu
hiïơn coâ Muơc ăñch cuêa viïơc lûơa choơn nađy lađ
nhùìm ăaêm baêo tñnh bïìn vûông cuêa dûô liïơu
theo thúđi gian Taơi Viïơt Nam, ăaô coâ möơt söị
cuöơc thaêo luíơn vïì chuíín dûô liïơu cuêa caâc thû
viïơn ăiïơn tûê [11,12], tuy nhiïn cuông chûa coâ
tađi liïơu nađo ăïì cíơp ăïịn ắnh daơng phuđ húơp
cho GSDL Chuâng töi ăaô xem xeât lûơa choơn
khöí míîu tađi liïơu söị dûơa trïn baêy tiïu chñ do
Thû viïơn Quöịc höơi Hoa Kyđ ặa ra, bao göìm:
Tñnh cöng khai hoùơc tñnh múê (Disclosure);
Sûơ chíịp nhíơn hoùơc Tñnh phöí biïịn
(Adoption); Tñnh trong suöịt (Transperancy);
Dûô liïơu ăùơc taê nhuâng hoùơc mö taê nhuâng
(Self-documentation); Sûơ phuơ thuöơc bïn
ngoađi (External dependencies); AÊnh hûúêng
cuêa saâng chïị ăöơc quýìn (Impact of patents)
vađ caâc cú chïị baêo vïơ kyô thuíơt (Technical
protection mechanisms) [3]
Tñnh cöng khai hoùơc Tñnh múê liïn quan
ăïịn mûâc ăöơ mađ nhađ saên xuíịt cung cíịp
nhûông thöng tin vïì ăùơc tñnh kyô thuíơt vađ cöng
cuơ liïn quan ăïịn khöí míîu ăïí ăaânh giaâ vađ
xem xeât tñnh toađn veơn vađ bïìn vûông cuêa nöơi
dung söị Sûơ baêo quaên líu dađi nöơi dung söị seô
khöng thïí thûơc hiïơn ặúơc nïịu khöng coâ sûơ
hiïíu síu sùưc vïì caâch thûâc thöng tin söị ặúơc
trònh bađy, maô hoaâ túâi tûđng bit vađ byte trong
tïơp tin Thöng thûúđng, nhûông chuíín khöng
ăöơc quýìn, chuíín múê coâ nhiïìu thöng tin
ặúơc böơc löơ cöng khai ăïì chuâng ta nghiïn
Vò thïị viïơc ặúơc möơt töí chûâc tiïu chuíín hoaâ cöng nhíơn coâ thïí chûa quan troơng bùìng viïơc coâ ăíìy ăuê tađi liïơu kyô thuíơt vïì khöí míîu Sûơ chíịp nhíơn hoùơc tñnh phöí biïịn ăïì cíơp ăïịn mûâc ăöơ mađ khöí míîu nađy ăaô ặúơc sûê duơng búêi nhûông ngûúđi taơo ra noâ, sûê duơng búêi ngûúđi phöí biïịn khöí míîu vađ búêi nhûông ngûúđi duđng khaâc Nïịu khöí míîu ặúơc chíịp nhíơn röơng raôi, seô ñt coâ nguy cú bõ löîi thúđi hún khöí míîu chûa ặúơc chíịp nhíơn röơng raôi vađ nhûông cöng cuơ cho viïơc chuýín ăöíi, di truâ dûô liïơu cuông dïî kiïịm hún vađ coâ thïí khöng ăođi hoêi sûơ ăíìu tû ăùơc biïơt ăïí chuýín ăöíi dûô liïơu Tñnh trong suöịt ăïì cíơp ăïịn mûâc ăöơ mađ viïơc trònh bađy thöng tin söị coâ thïí ặúơc nhíơn biïịt, phín tñch trûơc tiïịp bùìng caâc cöng cuơ cú baên, kïí caê viïơc ăoơc bùìng nhûông chûúng trònh soaơn thaêo vùn baên ăún giaên khöng maô hoaâ (Text-only editor) Nhûông khöí míîu dûô liïơu trong ăoâ thöng tin ặúơc trònh bađy ăún giaên vađ trûơc tiïịp seô dïî dađng ặúơc di truâ sang loaơi khöí míîu khaâc Tñnh trong suöịt cođn ăïì cíơp ăïịn nöơi dung vùn baên (kïí caê siïu dûô liïơu nhuâng trong tïơp tin) Dûô liïơu nhíơp bùìng maô kyâ tûơ chuíín UNICODE (thñ duơ UTF-8) ặúơc coi lađ trong suöịt Nhiïìu khöí míîu dûô liïơu söị sûê duơng kyô thuíơt maô hoaâ (encryption) hoùơc neân dûô liïơu (compression) Hai kyô thuíơt nađy míu thuíîn vúâi ýu cíìu vïì tñnh trong suöịt Mùơc duđ víơy vò nhûông lyâ do thûơc duơng, möơt söị khöí míîu dûô liïơu video vađ ím thanh víîn aâp duơng kyô thuíơt neân hoùơc maô hoaâ ăïí lûu trûô dûô liïơu ngay tûđ luâc taơo ra dûô liïơu söị
Mö taê nhuâng hoùơc Dûô liïơu ăùơc taê nhuâng liïn quan ăïịn viïơc ăöịi tûúơng söị chûâa siïu dûô liïơu (siïu dûô liïơu mö taê, siïu dûô liïơu kyô thuíơt, siïu dûô liïơu hađnh chñnh) nhuâng bïn trong noâ (tûúng tûơ nhû möơt cuöịn saâch coâ trang tïn) thay vò siïu dûô liïơu mö taê ăöơc líơp vúâi ăöịi tûúơng (nhû phiïịu thû muơc hoùơc biïíu
Trang 5dûô liïơu thû muơc) Nhûông siïu dûô liïơu nađy
cho pheâp ngûúđi sûê duơng coâ thïí biïịt nhûông
thöng tin vïì ăöịi tûúơng mađ khöng cíìn phaêi sûê
duơng cöng cuơ tra cûâu bïn ngoađi vađ coâ thïí
theo doôi ặúơc quaâ trònh taơo líơp vađ thay ăöíi
cuêa ăöịi tûúơng
Sûơ phuơ thuöơc bïn ngoađi liïn quan ăïịn
mûâc ăöơ mađ möơt khöí míîu phuơ thuöơc vađo
phíìn cûâng, phíìn mïìm, hïơ ăiïìu hađnh cuơ thïí
nađo ăoâ ăïí coâ thïí sûê duơng ặúơc Ăiïìu nađy ríịt
quan troơng ăïí dûơ baâo mûâc ăöơ phûâc taơp liïn
quan ăïịn phaât triïín cuêa thiïịt bõ, cöng nghïơ
trong tûúng lai Thñ duơ, möơt söị khöí míîu
ặúơc taơo ra chó coâ thïí hoaơt ăöơng trïn möơt söị
möi trûúđng kyô thuíơt nhíịt ắnh seô coâ thïí coâ
khoâ khùn trong tûúng lai khi coâ nhu cíìu
thay ăöíi thiïịt bõ hoùơc khi töịc ăöơ phaât triïín
cöng nghïơ cuêa thiïịt bõ liïn quan xaêy ra quaâ
nhanh Möơt söị dûô liïơu khoa hoơc seô coâ thïí
khöng ăoơc ặúơc nïịu khöng coâ nhûông phíìn
mïìm chuýn duơng ăïí phín tñch vađ trònh bađy
Víịn ăïì taâc ăöơng cuêa saâng chïị ăöơc quýìn
coâ thïí haơn chïị khaê nùng cuêa töí chûâc trong
viïơc duy trò nöơi dung söị trïn khöí míîu nađo
ăoâ Viïơc phaêi mua baên quýìn, mua giíịy
pheâp ăïí chuýín maô dûô liïơu tûđ khöí míîu löîi
thúđi sang khöí míîu múâi coâ thïí ăođi hoêi chi phñ lúân vađ coâ thïí gíy khoâ khùn Khi phñ baên quýìn ặúơc tñnh dûơa trïn mûâc ăöơ sûê duơng thò chi phñ coâ thïí seô khöng lûúđng trûúâc ặúơc
Cú chïị baêo vïơ kyô thuíơt liïn quan ăïịn baêo vïơ nöơi dung söị vađ cung cíịp dõch vuơ cho ngûúđi sûê duơng trong nhiïìu nùm sau Ngûúđi lûu giûô dûô liïơu phaêi coâ khaê nùng nhín baên hoùơc sao dûô liïơu söị sang möi trûúđng múâi, di truâ dûô liïơu sang möi trûúđng hoùơc khöí míîu múâi ăöìng thúđi ăöịi mùơt vúâi víịn ăïì phaât triïín vađ thay ăöíi cöng nghïơ Vò thïị dûô liïơu lûu giûô phaêi khöng ặúơc baêo vïơ bùìng möơt cú chïị kyô thuíơt ăùơc biïơt nađo (nhû maô hoaâ) mađ noâ haơn chïị khaê nùng cuêa ngûúđi lûu giûô tađi liïơu thûơc hiïơn nhûông bûúâc cíìn thiïịt, chuýín ăöíi khöí míîu ăïí lađm cho noâ coâ thïí tiïịp cíơp ặúơc vúâi nhûông thïị hïơ tûúng lai
Nhoâm nghiïn cûâu ăaô xem xeât, ăaânh giaâ kyô cađng nhûông khña caơnh trïn ăïí lûơa choơn ặúơc khöí míîu dûô liïơu phuđ húơp, coâ thïí lûu trûô líu dađi, coâ khaê nùng thay ăöíi, ăaêm baêo sûơ truy cíơp cuêa thïị hïơ tûúng lai Nhoâm dûơ aân ăaô lûơa choơn so saânh ba loaơi khöí míîu tađi liïơu ăiïơn tûê lađ: MS Word, HTML vađ PDF Kïịt quaê so saânh ặúơc thïí hiïơn trong Baêng 2
Baêng 2 So saânh giûôa MS Word, PDF vađ HTML
Tñnh cöng khai
(hoùơc tñnh múê)
Sûơ chíịp nhíơn hoùơc
Tñnh phöí biïịn
Ăûúơc sûê duơng röơng raôi trong lônh vûơc vùn baên hađnh chñnh
Ăûúơc sûê duơng röơng raôi ăïí phöí biïịn vùn baên, tađi liïơu
Ăûúơc sûê duơng röơng raôi trïn web
Tñnh trong suöịt Cíìn coâ phíìn mïìm MS
Word ăïí taơo vađ ăoơc tađi liïơu
Coâ caâc cöng cuơ ăún giaên ăïí ăoơc Caâc cöng cuơ taơo tađi liïơu phûâc taơp hún nhiïìu
coâ
Trang 6Tiïu chñ MS Word PDF HTML
Dûô liïơu ăùơc taê
nhuâng hoùơc Mö taê
nhuâng
Möơt phíìn Möơt phíìn Coâ
Sûơ phuơ thuöơc bïn
ngoađi
AÊnh hûúêng cuêa saâng
chïị ăöơc quýìn
Caâc cú chïị baêo vïơ
kyô thuíơt
Hiïơn nay, híìu hïịt caâc tađi liïơu ăiïơn tûê cuêa
Viïơt Nam sûê duơng khöí míîu MS Word Tuy
nhiïn, MS Word thuöơc súê hûôu cuêa Cöng ty
Microsoft, do ăoâ nhoâm dûơ aân khöng choơn
chuíín nađy cho sûu tíơp söị cuêa mònh
PDF lađ tûđ viïịt tùưt cuêa Portable Document
Format, do cöng ty Adobe Systems
Incorporated phaât triïín Noâ lađ ngön ngûô thïí
hiïơn vùn baên ặúơc ắnh daơng Tađi liïơu PDF
coâ thïí ặúơc cíịu truâc hoùơc coâ thïí dûúâi daơng
ăún giaên Tïơp tin PDF coâ thïí chûâa vùn baên,
hònh aênh, ăöì hoơa, vađ caâc nöơi dung ăa
phûúng tiïơn khaâc nhû video vađ ím thanh
PDF cuông höî trúơ chuâ thñch, siïu dûô liïơu, liïn
kïịt siïu vùn baên vađ ăaânh díịu vùn baên
PDF/A lađ khöí míîu duđng ăïí trònh bađy vađ baêo
quaên dûô liïơu, ặúơc phï chuíín trong
tiïu chuíín ISO 19005-1 vïì Quaên lyâ tađi
liïơu - Khöí míîu tïơp tin tađi liïơu ăiïơn tûê dađnh
cho baêo quaên líu dađi - Phíìn 1: Sûê duơng PDF
(PDF/A) [14] Mùơc duđ PDF lađ möơt khöí míîu
töịt ăïí trònh bađy thöng tin, song nhoâm dûơ aân
khöng sûê duơng chuíín nađy búêi caâc tađi liïơu
trong böơ sûu tíơp cuêa sûu tíơp söị sûê duơng
tiïịng Viïơt, mađ hiïơn taơi phíìn mïìm GSDL
chûa cho pheâp chuýín ăöíi chñnh xaâc tađi liïơu
PDF sang khöí míîu HTML
Do ăoâ, nhoâm dûơ aân ăaô lûơa choơn khöí míîu
HTML cho caâc tađi liïơu trong sûu tíơp söị Ûu
ăiïím chñnh cuêa HTML lađ noâ coâ thïí dïî dađng
ặúơc nhíơp vađo GSDL vađ taơo chó muơc búêi
caâc cöng cuơ phíìn mïìm nhuâng (plug-in) sùĩn
nhíơn daơng vađ chuýín ăöíi chñnh xaâc tiïịng Viïơt
2 Phûúng phaâp nhíơp siïu dûô liïơu Siïu dûô liïơu hoùơc Dûô liïơu ăùơc taê (Meta-data) lađ nhûông thöng tin mö taê caâc ăùơc tñnh cuêa dûô liïơu nhû nöơi dung, ắnh daơng, chíịt lûúơng, ăiïìu kiïơn vađ caâc ăùơc tñnh khaâc nhùìm taơo thuíơn lúơi cho quaâ trònh tòm kiïịm, truy nhíơp, quaên lyâ vađ lûu trûô dûô liïơu [15] Chuâng töi quýịt ắnh choơn siïu dûô liïơu Dublin Core ăïí lađm khöí míîu siïu dûô liïơu cho dûô liïơu söị Dublin Core lađ chuíín siïu dûô liïơu mùơc ắnh cuêa phíìn mïìm GSDL Siïu dûô liïơu Dublin Core ặúơc giúâi thiïơu búêi Dublin Core Metadata Element Initiative nùm 1995 [16] Thaâng 6/2000, Dublin Core ặúơc UÊy ban Tiïu chuíín hoâa/Hïơ Thöịng Tiïu chuíín Xaô höơi Thöng tin Chíu Íu (CEN/ISSS) chíịp nhíơn lađ möơt tiïu chuíín Thaâng 9/2001, Dublin Core ặúơc cöng böị lađ möơt tiïu chuíín quöịc gia cuêa Hoa Kyđ ANSI/NISO Z39.85-2001 [17]
Coâ hai caâch nhíơp siïu dûô liïơu cho caâc tađi liïơu trong thû viïơn söị GSDL:
- Nhuâng siïu dûô liïơu vađo trong tađi liïơu bùìng caâch sûê duơng theê siïu dûô liïơu HTML (meta tags);
Trang 7thuê thû (GLI).
Theo caâch thûâ nhíịt, caâc theê siïu dûô liïơu
ặúơc taơo ra trong phíìn tiïu ăïì (HEAD) cuêa
tïơp tin HTML Nöơi dung cuêa siïu dûô liïơu ặúơc thïí hiïơn trong díịu “< >” Caâch nhíơp ặúơc thïí hiïơn nhû dûúâi ăíy:
Nïịu nhíơp siïu dûô liïơu theo caâch nađy thò
khöng cíìn phaêi nhíơp trûơc tiïịp siïu dûô liïơu
trong Giao diïơn thuê thû (GLI) GSDL coâ
khaê nùng tûơ ăöơng triïịt ruât vađ ặa caâc siïu dûô
liïơu coâ sùĩn trong caâc theê HTML vađo trong
chó muơc cuêa böơ sûu tíơp GSDL Tuy nhiïn,
nhûúơc ăiïím cuêa phûúng phaâp nađy lađ chûa coâ
cöng cuơ nađo höî trúơ viïơc taơo ra caâc theê siïu
dûô liïơu trong tïơp tin HTML Toađn böơ cöng
viïơc nađy phaêi lađm thuê cöng, do ăoâ coâ thïí díîn
ăïịn sai soât vađ khöng nhíịt quaân Bïn caơnh
ăoâ, ngûúđi nhíơp khöng thïí tham khaêo caâc
siïu dûô liïơu ăaô ặúơc nhíơp trûúâc ăíy
Phûúng phaâp thûâ hai lađ sûê duơng Giao diïơn thuê thû (GLI) ăïí nhíơp siïu dûô liïơu, thöng qua muơc Enrich GLI lađ giao diïơn ăöì hoơa cho pheâp taơo líơp, chónh sûêa caâc böơ sûu tíơp söị, vađ xuíịt böơ sûu tíơp ra ẵa CD-ROMs Noâ cho pheâp nhíơp hoùơc gaân caâc siïu dûô liïơu GLI cho pheâp ngûúđi duđng sûê duơng caâc tñnh nùng cuêa mònh thöng qua möơt giao diïơn thín thiïơn vađ dïî sûê duơng Giao diïơn GLI ặúơc thïí hiïơn trong Hònh 1
<html>
<head>
<meta name=”GENERATOR” content=”Microsoft FrontPage 5.0”>
<meta name=”ProgId” content=”FrontPage.Editor.Document”>
<meta http-equiv=”Content-Type” content=”text/html; charset=windows-1252”>
<meta name=”Title” content=”Kyô thuíơt thím canh giöịng ăíơu tûúng 3 vuơ: DT 84”>
<meta name=”Creator” content=”Nguýîn Vùn A.”>
<meta name=”Subject” content=”Tröìng troơt”>
<meta name=”Subject” content=”Ăíơu tûúng”>
<meta name=”Subject” content=”Giöịng ăíơu tûúng DT 84”>
<meta name=”Publisher” content=”Trung tím Giöịng cíy tröìng Vuơ Baên tónh Nam Ăõnh”>
<meta name=”Date” content=”2006”>
<title>Kyô thuíơt thím canh giöịng ăíơu tûúng 3 vuơ: DT 84</title></head>
<body>
Kyô thuíơt thím canh giöịng ăíơu tûúng 3 vuơ: DT 84
(Techniques of intensive cropping for soybean variety DT-84)
</body>
</html>
Trang 8Hònh 1 Giao diïơn GLI
Hònh 2 Mađn hònh nhíơp siïu dûô liïơu
Trong giao diïơn GLI,
ngûúđi duđng coâ thïí lûơa choơn
möơt söị chuíín siïu dûô liïơu
cho böơ sûu tíơp cuêa mònh
Trong khuön khöí dûơ aân nađy,
chuâng töi sûê duơng chuíín
siïu dûô liïơu Dublin Core
Caâch nhíơp siïu dûô liïơu
trong GLI ríịt trûơc quan vađ
ăún giaên Bïn caơnh ăoâ, giao
diïơn GLI cuông höî trúơ tiïịng
Viïơt nïn ríịt thuíơn tiïơn cho
ngûúđi duđng Caâch nhíơp siïu
dûô liïơu trong GLI ặúơc thïí
hiïơn taơi Hònh 2
3 Duýơt tađi liïơu trong
sûu tíơp söị
Duýơt böơ sûu tíơp söị
trong GSDL ríịt thuíơn tiïơn
Ngûúđi duđng coâ thïí duýơt tađi
liïơu theo chuê ăïì Thñ duơ:
duýơt theo chuê ăïì giöịng cíy
tröìng, víơt nuöi, v.v Ăiïìu
nađy ríịt quan troơng ăöịi vúâi
sûu tíơp söị dađnh cho nöng
thön, búêi ngûúđi duđng chuê
ýịu lađ nöng dín coâ trònh ăöơ
CNTT haơn chïị nïn viïơc tòm
kiïịm toađn vùn ăöịi vúâi hoơ lađ
viïơc khoâ khùn Ăïí taơo khaê
nùng duýơt tađi liïơu theo hïơ
thöịng chuê ăïì, chuâng töi sûê
duơng kyâ hiïơu “/” hoùơc “|” ăïí
taơo hïơ thöịng thûâ bíơc
Thñ duơ, nïịu chuâng ta nhíơp
vađo trûúđng dc.Subject and
keywords vúâi nöơi dung nhû
Trang 9Thñ duơ vïì hiïín thõ ăïí duýơt
tađi liïơu theo caâch trïn ặúơc
thïí hiïơn trong Hònh 3
IV Kïịt luíơn
Sûu tíơp söị vïì cöng nghïơ thñch húơp nöng
thön lađ möơt nguöìn tin tham khaêo quan troơng
ăöịi vúâi ngûúđi dín caâc vuđng nöng thön Ăïí
xíy dûơng sûu tíơp nađy, phíìn mïìm GSDL ăaô
ặúơc lûơa choơn sûê duơng nhúđ coâ möơt söị ûu
ăiïím so vúâi phíìn mïìm CDS/ISIS vïì khaê
nùng quaên lyâ toađn vùn vađ quaên lyâ siïu dûô
liïơu trong sûu tíơp söị
Trong ba loaơi khöí míîu tađi liïơu ặúơc xem xeât, chuâng töi choơn khöí míîu HTML cho sûu tíơp söị búêi ăíy lađ möơt chuíín múê vađ noâ ăaêm baêo tñnh tûúng thñch vađ tñnh bïìn vûông cuêa sûu tíơp söị Giao diïơn GLI ặúơc sûê duơng ăïí taơo líơp, chónh sûêa böơ sûu tíơp söị vađ nhíơp siïu dûô liïơu Quaâ trònh taơo líơp tûúng ăöịi ăún giaên nhúđ sûơ trûơc quan vađ caâc cöng cuơ thuíơn tiïơn mađ phíìn mïìm GSDL cung cíịp
Kyô thuíơt Tröìng troơt
Luâa
Xûê lyâ haơt giöịng Phođng trûđ dõch bïơnh
Luâa
Bïơnh luâa heâo
Hònh 3 Mađn hònh duýơt tađi liïơu trong sûu tíơp söị
Siïu dûô liïơu: Kyô thuíơt Tröìng troơt/Luâa/Xûê lyâ haơt giöịng
Phođng trûđ dõch bïơnh/Luâa/bïơnh luâa heâo Thò mađn hònh seô hiïín thõ tađi liïơu theo hïơ thöịng thûâ bíơc chuê ăïì nhû sau:
Trang 10Trïn cú súê phíìn mïìm GSDL, vúâi khöí
míîu dûô liïơu söị lađ HTML vađ sú ăöì siïu dûô
liïơu Dublin Core, chuâng töi ăaô xíy dûơng
ặúơc möơt sûu tíơp söị vïì cöng nghïơ thñch húơp
cho nöng thön Hïơ thöịng ríịt dïî khai thaâc, phuđ húơp vúâi trònh ăöơ cuông nhû kyô nùng sûê duơng caâc cöng cuơ tin hoơc cuêa khu vûơc nöng thön
1 CDS/ISIS database software: CI.
http://www.unesco.org/webworld/isis/ Viewed June 11,
2007.
2 Cao Minh Kiem and Middleton M.R (1998) An
evaluation of textual storage and retrieval software:
CDS/ISIS and InMagic Program: electronic library &
information systems, Vol 32, no 3, pp 283-302.
3 Mahmood, K (1997) The best library software
for developing countries: more than 30 plus points of
Micro CDS/ISIS Library software review, Vol 16, no 1,
pp 12-16
4 Carlos Henrique Marcondes, Luñs Fernando
Sayaôo (2003) Nuclear Information Center, Nuclear
Energy National Commission, Brazil The SciELO
Brazil-ian Scientific Journal Gateway and Open Archives: A
Report on the Development of the SciELO-Open
Archives Data Provider Server D-Lib Magazine, March
2003, Vol 9, no 3 (ISSN 1082-9873).
http://www.dlib.org/dlib/march03/marcondes/03marcon-des.html
http://www.fao.org/agris/tools/WebAGRIS/WebAGRIS_E
n.htm
http://www.greenstone.org/ Truy cíơp ngađy 11/6/2007.
7 Bainbridge D., Osborn W., Witten I.H and
Nikols D.M (2006) Extending greenstone for institutional
repositories Digital Libraries : Achievements, challenges
and opportunities Proceedings of the 9th International
Conference on Asian Digital Libraries, ICADL 2007,
Kyoto, Japan, November 27-30, 2006.
8 Ăaơi hoơc Quöịc gia TP Höì Chñ Minh
http://gral-9 Morete P and Rose J Creating digital libraries based on CDS/ISIS databases http://greenstonesup-port.iimk.ac.in/Documents/CDS-ISIS_to_DL.pdf
10 Jayakanth F., Shivaram B.S., Venkatlakshmi K and Singh S (2004) Integrating CDS/ISIS databases with Greenstone Digital Libraries Software (GSDL) Available
at Digital Library of Information science and Technology http://dlist.sir.arizona.edu/1689/
11 Cao Minh Kiïím vađ Lï Xuín Ăõnh (2002) Möơt söị suy nghô vïì chuíín dûô liïơu in liïn kïịt Taơp chñ Thöng tin &
Tû liïơu, 2002, Söị 3, trang7-13.
12 Cao Minh Kiïím (2006) Tòm hiïíu möơt söị víịn ăïì vïì chuíín khöí míîu dûô liïơu cho thû viïơn ăiïơn tûê Tađi liïơu trònh bađy taơi Höơi thaêo Tiïu chuíín hoâa hoaơt ăöơng Khoa hoơc
& Cöng nghïơ, töí chûâc taơi Trung tím Thöng tin KH&CN Quöịc gia, Hađ Nöơi, 16-17/11/2006.
13 Sustainability of Digital formats Planning for Library of Congress collections http://www.digitalpreser-vation.gov/formats/intro/intro.shtml
14 International Standard Organization ISO 19005-1:2005 Document management - Electronic doc-ument file format for long-term preservation - Part 1: Use
of PDF 1.4 (PDF/A-1)
http://www.iso.ch/iso/en/Catal o g u e D e t a i http://www.iso.ch/iso/en/Catal P a g e C a t a http://www.iso.ch/iso/en/Catal o g u e D e t a i http://www.iso.ch/iso/en/Catal ? C S N U M -BER=38920&scopelist=PROGRAMME
15 Nghõ ắnh söị 64/2007/NĂ-CP vïì ûâng duơng CNTT trong hoaơt ăöơng cuêa cú quan nhađ nûúâc
16 Dublin Core Metadata Initiative http://dublin-core.org/
17 The National Information Standard Organiza-tion Dublin Core Metadata Element set Bethesda, Mary-land: NISO Press, 2001 ISSN 1041-5653
Tađi liïơu tham khaêo