GIẢI PHÁP XÂY DỰNG BỘ SƯU TẬP SỐ HI U UẢ ThS.
Trang 1GIẢI PHÁP XÂY DỰNG BỘ SƯU TẬP SỐ HI U UẢ
ThS u *
S Lê Đức Thắng **
S , ,
,
t ,
,
V N
1 ự
T 2007, T T H K NISO) “H A Framework of Guidance for Building Good Digital Collections), ,
T , ng m t b p s ợ
vụ í : • C p (t ch ợng) • C ợ t li u s ) • S ợ p) • C ặc d t o l ý
t p) NISO 9
, :
Một là: M t b p s ợc t o l quy t n b õ ợc th ng nh c khi vi c ti ng b p Hai là: B p c i sử dụ n m b ợc nh ng ặ a b , m ph m vi, d ng th c, m ợc truy c p,
*
T Q V N
**
T Q V N
Trang 22
quy n sở h u hoặc b t k n thi t ịnh ngu n g ở h u c a
b
Ba là: M t b ợng cao c ợc qu ý t trong su
i c Q ý ú ọ n vi c qu ý i c u t ợc t o
l p hoặc thu th ợc lo i b Vi c qu ý m m t lo
vụ n trị d li í , o qu n s
Bốn là: M t b p t t c ợc ph bi n m ng
trở ng i sử dụng ti p c n Quy t í : kh ă ẵn , í dụng, kh ă p Kh ă ẵ ĩ
n h n truy c ử dụ ĩ ng
b truy c c, sử dụng nh gh ù hợp v i nh i sử dụng mụ
Năm là: M t b p t t c ý n nh ng quy n sở h í : n
b p tham kh ịnh v b n quy n trong ph m vi Vi t Nam (Lu D
s 2005; Lu t Sở h í 009) ịnh b n quy m vi th gi i ( Hi ị P , 97 ); C c b n quy WIPO G , 996); C
ễn WIPO (WPPT) (Geneva 1996)
Sáu là: M t b p t t ph thu th p d li u
c sử dụ h u dụng: Nh p s c ợ ịnh k õ sử dụ , í u qu c a dịch vụ Vi c qu ý
t p hi u qu c n nhi ị ợng m h u dụng
c a b , th c hi n vi , ý , ú ọ n nh
i sử dụng, ph ng v n, thử nghi , í t
ý ục vụ s dụ í u dụng
Bảy là: M t b p t t ph i í : m b o kh ă ẻ
li u (metadata) c ú i nh
Tám là: M t b p t í ợ c c
i sử dụng
Chín là: M t b p t t ph ị l c h u: Nh p s
ch a nh ị ợ ụ m b
th truy xu ợ Tí ục c ợ ặt ra t í nh t ch , í
kỹ thu ặc bi t, nh p s ợ ng v n c
ho ti p tục vi , ỡ ỗ trợ c vi
Trang 33
ng M , t k ợ ,
t p s ợ í ợ c qu ý ng b p chung
2 ả ự
2.1 Hoàn t ện côn tác lập kế hoạch
i v p k t ho ch, c n th c hi c:
: X ịnh mụ m vi c a d , c
c 2: X ị õ ợng phục vụ theo t ụ th
: P í ụ th i v i t ng d
c 4: L p t í, ng th ng, ởng
c í c hi ị
5: R n kỹ hoặ ỹ thu ,
dụ m b í ng nh t c a d
2.2 Hoàn t ện côn tác lựa chọn c o các bộ sưu tập số
* X ng b í a chọ u s
C th l a chọ ợ í , n thi t nh t
s T c t vi c l a chọn n s ợc th c
hi n m quan, trong nhi ng hợ ụ thu ý í quan c a
o b ph n hoặc ở , u khi n u s
ù ợp hoặ c s ù ợp cho d c hi n
kh c phụ ị ng b í a chọ
li u s , ú a chọn m , ng th i hỗ trợ
ị, qu ý ph c thi s u ra quy ịnh m ù
hợ C n nh ặt nhi c khi th c hi n s ,
b p s :
- ợng phục vụ hoặ i t ợ i sử dụng s n?
- Vi c s ở n ho ng c ị hoặ ph n
- T ng b n quy n c T i h n b o h b n quy , ch ở h th c hi c ti p
ng hợ thi i v i d : , í chi tr , th a thu n sử …
Trang 44
- T ng v ý , c t u
d , ú i nhi , a chọn c ý ng v ý ịnh kh ợ
vi c hoặ Ví ụ: phục ch c khi s ), ặc c
gi kỹ thu t s ù ợ i v i t ng lo
i t ng thi t bị ù ợp)
* ịnh v í a chọ u
X ị t ph n c a chọ s ,
d , n thi t ph “văn bản hóa í ợc sử
dụ l a chọ u cho vi c s ởi vi ục vụ nhi u mụ í u , c hi n, tri n khai m t d , i
ợc l a chọ m b o r ng vi c l a chọ u s ợ dụng m ù ợp v í ặt ra
Mặ ă ị í a chọ u s ợc
t v i nh ng th ý, , í ụ í ị i nh í ợ
d , dễ u chỉnh, b sung, thay th nh í ị ởng, hoặc
c hi u chỉ c th c hi
ụ thu
N , ă ú ph n th c hi c m
hi u qu , ng nh ởi t t c b t bu c ph i th c hi n theo
ú ị V ă “ u m
ti p theo, s m b í ng nh t cho t t c , ặ
b p s
2.3 Giải quyết hiệu quả vấn đ bản quy n
Hi n nay dịch vụ s ă u t trong s nh ng dịch vụ t
ph bi n ở T , ọ i, k c
i cung c p dịch vụ l i sử dụng dịch vụ í
c nh b n quy n khai dịch vụ ặ u ở d ng s
ễ , ễ ph bi n, dễ
c i quy t, bởi vi c s u v i b t c
mụ í ởng nh ị n quy n lợi c a c th ,
c t , ỗ , b n quy ợc
Trang 55
khuy m, tr nh ng cu t th i gian b o h b n quy n hoặc
nh ị ợc b n quy
V b n quy n trong vi c s , b n quy
ng kỹ thu t s t ph c t hi õ c hi ú b n quy n, c õ sau:
• ợng b o h quy
• T , ch sở h u quy , quy
• X p sử dụng quy
• G i h i l
gi i quy ý u hoặc ph
bi , c p m u v b n quy
li , u, n m b ịnh cụ th v b n quy
sở h í , n cho , hoặ u m i gi i quy
ý p s
Trang 6Mô hình giải pháp y d ng bộ s u t p số hi u quả
1
6
7
8
Tạo l p
Thu th p
S
dữ liệu
L ữ
(File Storage)
Databases
(Metadata)
Hệ
th ng tra cứu /Hi n thị
N ời sử
d ng
Sao l
(Offline Backup)
- DublinCore
- MET S/ALTO
- OCR
- XML
L p kế hoạch
Quả lý
OAIS
Giải quyết
v bản quy n
S
óa
L a chọn
Trang 75
2.4 Quy chuẩn côn tác số ó tà l ệu
C , n nh ú ị nh t c a m t
d T ú ị ở i th c hi n s ợc ti ú c
ti p v i nh ng lo i ý “ c s
í n ở hi u b n mu n ) ặc m u ở m ă ễ , u d
u s i u v nh ch ợ l i trở c
t p
S u c lặ ặp l i dễ ,
nh ng sai l ọ , c kh c phục s ặc m t nhi u th i ợng h nh s n ph ợ ịnh ngay t u
h n ch sai l u, c n thi t ph ụng tri ý
“S t l n cho t t c ng nh t t t c ặ c nh , lẻ trong k ho ch hoặ ho u ph m b o hai mụ í í “S
b o qu “S phục vụ , ợc s ợc th c
hi n ở ch ợng cao nh (mặ ù t r ng ch ợng c a s n ph ụ thu u ki n h t ng, trang thi t bị s …), ởi ch ợng s ,
ĩ i vi c tu i thọ n ph ợc sử dụng cho nhi u mục
í V t nh ỉ "S t l " t o ra t p
ch f ) o nh ng t sinh (copy file) t nh nh g c cho
nh ng mụ í ù c cụ th
2.4.1 Số hóa hình ảnh
Vi c t ở n m i v scan kỹ thu t s trong th , í ỗi MB d li u
gi so v C gi i quy t v ch ợ nh b ng
ử dụ ị mụ ặ ki
nh Hi n t i, vi nh nặng 48- m l n v i kỹ thu t
s 48-bit) chỉ ù ợp v i m t s í ng hợp Ch ợ nh ở m
ỉ m khi mu n t ợng c c k , u
ù ợ n thi i v i ph n l , u
2.4.2 Các thông số kỹ thu t trong số hóa
Vi c s m mụ í t b n in hoặc m ă n
v i ch ợ ù ợp v u khoa họ ụng
ĩ C n l a chọ n ch t
Trang 86
ợ nh, kh ă ử dụ , ă í
v hi n t
Trong kỹ thu t s , u quan trọng Th nh
p ch (master file) i d ng s , t ở ịnh d ặ ịnh d ng Th ng f ) ợc t i sử dụng, v n
ng b ợc gi ợ ợ f C
ỉ ụng cho p ch s N file d ng JPEG hoặc GIF t t p ch ù ụ í ử dụng Gi sử p
ch ợng th , b ợ ù ỉnh theo nhu
c c n thi t, í ụ ng hợ í
i sử dụ i so v i gi ị u, hoặ ịnh d
ợc sử dụng v ặ í ợc t ng m t mụ í
ị - zoom) li ục, chuy n ti p t ng c ợng í c l u chi ti hoặ ă n c
T p ch í n t ng cho t t c ử ý D , ặc
bi ú ý t p ch T , i v p ch
ặ ịnh ph t ch ợng kỹ thu t t t nh ở th m ti n
2.4.2.1 ợ nh
i v ặ , ử dụ ng v ịnh
d ng c u g 00 i v ă
b n hoặc b a nh ặc ch vi t r t m nh, c n sử dụ
400 C n scan nhị s c c i 600 dpi
C i ng hi ụng bở ị chu m b o kh ă n thị trọ i v i nh ng hợp th ị ặc bi , í ụ khi th ịnh c ú y
i ph i ở m l , ph ụ ;
ng hợ y n n nghị
Mặ ù , ỉ t trong m t s í nh quy ịnh
ch ợ N í nh k – í u t kỹ thu t
D , n ki m tra kỹ ợc t m b o s trung th c v phục vụ mụ í , n nghị u chu n
t l p m ,
Trang 97
Khi sử dụ , ợ í ợc c ị
i c i trong gi i h í c t ợc mặc
ị ợ í ụ gi 00 ợ ụ í c t i
A ) i v nh kỹ thu t s , i phụ thu i
ợ í m b i 300 dpi, c í t l í c t
c ợng cho m nh nh t ị Ví ụ, n 4 000 ×
000 m m ) ỉ chụ ợc nh i
ợ í c nh ặc b ,9 5,4 C í
th c:
Đối với độ ph n giải 300 dpi:
Chi : 4 000 ÷ 00 = , = ,9
Chi u r : 000 ÷ 00 = 0 = 5,4
Khi s , c h s gi a vi phim (microfilm) hoặc vi
í f ) ng v i b n g m b ợ í
00 Ví ụ, n u b n g í 4 6 , ợc ghi l
n truy n th ng cỡ 4 × 6 , í i h s 10 khi scan t ; , n c n ph ợc scan ở i 3.000 dpi ị í i c n scan, c n bi õ í c c i ợng g c hoặ í t c í ọ ợ ý í í dụ: í 40 ) m b o
ợ i í ng v í c c a b n g 00 dpi
2.4.2.2 c
C n scan nhị s ) ng sử dụ p (1 bit)
m D , ỗ m nh s t n t i d = ) ặc 0 (=
tr ) H ợc s ở c 256 c t
m H ử dụ , xanh lụ ỹ thu t gọ RG ), c k t hợp b ng 3 l n 256 c V ,
kỹ thu t m n g p 3 l n m ,
ị ỗ ợc c ng l i v ợ ụng cho mỗi
m í ụ 5 + 233 xanh lục + 186 xanh lam), cho k t qu t ng c 6,7
S ợ )
)
í ợ
ị , = ,54 )
=
Trang 108
tri 56 × 56 × 56) S t 256 c 8 , i 1 , í ỗi bit t n t i d ng 0 hoặ ) D ,
4 × 8 = ) M t s n xu cho ra nh ng s n ph , n 48-bit M c s n thi t bở c 24-
th hi í , 48- h u dụng
p m nh scan, bởi l ị bị m chỉnh sửa c Chụ ở 48 i , ở nh nh n bi t ph i m i
T , nh 48-bit l i hi t vi c l n thi t C
nh ng m nh 48-bit s chi m g , trở t v th c s nan gi i v i nh ng b kh i ợng l D , n ch nh 4 ỉ
dụ i ch ợ í t do nh ý
do khoa học, nh ặ ù, ặ phục vụ
di s diễn ra
2.4.3 Định dạng t p
T hi n t i, p ch nh v ặ nh
ợ i d f TIFF K ) i v i nh nh nhị
s , sử dụng d ng file TIFF v ặ í N f N 4 TIFF G 4) ịnh
d f TIFF n t i t nh ă 980 , ẳ ịnh vị th c a m t trong nh ng chu ịnh d ng quan trọng nh t D ki
í n s ti p tục hỗ trợ ịnh d f T , ỉ ú i v i
nh f ịnh d TIFF n (Baseline TIFFs) Nh ng thu t ng
t m t th c t : ịnh d ng TIFF chu ịnh d ng file c c m nh, cho
nh ặ í t – í ụ ợc ) t i t ng ph n c a b c l p,
v ặ í c k h u dụ ĩ ng hợ nh b
T , ịnh d ng file m y r n
V ý , ịnh d ng chu TIFF s t gi a m
nh í nh c n ph ợc hỗ trợ bởi nh ng ph n m m ng dụ ợc
hỗ trợ TIFF v i m t s ợng mở r í n m m ng
dụ sử dụng
N ă m ở tr , mặ ý ,
ợ b ợ d li u bị m í ụ ịnh d ng