Nghiên cứu cơ sở khoa học và thực tiễn phát triển mạng thông tin tư liệu về khoa học
Trang 1BO KHOA HOC CONG NGHE VA MOI TRUONG
DE TAI NGHIEN CUU KHOA HOC CAP BO
NGHIEN CUU CO SO KHOA HOC VA THUC TIEN
PHAT TRIEN MANG THONG TIN TU LIEU
VE KHOA HOC VA CONG NGHE 6 VIET NAM
Chủ nhiệm đề tài: Ts Tạ Bá Hưng
Thư ký đề tài: Ks Nguyén Van Dién
Công nghệ Quốc gia Các công tác viên: Ks Nguyễn Tháng, Ks Nguyễn Tử Bình,
Ks Trần Đức Phương, Ks Nguyên Tuấn Hải,
Ks Hoang Anh Tuan, Ks Tran Việt Tiến,
Ks Tao Huong Lan, Ks Tran Mai Lan
Hà Nội 11-2001
Trang 2BAO CAO KẾT QUÁ THỰC HIỆN ĐỀ TÀI 2000-2001
“NGHIÊN CỨU CƠ SỞ KHOA HOC VA THUC TIEN PHAT TRIEN MANG
THONG TIN KHOA HOC VA CONG NGHE VIET NAM”
Đề tài nghiên cứu khoa học cấp bộ “Nghiên cứu cơ sở khoa học và thực tiễn phát triển mạng thông tin khoa học và công nghệ Việt Nam” được tiến hành trên cơ
sở nhu cầu thực tiễn và cấp bách hiện nay của nước ta Nhu cầu xây dựng các mạng thông tin trong nước, xây dựng các Website và các công cụ cần thiết để tổ chức, xử lý và tra cứu thông tin cũng như cập nhật thông tin là cấp bách, nhằm nhanh chóng hình thành một mạng thông tin khoa học và công nghệ để phục vụ cho sự nghiệp công nghiệp hoá và hiện đại hoá đất nước Đề tài được tiến hành trên cơ sở nghiên cứu thực tế, điều tra, khảo sát, phân tích tình hình và nhu cầu thực tiễn ở các cơ quan thông tin tư liệu Việt Nam, từ đó nghiên cứu, thiết kế và xây dựng các mạng thông tin khoa học và công nghệ, các công cụ cần thiết để quản trị dữ liệu, cập nhật thông tin, đáp ứng nhu cầu thong tin của người dùng tin
Theo để cương nghiên cứu đã được duyệt, đề tài phải thu được các kết qua sau:
- Bao cdo tong quan vé hién trạng và triển vọng của hệ thong thong tin khoa hoc va cong nghé Viét Nam
- Xay dựng Website về khoa học và công nghệ trong đó một phần quan trọng
là hệ quản tri cơ sở đữ liệu sử dụng trong các cơ quan thông tin khoa học và công nghệ
Kết quả thứ nhất đã được lập thành một báo cáo riêng “tổng quan về tình hình hoạt động của mạng thong tin khoa học và công nghệ Việt Nam” Trong báo cáo này chỉ dé cập tới hai nội dung sau là xây dựng Website và hệ thống cập nhật đữ liệu từ xa
Trang 31 MỞ ĐẦU
Nghị Quyết Đại hội IX đã khẳng định - khoa học và công nghệ cùng với giáo dục và đào tạo là quốc sách hàng đầu, là nền tảng và động lực đẩy mạnh công nghiệp hoá và hiện đại hoá đất nước Khoa học và công nghệ hướng vào việc nâng cao năng suất lao động, đổi mới sản phẩm, nâng cao năng lực cạnh tranh của hàng hoá trên thị trường, xây dựng năng lực công nghệ quốc gia, ứng dụng một cách sáng tạo những công nghệ nhập khẩu, từng bước tạo ra công nghệ mới
Đi nhanh vào một số ngành, lĩnh vực sử dụng công nghệ hiện đại, công nghệ cao Trên cơ sở đó, Nghị quyết của Đảng đã đề ra các giải pháp chơ việc phát triển khoa học và công nghệ ở nước ta trong giai đoạn này như sau:
z Tạo thị trường cho khoa học và công nghệ, đổi mới cơ chế tài chính nhằm khuyến khích sáng tạo và gắn ứng dụng khoa học và công nghệ với sản xuất kinh doanh, quản lý, dịch vụ
Tăng đầu tư ngân sách và có chính sách khuyến khích, huy động các nguồn
lực khác để đi nhanh vào một số ngành, lĩnh vực sử dụng công nghệ hiện đại, công nghệ cao
~ Coi trọng nghiên cứu cơ bản trong các ngành khoa học Sắp xếp và đổi mới
hệ thống nghiên cứu khoa học, phối hợp chặt chẽ việc nghiên cứu khoa học tự nhiên, khoa học-công nghệ với khoa học xã hội và nhân văn
VớI sự phát triển của khoa học và công nghệ, các tư liệu về khoa học và công nghệ ngày một tăng bao gồm sách, báo, tạp chí, các báo cáo khoa học tại các hội nghị, hội thao, các kết quả nghiên cứu từ các chương trình, đề tài, các số liệu thống kê, điều tra cơ bản về tài nguyên, thiên nhiên và môi trường Sự gia tăng của các tư liệu hàng năm là cấp số nhân và chúng nằm tản mát ở khap mọi nơi trong nước
Luật khoa học và công nghệ đã được Quốc hội thông qua trong đó điều 45 đã nêu rõ: Chính phủ đầu tư xây dựng hệ thống thông tin khoa học và công nghệ quốc gia hiện đại, bảo đảm thông tin đầy đủ, chính xác, kịp thời về các thành tựu quan trọng trong các lĩnh vực khoa học và công nghệ ở trong nước và trên thế giới; bán hành Quy chế quản lý thông tin khoa học và công nghệ; hàng năm công bố danh mục và kết quả thực hiện các nhiệm vụ khoa học và công nghệ trong nước
Để thực hiện chủ trương, đường lối của Đảng, dưới sự chỉ đạo của Bộ Khoa học Công nghệ và Môi trường, Trung tâm Thông tin Tư liệu khoa học và Công nghệ
2
Trang 4Quốc gia đã và đang phối hợp với các ngành và các địa phương xây dựng Nghị định nhằm hướng dẫn chỉ tiết việc tổ chức, quản lý thông tin khoa học và công
nghệ đã được đề cập trong Luật Khoa học và Công nghệ
Một trong những vấn đề trọng tâm là thu thập, xử lý, lưu trữ nguồn tư liệu xám,
nguồn thông tin đã được tư liệu hoá do hoạt động khoa học và công nghệ được
cấp kinh phí từ ngân sách Nhà nước Đây là một nguồn tin nội sinh rất phong phú, phù hợp với nhu cầu phát triển của Việt Nam, có thể phục vụ tốt cho sự nghiệp công nghiệp hoá và hiện đại hoá đất nước Các nguồn tư liệu này sẽ giúp ích cho việc thẩm định dé tài, đề án, đánh giá công nghệ, chấc chắn sẽ giúp ích
cho hoạt động nghiên cứu khoa học và triển khai công nghệ trong nước
Cơ sở dữ liệu là một thành phần quan trọng trong một hệ thống thông tin Có thể phân loại CSDL, ra làm 3 loại:
CSDL thư mục;
CSDL dữ kiện;
CSDL, toàn văn
Tuy nhiên cũng có nhiều tài liệu phân loại, sắp xếp CSDL theo tiêu chí khai thác
(Source Database)
biểu thống kê, hình ảnh, âm thanh (multimedia) còn CSDI, tham khảo bao gồm: CSDL, chỉ dẫn; CSDL thư mục Đây là loại CSDL có chức nang chi ra nguồn chứa thông tin, chứa các thông tin đại diện cho nguồn tài liệu (mẫu tìm)
CSDL nguồn có thể xếp thành nhóm như sau:
CSDL toàn văn;
CSDL số:
CSDL ký tự/số;
Multimedia
Trang 5Các CSDL loại này không chỉ dẫn cho người sử dụng tư liệu mà cung cấp cho họ những thông tin đầy đủ
CSDL toàn văn Đó là những tư liệu được số hoá như sách, tạp chí, bài báo, báo
và xây dựng thành các thư viện điện tử mà có những tính năng vượt trội so với
chất lượng
Ở nước ta, trong những năm gần đây đã chú trọng vào việc xây dựng các cơ sở
dữ liệu nguồn Một số cơ sở dư liệu đã hình thành như cơ sở đữ liệu luật, các cơ
sở dữ liệu các số liệu thống kê, CSDL GIS, các số liệu điều tra cơ bản về tài nguyên thiên nhiên và môi trường, các kết quả nghiên cứu, các báo cáo lại các hội nghị hội thảo Tuy vậy, lượng thông tin thu thập được chiếm một phần không đáng kể trong toàn bộ các cơ sở dữ liệu hiện có tại Việt Nam
Hiện nay, về mặt tổ chức, ở nước ta đã hình thành một hệ thống các cơ quan thông tin khoa học và công nghệ Các cơ quan này làm nhiệm vụ thu thập, xử lý lưu trữ và nhục vụ thông tin trước tiên cho người dùng tin của cơ quan mình, sau nữa là người dùng tin trong nước và quốc tế Hiện trạng về hệ thống thông tin đã được mô tả chỉ tiết trong báo cáo về hiện trạng hệ thông thông tin khoa học và công nghệ Việt Nam Cho đến nay, rất ÍL các cơ quan thông tin tư liệu có mạng
với nhau Kết nối với các mạng thông tin hầu hết là dial-up Ngoai ra, cdc thong tin thu thập được tuy nhiều nhưng chưa được số hoá, hoặc đã số hoá nhưng không có một chuẩn mực thống nhất Vì vậy, việc trao đổi thông tin giữa các hệ thống hầu như chưa được thực hiện
Các thông tin về tư liệu xám ở nước ta khá nhiều, tập trung rải rác ở các ngành, các địa phương, các viện nghiên cứu, các trường đại học Nhà nước đã có chủ
tại các cơ quan thông tin khoa học và công nghệ địa phương
Trang 6Nhu vậy, nguồn tư liệu xám khổng lồ đã được chảy theo một tuyến, bước tiếp theo là các cơ quan thông tin cần phải xây dựng được các hệ thống thông tin quản lý các tư liệu này Đối với các cơ quan thông tin không có khả năng xây dựng hệ thống mạng riêng có thể cập nhật thông tin (các kết quả nghiên cứu) vào
cơ sở đữ liệu tại trung tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia
để phục vụ người dùng trong cả nước Đối với những cơ quan có khả năng xây dựng hệ thống thông tin (mạng máy tính và thong tin tư liệu trong mạng) cần nhanh chóng xây dựng và hoàn thiện hệ thống thông tin để đưa hệ thống vào hoạt động, kết nối với hệ thống khác để phục vụ cho các mục tiêu chung về phát triển kinh tế xã hội
Điều quan trọng là “phổ biến một cách nhanh nhất, chính xác và kịp thời các
thông tin trong và ngoài nước” cho người dung tin trong nước và quốc tế Muốn như vậy, cần phải xây dựng được một hệ thống thông tín, kết nối các hệ thống thông tin với nhau, tổ chức hệ thống tra cứu sao cho người dùng tin có thể truy cập, tìm kiếm và với tới được nguồn tài liệu gốc một cách nhanh nhất, với chỉ phí
về thời gian cũng như tài chính ít nhất Chỉ khi đó, một hệ thống thông tin tin
học hoá quốc gia mới có ý nghĩa và mới phát huy được tác dụng
Trang 72 KET QUA THUC HIEN
2.1 Thiét ké, xay dung Website mau vé thong tin khoa học và công nghệ Việt Nam
Website là phương tiện, là cầu nối giữa người cung cấp thông tin và người dùng tin Để xây dựng Website, trước tiên phải thiết kế và xây dựng một mạng máy vi tính và sau đó là thu thập và tổ chức nội dung thông tin của Website trong mạng Ngoài ra, một vấn để quan trọng là phải phổ biến thông tin đến người dùng tin ở khắp mọi nơi, không bị cản trở về không gian địa lý, về mặt kỹ thuật, điều này đồng nghĩa với việc phát triển mạng cục bộ máy tính thành một mạng máy tính điện rộng
2.1.1 Mạng máy tính
Mạng máy tính là tập hợp các máy tính, các thiết bị công nghệ thông tin Chúng được kết nối với nhau theo một chuẩn mực nhất định nhằm mục đích chia sẻ tài nguyên, quản trị tập trung, tiết kiệm và sử dụng hiệu quả tài nguyên mạng và thong tin trong mang
Nhiều mạng máy tính cục bộ được kết nối với nhau dựa trên cơ sở hạ tầng viễn thông tạo nên một mạng điện rộng
Hình 8: mô hình mạng máy tính diện rộng
Ở nước ta, nhà cung cấp dịch vụ viễn thông duy nhất là Tổng công ty Bưu chính Viễn thông Việt Nam Các dịch vụ kết nối chính trong thời điểm này dành cho các mạng máy tính được Tổng công ty bưu chính viễn thông Việt Nam đưa ra là
6
Trang 8đường Leased line và đường ISDN Trong tương lai gần có thể có các dich vu khác như kết nối không dây, kết nối qua vệ tỉnh
Thiết kế mạng cục bộ máy vì tính
Tại thời điểm này và trong một vài năm tới, công nghệ xây dựng mạng LAN sẽ chưa có gì thay đổi nhiều Các công nghệ hiện đại, tốc độ cao sẽ dần dần thay thế các công nghệ mạng tốc độ thấp song đi đôi với việc thay đổi công nghệ là kinh phí đầu tư cũng tăng lên đáng kể Đối với các cơ quan thông tin trong hệ thống thông tin Quốc gia do kinh phí đầu tư không lớn, khoảng từ 30 đến 100 triệu đồng/năm, hơn nữa nhu cầu thông tin ngày một tăng nhưng chưa ở mức cao cần thiết phải có những hệ thống mạng mạnh mới đáp ứng yêu cầu Do đó, chưa cần phải có những đột phá về đầu tư công nghệ Dự đoán trong vài năm tới, công nghệ sử dụng cho các mạng LAN trong nước vẫn là FAST ETHERNET Sử dung công nghệ này hiện nay vẫn là rẻ nhất, cho phép tân dụng được tối đa sự đầu tư
kỹ thuật từ trước tới nay Ngoài ra, với công nghệ này, việc đầu tư nhân lực sẽ đơn giản, dễ dàng hơn nhiều so với việc áp dụng các công nghệ hiện đạt khác Trong hệ thống các mạng LAN hiện tại, để kết nối các điểm nút mạng trong cùng toà nhà với nhau ta sử dụng cấp xoắn loại CATS, Loại cáp mạng này cho tốc độ tối đa là 155 Mbps Trong trường hợp các điểm nút ở khoảng cách xa trên
100 m có thể sử dụng cáp quang Khi đó, dải thông trong mạng chung sẽ đạt được tối đa là 100 mbps Để kết nối các điểm của mạng với nhau ta sử dụng switch Với công nghệ switching sẽ đem lại cho chúng ta tốc độ tối đa Các thiết
bị mạng trong trường hợp đó sẽ có được tốc độ bằng tốc độ thấp nhất của các thiết bị và cáp kết nối (cáp, switch, card mạng, tốc độ máy tính) Với thiết kế như vậy sẽ hoàn toàn phù hợp cho các mạng thông tin khoa học và công nghệ vừa và nhỏ với số lượng máy tính trong mạng nội bộ khoảng 100 máy trở lại
Hình 9 Sơ đồ của một mạng diện rộng
Trang 10
Hình 12: kết nối hai mạng qua anten định hướng
Các kết nối với bên ngoài của một mạng diện rộng, thông thường có hai loạt:
Sử dụng một thiết bị kết nối chuyên dụng của các công ty cung cấp thiết bị mạng, kết nối không dây hoặc đường E1 do công ty bưu chính viễn thông Việt Nam cung cấp Thông thường sử dụng thiết bị chuyên dụng để kết nối với mạng điện thoại công cộng qua modem vì kết nối theo phương thức này rẻ tiền (người dùng phải trả thuê bao điện thoại với giá 130 đồng một phút) Phương án thuê đường lcascd line là không thực hiện được vì quá đất tiền (kinh phí đầu tư ban đầu khoảng 100 triệu đồng để chỉ phí cho 02 routers va 02 NTU Modem va khoảng 24 triệu đồng một năm để báo dưỡng đường truyền đối với đường leascd line 64 Kbps)
Đối với các mạng nhỏ, khi thiết kế hệ thống nên tuân thủ theo chuẩn của mạng InerneU/Intranet (2) Với thiết kế như vậy, ta có thể đễ đàng xây dựng các ứng dụng tra cứu, tìm kiếm thông tin cũng như có thể xây dựng ứng dụng cập nhật dữ liệu từ xa
Đối với những kết nối cho người truy cập từ xa bằng dial-up: Người dùng phải có máy tính, sử dụng modem và một đường dây điện thoại công cộng (2)
Người dùng cũng có thể sử dụng các công nghệ khác như wireless nhưng chỉ phí
sẽ lớn hơn nhiều so với kết nối dial-up
Các kết nối dial-up ngày nay phụ thuộc chủ yếu vào tốc độ và chất lượng đường điện thoại của mạng điện thoại công cộng Tuỳ thuộc theo thiết bị kết nối tại
“9
Trang 11mạng máy tính, nhưng thông thường, tốc độ của đường điện thoại không vượt
nhiều vào thời tiết, vào các điểm kết nối do các cơ quan của Tổng công ty Bưu chính Viễn thông quản lý
máy tính Sơ đồ kết nối được mô tả trong hình vẽ dưới đây
Hình 13: Kết nối mang qua lcascd line hoặc mạng điện thoại Công, cộng
(NTU modem) - Các loại thiết bị này hiện nay rất đa dang D6 IA những thiết bị
định với chất lượng cao là các thiết bi cua các hang thiét bi Tạng CÓ tiếng trên thế giới (như đã nêu trên) Chất lượng thiết bị phụ thuộc nhiều vào nhà sản xuất
và nơi sản xuất
2000 và 2001
10
Trang 12cũng là một lựa chọn trong giai đoạn hiện nay Tổng số tiền để kết nối giữa hai điểm trong khoảng cách 40 km trở lại (trọn gói) với trang thiết bị ban đần chừng
200 triệu đồng Số tiền bảo trì hàng tháng khoảng 6-8 triệu đồng (số liệu do KASATI cung cấp) Trong trường hợp đó giải thông phụ thuộc vào khoảng cách
và thiết bị sử đụng và có thể đạt tới tốc độ của đương E1/TI Sơ đồ kết nối được
mô tả trong hình 5
2.1.2 Nghiên cứu, thiết kế các tng dung trong mang
Một mạng máy tính của một cơ quan thông tin tư liệu thông thường cần có các ứng dụng như sau:
YVebsite
Dùng để phục vụ thông tin cho đông đảo người dùng Đây là một phương tiện tiện lợi, ổn định và có độ bảo mật cao đối với đữ liệu Website này bao gồm các nội dung chính như sau:
Trang chủ: giới thiệu về :
- Hoạt động của cơ quan: bao gồm các thông tin liên quan đến tư cách pháp nhân của cơ quan; quá trình thành lập và phát triển; các kết quả hoại động khoa học và công nghệ; các văn bản pháp quy về tổ chức và hoạt động của
cơ quan; qui chế hoạt động; quan hệ đối nội và đối ngoại v.v
- Cac dich vụ của cơ quan thông tin: bao gồm các dịch vụ chính của cơ quan thông in tư liệu Thông thường đó là các dịch vụ thông tin và tư liệu (tra cứu tài liệu; phục vụ tài liệu như sách, tạp chí; dịch vụ cung cấp tài liệu gốc .); dịch vụ mạng và các dịch vụ khác
- Cac thong tin có tính thời sự về khoa học và công nghệ: thường là bản tin khoa học và công nghệ phục vụ cho các đối tượng dùng tin của cơ quan Các thông tin này được thu thập và biện tập từ những thông tin mới nhất thuộc lĩnh vực bao quát của cơ quan thông tin tư liệu đó
thông tin khoa học và công nghệ biên soạn Các bản tin này được xuất bản hàng tuần, hàng quí hoặc hàng tháng về những chuyên để hẹp phục vụ cho các đói tượng dùng tin của cơ quan mình
dùng có thể liên hệ trực tiếp với nhau Đối với các mạng nhỏ có thể sử
N
Trang 13dụng các phần mềm nhỏ nhu MDaemon dé xay dựng Server thư điện tử Đây là một phần mềm rất tiện dụng, nhỏ, chỉ phí ít và sau khi cài đặt lên máy chủ chiếm khoảng 10 MB, hoạt động ổn định Phía người dùng tin có thể sử dụng Outlook hoặc trình client của MDaemon Trong trường hợp hệ thống lớn có thể sử dụng Microsoft exchange
- _ Truyền tệp: sử dụng để trao đổi tệp trong hệ thống Có thể sử dụng phương tiện của hệ điều hành để xây dựng dịch vụ này
-_ Dịch vụ tra cứu tin tại thư viện cũng như kho tài liệu của cơ quan: hệ tra cứu thông tin trong các cơ sở dữ liệu của cơ quan thông tin thư viện Các
hệ này thông thường được tổ chức tra cứu dưới đạng trang Web
khác
ĐỀ thực hiên các nhiệm vụ nêu trên sử dụng các phần mềm sau:
Hệ điều hành Windows NT, Window 2000 Đây là những phần mềm phù hợp nhất hiện nay vì tính tiện dụng, nhiều người biết, nhiều chương trình ứng dụng hiện đang được sử dụng rộng rãi tại Việt Nam chạy trong hệ điều hành này Tuy nhiên, vì hệ điều hành này quá phổ biến do đó các khuyết tật của nó cũng được các nhà tin học nhất là các tin tặc khai thác triệt để Song nếu chỉ
sử dụng trong mạng nội bộ thì không phải là vấn đề đáng ngại Về lâu đài, có thể phát triển Linux khi các phần mềm ứng dụng cho Linux đã khá phổ biến; Frontpage và ngôn ngữ HTML, XML để thiết kế và xây dung trang Web;
V Basic va VScripts;
IIS dé xay dung Website;
FTP dé truyén tép;
Các chương trình được viết thêm để cập nhật thông tin lên Web;
Diamond hoặc các ứng dụng nhỏ khác để xây dựng hệ thống thư điện tử Cũng có thể sử dụng Microsoft exchange nhưng chương trình này cổng kénh, chiếm nhiều tài nguyên, lãng phí đối với các hệ thống mạng nhỏ
12
Trang 14
Viện khoa học tổ chức Nhà nước là đen vị sự nghiệp có tư cách pháp nhân, có con đấu Tiếng và được mỹ tải khoản tại các ngản hàng vả kho bạc Nhà nước, được lợp tác nghiên cưu và ứng
Ban
Viện hơạt động bằng, kinh phi su nghiép wong Jing vuc công, tíc nabiên cứu khoa bọc
Hình 15: Trang chu mang thông tin cải cách hành chính
Trang 15
DI Ủ HỌC TÔ CHỨC NHÀ NƯỚC { THÔNG TÌN TU HỆU CÁ CÁCH HÀẦNH CHINH
Thùng tia Gia cítch bữu tinh: thi Bae made
NAM 2006
Hinh 16: Trang tin cha Vién nghién cttu khoa học Tổ chức Nhà nước
2.2 Nghiên cứu thiết kế hệ quản trị CSDL
Mot van dé quan trọng khi thiết kế, xây dựng hệ quản trị CSDL là thiết kế và xây dựng CSDL Để thuận tiện cho việc sử dụng sau này, các CSDL cần phải được
Ve dit liéu
loại để mục Quốc gia
trường ưong MARC2I, có một số loại dữ liệu mà trong đó có một số yếu tố hiện nay MARC21 chưa mô tả, chúng tôi sử dụng các trường dự trữ của MARC2I để mô tả các yếu tố của loại tài liệu đó Khi khổ mẫu chuẩn của Việt Nam hình thành sẽ chuyển đổi sử dụng khổ mẫu MARC21VN,
Vẻ ngôn ngữ xử dụng trong CSDL:
Tiếng Anh và tiếng Việt Trong đó tiếng Việt:
14
Trang 16- Thời điểm thực hiện đề tài không đặt ra chuẩn Unicode cho tiếng Việt mà chủ yếu vẫn dùng TCVN 5712-93 Tuy nhiên, đã nghiên cứu và xây dựng phương tiện chuyển đổi sang chudn UNICODE tiéng Việt khi cần thiết
tương lai phải được chuẩn hoá theo tiêu chuẩn mới của Việt Nam
Việc thiết kế hệ quản trị CSDL chúng tôi đưa ra hai phương án để người dùng có thể lựa chọn:
2.2.1 Sử dụng WeblSIS (kết quả của đề tài “Thiết kế một số dịch vụ của mạng VISTA” đã được bảo vệ năm 1999 có một số sửa đổi phù hợp với yêu cầu hiện nay)
Yêu cầu đặt ra đối với hệ thống khi sử dụng phương án này như sau:
Phan cứng:
Máy chú là các máy tính Pentium trở lên Làm việc trên nền hệ điều hành Windows NT, hoặc Window 2000 Hệ thống làm việc trong chế độ Chent/Server, str dung cong cu IIS cla Microsoft để tao Web server
Đối với người dùng cuối chỉ cần máy tính 586 trở lên có cài đặt trình duyệt 1E4.0, Netscape Navigator 4.0 td lén
Để thứ nghiệm, một CSDL về báo cáo khoa học và công nghệ của các Viện, Trường được đăng tái trên các ấn phẩm không định kỳ, các kỹ yếu hội nghị, hội tháo khoa học thuộc các lĩnh vực khoa học tự nhiên và công nghệ đã được xây dựng Cơ sớ dữ liệu này được kết hợp giữa việc tìm kiếm, tra cứu và xem toàn văn khí cần thiết
Các trường chính của CSDL để mô tả dữ hiệu là:
6 Phụ đề của tài liệu
7 Chương trình nghiên cứu
8 Dang tat
9 Linh vue
15
Trang 1710.Năm xuất bản
11.Tập
12.Số
13.Trang
14.Cấp báo cáo khoa học
15.Địa chỉ xuất bản (nơi xuất bản, nhà xuất bản)
16.Co quan cht tri
17.Cơ quan phối hop
18.Co quan chủ quản
19.Năm viết năm hoàn thành
20.Tên tệp và địa chỉ lưu trữ toàn văn
21.Từ khoá/từ chuẩn
22.Phần mềm dùng để đọc
Trong đó trường full tcxt (toàn văn) cũng được coi như một trường bình thường, của biểu ghi nhưng nó chứa địa chi lưu trữ của tệp toàn văn (trường 20) Tệp toàn văn có thể lưu dưới định dạng HTML, Adobe Acrobat, Word, hoặc Rich tcxI
Để hệ thống hoạt động có hiệu quả, máy chủ cần có tốc độ cao, bộ nhớ lớn nhất
là đĩa cứng sử dụng để lưu trữ toàn văn tài liệu Thông thường máy chủ có đĩa cứng tối thiểu từ 10 GB trở lên
Để bảo đảm an toàn đữ liệu có thể xây dựng các hệ thống bảo mật Hệ thống bảo mật bao gồm về mặt tổ chức cũng như chương trình Hệ thống bảo mật về mãi tổ chức đã được mô tả chỉ tiết trong (1) Hệ thống bảo mật về phần cứng và phần mềm có thể tham khảo trong báo cáo kết quả nghiên cứu “thiết kế một số dịch
vụ của mạng V]STA” (2) Trong thực tế, các hệ thống bảo mật sẽ làm giảm tốc
độ hoạt động của mạng máy tính vì vậy cần phải được nghiên cứu kỹ càng khi áp dụng trong hệ thống mạng,
Ngoài ra, không có gì kháng định là hệ thống được đảm bảo an toàn tuyệt đối
Do vậy, việc sao lưu đữ liệu đối với các hệ thống là điều cần thiết
Trang 18- Dang tai liéu
- Tên tài liệu
-_ Từ chuẩn/từ khoá
kỳ nào chưa được index nhưng cách tìm này chậm và không mềm dẻo Công việc nhập đữ liệu vào CSDL có thể thực hiện ở cả hai phương án: chạy trên hệ điều hành DOS hoặc Windows sau đó cập nhật vào máy chủ hoặc nhập từ máy trạm theo chế độ mạng để cập nhập trực tiếp vào máy chủ
Khi kích hoạt chương trình, trên màn hình dữ liệu có thể được trình bày theo nhiều kiểu format đầu ra khác nhau tuỳ theo yêu cầu người sử dụng bằng việc chọn các format tinh bay theo thực đơn Thí dụ, ưình bẩy dữ liệu đầu ra như
Sau:
Mã số tài liệu: AAA_1999—0001
Tên báo cáo: Độ bền nhiệt đới và các phương pháp nhiệt đới hoá các sản
phẩm chế tạo máy là hệ thống kỹ thuật phức tạp
Lĩnh vực: Công nghệ nhiệt đới hoá
Aem toàn văn
Để xem toàn văn, kích chuột vào dòng ký tự “Xem Ioàm văn”, chương trình sẽ
tự động kích hoạt các phần mềm tương thích để đọc các dữ liệu toàn văn Việc in toàn bộ báo cáo (văn bản toàn văn đó) ra may n hay tệp tuỳ thuộc vào chương
17
Trang 19trình ứng dụng cụ thể sử dụng để đọc dữ liệu đó Các phần mềm ứng dụng phụ trợ này cần phải được cài đặt trước trên máy của người dùng
Mô tả hệ thống tìm kiếm thông tin rong chế độ Web
Nguyên tác hoạt động của hệ thống tìm kiếm thông tin trong các CSDL của Trung tâm (trên CDS/ISIS chạy trong môi trường DOS hoặc Windows) chạy trong chế độ Web được mô tả trong hình 8 cụ thể như sau:
a - trên máy trạm, người sử dụng điền vào một biểu mẫu yêu cầu những thông tin
họ cẩn vào các trường tương ứng Biểu mẫu này là một trang web bình thường được hiện bằng một trình duyệt quen thuộc như MS Internet Explorer hay Netscape Navigator
b - trên máy chủ, một phần mềm quản trị web nhu Internet Information Server hoac Netscape Web Server nhan cau hỏi và không gửi lại cho người sử dụng một trang wecb lĩnh như thường lệ mà chuyển nó cho một chương trình mở rộng có tên là Iscarch để tiếp tục xử lý
c - chương trình mở rộng theo câu hỏi này cho phép tìm trong CSDL CDS/ISIS những biểu ghi phù hợp, định dạng những biểu ghi tìm được dưới dạng một trang NWGb theo những đặc trưng của ngôn ngữ HTML và gửi trả lại cho hệ quản trị Web
d- hé quan tri Web gifi tra trang Wcb này cho trình duyệt ở máy trạm để người dùng có thể xem kết quả
e - sau khi xem kết quả, nếu có nhu cầu đọc toàn văn tư liệu tìm được, người dùng chỉ cần kích chuột vào mục full text-rong phần kết quả tìm được của từng biểu ghi, hệ thống sẽ chuyển về máy trạm toàn văn tài liệu đó và có thể kích hoạt khi ở máy trạm có chương trình tương ứng để đọc
18
Trang 20Web Server
Biểu mẫu tìm
Các biểu ghi tìm được
Hinhl7 - Nguyên tắc hoạt động của hệ thống tra cứu thông tín trong các CSDL
Trang 21
Hoạt động của hệ thống tìm kiếm thông ñn
Chương trình cho phép truy cập đến các CSDL CDS/ISIS từ các trình duyệt Web Điều này cho phép giữ nguyên được các CSDL sẵn có, phù hợp với nhu cầu công việc cũng như tuân theo các chuẩn quốc tế về xử lý và trao đổi dữ liệu, nhưng đồng thời cũng cho phép tận dụng được những khả năng của công nghệ mới (nternet/ntranet, kiến trúc khách/chủ, )
Ở đây, vẫn có thể sử dụng hoàn toàn khả năng tìm kiếm linh hoạt cũng như các {ormat hiện hình đa dạng của CDS/ISIS, việc quản trị và bảo trì CSDL, được đơn giản hoá vì chỉ có một hệ CSDL đã quen thuộc Mọi qui trình làm việc khác với tìm kiếm như cập nhật đữ liệu, xuất bản các ấn phẩm, vẫn được giữ nguyên như cũ
Mặt khác, với công nghệ mới, có thể tra cứu các CSDL từ xa cũng như trong mạng cục bộ từ các máy trạm mà không cần cài đặt chương trình đặc biệt nào riêng cho ứng dụng này, mọi chương trình đều đã được thực hiện trên máy chủ Mọi xử lý đối với CSDL, đều được thực hiện trên máy chủ nên có thể giảm tối thiếu việc chuyển dữ liệu trên đường tưuyền Chương trình được thực hiện rất nhanh do được lưu trong RAM của máy chủ mà không cần nạp lại mỗi khi có câu hỏi mới Chương trình có thể chạy trong một tiến trình riêng biệt cách ly với tiến trình cúa Wcb server nên nếu có bị hồng cũng không ảnh hưởng đến Wcb servcr và những câu hỏi tiếp theo
Các CSDL này có thể được truy cập qua giao diện Web từ một trạm làm VIỆC trong mạng cục bộ hay bằng một máy từ xa qua modem hoặc 1ừ các mạng khác
có kết nối Internet Kết quả thử nghiệm cho thấy thời gian nhận được kết quả là khá nhanh, đáp ứng được yêu cầu
Về phương án này, hệ thống đã được chạy trên nhiều Website ở Việt Nam như tại Mạng thông tin khoa học và công nghệ Việt Nam (VISTA), Mạng của Sở khoa học và Môi trường Quảng Nam, Mạng của thư viện trường Đại học Y Hà Nội, Mạng của Viện thông tin Tư liệu và bảo tàng Địa chất, Website của Thư viện Khoa học Tổng hợp Thành phố Hồ Chí Minh v.v.v Hệ quản trị này làm việc tương đối ốn định đối với các CSDL không lớn và tốc độ xử lý nhanh
20
Trang 22Ngoài ra, hệ quản trị CSDL CDS/ISIS đã được đông đảo người dùng trong mạng lưới thông tin tư liệu trong nước chấp nhận, do đó, phương án này cũng sẽ là một phương án hợp lý thúc đẩy tiến trình tin học hoá các hoạt động thông tin trong các cơ quan thông tin tư liệu ở Việt Nam
Nhược điểm tồn tại của hệ quản trị này là không có phương tiện kiểm tra trùng lặp các biểu ghi, chưa có phương tiện để tính toán, thống kê mà đôi khi cần thiết đối với các hệ thống quản trị thư viện
biểu ghỉ mối rang
Tìm theo tên báo cáo: Chọn mục Tên báo cáo hoặc Mọi trường trong ô tìm,
Tại ô tên báo cáo gõ: bấo (nếu không nhớ phần cuối của tên )
Hoặc tại Ôô: mọi trường gõ: phương pháp dự báo bão
(có thể đùng toán tử để xác định các từ liền nhau)
Tìm các mục khác gõ giá trị vào các ô tương ứng
Thí dụ: tìm theo chủ nhiệm để tài, cán bộ phối hợp, cơ quan chủ trì, cơ quan phối hợp,
cơ quan chủ quản, cơ quan quản lý, cấp quản ly dé tài, từ khoá tiếng Việt, chỉ số đề
21
Trang 23Chủ nhiệm số: Ngô Thế Long
Co quan didn © Viên nghién city Hin Nom
Made BIE Mo XWĐIL.92-19
Đặc trung số lượng — 26
bÐi gia ket thúc - 7 09, 1994
quý giá của dân tộc ta, biện đang còn tản mác ở nhiều bơi, đang bị lãng quên viít người đọc đự
bưng những giá trị tình thần đè xây dựng nén văn hóa mới Công nghé thong ra hiệp đại có thể
Phân nh các điều kiện nguyên tắc và khả năng ứng dụng công nghệ thêng rà {CNTT) vào
Hoe viêu chính trị quốc gia Hé Chi Minh, Trình bày các fink vur ¢4 thé ime dung CNTT trang
phương hướng ứng dụng CNTT tại Học viện mong điều kiêu biến nay và các giải pháp đảm bảo hiệu quả ứng dụng CNTT tại Học viện
Trang 242.2.2 Phương án thiết kế một hệ quản tri CSDL trén Microsoft SQL Server Yêu câu đối với hệ quản trị như sau-
từ 10 GB trở lên
Hệ điều hành: Microsoft Windows NT 4.0 trở lên
Server sẽ quản lý chuyển tải các trang Web đến trình đuyệt để tạo ra giao diện
tình đuyệt để cập nhật dữ liệu từ xa thông qua các trang ASP Các trang ASP
Webserver tra về trình duyệt cho người sử dụng
ASP
Cong cu truy cap CSDL: Sử dụng thư viện uy cập CSDL từ xa của Microsoll là ADO (AliveX Data Object) dé xu ly di liệu trên SQL server thông qua các lệnh gọi trong các trang ẤSP
quả về cho trình duyệt dưới dạng trang Web với dữ liệu đạng ngôn ngữ HTML chuẩn
Thiết kế hệ thống
Cơ sở đữ liệu:
Cấu trúc dữ liệu trong cơ sở đữ liệu
Bảng các yếu tố mô tả chính trong CSDL
23
Trang 25Bảng Có_quan_ củng cạp: Chứa các thông tín về cơ quan cung cấp tài liệu
Tên trường Độ dài | Kiến Diền giải
Địa chỉ có quan 255 Text Địa chỉ của cơ quan
24
Trang 26
Bang Linh_vuc-: linh vuc bao quát của tài liệu - Danh mục các lĩnh vực của tài liệu
Ten_Nha_xuat_ban 255 Text Tên của nhà xuất bản
Trang 27Bang Ket_qua_nghien_cuu: Thong tin về kết quả các đề tài nghiên cứu
Nam_nghien_ cuu 8 Date Ngày tháng năm bất đầu nghiên cứu
Chu_nhiẻm_ dc, tại 50 Text Tên chủ nhiệm dé tai
Bảng Tai_leu_goc- Danh sách các tài liệu gốc
26
Trang 28Bảng Dsers: Danh sách các người sử dụng và phân quyền
Id_co_quan_cung_cap |4 Long Mã cơ quan cưng cấp
Bảng Muc_ mat: Danh sách các m ức bảo mát
Hình 21 Sơ đồ quan hệ các bảng thông tín trong hệ thống
Id_Nha_xuat_ban Hanm_xuat_ban
Id_co_quan_cung_cap
Id_Tu_khoe
Td_Muc_mat Id_Linh vuc Tom _kat Tai_tieu_goc
{Ten_co_Quan:: ị
Can có quan Diện Thoại
Trang 30Xây dựng các dịch vu của Website
Hình 24: Sơ đồ tổng quan của hệ thống
Người dùng nếu có
thì có thể cập nhật F————{|_ | cập nhật thông tin kiếm thông tin
Internet Information Server (IIS) Quan tri Website,
Nhận các yêu cầu cập nhật các CSDI, và pọi các
trang ASP để truy cập CSDL thong qua ADO
Chuyển kết quả trả về cdc trang ASP thong qua các trang HTML, và gửi cho trình duyệt Tải các trang HTML cho trình duyệt
29
Trang 31Hình 25: Sơ đồ cơ sở dữ liệu và sơ đồ hệ thống dich vu
Cơ sở dữ liệu về tài liệu và
kết quả nghiên cứu
Danh sách các tài liệu
Danh sách các đề tài nghiên
-Nhập mới, sửa đổi, xóa tài
liệu, các kết quả nghiên cứu
-Phân loại tài liệu theo
Cơ sở đữ liệu về người dùng Danh sách người sử dụng và quyền sử dụng
-Phân quyền cho người sử dụng
-Thay đổi các tham số hệ thống
Trang 32Giáo điện của hệ thống
Chương trình được chia làm 3 phân cơ bản
thống cập nhật dữ liệu từ xa
Phân Tra cứu: Cho phép người dùng tra cứu các Tài liệu, Kết quả nghiên cứu theo các điều kiện khác nhau do người dùng thiết lập Các dif lieu được đưa lên tra cứu trực tuyến mà ta thường gọi là OPAC
Quản trị người dùng: Cập nhật các thông tin liên quan và phân quyền người sử dụng, những người được đăng ký trong danh sách này thì mới có quyền cập nhật
đữ liệu hoặc quản trị đữ liệu của hệ thống
Trang chính của phần quả trị đữ liệu được mô tả như sau:
hang tela thất lý thi Nite kas bee & aing wake
Web site quan ly tai liễu khoa hoe Cởng nghề được thị
kể nhằm muc đích giúp chớ mới người tìm tìn thuận lợi hơn treng việc tra cứu các thông tìn VỀ các tài liều
céng nghé, céc théng tin vé ode ket quả để tài nghiên
trung tâm mang khoa hoc và công nghẽ VISTA theo địa chi = đưới d&y Min ch&n thanh cam ơn:
Trang 33
Các mục trên hệ thống thực đơn ngang gồm các mục sau:
Hệ thống: Gồm các chức năng về quản trị hệ thống
kế nhằm mục đích giúp cho mọi người tìm hơn trong việc tra cứu các thông tin về khoa hoc, bài bác có liên quan đến Lĩnh
cứu Rất mong được sư góp ÿ của các ban
Cập nhật: Gồm các chức năng để cập nhật các Tài liệu và các kết quả nghiên vứu khoa học
Tra cứu: Gôm các chức năng để người sử dụng tra cứu và tìm kiếm các tài liệu
và kết quả nghiên cứu
Báo cáo: In các báo cáo về tài liệu và nghiên cứu khoa học
32
Trang 34HN
Se
TRA Tim Thi LEY
Hình 28: trang Web tra tìm tài liệu
Đây là phần Public, mọi người khi kết nối vào CSDL, đều có thể truy cập vào CSDL, đều có thể truy cập vào module này Mục đích của module này là cho phép mọi người có thể tra cứu thong tin trong CSDL
và giúp cho người tìm tin có thể tim ra thong tin một cách nhanh nhất, chính xác nhất
Âthngg ÐfNft nuềt 4Á l6 / Ai khoa đục 4 công amb
kế nhàm mục đích giúp cho moi người tìm tìn thuận Lợi
khoa học, bài báo có liên quan đến lĩnh vực khoa học và
cứu R&t mong duoc eu gép ý của các ban để chương trình
due d@y Xan chấn thánh cổn ont
Hình 29: Các dịch vụ chính của phần tra cứu
33
Trang 35Để truy xuất thông tin trong CSDL ban hãy chọn menu TRA CƯU cửa
số chương trình sẽ hiện ra như hình vẽ:
Để tra cứu thông tin các bản tin/ Báo cáo khoa học Bạn hãy nhấp chuột vào để mục tương ứng để chọn Cửa sổ tra cứu thông tin sẽ hiện ra Bạn hãy gõ yêu cầu tìm kiếm vào các text box và hãy chọn điều kiện tìm cho thông tin yêu cầu của bạn Nếu bạn muốn tìm thông tin chính xác hãy điển đầy đủ thông tin yêu cầu của mình Kết quả sẽ hiện ra như bạn mong muốn
Khi bạn click chuột vào trang tìm kiếm cửa sổ tìm kiếm sẽ hiện ra như hình vẽ dưới đây:
TRA Tim TAI LIEW
NHĂN THƯỜNG sev KEW ih TRY THÍN TỂ
Trang 36Hãy nhập điều kiện tìm kiếm vào cửa sổ tìm kiếm Ví dụ như sau:
NHĂN TRƯỜNG “IỂY Kiện: #IÍ TR TORR TE
Điều kiện:
Là: Tìm chính xác (tương đương dấu “=”
Bài đâu bằng: Tìm các chuỗi ký tự có phần bắt đầu giống giá trị nhập vào, phần kết thúc không quan tâm
Ví dụ: Các chuỗi bắt đầu là Công Kết duả tìm kiếm sẽ cho các chuỗi như: Công
An, Cong dân, Công nông ,
Có chứa: Tìm các chuỗi ký tự trong nội dung có chứa chuỗi giống giá trị nhập vào, phần đầu và phần kết thúc không quan tâm
w a
Trang 37Vi dụ: Tìm các tác giả có chứa Văn-Kết quả tìm kiếm sẽ cho các tác giả như: Văn Cao, Nguyễn Văn Nam, Lê Văn Hải, Nguyễn Đình Van
Kếi thúc bằng: Tìm các chuỗi ký tự có phần kết thúc giống giá trị nhập vào
Ví dụ: Tìm các tác giả có Tên là Cao
Ví dụ như ở màn hình trên là Điều kiện để tìm kiếm Các Bài báo/Tài liệu hoặc kết quả nghiên cứu với tên có chứa chữ Công và Tác giả phải có tên là Cao hoặc những văn bản phát hành năm 1990
Nút Tìm kiếm: Bất đầu tìm kiếm theo Điều kiện đã đặt
Máy sẽ hiện ra màn hình để hiển thị các kết quả tìm kiếm được như sau:
Muốn xem đây đủ các thông uin liên quan đến Bài báo/Tài liệu thì nháy chuột vào cột Toàn văn
36
Trang 38Thí dụ về một kết quả tìm kiếm được trình bày theo hình dưới đây
loài khưou Ngọc Linh có tứn khoa học Garulax ngöclInhenEis va Actinodura
va Joal khuou Kon ka kink, co tén Khoa hoc Garrulax konkakinheneis vua được
hiện tại tĨnh Kon Tum và Gia Lai Đây la cắc loài chim quý hiểm được ghi trong Sắch Việt ham và đang có nguy cơ bị đa doa tuyết ching tren thé gidi Tại Viát Nam, các nhà học đã phát hiên thấy Khoảng 840 loại chim, chiếm gắn B,6% tổng số loại chịm trên
hế giới Tính riêng tử nam 1083 đến nay, Việt Nam đã pat men them 226 loài, Hiến nay, việc săn tết lrát phép các loài động vật hoang dã để Lấy thịt và xuất khổu, nhiều loại
ở Việt Narh dang bị săn bắt hàng loạt để làm chìm cảnh, dỗn đến nhiều loại chim quỳ được ghi trong sách đỏ của Việt Nam ve thế giới đang mất dần và có nguy cơ tuyết
Trang 39
Hình 33 Sơ đồ nguyên lý hoạt động của modun nhập dữ liệu
Để có thể xây dung được hệ thống cập nhật dữ liệu, vấn dé trước tiên là thiết kế
hệ thống Vấn để này đã được phân tích chi tiết ở phần xây dựng hệ thống quản
38