1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu cơ sở khoa học và thực tiễn phát triển mạng thông tin tư liệu về khoa học

78 631 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu cơ sở khoa học và thực tiễn phát triển mạng thông tin tư liệu về khoa học
Thể loại Luận văn
Định dạng
Số trang 78
Dung lượng 2,97 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nghiên cứu cơ sở khoa học và thực tiễn phát triển mạng thông tin tư liệu về khoa học

Trang 1

BO KHOA HOC CONG NGHE VA MOI TRUONG

DE TAI NGHIEN CUU KHOA HOC CAP BO

NGHIEN CUU CO SO KHOA HOC VA THUC TIEN

PHAT TRIEN MANG THONG TIN TU LIEU

VE KHOA HOC VA CONG NGHE 6 VIET NAM

Chủ nhiệm đề tài: Ts Tạ Bá Hưng

Thư ký đề tài: Ks Nguyén Van Dién

Công nghệ Quốc gia Các công tác viên: Ks Nguyễn Tháng, Ks Nguyễn Tử Bình,

Ks Trần Đức Phương, Ks Nguyên Tuấn Hải,

Ks Hoang Anh Tuan, Ks Tran Việt Tiến,

Ks Tao Huong Lan, Ks Tran Mai Lan

Hà Nội 11-2001

Trang 2

BAO CAO KẾT QUÁ THỰC HIỆN ĐỀ TÀI 2000-2001

“NGHIÊN CỨU CƠ SỞ KHOA HOC VA THUC TIEN PHAT TRIEN MANG

THONG TIN KHOA HOC VA CONG NGHE VIET NAM”

Đề tài nghiên cứu khoa học cấp bộ “Nghiên cứu cơ sở khoa học và thực tiễn phát triển mạng thông tin khoa học và công nghệ Việt Nam” được tiến hành trên cơ

sở nhu cầu thực tiễn và cấp bách hiện nay của nước ta Nhu cầu xây dựng các mạng thông tin trong nước, xây dựng các Website và các công cụ cần thiết để tổ chức, xử lý và tra cứu thông tin cũng như cập nhật thông tin là cấp bách, nhằm nhanh chóng hình thành một mạng thông tin khoa học và công nghệ để phục vụ cho sự nghiệp công nghiệp hoá và hiện đại hoá đất nước Đề tài được tiến hành trên cơ sở nghiên cứu thực tế, điều tra, khảo sát, phân tích tình hình và nhu cầu thực tiễn ở các cơ quan thông tin tư liệu Việt Nam, từ đó nghiên cứu, thiết kế và xây dựng các mạng thông tin khoa học và công nghệ, các công cụ cần thiết để quản trị dữ liệu, cập nhật thông tin, đáp ứng nhu cầu thong tin của người dùng tin

Theo để cương nghiên cứu đã được duyệt, đề tài phải thu được các kết qua sau:

- Bao cdo tong quan vé hién trạng và triển vọng của hệ thong thong tin khoa hoc va cong nghé Viét Nam

- Xay dựng Website về khoa học và công nghệ trong đó một phần quan trọng

là hệ quản tri cơ sở đữ liệu sử dụng trong các cơ quan thông tin khoa học và công nghệ

Kết quả thứ nhất đã được lập thành một báo cáo riêng “tổng quan về tình hình hoạt động của mạng thong tin khoa học và công nghệ Việt Nam” Trong báo cáo này chỉ dé cập tới hai nội dung sau là xây dựng Website và hệ thống cập nhật đữ liệu từ xa

Trang 3

1 MỞ ĐẦU

Nghị Quyết Đại hội IX đã khẳng định - khoa học và công nghệ cùng với giáo dục và đào tạo là quốc sách hàng đầu, là nền tảng và động lực đẩy mạnh công nghiệp hoá và hiện đại hoá đất nước Khoa học và công nghệ hướng vào việc nâng cao năng suất lao động, đổi mới sản phẩm, nâng cao năng lực cạnh tranh của hàng hoá trên thị trường, xây dựng năng lực công nghệ quốc gia, ứng dụng một cách sáng tạo những công nghệ nhập khẩu, từng bước tạo ra công nghệ mới

Đi nhanh vào một số ngành, lĩnh vực sử dụng công nghệ hiện đại, công nghệ cao Trên cơ sở đó, Nghị quyết của Đảng đã đề ra các giải pháp chơ việc phát triển khoa học và công nghệ ở nước ta trong giai đoạn này như sau:

z Tạo thị trường cho khoa học và công nghệ, đổi mới cơ chế tài chính nhằm khuyến khích sáng tạo và gắn ứng dụng khoa học và công nghệ với sản xuất kinh doanh, quản lý, dịch vụ

Tăng đầu tư ngân sách và có chính sách khuyến khích, huy động các nguồn

lực khác để đi nhanh vào một số ngành, lĩnh vực sử dụng công nghệ hiện đại, công nghệ cao

~ Coi trọng nghiên cứu cơ bản trong các ngành khoa học Sắp xếp và đổi mới

hệ thống nghiên cứu khoa học, phối hợp chặt chẽ việc nghiên cứu khoa học tự nhiên, khoa học-công nghệ với khoa học xã hội và nhân văn

VớI sự phát triển của khoa học và công nghệ, các tư liệu về khoa học và công nghệ ngày một tăng bao gồm sách, báo, tạp chí, các báo cáo khoa học tại các hội nghị, hội thao, các kết quả nghiên cứu từ các chương trình, đề tài, các số liệu thống kê, điều tra cơ bản về tài nguyên, thiên nhiên và môi trường Sự gia tăng của các tư liệu hàng năm là cấp số nhân và chúng nằm tản mát ở khap mọi nơi trong nước

Luật khoa học và công nghệ đã được Quốc hội thông qua trong đó điều 45 đã nêu rõ: Chính phủ đầu tư xây dựng hệ thống thông tin khoa học và công nghệ quốc gia hiện đại, bảo đảm thông tin đầy đủ, chính xác, kịp thời về các thành tựu quan trọng trong các lĩnh vực khoa học và công nghệ ở trong nước và trên thế giới; bán hành Quy chế quản lý thông tin khoa học và công nghệ; hàng năm công bố danh mục và kết quả thực hiện các nhiệm vụ khoa học và công nghệ trong nước

Để thực hiện chủ trương, đường lối của Đảng, dưới sự chỉ đạo của Bộ Khoa học Công nghệ và Môi trường, Trung tâm Thông tin Tư liệu khoa học và Công nghệ

2

Trang 4

Quốc gia đã và đang phối hợp với các ngành và các địa phương xây dựng Nghị định nhằm hướng dẫn chỉ tiết việc tổ chức, quản lý thông tin khoa học và công

nghệ đã được đề cập trong Luật Khoa học và Công nghệ

Một trong những vấn đề trọng tâm là thu thập, xử lý, lưu trữ nguồn tư liệu xám,

nguồn thông tin đã được tư liệu hoá do hoạt động khoa học và công nghệ được

cấp kinh phí từ ngân sách Nhà nước Đây là một nguồn tin nội sinh rất phong phú, phù hợp với nhu cầu phát triển của Việt Nam, có thể phục vụ tốt cho sự nghiệp công nghiệp hoá và hiện đại hoá đất nước Các nguồn tư liệu này sẽ giúp ích cho việc thẩm định dé tài, đề án, đánh giá công nghệ, chấc chắn sẽ giúp ích

cho hoạt động nghiên cứu khoa học và triển khai công nghệ trong nước

Cơ sở dữ liệu là một thành phần quan trọng trong một hệ thống thông tin Có thể phân loại CSDL, ra làm 3 loại:

CSDL thư mục;

CSDL dữ kiện;

CSDL, toàn văn

Tuy nhiên cũng có nhiều tài liệu phân loại, sắp xếp CSDL theo tiêu chí khai thác

(Source Database)

biểu thống kê, hình ảnh, âm thanh (multimedia) còn CSDI, tham khảo bao gồm: CSDL, chỉ dẫn; CSDL thư mục Đây là loại CSDL có chức nang chi ra nguồn chứa thông tin, chứa các thông tin đại diện cho nguồn tài liệu (mẫu tìm)

CSDL nguồn có thể xếp thành nhóm như sau:

CSDL toàn văn;

CSDL số:

CSDL ký tự/số;

Multimedia

Trang 5

Các CSDL loại này không chỉ dẫn cho người sử dụng tư liệu mà cung cấp cho họ những thông tin đầy đủ

CSDL toàn văn Đó là những tư liệu được số hoá như sách, tạp chí, bài báo, báo

và xây dựng thành các thư viện điện tử mà có những tính năng vượt trội so với

chất lượng

Ở nước ta, trong những năm gần đây đã chú trọng vào việc xây dựng các cơ sở

dữ liệu nguồn Một số cơ sở dư liệu đã hình thành như cơ sở đữ liệu luật, các cơ

sở dữ liệu các số liệu thống kê, CSDL GIS, các số liệu điều tra cơ bản về tài nguyên thiên nhiên và môi trường, các kết quả nghiên cứu, các báo cáo lại các hội nghị hội thảo Tuy vậy, lượng thông tin thu thập được chiếm một phần không đáng kể trong toàn bộ các cơ sở dữ liệu hiện có tại Việt Nam

Hiện nay, về mặt tổ chức, ở nước ta đã hình thành một hệ thống các cơ quan thông tin khoa học và công nghệ Các cơ quan này làm nhiệm vụ thu thập, xử lý lưu trữ và nhục vụ thông tin trước tiên cho người dùng tin của cơ quan mình, sau nữa là người dùng tin trong nước và quốc tế Hiện trạng về hệ thống thông tin đã được mô tả chỉ tiết trong báo cáo về hiện trạng hệ thông thông tin khoa học và công nghệ Việt Nam Cho đến nay, rất ÍL các cơ quan thông tin tư liệu có mạng

với nhau Kết nối với các mạng thông tin hầu hết là dial-up Ngoai ra, cdc thong tin thu thập được tuy nhiều nhưng chưa được số hoá, hoặc đã số hoá nhưng không có một chuẩn mực thống nhất Vì vậy, việc trao đổi thông tin giữa các hệ thống hầu như chưa được thực hiện

Các thông tin về tư liệu xám ở nước ta khá nhiều, tập trung rải rác ở các ngành, các địa phương, các viện nghiên cứu, các trường đại học Nhà nước đã có chủ

tại các cơ quan thông tin khoa học và công nghệ địa phương

Trang 6

Nhu vậy, nguồn tư liệu xám khổng lồ đã được chảy theo một tuyến, bước tiếp theo là các cơ quan thông tin cần phải xây dựng được các hệ thống thông tin quản lý các tư liệu này Đối với các cơ quan thông tin không có khả năng xây dựng hệ thống mạng riêng có thể cập nhật thông tin (các kết quả nghiên cứu) vào

cơ sở đữ liệu tại trung tâm Thông tin Tư liệu Khoa học và Công nghệ Quốc gia

để phục vụ người dùng trong cả nước Đối với những cơ quan có khả năng xây dựng hệ thống thông tin (mạng máy tính và thong tin tư liệu trong mạng) cần nhanh chóng xây dựng và hoàn thiện hệ thống thông tin để đưa hệ thống vào hoạt động, kết nối với hệ thống khác để phục vụ cho các mục tiêu chung về phát triển kinh tế xã hội

Điều quan trọng là “phổ biến một cách nhanh nhất, chính xác và kịp thời các

thông tin trong và ngoài nước” cho người dung tin trong nước và quốc tế Muốn như vậy, cần phải xây dựng được một hệ thống thông tín, kết nối các hệ thống thông tin với nhau, tổ chức hệ thống tra cứu sao cho người dùng tin có thể truy cập, tìm kiếm và với tới được nguồn tài liệu gốc một cách nhanh nhất, với chỉ phí

về thời gian cũng như tài chính ít nhất Chỉ khi đó, một hệ thống thông tin tin

học hoá quốc gia mới có ý nghĩa và mới phát huy được tác dụng

Trang 7

2 KET QUA THUC HIEN

2.1 Thiét ké, xay dung Website mau vé thong tin khoa học và công nghệ Việt Nam

Website là phương tiện, là cầu nối giữa người cung cấp thông tin và người dùng tin Để xây dựng Website, trước tiên phải thiết kế và xây dựng một mạng máy vi tính và sau đó là thu thập và tổ chức nội dung thông tin của Website trong mạng Ngoài ra, một vấn để quan trọng là phải phổ biến thông tin đến người dùng tin ở khắp mọi nơi, không bị cản trở về không gian địa lý, về mặt kỹ thuật, điều này đồng nghĩa với việc phát triển mạng cục bộ máy tính thành một mạng máy tính điện rộng

2.1.1 Mạng máy tính

Mạng máy tính là tập hợp các máy tính, các thiết bị công nghệ thông tin Chúng được kết nối với nhau theo một chuẩn mực nhất định nhằm mục đích chia sẻ tài nguyên, quản trị tập trung, tiết kiệm và sử dụng hiệu quả tài nguyên mạng và thong tin trong mang

Nhiều mạng máy tính cục bộ được kết nối với nhau dựa trên cơ sở hạ tầng viễn thông tạo nên một mạng điện rộng

Hình 8: mô hình mạng máy tính diện rộng

Ở nước ta, nhà cung cấp dịch vụ viễn thông duy nhất là Tổng công ty Bưu chính Viễn thông Việt Nam Các dịch vụ kết nối chính trong thời điểm này dành cho các mạng máy tính được Tổng công ty bưu chính viễn thông Việt Nam đưa ra là

6

Trang 8

đường Leased line và đường ISDN Trong tương lai gần có thể có các dich vu khác như kết nối không dây, kết nối qua vệ tỉnh

Thiết kế mạng cục bộ máy vì tính

Tại thời điểm này và trong một vài năm tới, công nghệ xây dựng mạng LAN sẽ chưa có gì thay đổi nhiều Các công nghệ hiện đại, tốc độ cao sẽ dần dần thay thế các công nghệ mạng tốc độ thấp song đi đôi với việc thay đổi công nghệ là kinh phí đầu tư cũng tăng lên đáng kể Đối với các cơ quan thông tin trong hệ thống thông tin Quốc gia do kinh phí đầu tư không lớn, khoảng từ 30 đến 100 triệu đồng/năm, hơn nữa nhu cầu thông tin ngày một tăng nhưng chưa ở mức cao cần thiết phải có những hệ thống mạng mạnh mới đáp ứng yêu cầu Do đó, chưa cần phải có những đột phá về đầu tư công nghệ Dự đoán trong vài năm tới, công nghệ sử dụng cho các mạng LAN trong nước vẫn là FAST ETHERNET Sử dung công nghệ này hiện nay vẫn là rẻ nhất, cho phép tân dụng được tối đa sự đầu tư

kỹ thuật từ trước tới nay Ngoài ra, với công nghệ này, việc đầu tư nhân lực sẽ đơn giản, dễ dàng hơn nhiều so với việc áp dụng các công nghệ hiện đạt khác Trong hệ thống các mạng LAN hiện tại, để kết nối các điểm nút mạng trong cùng toà nhà với nhau ta sử dụng cấp xoắn loại CATS, Loại cáp mạng này cho tốc độ tối đa là 155 Mbps Trong trường hợp các điểm nút ở khoảng cách xa trên

100 m có thể sử dụng cáp quang Khi đó, dải thông trong mạng chung sẽ đạt được tối đa là 100 mbps Để kết nối các điểm của mạng với nhau ta sử dụng switch Với công nghệ switching sẽ đem lại cho chúng ta tốc độ tối đa Các thiết

bị mạng trong trường hợp đó sẽ có được tốc độ bằng tốc độ thấp nhất của các thiết bị và cáp kết nối (cáp, switch, card mạng, tốc độ máy tính) Với thiết kế như vậy sẽ hoàn toàn phù hợp cho các mạng thông tin khoa học và công nghệ vừa và nhỏ với số lượng máy tính trong mạng nội bộ khoảng 100 máy trở lại

Hình 9 Sơ đồ của một mạng diện rộng

Trang 10

Hình 12: kết nối hai mạng qua anten định hướng

Các kết nối với bên ngoài của một mạng diện rộng, thông thường có hai loạt:

Sử dụng một thiết bị kết nối chuyên dụng của các công ty cung cấp thiết bị mạng, kết nối không dây hoặc đường E1 do công ty bưu chính viễn thông Việt Nam cung cấp Thông thường sử dụng thiết bị chuyên dụng để kết nối với mạng điện thoại công cộng qua modem vì kết nối theo phương thức này rẻ tiền (người dùng phải trả thuê bao điện thoại với giá 130 đồng một phút) Phương án thuê đường lcascd line là không thực hiện được vì quá đất tiền (kinh phí đầu tư ban đầu khoảng 100 triệu đồng để chỉ phí cho 02 routers va 02 NTU Modem va khoảng 24 triệu đồng một năm để báo dưỡng đường truyền đối với đường leascd line 64 Kbps)

Đối với các mạng nhỏ, khi thiết kế hệ thống nên tuân thủ theo chuẩn của mạng InerneU/Intranet (2) Với thiết kế như vậy, ta có thể đễ đàng xây dựng các ứng dụng tra cứu, tìm kiếm thông tin cũng như có thể xây dựng ứng dụng cập nhật dữ liệu từ xa

Đối với những kết nối cho người truy cập từ xa bằng dial-up: Người dùng phải có máy tính, sử dụng modem và một đường dây điện thoại công cộng (2)

Người dùng cũng có thể sử dụng các công nghệ khác như wireless nhưng chỉ phí

sẽ lớn hơn nhiều so với kết nối dial-up

Các kết nối dial-up ngày nay phụ thuộc chủ yếu vào tốc độ và chất lượng đường điện thoại của mạng điện thoại công cộng Tuỳ thuộc theo thiết bị kết nối tại

“9

Trang 11

mạng máy tính, nhưng thông thường, tốc độ của đường điện thoại không vượt

nhiều vào thời tiết, vào các điểm kết nối do các cơ quan của Tổng công ty Bưu chính Viễn thông quản lý

máy tính Sơ đồ kết nối được mô tả trong hình vẽ dưới đây

Hình 13: Kết nối mang qua lcascd line hoặc mạng điện thoại Công, cộng

(NTU modem) - Các loại thiết bị này hiện nay rất đa dang D6 IA những thiết bị

định với chất lượng cao là các thiết bi cua các hang thiét bi Tạng CÓ tiếng trên thế giới (như đã nêu trên) Chất lượng thiết bị phụ thuộc nhiều vào nhà sản xuất

và nơi sản xuất

2000 và 2001

10

Trang 12

cũng là một lựa chọn trong giai đoạn hiện nay Tổng số tiền để kết nối giữa hai điểm trong khoảng cách 40 km trở lại (trọn gói) với trang thiết bị ban đần chừng

200 triệu đồng Số tiền bảo trì hàng tháng khoảng 6-8 triệu đồng (số liệu do KASATI cung cấp) Trong trường hợp đó giải thông phụ thuộc vào khoảng cách

và thiết bị sử đụng và có thể đạt tới tốc độ của đương E1/TI Sơ đồ kết nối được

mô tả trong hình 5

2.1.2 Nghiên cứu, thiết kế các tng dung trong mang

Một mạng máy tính của một cơ quan thông tin tư liệu thông thường cần có các ứng dụng như sau:

YVebsite

Dùng để phục vụ thông tin cho đông đảo người dùng Đây là một phương tiện tiện lợi, ổn định và có độ bảo mật cao đối với đữ liệu Website này bao gồm các nội dung chính như sau:

Trang chủ: giới thiệu về :

- Hoạt động của cơ quan: bao gồm các thông tin liên quan đến tư cách pháp nhân của cơ quan; quá trình thành lập và phát triển; các kết quả hoại động khoa học và công nghệ; các văn bản pháp quy về tổ chức và hoạt động của

cơ quan; qui chế hoạt động; quan hệ đối nội và đối ngoại v.v

- Cac dich vụ của cơ quan thông tin: bao gồm các dịch vụ chính của cơ quan thông in tư liệu Thông thường đó là các dịch vụ thông tin và tư liệu (tra cứu tài liệu; phục vụ tài liệu như sách, tạp chí; dịch vụ cung cấp tài liệu gốc .); dịch vụ mạng và các dịch vụ khác

- Cac thong tin có tính thời sự về khoa học và công nghệ: thường là bản tin khoa học và công nghệ phục vụ cho các đối tượng dùng tin của cơ quan Các thông tin này được thu thập và biện tập từ những thông tin mới nhất thuộc lĩnh vực bao quát của cơ quan thông tin tư liệu đó

thông tin khoa học và công nghệ biên soạn Các bản tin này được xuất bản hàng tuần, hàng quí hoặc hàng tháng về những chuyên để hẹp phục vụ cho các đói tượng dùng tin của cơ quan mình

dùng có thể liên hệ trực tiếp với nhau Đối với các mạng nhỏ có thể sử

N

Trang 13

dụng các phần mềm nhỏ nhu MDaemon dé xay dựng Server thư điện tử Đây là một phần mềm rất tiện dụng, nhỏ, chỉ phí ít và sau khi cài đặt lên máy chủ chiếm khoảng 10 MB, hoạt động ổn định Phía người dùng tin có thể sử dụng Outlook hoặc trình client của MDaemon Trong trường hợp hệ thống lớn có thể sử dụng Microsoft exchange

- _ Truyền tệp: sử dụng để trao đổi tệp trong hệ thống Có thể sử dụng phương tiện của hệ điều hành để xây dựng dịch vụ này

-_ Dịch vụ tra cứu tin tại thư viện cũng như kho tài liệu của cơ quan: hệ tra cứu thông tin trong các cơ sở dữ liệu của cơ quan thông tin thư viện Các

hệ này thông thường được tổ chức tra cứu dưới đạng trang Web

khác

ĐỀ thực hiên các nhiệm vụ nêu trên sử dụng các phần mềm sau:

Hệ điều hành Windows NT, Window 2000 Đây là những phần mềm phù hợp nhất hiện nay vì tính tiện dụng, nhiều người biết, nhiều chương trình ứng dụng hiện đang được sử dụng rộng rãi tại Việt Nam chạy trong hệ điều hành này Tuy nhiên, vì hệ điều hành này quá phổ biến do đó các khuyết tật của nó cũng được các nhà tin học nhất là các tin tặc khai thác triệt để Song nếu chỉ

sử dụng trong mạng nội bộ thì không phải là vấn đề đáng ngại Về lâu đài, có thể phát triển Linux khi các phần mềm ứng dụng cho Linux đã khá phổ biến; Frontpage và ngôn ngữ HTML, XML để thiết kế và xây dung trang Web;

V Basic va VScripts;

IIS dé xay dung Website;

FTP dé truyén tép;

Các chương trình được viết thêm để cập nhật thông tin lên Web;

Diamond hoặc các ứng dụng nhỏ khác để xây dựng hệ thống thư điện tử Cũng có thể sử dụng Microsoft exchange nhưng chương trình này cổng kénh, chiếm nhiều tài nguyên, lãng phí đối với các hệ thống mạng nhỏ

12

Trang 14

Viện khoa học tổ chức Nhà nước là đen vị sự nghiệp có tư cách pháp nhân, có con đấu Tiếng và được mỹ tải khoản tại các ngản hàng vả kho bạc Nhà nước, được lợp tác nghiên cưu và ứng

Ban

Viện hơạt động bằng, kinh phi su nghiép wong Jing vuc công, tíc nabiên cứu khoa bọc

Hình 15: Trang chu mang thông tin cải cách hành chính

Trang 15

DI Ủ HỌC TÔ CHỨC NHÀ NƯỚC { THÔNG TÌN TU HỆU CÁ CÁCH HÀẦNH CHINH

Thùng tia Gia cítch bữu tinh: thi Bae made

NAM 2006

Hinh 16: Trang tin cha Vién nghién cttu khoa học Tổ chức Nhà nước

2.2 Nghiên cứu thiết kế hệ quản trị CSDL

Mot van dé quan trọng khi thiết kế, xây dựng hệ quản trị CSDL là thiết kế và xây dựng CSDL Để thuận tiện cho việc sử dụng sau này, các CSDL cần phải được

Ve dit liéu

loại để mục Quốc gia

trường ưong MARC2I, có một số loại dữ liệu mà trong đó có một số yếu tố hiện nay MARC21 chưa mô tả, chúng tôi sử dụng các trường dự trữ của MARC2I để mô tả các yếu tố của loại tài liệu đó Khi khổ mẫu chuẩn của Việt Nam hình thành sẽ chuyển đổi sử dụng khổ mẫu MARC21VN,

Vẻ ngôn ngữ xử dụng trong CSDL:

Tiếng Anh và tiếng Việt Trong đó tiếng Việt:

14

Trang 16

- Thời điểm thực hiện đề tài không đặt ra chuẩn Unicode cho tiếng Việt mà chủ yếu vẫn dùng TCVN 5712-93 Tuy nhiên, đã nghiên cứu và xây dựng phương tiện chuyển đổi sang chudn UNICODE tiéng Việt khi cần thiết

tương lai phải được chuẩn hoá theo tiêu chuẩn mới của Việt Nam

Việc thiết kế hệ quản trị CSDL chúng tôi đưa ra hai phương án để người dùng có thể lựa chọn:

2.2.1 Sử dụng WeblSIS (kết quả của đề tài “Thiết kế một số dịch vụ của mạng VISTA” đã được bảo vệ năm 1999 có một số sửa đổi phù hợp với yêu cầu hiện nay)

Yêu cầu đặt ra đối với hệ thống khi sử dụng phương án này như sau:

Phan cứng:

Máy chú là các máy tính Pentium trở lên Làm việc trên nền hệ điều hành Windows NT, hoặc Window 2000 Hệ thống làm việc trong chế độ Chent/Server, str dung cong cu IIS cla Microsoft để tao Web server

Đối với người dùng cuối chỉ cần máy tính 586 trở lên có cài đặt trình duyệt 1E4.0, Netscape Navigator 4.0 td lén

Để thứ nghiệm, một CSDL về báo cáo khoa học và công nghệ của các Viện, Trường được đăng tái trên các ấn phẩm không định kỳ, các kỹ yếu hội nghị, hội tháo khoa học thuộc các lĩnh vực khoa học tự nhiên và công nghệ đã được xây dựng Cơ sớ dữ liệu này được kết hợp giữa việc tìm kiếm, tra cứu và xem toàn văn khí cần thiết

Các trường chính của CSDL để mô tả dữ hiệu là:

6 Phụ đề của tài liệu

7 Chương trình nghiên cứu

8 Dang tat

9 Linh vue

15

Trang 17

10.Năm xuất bản

11.Tập

12.Số

13.Trang

14.Cấp báo cáo khoa học

15.Địa chỉ xuất bản (nơi xuất bản, nhà xuất bản)

16.Co quan cht tri

17.Cơ quan phối hop

18.Co quan chủ quản

19.Năm viết năm hoàn thành

20.Tên tệp và địa chỉ lưu trữ toàn văn

21.Từ khoá/từ chuẩn

22.Phần mềm dùng để đọc

Trong đó trường full tcxt (toàn văn) cũng được coi như một trường bình thường, của biểu ghi nhưng nó chứa địa chi lưu trữ của tệp toàn văn (trường 20) Tệp toàn văn có thể lưu dưới định dạng HTML, Adobe Acrobat, Word, hoặc Rich tcxI

Để hệ thống hoạt động có hiệu quả, máy chủ cần có tốc độ cao, bộ nhớ lớn nhất

là đĩa cứng sử dụng để lưu trữ toàn văn tài liệu Thông thường máy chủ có đĩa cứng tối thiểu từ 10 GB trở lên

Để bảo đảm an toàn đữ liệu có thể xây dựng các hệ thống bảo mật Hệ thống bảo mật bao gồm về mặt tổ chức cũng như chương trình Hệ thống bảo mật về mãi tổ chức đã được mô tả chỉ tiết trong (1) Hệ thống bảo mật về phần cứng và phần mềm có thể tham khảo trong báo cáo kết quả nghiên cứu “thiết kế một số dịch

vụ của mạng V]STA” (2) Trong thực tế, các hệ thống bảo mật sẽ làm giảm tốc

độ hoạt động của mạng máy tính vì vậy cần phải được nghiên cứu kỹ càng khi áp dụng trong hệ thống mạng,

Ngoài ra, không có gì kháng định là hệ thống được đảm bảo an toàn tuyệt đối

Do vậy, việc sao lưu đữ liệu đối với các hệ thống là điều cần thiết

Trang 18

- Dang tai liéu

- Tên tài liệu

-_ Từ chuẩn/từ khoá

kỳ nào chưa được index nhưng cách tìm này chậm và không mềm dẻo Công việc nhập đữ liệu vào CSDL có thể thực hiện ở cả hai phương án: chạy trên hệ điều hành DOS hoặc Windows sau đó cập nhật vào máy chủ hoặc nhập từ máy trạm theo chế độ mạng để cập nhập trực tiếp vào máy chủ

Khi kích hoạt chương trình, trên màn hình dữ liệu có thể được trình bày theo nhiều kiểu format đầu ra khác nhau tuỳ theo yêu cầu người sử dụng bằng việc chọn các format tinh bay theo thực đơn Thí dụ, ưình bẩy dữ liệu đầu ra như

Sau:

Mã số tài liệu: AAA_1999—0001

Tên báo cáo: Độ bền nhiệt đới và các phương pháp nhiệt đới hoá các sản

phẩm chế tạo máy là hệ thống kỹ thuật phức tạp

Lĩnh vực: Công nghệ nhiệt đới hoá

Aem toàn văn

Để xem toàn văn, kích chuột vào dòng ký tự “Xem Ioàm văn”, chương trình sẽ

tự động kích hoạt các phần mềm tương thích để đọc các dữ liệu toàn văn Việc in toàn bộ báo cáo (văn bản toàn văn đó) ra may n hay tệp tuỳ thuộc vào chương

17

Trang 19

trình ứng dụng cụ thể sử dụng để đọc dữ liệu đó Các phần mềm ứng dụng phụ trợ này cần phải được cài đặt trước trên máy của người dùng

Mô tả hệ thống tìm kiếm thông tin rong chế độ Web

Nguyên tác hoạt động của hệ thống tìm kiếm thông tin trong các CSDL của Trung tâm (trên CDS/ISIS chạy trong môi trường DOS hoặc Windows) chạy trong chế độ Web được mô tả trong hình 8 cụ thể như sau:

a - trên máy trạm, người sử dụng điền vào một biểu mẫu yêu cầu những thông tin

họ cẩn vào các trường tương ứng Biểu mẫu này là một trang web bình thường được hiện bằng một trình duyệt quen thuộc như MS Internet Explorer hay Netscape Navigator

b - trên máy chủ, một phần mềm quản trị web nhu Internet Information Server hoac Netscape Web Server nhan cau hỏi và không gửi lại cho người sử dụng một trang wecb lĩnh như thường lệ mà chuyển nó cho một chương trình mở rộng có tên là Iscarch để tiếp tục xử lý

c - chương trình mở rộng theo câu hỏi này cho phép tìm trong CSDL CDS/ISIS những biểu ghi phù hợp, định dạng những biểu ghi tìm được dưới dạng một trang NWGb theo những đặc trưng của ngôn ngữ HTML và gửi trả lại cho hệ quản trị Web

d- hé quan tri Web gifi tra trang Wcb này cho trình duyệt ở máy trạm để người dùng có thể xem kết quả

e - sau khi xem kết quả, nếu có nhu cầu đọc toàn văn tư liệu tìm được, người dùng chỉ cần kích chuột vào mục full text-rong phần kết quả tìm được của từng biểu ghi, hệ thống sẽ chuyển về máy trạm toàn văn tài liệu đó và có thể kích hoạt khi ở máy trạm có chương trình tương ứng để đọc

18

Trang 20

Web Server

Biểu mẫu tìm

Các biểu ghi tìm được

Hinhl7 - Nguyên tắc hoạt động của hệ thống tra cứu thông tín trong các CSDL

Trang 21

Hoạt động của hệ thống tìm kiếm thông ñn

Chương trình cho phép truy cập đến các CSDL CDS/ISIS từ các trình duyệt Web Điều này cho phép giữ nguyên được các CSDL sẵn có, phù hợp với nhu cầu công việc cũng như tuân theo các chuẩn quốc tế về xử lý và trao đổi dữ liệu, nhưng đồng thời cũng cho phép tận dụng được những khả năng của công nghệ mới (nternet/ntranet, kiến trúc khách/chủ, )

Ở đây, vẫn có thể sử dụng hoàn toàn khả năng tìm kiếm linh hoạt cũng như các {ormat hiện hình đa dạng của CDS/ISIS, việc quản trị và bảo trì CSDL, được đơn giản hoá vì chỉ có một hệ CSDL đã quen thuộc Mọi qui trình làm việc khác với tìm kiếm như cập nhật đữ liệu, xuất bản các ấn phẩm, vẫn được giữ nguyên như cũ

Mặt khác, với công nghệ mới, có thể tra cứu các CSDL từ xa cũng như trong mạng cục bộ từ các máy trạm mà không cần cài đặt chương trình đặc biệt nào riêng cho ứng dụng này, mọi chương trình đều đã được thực hiện trên máy chủ Mọi xử lý đối với CSDL, đều được thực hiện trên máy chủ nên có thể giảm tối thiếu việc chuyển dữ liệu trên đường tưuyền Chương trình được thực hiện rất nhanh do được lưu trong RAM của máy chủ mà không cần nạp lại mỗi khi có câu hỏi mới Chương trình có thể chạy trong một tiến trình riêng biệt cách ly với tiến trình cúa Wcb server nên nếu có bị hồng cũng không ảnh hưởng đến Wcb servcr và những câu hỏi tiếp theo

Các CSDL này có thể được truy cập qua giao diện Web từ một trạm làm VIỆC trong mạng cục bộ hay bằng một máy từ xa qua modem hoặc 1ừ các mạng khác

có kết nối Internet Kết quả thử nghiệm cho thấy thời gian nhận được kết quả là khá nhanh, đáp ứng được yêu cầu

Về phương án này, hệ thống đã được chạy trên nhiều Website ở Việt Nam như tại Mạng thông tin khoa học và công nghệ Việt Nam (VISTA), Mạng của Sở khoa học và Môi trường Quảng Nam, Mạng của thư viện trường Đại học Y Hà Nội, Mạng của Viện thông tin Tư liệu và bảo tàng Địa chất, Website của Thư viện Khoa học Tổng hợp Thành phố Hồ Chí Minh v.v.v Hệ quản trị này làm việc tương đối ốn định đối với các CSDL không lớn và tốc độ xử lý nhanh

20

Trang 22

Ngoài ra, hệ quản trị CSDL CDS/ISIS đã được đông đảo người dùng trong mạng lưới thông tin tư liệu trong nước chấp nhận, do đó, phương án này cũng sẽ là một phương án hợp lý thúc đẩy tiến trình tin học hoá các hoạt động thông tin trong các cơ quan thông tin tư liệu ở Việt Nam

Nhược điểm tồn tại của hệ quản trị này là không có phương tiện kiểm tra trùng lặp các biểu ghi, chưa có phương tiện để tính toán, thống kê mà đôi khi cần thiết đối với các hệ thống quản trị thư viện

biểu ghỉ mối rang

Tìm theo tên báo cáo: Chọn mục Tên báo cáo hoặc Mọi trường trong ô tìm,

Tại ô tên báo cáo gõ: bấo (nếu không nhớ phần cuối của tên )

Hoặc tại Ôô: mọi trường gõ: phương pháp dự báo bão

(có thể đùng toán tử để xác định các từ liền nhau)

Tìm các mục khác gõ giá trị vào các ô tương ứng

Thí dụ: tìm theo chủ nhiệm để tài, cán bộ phối hợp, cơ quan chủ trì, cơ quan phối hợp,

cơ quan chủ quản, cơ quan quản lý, cấp quản ly dé tài, từ khoá tiếng Việt, chỉ số đề

21

Trang 23

Chủ nhiệm số: Ngô Thế Long

Co quan didn © Viên nghién city Hin Nom

Made BIE Mo XWĐIL.92-19

Đặc trung số lượng — 26

bÐi gia ket thúc - 7 09, 1994

quý giá của dân tộc ta, biện đang còn tản mác ở nhiều bơi, đang bị lãng quên viít người đọc đự

bưng những giá trị tình thần đè xây dựng nén văn hóa mới Công nghé thong ra hiệp đại có thể

Phân nh các điều kiện nguyên tắc và khả năng ứng dụng công nghệ thêng rà {CNTT) vào

Hoe viêu chính trị quốc gia Hé Chi Minh, Trình bày các fink vur ¢4 thé ime dung CNTT trang

phương hướng ứng dụng CNTT tại Học viện mong điều kiêu biến nay và các giải pháp đảm bảo hiệu quả ứng dụng CNTT tại Học viện

Trang 24

2.2.2 Phương án thiết kế một hệ quản tri CSDL trén Microsoft SQL Server Yêu câu đối với hệ quản trị như sau-

từ 10 GB trở lên

Hệ điều hành: Microsoft Windows NT 4.0 trở lên

Server sẽ quản lý chuyển tải các trang Web đến trình đuyệt để tạo ra giao diện

tình đuyệt để cập nhật dữ liệu từ xa thông qua các trang ASP Các trang ASP

Webserver tra về trình duyệt cho người sử dụng

ASP

Cong cu truy cap CSDL: Sử dụng thư viện uy cập CSDL từ xa của Microsoll là ADO (AliveX Data Object) dé xu ly di liệu trên SQL server thông qua các lệnh gọi trong các trang ẤSP

quả về cho trình duyệt dưới dạng trang Web với dữ liệu đạng ngôn ngữ HTML chuẩn

Thiết kế hệ thống

Cơ sở đữ liệu:

Cấu trúc dữ liệu trong cơ sở đữ liệu

Bảng các yếu tố mô tả chính trong CSDL

23

Trang 25

Bảng Có_quan_ củng cạp: Chứa các thông tín về cơ quan cung cấp tài liệu

Tên trường Độ dài | Kiến Diền giải

Địa chỉ có quan 255 Text Địa chỉ của cơ quan

24

Trang 26

Bang Linh_vuc-: linh vuc bao quát của tài liệu - Danh mục các lĩnh vực của tài liệu

Ten_Nha_xuat_ban 255 Text Tên của nhà xuất bản

Trang 27

Bang Ket_qua_nghien_cuu: Thong tin về kết quả các đề tài nghiên cứu

Nam_nghien_ cuu 8 Date Ngày tháng năm bất đầu nghiên cứu

Chu_nhiẻm_ dc, tại 50 Text Tên chủ nhiệm dé tai

Bảng Tai_leu_goc- Danh sách các tài liệu gốc

26

Trang 28

Bảng Dsers: Danh sách các người sử dụng và phân quyền

Id_co_quan_cung_cap |4 Long Mã cơ quan cưng cấp

Bảng Muc_ mat: Danh sách các m ức bảo mát

Hình 21 Sơ đồ quan hệ các bảng thông tín trong hệ thống

Id_Nha_xuat_ban Hanm_xuat_ban

Id_co_quan_cung_cap

Id_Tu_khoe

Td_Muc_mat Id_Linh vuc Tom _kat Tai_tieu_goc

{Ten_co_Quan:: ị

Can có quan Diện Thoại

Trang 30

Xây dựng các dịch vu của Website

Hình 24: Sơ đồ tổng quan của hệ thống

Người dùng nếu có

thì có thể cập nhật F————{|_ | cập nhật thông tin kiếm thông tin

Internet Information Server (IIS) Quan tri Website,

Nhận các yêu cầu cập nhật các CSDI, và pọi các

trang ASP để truy cập CSDL thong qua ADO

Chuyển kết quả trả về cdc trang ASP thong qua các trang HTML, và gửi cho trình duyệt Tải các trang HTML cho trình duyệt

29

Trang 31

Hình 25: Sơ đồ cơ sở dữ liệu và sơ đồ hệ thống dich vu

Cơ sở dữ liệu về tài liệu và

kết quả nghiên cứu

Danh sách các tài liệu

Danh sách các đề tài nghiên

-Nhập mới, sửa đổi, xóa tài

liệu, các kết quả nghiên cứu

-Phân loại tài liệu theo

Cơ sở đữ liệu về người dùng Danh sách người sử dụng và quyền sử dụng

-Phân quyền cho người sử dụng

-Thay đổi các tham số hệ thống

Trang 32

Giáo điện của hệ thống

Chương trình được chia làm 3 phân cơ bản

thống cập nhật dữ liệu từ xa

Phân Tra cứu: Cho phép người dùng tra cứu các Tài liệu, Kết quả nghiên cứu theo các điều kiện khác nhau do người dùng thiết lập Các dif lieu được đưa lên tra cứu trực tuyến mà ta thường gọi là OPAC

Quản trị người dùng: Cập nhật các thông tin liên quan và phân quyền người sử dụng, những người được đăng ký trong danh sách này thì mới có quyền cập nhật

đữ liệu hoặc quản trị đữ liệu của hệ thống

Trang chính của phần quả trị đữ liệu được mô tả như sau:

hang tela thất lý thi Nite kas bee & aing wake

Web site quan ly tai liễu khoa hoe Cởng nghề được thị

kể nhằm muc đích giúp chớ mới người tìm tìn thuận lợi hơn treng việc tra cứu các thông tìn VỀ các tài liều

céng nghé, céc théng tin vé ode ket quả để tài nghiên

trung tâm mang khoa hoc và công nghẽ VISTA theo địa chi = đưới d&y Min ch&n thanh cam ơn:

Trang 33

Các mục trên hệ thống thực đơn ngang gồm các mục sau:

Hệ thống: Gồm các chức năng về quản trị hệ thống

kế nhằm mục đích giúp cho mọi người tìm hơn trong việc tra cứu các thông tin về khoa hoc, bài bác có liên quan đến Lĩnh

cứu Rất mong được sư góp ÿ của các ban

Cập nhật: Gồm các chức năng để cập nhật các Tài liệu và các kết quả nghiên vứu khoa học

Tra cứu: Gôm các chức năng để người sử dụng tra cứu và tìm kiếm các tài liệu

và kết quả nghiên cứu

Báo cáo: In các báo cáo về tài liệu và nghiên cứu khoa học

32

Trang 34

HN

Se

TRA Tim Thi LEY

Hình 28: trang Web tra tìm tài liệu

Đây là phần Public, mọi người khi kết nối vào CSDL, đều có thể truy cập vào CSDL, đều có thể truy cập vào module này Mục đích của module này là cho phép mọi người có thể tra cứu thong tin trong CSDL

và giúp cho người tìm tin có thể tim ra thong tin một cách nhanh nhất, chính xác nhất

Âthngg ÐfNft nuềt 4Á l6 / Ai khoa đục 4 công amb

kế nhàm mục đích giúp cho moi người tìm tìn thuận Lợi

khoa học, bài báo có liên quan đến lĩnh vực khoa học và

cứu R&t mong duoc eu gép ý của các ban để chương trình

due d@y Xan chấn thánh cổn ont

Hình 29: Các dịch vụ chính của phần tra cứu

33

Trang 35

Để truy xuất thông tin trong CSDL ban hãy chọn menu TRA CƯU cửa

số chương trình sẽ hiện ra như hình vẽ:

Để tra cứu thông tin các bản tin/ Báo cáo khoa học Bạn hãy nhấp chuột vào để mục tương ứng để chọn Cửa sổ tra cứu thông tin sẽ hiện ra Bạn hãy gõ yêu cầu tìm kiếm vào các text box và hãy chọn điều kiện tìm cho thông tin yêu cầu của bạn Nếu bạn muốn tìm thông tin chính xác hãy điển đầy đủ thông tin yêu cầu của mình Kết quả sẽ hiện ra như bạn mong muốn

Khi bạn click chuột vào trang tìm kiếm cửa sổ tìm kiếm sẽ hiện ra như hình vẽ dưới đây:

TRA Tim TAI LIEW

NHĂN THƯỜNG sev KEW ih TRY THÍN TỂ

Trang 36

Hãy nhập điều kiện tìm kiếm vào cửa sổ tìm kiếm Ví dụ như sau:

NHĂN TRƯỜNG “IỂY Kiện: #IÍ TR TORR TE

Điều kiện:

Là: Tìm chính xác (tương đương dấu “=”

Bài đâu bằng: Tìm các chuỗi ký tự có phần bắt đầu giống giá trị nhập vào, phần kết thúc không quan tâm

Ví dụ: Các chuỗi bắt đầu là Công Kết duả tìm kiếm sẽ cho các chuỗi như: Công

An, Cong dân, Công nông ,

Có chứa: Tìm các chuỗi ký tự trong nội dung có chứa chuỗi giống giá trị nhập vào, phần đầu và phần kết thúc không quan tâm

w a

Trang 37

Vi dụ: Tìm các tác giả có chứa Văn-Kết quả tìm kiếm sẽ cho các tác giả như: Văn Cao, Nguyễn Văn Nam, Lê Văn Hải, Nguyễn Đình Van

Kếi thúc bằng: Tìm các chuỗi ký tự có phần kết thúc giống giá trị nhập vào

Ví dụ: Tìm các tác giả có Tên là Cao

Ví dụ như ở màn hình trên là Điều kiện để tìm kiếm Các Bài báo/Tài liệu hoặc kết quả nghiên cứu với tên có chứa chữ Công và Tác giả phải có tên là Cao hoặc những văn bản phát hành năm 1990

Nút Tìm kiếm: Bất đầu tìm kiếm theo Điều kiện đã đặt

Máy sẽ hiện ra màn hình để hiển thị các kết quả tìm kiếm được như sau:

Muốn xem đây đủ các thông uin liên quan đến Bài báo/Tài liệu thì nháy chuột vào cột Toàn văn

36

Trang 38

Thí dụ về một kết quả tìm kiếm được trình bày theo hình dưới đây

loài khưou Ngọc Linh có tứn khoa học Garulax ngöclInhenEis va Actinodura

va Joal khuou Kon ka kink, co tén Khoa hoc Garrulax konkakinheneis vua được

hiện tại tĨnh Kon Tum và Gia Lai Đây la cắc loài chim quý hiểm được ghi trong Sắch Việt ham và đang có nguy cơ bị đa doa tuyết ching tren thé gidi Tại Viát Nam, các nhà học đã phát hiên thấy Khoảng 840 loại chim, chiếm gắn B,6% tổng số loại chịm trên

hế giới Tính riêng tử nam 1083 đến nay, Việt Nam đã pat men them 226 loài, Hiến nay, việc săn tết lrát phép các loài động vật hoang dã để Lấy thịt và xuất khổu, nhiều loại

ở Việt Narh dang bị săn bắt hàng loạt để làm chìm cảnh, dỗn đến nhiều loại chim quỳ được ghi trong sách đỏ của Việt Nam ve thế giới đang mất dần và có nguy cơ tuyết

Trang 39

Hình 33 Sơ đồ nguyên lý hoạt động của modun nhập dữ liệu

Để có thể xây dung được hệ thống cập nhật dữ liệu, vấn dé trước tiên là thiết kế

hệ thống Vấn để này đã được phân tích chi tiết ở phần xây dựng hệ thống quản

38

Ngày đăng: 01/03/2013, 17:01

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w