1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu và xây dựng hệ thống cơ sở dữ liệu phân tán trong quản lý đào tạo

8 2 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Nghiên cứu Và Xây Dựng Hệ Thống Cơ Sở Dữ Liệu Phân Tán Trong Quản Lý Đào Tạo
Tác giả Nguyễn Thị Ly Sa
Trường học Trường Cao Đẳng Công Nghệ Thông Tin, Đại Học Đà Nẵng
Chuyên ngành Quản lý đào tạo và cơ sở dữ liệu
Thể loại đề tài nghiên cứu
Năm xuất bản 2013
Thành phố Đà Nẵng
Định dạng
Số trang 8
Dung lượng 766,67 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

TẠP CHÍ KHOA HỌC VÀ CÔNG NGHỆ, ĐẠI HỌC ĐÀ NẴNG SỐ 12(73) 2013, Quyển 2 87 NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN TRONG QUẢN LÝ ĐÀO TẠO RESEARCHING AND BUILDING A FRAGMENTED DATABASE SY[.]

Trang 1

NGHIÊN CỨU VÀ XÂY DỰNG HỆ THỐNG CƠ SỞ DỮ LIỆU PHÂN TÁN

TRONG QUẢN LÝ ĐÀO TẠO

RESEARCHING AND BUILDING A FRAGMENTED DATABASE SYSTEM

FOR TRAINING ADMINISTRATION

Nguyễn Thị Ly Sa

Trường Cao đẳng Công nghệ Thông tin, Đại học Đà Nẵng

Email: lysa.dsn@gmail.com

TÓM TẮT

Ứng dụng tốt công nghệ thông tin trong quản lý đào tạo là chìa khóa thành công trong việc quản lý của các nhà trường, là tiền đề nâng cao chất lượng và hiệu quả đào tạo Cùng với mục đích này, bài báo đã tập trung tìm hiểu và xây dựng mô hình cơ sở dữ liệu phân tán phù hợp với yêu cầu của hệ thống quản lý đào tạo thay cho hệ thống cơ sở dữ liệu tập trung nhiều bất cập trong hiện tại, góp phần nâng cao hiệu quả trong việc quản lý sinh viên của các trường Đại học Cao đẳng Nội dung bài báo này trình bày tổng quan về cơ sở dữ liệu phân tán, qui trình quản lý đào tạo, đề xuất mô hình cơ sở dữ liệu phân tán trong quản lý đào tạo cùng với giải pháp đồng bộ dữ liệu

Từ khóa: cơ sở dữ liệu phân tán; phân mảnh; nhân bản; đồng bộ dữ liệu; hệ thống quản lý đào tạo

ABSTRACT

Application of information technology to effective training administration is the key to successes in the administration of the university, and one of the premises to improve the quality and effectiveness of training With this purpose, I study and build a distributed database model for training administration, which is used to replace the centralized database system at the present, contributing to improving the efficiency of the administration of college and university students In this study, I present an overview of distributed database, training administration processes and the proposal of a distributed database model for training administration as well as data synchronization solutions

Key words: distributed database; fragmentation; replication; data synchronization; training administration system

1 Đặt vấn đề

Công nghệ cơ sở dữ liệu (DataBase) đã trải

qua một quá trình hình thành và phát triển khá lâu

dài Ban đầu, các hệ cơ sở dữ liệu thường gắn liền

với ứng dụng, nghĩa là mỗi ứng dụng định nghĩa

và duy trì dữ liệu của riêng chúng Phát triển hơn,

dữ liệu được quản lý một cách tập trung, nhiều

ứng dụng khác nhau có thể truy xuất dữ liệu trực

tiếp từ cơ sở dữ liệu tập trung đó

Tuy nhiên, cơ sở dữ liệu tập trung cũng tồn

tại nhiều khuyết điểm, có thể kể đến đó là khi

trung tâm lưu trữ và xử lý dữ liệu có sự cố thì toàn

hệ thống sẽ ngừng hoạt động, hay tình trạng tắc

nghẽn khi có quá nhiều yêu cầu truy xuất dữ liệu

Cơ sở dữ liệu phân tán ra đời đã phần nào khắc

phục được những hạn chế của cơ sở dữ liệu tập

trung, là kết quả của sự hợp nhất hai hướng tiếp

cận đối với quá trình xử lý dữ liệu: công nghệ cơ

sở dữ liệu và công nghệ mạng máy tính

Hiện nay phần lớn hệ thống quản lý đào

tạo của các trường Đại học, Cao đẳng, cụ thể Trường Cao đẳng Công nghệ Thông tin, Đại học

Đà Nẵng (CĐCNTT, ĐHĐN) được xây dựng theo mô hình cơ sở dữ liệu tập trung, cơ sở dữ liệu được lưu ở một máy chủ (server) và mọi hoạt động như đăng ký học phần của sinh viên, nhập điểm của phòng đào tạo hay quản lý lớp học của giáo viên… đều truy cập trực tiếp lên một server gây nên sự quá tải xử lý cho server, giảm hiệu suất hoạt động và đôi khi ảnh hưởng đến tính an toàn của hệ thống

Nhằm góp phần nâng cao hiệu quả trong việc quản lý sinh viên của các trường Đại học, Cao đẳng, bài báo này tập trung tìm hiểu và xây dựng mô hình cơ sở dữ liệu phân tán phù hợp với các yêu cầu đặt ra của hệ thống Trong phạm vi bài báo này, tác giả giới thiệu tổng quan về cơ sở

dữ liệu phân tán, đề xuất mô hình cơ sở dữ liệu phân tán trong quản lý đào tạo ứng dụng vào Trường CĐCNTT, ĐHĐN, đồng thời đề xuất giải pháp đồng bộ cơ sở dữ liệu trên SQL Server

Trang 2

2 Tổng quan về Cơ sở dữ liệu phân tán [1, 2]

2.1 Cơ sở dữ liệu phân tán là gì?[1, 2]

Cơ sở dữ liệu phân tán (Distributed

DataBase - DDB) là một tập hợp nhiều cơ sở dữ

liệu có liên đới logic và được phân bố trên một

mạng máy tính Trong đó liên đới logic là dữ liệu

ở các nơi được sử dụng để giải quyết chung một

vấn đề, còn phân bố trên một mạng máy tính là

toàn bộ dữ liệu không phải lưu trữ ở một nơi mà

lưu trữ trên nhiều trạm thuộc mạng máy tính

2.2 Thiết kế Cơ sở dữ liệu phân tán [1, 2]

Kỹ thuật thiết kế cơ sở dữ liệu phân tán

chính là trả lời câu hỏi “Làm thế nào để cơ sở dữ

liệu và các ứng dụng chạy trên cơ sở dữ liệu đó

có thể đặt ở nhiều vị trí?” Hai kỹ thuật được sử

dụng trong quá trình thiết kế là phân mảnh

(Fragmentation) và nhân bản (Replication)

Phân mảnh chính là chia một quan hệ thành

những mảnh tách biệt (phân hoạch), mỗi mảnh

được phân bố tại các vị trí khác nhau Khi phân

bố các mảnh lên các vị trí, nó có thể được nhân

bản hoặc chỉ duy trì một bản duy nhất

Lý do cần nhân bản là nhằm đảm bảo được

độ tin cậy và hiệu quả cho yêu cầu truy vấn dữ

liệu, cụ thể nếu có nhiều bản sao của một đơn vị

dữ liệu đặt tại nhiều vị trí thì người dùng vẫn có

cơ hội truy xuất được dữ liệu ngay cả khi vị trí

khác xảy ra sự cố Tuy nhiên đối với những yêu

cầu cập nhật dữ liệu thì việc nhân bản gây nên

nhiều rắc rối vì hệ thống phải đảm bảo rằng tất cả

các bản sao phải được cập nhật chính xác

Vì vậy, quyết định phân mảnh như thế nào,

có nhân bản hay không và việc phân bố các mảnh

tới các vị trí sao cho tối ưu là bài toán qui hoạch

toán học với độ phức tạp NP-hard nhằm hạ tối đa

chi phí lưu trữ, chi phí xử lý và truyền thông

2.3 Phương pháp phân mảnh [1, 2]

2.3.1 Phân mảnh dọc

Một phân mảnh dọc cho một quan hệ R sinh

ra các mảnh R1, R2, , Rr, mỗi mảnh chứa một tập

con các thuộc tính của R và cả khoá của R Phân

mảnh dọc thực chất là chia quan hệ theo chiều dọc,

nghĩa là thiết lập các quan hệ mới từ một số thuộc

tính của quan hệ gốc Thực chất đây là phép chiếu

lên tập con các thuộc tính của quan hệ

2.3.2 Phân mảnh ngang

Phân mảnh ngang chính là việc chia quan

hệ theo chiều ngang, kết quả của phân mảnh ngang

là các quan hệ con, số bộ trong các quan hệ con này là tách biệt nhau Phân mảnh ngang thực chất

là phép chọn thỏa một điều kiện cho trước

Phân mảnh ngang nguyên thủy: Phân

mảnh ngang nguyên thuỷ được định nghĩa bằng một phép toán chọn trên các quan hệ gốc Với quan hệ R, các mảnh ngang của R là các Ri:

Ri = σFi(R), 1 ≤ i ≤ n Trong đó Fi là điều kiện chọn được sử dụng để có được mảnh Ri

Phân mảnh ngang dẫn xuất: Phân mảnh

ngang dẫn xuất là phân rã một quan hệ thành các mảnh dựa vào điều kiện chọn được định nghĩa trên một quan hệ khác có liên quan

2.3.3 Phân mảnh hỗn hợp

Trong đa số các trường hợp, phân mảnh ngang hoặc phân mảnh dọc đơn giản không đủ đáp ứng các yêu cầu từ ứng dụng Có một số trường hợp phân mảnh dọc có thể thực hiện sau một số mảnh ngang hoặc ngược lại, chọn lựa này được gọi là phân mảnh hỗn hợp

3 Xây dựng mô hình Cơ sở dữ liệu phân tán trong quản lý đào tạo

3.1 Qui trình quản lý đào tạo

Hiện nay, việc quản lý sinh viên theo học chế tín chỉ trong một số trường Đại học Cao đẳng được thực hiện như sau:

- Phòng Đào tạo tiếp nhận sinh viên nhập học, xếp lớp, mở lớp học phần

- Mỗi sinh viên sẽ nhận được một tài khoản

và tự đăng nhập vào hệ thống để đăng ký học phần

- Phòng Tài vụ căn cứ vào số tín chỉ sinh viên đăng ký trong mỗi học kỳ để thu học phí sinh viên

- Kết quả học tập của sinh viên được Phòng Đào tạo trực tiếp quản lý: nhập điểm, tổng hợp, phân loại và xét học vụ mỗi hoc kỳ

- Phòng Công tác Sinh viên căn cứ vào kết quả học tập và kết quả tham gia các hoạt động để xét điểm rèn luyện, xét học bổng

- Khoa trực tiếp quản lý tiến độ giảng dạy của giáo viên theo đề cương chi tiết và trực tiếp

Trang 3

quản lý sinh viên về chuyên cần, thông tin đề tài

thực tập, nơi thực tập, đề tài tốt nghiệp, phân

giáo viên hướng dẫn

- Ngoài ra, sinh viên cũng có thể đăng

nhập vào hệ thống để xem thời khóa biểu, lịch

thi, bảng điểm kết quả học tập và cũng có thể

đặt những câu hỏi nếu có bất cứ vấn đề gì liên

quan đến học tập

3.2 Mô hình cơ sở dữ liệu phân tán quản lý

đào tạo

Hệ thống cơ sở dữ liệu quản lý đào tạo nên

được tổ chức phân tán tới các bộ phận (Khoa và

các Phòng ban) trong Nhà trường, mỗi bộ phận sẽ

có một cơ sở dữ liệu chứa dữ liệu thuộc phạm vi

của bộ phận và vận hành độc lập Ngoài ra, cần

phải có một cơ sở dữ liệu dành riêng cho sinh

viên xem điểm và đăng ký học phần qua internet

Cơ sở dữ liệu tại Phòng Đào tạo chứa toàn bộ cơ

sở dữ liệu tại các bộ phận Để đảm bảo tính chính

xác của dữ liệu, cơ sở dữ liệu tại Phòng Đào tạo,

cơ sở dữ liệu tại các bộ phận và cơ sở dữ liệu dành cho sinh viên phải có cơ chế đồng bộ trực tuyến hai chiều thông qua hệ thống mạng

Tùy vào qui mô của tổ chức mà việc sử dụng cơ sở dữ liệu và phân bổ server đến từng bộ phận được thiết kế sao cho phù hợp Chẳng hạn,

với Trường CĐCNTT, ĐHĐN, Phòng Tài vụ và

Phòng Công tác Sinh viên hiện tại chỉ có một vài

người sử dụng hệ thống, việc bố trí cho mỗi phòng ban một server là điều không cần thiết nên hai bộ phận này có thể dùng chung server và

chung cơ sở dữ liệu với Phòng Đào tạo để hạn chế việc đồng bộ dữ liệu Ngoài server Phòng

Đào tạo, đề tài đề xuất thêm hai server nữa: một

server dành riêng cho sinh viên và một server

dành cho cả hai Khoa Công nghệ Thông tin và

Khoa Kế toán - Tin học, hai khoa dùng chung

server vì tổng số sinh viên từ trước đến nay của hai khoa không nhiều (khoảng hơn 4000 sinh viên) Mô hình này được minh họa bằng Hình 1

3.3 Thiết kế cơ sở dữ liệu phân tán

Trong hệ thống quản lý đào tạo, toàn bộ dữ

liệu nên được lưu trữ tại cơ sở dữ liệu Phòng Đào

tạo, việc phân tán dữ liệu đến các bộ phận được

thực hiện bằng cách phân mảnh bảng dữ liệu của

các quan hệ tổng thể thành các bảng dữ liệu độc

lập phù hợp với chức năng và nhiệm vụ của từng

bộ phận sau đó nhân bản chúng rồi định vị các bản

sao vào các vị trí thích hợp Mọi thay đổi dữ liệu

tại các phòng ban sẽ được đồng bộ về Phòng Đào

tạo và mọi thay đổi dữ liệu tại Phòng Đào tạo cũng

sẽ được đồng bộ về các bộ phận liên quan

Vấn đề ở đây là tại sao lại sử dụng nhân bản của các phân mảnh tại các phòng ban mà không sử dụng các phân mảnh tách biệt, khi đó Phòng Đào tạo cần thông tin bộ phận nào thì liên kết tới cơ sở dữ liệu của phòng ban đó để lấy dữ liệu, bởi vấn đề nhân bản sẽ dẫn tới tình trạng dư thừa dữ liệu nên có thể lãng phí không gian lưu trữ và nguy cơ gây nên nhiều xung đột khi cập nhật dữ liệu?

Câu trả lời cho vấn đề này là việc truy xuất dữ liệu và cập nhật thông tin tại Phòng Đào

Hình 1 Một mô hình cơ sở dữ liệu phân tán quản lý đào tạo

Trang 4

tạo được thực hiện rất thường xuyên, trong khi

việc truy xuất dữ liệu từ hai hay nhiều mảnh tại

nhiều server rồi nối hoặc hợp chúng lại với chi

phí rất cao nên hiệu suất hoạt động bị giảm

mạnh là điều có cơ sở Ngày nay, việc tốn không

gian lưu trữ không còn là vấn đề được đặt lên

hàng đầu mà là tốc độ xử lý, còn các nguy cơ

xung đột xảy ra khi cập nhật dữ liệu có thể giải

quyết được trong hệ thống quản lý đào tạo (sẽ

được trình bày ở phần 3.5)

Chẳng hạn ứng với mô hình cơ sở dữ liệu

phân tán đã đề xuất trong Hình 1, toàn bộ dữ

liệu được lưu trong cơ sở dữ liệu đặt tại server

Phòng Đào tạo, server Sinh viên lưu bản sao

một phần cơ sở dữ liệu mà sinh viên được phép

xem và cập nhật, tương tự server Khoa lưu bản

sao một phần cơ sở dữ liệu mà Khoa được phép

xem và cập nhật

3.4 Giải pháp đồng bộ cơ sở dữ liệu phân tán

[3, 4]

Hiện nay có rất nhiều giải pháp đồng bộ

cơ sở dữ liệu phân tán khác nhau như: Streams

trong Oracle, Replication trong SQL Server,

IBM Websphere MQ…, mỗi loại đều có những

ưu và nhược riêng Trong phạm vi bài báo này

sẽ giới thiệu kỹ thuật đồng bộ Replication trong

SQL Server

3.4.1 Thành phần chính trong Replication [3][6]

- Publisher: Là server tạo dữ liệu để nhân

bản tới server khác Nó xác định dữ liệu nào

nhân bản, dữ liệu nào thay đổi và lưu thông tin

về các nhân bản tại server đó

- Subscriber: Là server nhận nhân bản và

các hành động cập nhật dữ liệu từ Publisher

Một Subscriber có thể là một Publisher của các

Subscriber khác

- Distributor: Là server chứa cơ sở dữ liệu

phân tán, là nơi lưu và chuyển dữ liệu nhân bản

từ Publisher tới Subscriber

- Publication: Là tập hợp các mẩu dữ liệu,

mỗi mẩu là một nhóm các dữ liệu được nhân

bản Một mẩu có thể bao gồm một bảng hay chỉ

một vài hàng hay vài cột

3.4.2 Các loại Replication [3, 4]

SQL Server hỗ trợ cácloại Replication sau:

- Snapshot Replication: Đây là loại nhân

bản đơn giản nhất, nó sao chép toàn bộ dữ liệu cần nhân bản từ Publisher tới Subscriber Khi có thay đổi, nhân bản Snapshot gởi tất cả dữ liệu tới cho Subscriber thay vì chỉ gởi những thay đổi Loại nhân bản này được đánh giá cao trong các ứng dụng chỉ đọc như tìm kiếm hay các hệ thống yêu cầu dữ liệu mới nhất và dung lượng không lớn

- Transactional Replication: Với loại

nhân bản này, người dùng có thể chọn tất cả hay một phần của bảng Loại nhân bản này sử dụng transaction log để giữ những thay đổi trên dữ liệu và lưu những thay đổi này lên cơ sở dữ liệu phân tán (tại Distrubutor), những thay đổi này sẽ được chuyển đến các Subscriber theo một trật tự nhất định Transactional Replication giải quyết tốt vấn đề xung đột dữ liệu nhưng tính độc lập của các server không cao

- Merge Replication: Nhân bản này hỗ trợ

tính độc lập giữa các server cao nhất, Publisher

và Subscriber có thể làm việc độc lập và sẽ kết nối với nhau theo những khoảng thời gian để hội

tụ kết quả lại, cả hai Publisher và Subsciber đều

có thể cập nhật dữ liệu Nếu xung đột xảy ra giữa các server thì những xung đột này sẽ được giải quyết một cách tự động, khi đó bộ giải quyết đụng độ sẽ chọn server có độ ưu tiên cao hơn Đối với mô hình cơ sở dữ liệu phân tán quản lý đào tạo đã trình bày phần trên, ta nhận thấy loại nhân bản Merge Replication là phù hợp với hệ thống hơn cả vì loại nhân bản này cho phép cập nhật dữ liệu tại các server và tính độc lập của các server rất cao Ngoài ra, dùng Merge Replication ta còn có thể hủy bỏ quyền cập nhật

dữ liệu tại Subscriber trên một số bảng dữ liệu, góp phần vào việc bảo vệ sự bảo mật cho những

dữ liệu quan trọng tại publisher

Publisher trong hệ thống quản lý đào tạo chính là server Phòng Đào tạo và các Subscriber chính là các server tại các bộ phận, cụ thể các Subscriber là server Khoa và server Sinh viên ứng với mô hình trong Hình 1 Vì dữ liệu nhân bản lưu tại các bộ phận khác nhau nên cần tạo nhiều publication khác nhau ứng với nhiệm vụ

và chức năng của từng bộ phận Với những bảng

dữ liệu quan trọng như thông tin về điểm của sinh viên chỉ được phép cập nhật tại Phòng Đào

Trang 5

tạo (Publisher), các bộ phận (Subscriber) có thể

xem nhưng không được phép cập nhật

3.5 Các vấn đề trong đồng bộ dữ liệu [3]

Một trong những vấn đề đáng quan tâm

của việc đồng bộ dữ liệu là xung đột (Conflict),

vấn đề này xảy ra khi hai hay nhiều server cùng

một lúc cập nhật trên cùng một dòng dữ liệu

Nhận thấy trong hệ thống cơ sở dữ liệu phân tán

quản lý đào tạo, cụ thể là Trường CĐ Công nghệ

Thông tin, các server đều có quyền cập nhật dữ

liệu (thêm, xóa, sửa): server Phòng Đào tạo cập

nhật lớp học phần, điểm, học phí…; server các

khoa cập nhật thông tin lịch trình giảng dạy của

giáo viên, các đề tài sinh viên thực hiện…;

server sinh viên cập nhật thông tin đăng ký học

phần Nhận thấy các quyền này hoàn toàn tách

biệt nhau, không có sự chồng chéo nên vấn đề

xung đột hiếm khi xảy ra

Vì quyền thao tác lên cơ sở dữ liệu tại các

bộ phận khác tách biệt nhau, nên nếu có cập

nhật trên cùng một dòng thì cột cần cập nhật

cũng chưa hẳn là giống nhau, sử dụng tính chất

column-level tracking trong quá trình tạo

Publication để tránh xung đột xảy ra khi có hai

bộ phận cùng cập nhật trên một dòng dữ liệu

nhưng tại các cột khác nhau

Các trường hợp xung đột chắc chắn xảy

ra, sử dụng biện pháp giải quyết xung đột trong

Replication được SQL Server hỗ trợ là gán

quyền ưu tiên (Priority) cho từng server và nếu

có xung đột xảy ra thì chọn hành động cập nhật

của server có quyền ưu tiên cao hơn, trong hệ

thống quản lý đào tạo, quyền ưu tiên dành cho

Phòng Đào tạo

3.6 An toàn và bảo mật trong Replication [5]

An toàn và bảo mật trong cơ chế

Replication liên quan đến việc chứng thực và

phân quyền (Authorization and Authentication),

mã hóa (Encryption) và xác lập các bộ lọc dữ

liệu để bảo vệ an toàn dữ liệu và các đối tượng

liên quan trong môi trường nhân bản

- Chứng thực và phân quyền: Được sử

dụng để kiểm soát truy cập đến các đối tượng

trong cơ sở dữ liệu, các máy tính và Agent liên

quan đến quá trình Replication

- Mã hóa: Bản thân Replication không

thực hiện mã hóa dữ liệu khi truyền trên mạng,

tuy nhiên ta có thể sử dụng các phương pháp mã hóa tiêu chuẩn có sẵn như Virtual Private Networks (VPN), Secure Sockets Layer (SSL), and IP Security (IPSEC)

- Lọc các dữ liệu cho phép xuất bản: Chỉ

thực hiện công bố các dữ liệu và các đối tượng cần thiết từ cơ sở dữ liệu, nhờ vậy ta có thể giới hạn quyền truy cập tới các dữ liệu quan trọng cần bảo mật

4 Thực nghiệm và đánh giá

4.1 Thực nghiệm

Hiện nay, Trường CĐ Công nghệ Thông tin - ĐHĐN đang sử dụng cơ sở dữ liệu tập trung trong quản lý đào tạo Vì lý do dữ liệu nhạy cảm nên mô hình cơ sở dữ liệu phân tán mà bài báo đề xuất chưa được kiểm nghiệm trên thực tế Để mô phỏng cho vấn đề của mình, tôi đã dùng ba máy tính nối với nhau qua mạng LAN, máy tính thứ nhất tượng trưng cho server Phòng Đào tạo, máy tính thứ hai tượng trưng cho server Khoa, máy tính thứ ba tượng trưng cho server Sinh viên

Cơ sở dữ liệu dùng thử nghiệm chính là bản sao của cơ sở dữ liệu mà Trường CĐ Công nghệ Thông tin đang dùng hiện nay, cơ sở dữ liệu này khá lớn, có đến gần 60 bảng dữ liệu Phần thử nghiệm này dùng 11 bảng dữ liệu tiêu biểu nhất được sử dụng phần lớn tại các server (Hình 2)

- tmHosoSV: Thông tin sinh viên, gồm

4800 dòng;

- tmHosoGV: Thông tin giáo viên, gồm

153dòng;

- tmLop: Thông tin các lớp sinh hoạt, gồm

77 dòng;

- tmLopHP: Thông tin các lớp học phần,

gồm 3242 dòng;

- tmLichTrinh: Thông tin lịch trình giảng

dạy và điểm danh, gồm 2892 dòng;

- tmDKHP: Thông tin đăng ký học phần

của sinh viên, gồm 14407 dòng;

- tmDiemkyhoc: Thông tin về kết quả các

môn học của sinh viên, gồm 125725 dòng;

- tmKhung: Thông tin môn học theo

khung chương trình, gồm 1102 dòng;

- tmNganh: Thông tin các ngành học, gồm

20 dòng;

Trang 6

- tmHocvu: Thông tin xét học vụ sinh

viên, gồm 23587 dòng;

- tmHocPhi: Thông tin sinh viên đóng học

phí, gồm 21555 dòng

Hình 2 Cơ sở dữ liệu được dùng thử nghiệm

Kết quả cấu hình Replication trong SQL

server 2008 trình bày trong Hình 3, trong đó

Publisher là server DSN, 2 Subscriber là server

MTD-GIANGNTT1 và server DONG-PC Mỗi Subscriber ứng với một cơ sở dữ liệu Publication phù hợp với chức năng của server đó Cơ sở dữ liệu tại 3 server trình bày trong Hình 4

Publisher: server Phòng Đào tạo

Subscriber: server Sinh viên

Subscriber: server Khoa

Publicationứng với server Khoa

Publication ứng với server Sinh viên

Subscription tại server Sinh viên

Subscription tại server Khoa

Hình 3 Cấu hình Replication trong SQL Server

Trang 7

Hình 4 Cơ sở dữ liệu tại các server

Sau đây là kết quả đồng bộ dữ liệu giữa 3 server của các lần thử nghiệm:

Hình 5 Kết quả đồng bộ dữ liệu giữa các server

4.2 Đánh giá kết quả thực nghiệm

- Thời gian đồng bộ ở mức độ chấp nhận

được (xem Hình 5)

- Sự chính xác của việc đồng bộ là 100%,

có nghĩa là dữ liệu giữa các server Phòng Đào

tạo được đồng bộ chính xác về server Khoa,

server Sinh viên và ngược lại

Để kiểm tra độ chính xác, tác giả đã dùng

tiện ích tablediff để so sánh hai bảng dữ liệu tại

các server sau mỗi lần đồng bộ Chẳng hạn muốn kiểm tra sự giống nhau giữa hai bảng

cùng tên tmHosoSV trên hai server cần thực hiện

câu lệnh sau:

"C:\Program Files\Microsoft SQL

(a) CSDL tại server Phòng Đào

tạo

Tổng cộng 102.000 dòng dữ liệu cập nhật

tại server Khoa được đồng bộ về server Phòng

Đào tạo trong thời gian 3 phút 45giây

Tổng cộng 214.100 dòng dữ liệu cập nhật tại server Phòng Đào tạo được đồng bộ về server Sinh viên trong thời gian 2 phút 29 giây

Trang 8

Server\100\COM\tablediff.exe"

-sourceserver DSN

-sourcedatabase CSDL_PhongDaoTao

-sourcetable tmHosoSV

-destinationserver MTD-GIANGNTT1

-destinationdatabase CSDL_SinhVien

-destinationtable tmHosoSV

4.3 Hạn chế

Bài báo chỉ mới dừng lại ở giai đoạn thử

nghiệm nên chưa kiểm tra được các trường hợp

có sự cố phát sinh khi đồng bộ dữ liệu cũng như

các kỹ thuật nhằm đảm bảo an toàn dữ liệu trong

hệ thống cơ sở dữ liệu phân tán

5 Kết luận và hướng phát triển

Trong bài báo này, tác giả đã tìm hiểu và

đề xuất mô hình cơ sở dữ liệu phân tán trong quản lý đào tạo nhằm khắc phục những hạn chế của cơ sở dữ liệu tập trung truyền thống, nâng cao hiệu quả trong quá trình quản lý sinh viên tại các trường Đại học Cao đẳng Trong tương lai, tác giả nhắm tới việc đưa mô hình vào

áp dụng thực tế tại Trường CĐ Công nghệ Thông tin - ĐHĐN, phát hiện và giải quyết các

sự cố phát sinh trong quá trình đồng bộ và đề xuất kỹ thuật để đảm bảo tính an toàn bảo mật

dữ liệu

TÀI LIỆU THAM KHẢO

[1] M.Tamer, Patrick Valduriez, Principles of Distributed Database Systems, Third Edition 2011 [2] Nguyễn Bá Tường, Nhập môn CSDL phân tán, NXB Khoa học & Kỹ Thuật, Hà Nội, 2005 [3] Sujoy P Paul., Pro SQL Server 2008 Replication, 2009

[4] Designing and Implementing: How-to Topics (Replication)

http://msdn.microsoft.com/en-us/library/bb510544(v=sql.105).aspx

[5] Replication Security Best Practices

http://technet.microsoft.com/en-us/library/ms151227%20(v=sql.105).aspx

[6] SQL Server Replication

http://msdn.microsoft.com/en-us/library/bb500351(v=sql.105).aspx

(BBT nhận bài: 02/10/2013, phản biện xong: 29/12/2013)

Ngày đăng: 09/07/2023, 03:13

HÌNH ẢNH LIÊN QUAN

Hình 1. Một mô hình cơ sở dữ liệu phân tán quản lý đào tạo - Nghiên cứu và xây dựng hệ thống cơ sở dữ liệu phân tán trong quản lý đào tạo
Hình 1. Một mô hình cơ sở dữ liệu phân tán quản lý đào tạo (Trang 3)
Hình 2. Cơ sở dữ liệu được dùng thử nghiệm - Nghiên cứu và xây dựng hệ thống cơ sở dữ liệu phân tán trong quản lý đào tạo
Hình 2. Cơ sở dữ liệu được dùng thử nghiệm (Trang 6)
Hình 3. Cấu hình Replication trong SQL Server - Nghiên cứu và xây dựng hệ thống cơ sở dữ liệu phân tán trong quản lý đào tạo
Hình 3. Cấu hình Replication trong SQL Server (Trang 6)
Hình 5. Kết quả đồng bộ dữ liệu giữa các server  4.2. Đánh giá kết quả thực nghiệm - Nghiên cứu và xây dựng hệ thống cơ sở dữ liệu phân tán trong quản lý đào tạo
Hình 5. Kết quả đồng bộ dữ liệu giữa các server 4.2. Đánh giá kết quả thực nghiệm (Trang 7)
Hình 4. Cơ sở dữ liệu tại các server - Nghiên cứu và xây dựng hệ thống cơ sở dữ liệu phân tán trong quản lý đào tạo
Hình 4. Cơ sở dữ liệu tại các server (Trang 7)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w