1. Trang chủ
  2. » Luận Văn - Báo Cáo

luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình

112 1,6K 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 112
Dung lượng 8,08 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỤC LỤC MỞ ĐẦU 1 1. Tính cấp thiết của đề tài 1 2. Mục tiêu nghiên cứu 2 3. Đối tượng và phạm vi nghiên cứu 2 4. Phương pháp nghiên cứu 3 5. Bố cục luận văn 3 6. Tổng quan tài liệu nghiên cứu 3 CHƯƠNG 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 4 1.1. MẠNG MÁY TÍNH 4 1.2. CƠ SỞ DỮ LIỆU PHÂN TÁN 6 1.2.1. Các khái niệm cơ bản về cơ sở dữ liệu phân tán 6 1.2.2. Hệ quản trị cơ sở dữ liệu phân tán (DDBMS) 7 1.2.3. Các điểm đặc trưng của cơ sở dữ liệu phân tán 8 1.2.4. Kiến trúc tham chiếu của cơ sở dữ liệu phân tán 10 1.2.5. Các loại truy xuất CSDL phân tán 13 1.3. CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN 14 1.3.1. Khái niệm tính trong suốt 14 1.3.2. Một số khía cạnh điển hình của tính trong suốt 14 1.4. PHÂN MẢNH VÀ CẤP PHÁT DỮ LIỆU 17 1.4.1. Phân mảnh dữ liệu 17 1.4.2. Cấp phát tài nguyên 23 2.5. GIAO DỊCH 28 2.5.1. Định nghĩa giao dịch 28 2.5.2. Tính chất của giao dịch 29 2.5.3. Phân loại giao dịch 30 CHƯƠNG 2. PHÂN TÍCH, THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 32 2.1. MÔ TẢ YÊU CẦU 32 2.1.1. Các căn cứ pháp lý về quản lý nhân sự 32 2.1.2. Cơ cấu tổ chức các cơ quan hành chính nhà nước 32 2.1.3. Các đối tượng tham gia vào hệ thống 32 2.1.4. Yêu cầu về các chức năng của hệ thống 33 2.1.5. Hệ thống mã hóa thông tin phục vụ xây dựng chương trình phân tán phục vụ thông tin nhanh về nhân sự tại Quảng Bình 34 2.2. THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 41 2.2.1. Mô hình tổng quát trong thiết kế CSDL phân tán 41 2.2.2. Phân mảnh dữ liệu 46 2.2.3. Cấp phát (chi phí phân bố các mảnh) 52 2.2.4. Xác định vị trí đặt cơ sở dữ liệu và phân nhóm người dùng 55 2.3. XỬ LÝ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 56 2.3.1. Khái niệm truy vấn 56 2.3.2. Các tầng của quá trình xử lý truy vấn phân tán 56 2.4. KIỂM SOÁT TÍNH TOÀN VẸN NGỮ NGHĨA 62 2.4.1. Kiểm soát toàn vẹn ngữ nghĩa tập trung 62 2.4.2. Kiểm soát toàn vẹn ngữ nghĩa phân tán 64 2.4.3. So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung và phân tán 67 CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 68 3.1. MÔ HÌNH CHỨC NĂNG CỦA HỆ THỐNG 68 3.1.1. Biểu đồ phân cấp chức năng 68 3.1.2. Biểu đồ luồng dữ liệu 68 3.2. TỐI ƯU HÓA TRUY VẤN PHÂN TÁN 70 3.2.1. Hàm chi phí 71 3.2.2. Số liệu thống kê cơ sở dữ liệu 72 3.2.3. Lực lượng của các kết quả trung gian 73 3.3. THUẬT TOAN TỐI ƯU HOA TRUY VẤN PHAN TAN SYSTEM R 75 3.4. ĐIỀU KHIỂN ĐỒNG THỜI PHÂN TÁN 78 3.4.1. Phân loại các cơ chế điều khiển đồng thời 79 3.4.2. Điều khiển đồng thời bằng khóa chốt 79 3.4.3. Thuật toán điều khiển đồng thời bằng dấu 83 3.4.4. Quản lý khóa gài 84 3.5. KIẾN TRÚC CHƯƠNG TRÌNH ỨNG DỤNG PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TỈNH QUẢNG BÌNH 86 3.5.1. Kiến trúc chương trình 86 3.5.2. Các chức năng của chương trình 92 3.6. CÀI ĐẶT VÀ THỬ NGHIỆM 98 KẾT LUẬN VÀ KIẾN NGHỊ 99 1. Kết quả đạt được 99 2. Hạn chế 100 3. Hướng phát triển đề tài 100 DANH MỤC TÀI LIỆU THAM KHẢO 101 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO).

Trang 1

2 Mục tiêu nghiên cứu 2

3 Đối tượng và phạm vi nghiên cứu 2

4 Phương pháp nghiên cứu 3

5 Bố cục luận văn 3

6 Tổng quan tài liệu nghiên cứu 3

CHƯƠNG 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 4

1.1 MẠNG MÁY TÍNH 4

1.2 CƠ SỞ DỮ LIỆU PHÂN TÁN 6

1.2.1 Các khái niệm cơ bản về cơ sở dữ liệu phân tán 6

1.2.2 Hệ quản trị cơ sở dữ liệu phân tán (DDBMS) 7

1.2.3 Các điểm đặc trưng của cơ sở dữ liệu phân tán 8

1.2.4 Kiến trúc tham chiếu của cơ sở dữ liệu phân tán 10

1.2.5 Các loại truy xuất CSDL phân tán 13

1.3 CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN 14

1.3.1 Khái niệm tính trong suốt 14

1.3.2 Một số khía cạnh điển hình của tính trong suốt 14

1.4 PHÂN MẢNH VÀ CẤP PHÁT DỮ LIỆU 17

1.4.1 Phân mảnh dữ liệu 17

1.4.2 Cấp phát tài nguyên 23

2.5 GIAO DỊCH 28

2.5.1 Định nghĩa giao dịch 28

2.5.2 Tính chất của giao dịch 29

2.5.3 Phân loại giao dịch 30

CHƯƠNG 2 PHÂN TÍCH, THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 32

Trang 2

2.1.3 Các đối tượng tham gia vào hệ thống 32

2.1.4 Yêu cầu về các chức năng của hệ thống 33

2.1.5 Hệ thống mã hóa thông tin phục vụ xây dựng chương trình phân tán phục vụ thông tin nhanh về nhân sự tại Quảng Bình 34

2.2 THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 41

2.2.1 Mô hình tổng quát trong thiết kế CSDL phân tán 41

2.2.2 Phân mảnh dữ liệu 46

2.2.3 Cấp phát (chi phí phân bố các mảnh) 52

2.2.4 Xác định vị trí đặt cơ sở dữ liệu và phân nhóm người dùng 55

2.3 XỬ LÝ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 56

2.3.1 Khái niệm truy vấn 56

2.3.2 Các tầng của quá trình xử lý truy vấn phân tán 56

2.4 KIỂM SOÁT TÍNH TOÀN VẸN NGỮ NGHĨA 62

2.4.1 Kiểm soát toàn vẹn ngữ nghĩa tập trung 62

2.4.2 Kiểm soát toàn vẹn ngữ nghĩa phân tán 64

2.4.3 So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung và phân tán 67

CHƯƠNG 3 XÂY DỰNG CHƯƠNG TRÌNH PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 68

3.1 MÔ HÌNH CHỨC NĂNG CỦA HỆ THỐNG 68

3.1.1 Biểu đồ phân cấp chức năng 68

3.1.2 Biểu đồ luồng dữ liệu 68

3.2 TỐI ƯU HÓA TRUY VẤN PHÂN TÁN 70

3.2.1 Hàm chi phí 71

3.2.2 Số liệu thống kê cơ sở dữ liệu 72

3.2.3 Lực lượng của các kết quả trung gian 73

Trang 3

3.4.1 Phân loại các cơ chế điều khiển đồng thời 79

3.4.2 Điều khiển đồng thời bằng khóa chốt 79

3.4.3 Thuật toán điều khiển đồng thời bằng dấu 83

3.4.4 Quản lý khóa gài 84

3.5 KIẾN TRÚC CHƯƠNG TRÌNH ỨNG DỤNG PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TỈNH QUẢNG BÌNH 86

3.5.1 Kiến trúc chương trình 86

3.5.2 Các chức năng của chương trình 92

3.6 CÀI ĐẶT VÀ THỬ NGHIỆM 98

KẾT LUẬN VÀ KIẾN NGHỊ 99

1 Kết quả đạt được 99

2 Hạn chế 100

3 Hướng phát triển đề tài 100

DANH MỤC TÀI LIỆU THAM KHẢO 101 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO).

Trang 4

length(A i ) Chiều dài của thuộc tính Ai

card(R j ) Số các bộ của quan hệ Rj

CÁC TỪ VIẾT TẮT

Trang 5

Bảng 1.1.

Bảng 2.3 Áp mã cho hệ thống cụ thể mã các sở, ngành

Trang 6

Hình 1.1 Sự phân tán các cụm server trong hệ thống phục

Hình 3.4

Trang 7

Hình 3.7 Biểu đồ khóa 2 pha nghiêm ngặt 81

Hình 3.14

Trang 8

MỞ ĐẦU

1 Tính cấp thiết của đề tài

Về cơ cấu tổ chức, tỉnh Quảng Bình có 159 đơn vị hành chính cấp xã, 8huyện, thành phố và 20 sở, ban ngành là các cơ quan hành chính cấp tỉnhthuộc Ủy ban nhân dân tỉnh quản lý Sở Nội vụ là cơ quan chuyên môn, giúp

Ủy ban nhân dân tỉnh quản lý cán bộ, công chức, viên chức toàn tỉnh với 187đầu mối các cơ quan, ban, ngành Việc quản lý nhân sự được bố trí phân tántheo tổ chức và phân cấp quản lý đa tầng

Đến năm 2012, toàn tỉnh Quảng Bình có hơn 20.000 công chức, viênchức Đối với cấp xã, toàn tỉnh hiện có 3.300 cán bộ, công chức và 6.700người hoạt động không chuyên trách Như vậy, trong toàn tỉnh có gần 30.000

hồ sơ cán bộ, công chức, viên chức và những người hoạt động không chuyêntrách cần được quản lý

Hồ sơ cán bộ, công chức là tài liệu quan trọng có tính pháp lý phản ánhtrung thực về lý lịch của từng cá nhân cán bộ, công chức

Trên thực tế, công tác quản lý hồ sơ cán bộ, công chức bằng phươngpháp truyền thống (hồ sơ giấy) nói chung và hồ sơ điện tử về cán bộ, côngchức nói riêng thời gian qua chưa được quan tâm, chỉ đạo để thực hiện mộtcách đầy đủ và nghiêm túc Do vậy, khi các cơ quan Nhà nước có thẩm quyềnyêu cầu số liệu để phục vụ cho việc nghiên cứu hoạch định chính sách đối vớiđội ngũ cán bộ, công chức hoặc ra quyết định về nhân sự thì các cơ quanchuyên môn không cung cấp được hoặc nếu có thì bản thân số liệu đó lại lạchậu và thiếu chính xác, không đầy đủ và thường không kịp thời

Từ thực tế nêu trên, để đáp ứng yêu cầu về tính kịp thời, nâng cao chấtlượng và hiệu quả công cụ quản lý cán bộ, công chức chính quy và hiệnđại, cần thiết xây dựng cơ sở dữ liệu thông tin về cán bộ, công chức hành

Trang 9

chính nhà nước của tỉnh Vì vậy, đề tài “Xây dựng cơ sở dữ liệu phân tánphục vụ thông tin nhanh về nhân sự tại Quảng Bình” được lựa chọn làhướng đi phù hợp với hệ thống quản lý đa tầng, phức tạp, phải xử lý theohướng phân tán mới giải quyết được yêu cầu bài toán; đồng thời hỗ trợthực hiện cải cách hành chính, hướng tới chính quyền điện tử là vấn đề tỉnhQuảng Bình đang quan tâm ưu tiên thực hiện trong giai đoạn hiện nay.

2 Mục tiêu nghiên cứu

Nghiên cứu lý thuyết cơ sở dữ liệu phân tán để xây dựng cơ sở dữ liệuphân tán giải quyết bài toán đã đặt ra Tập trung vào hai nội dung chính: tinhọc hóa trong công tác quản lý hành chính nhà nước và trợ giúp thông tin

huyện và xã; có khả năng mở rộng để kết nối với cơ sở dữ liệu Trung ươngtrong tương lai

3 Đối tượng và phạm vi nghiên cứu

3.1 Đối tượng nghiên cứu

- Lý thuyết hệ tin học phân tán; cơ sở dữ liệu phân tán

- Các công cụ, công nghệ được sử dụng để xây dựng cơ sở dữ liệu phântán theo mô hình giải pháp đã lựu chọn

- Hồ sơ cán bộ, công chức, viên chức tỉnh Quảng Bình

Trang 10

4 Phương pháp nghiên cứu

- Nghiên cứu lý thuyết:

+ Các văn bản quy phạm pháp luật hiện hành quy định về quản

lý cán bộ, công chức;

+ Các nguyên lý về cơ sở dữ liệu phân tán

- Nghiên cứu thực nghiệm:

+ Phân cấp, quy trình quản lý cán bộ, công chức, quản lý hồ sơcán bộ, công chức tại tỉnh Quảng Bình;

+ Cài đặt thực nghiệm cơ sở dữ liệu

5 Bố cục luận văn

Luận văn gồm có 3 chương, gồm:

Chương 1 Tổng quan về cơ sở dữ liệu phân tán

Chương 2 Phân tích, thiết kế cơ sở dữ liệu phân tán phục vụ thông tinnhanh về nhân sự tại Quảng Bình

Chương 3 Xây dựng chương trình phân tán phục vụ thông tin nhanh vềnhân sự tại Quảng Bình

6 Tổng quan tài liệu nghiên cứu

- Quy định hiện hiện hành của Nhà nước về quản lý cán bộ, công chức,viên chức và tình hình thực tế của địa phương;

- Hệ tin học phân phân tán; nguyên lý hệ cơ sở dữ liệu phân tán

- Ngôn ngữ lập trình Java và JSP

- Hệ quản trị cơ sở dữ liệu MySQL

Trang 11

CHƯƠNG 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN

Hệ cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại QuảngBình là hệ thống hợp nhất quản lý từ cấp tỉnh đến tất cả các xã trực thuộchuyện, do dó cơ sở dữ liệu phục vụ quản lý phải hợp nhất và là tài nguyêndùng chung để khai thác hiệu quả về công tác quản lý nhân sự

Hệ thống có sự phân cấp khác nhau nhằm mục đích quản lý, tra cứu,thống kê và cập nhật thông tin một cách nhanh chóng, hiệu quả Trên cơ sở

đó, hệ quản lý phân cấp thành 3 cụm Server khác nhau và phân tán trên phạm

vi địa lý khác nhau Cụm thứ nhất quản lý nhân sự cấp sở, ban ngành tươngđương trực thuộc tỉnh Cụm thứ hai quản lý nhân sự cấp huyện, ở đây chủ yếuquản lý nhân sự các phòng trực thuộc huyện Cụm thứ ba quản lý nhân sự cấp

xã, công tác quản lý tập trung là các cán bộ có chức danh thuộc xã

Việc phân tán cơ sở dữ liệu và chương trình trên hệ thống 3 cụm Serverkhác nhau theo Hình 1 buộc phải có sự phân tích, thiết kế và vận hành hệ đảmbảo tính hoạt động ổn định và gắn bó trên hệ Bên cạnh đó, công tác quản lýcác luồng dữ liệu khai thác dùng chung là yếu tố sống còn của hệ, như vậy ta

có thể phân chia hệ thành hai thành phần cơ bản là mạng máy tính và cơ sở dữliệu phân tán

Trang 12

- Một mạng máy tính là

một trường hợp đặc biệt của

môi trường xử lý phân tán,

thống phục vụ thông tin nhanh về nhân sự tại

Quảng Bình

Trang 13

1.2 CƠ SỞ DỮ LIỆU PHÂN TÁN

1.2.1 Các khái niệm cơ bản về cơ sở dữ liệu phân tán

Nguyên lý các hệ cơ

sở dữ liệu phân tán được

xây dựng dựa trên sự kết

hợp của hai hướng tiếp cận

đối với quá trình xử lý dữ

liệu đó là: lý thuyết hệ cơ

sở dữ liệu và công nghệ

mạng máy tính [4]

Một cơ sở dữ liệu

phân tán là một tập hợp

nhiều cơ sở dữ liệu có liên

đới logic và được phân bố

trên một mạng máy tính theo Hình 1.2

Mỗi vị trí có quyền tự quản cơ sở dữ liệu cục bộ của mình và thực thi cácứng dụng cục bộ Mỗi vị trí cũng phải tham gia vào việc thực thi ít nhất mộtứng dụng toàn cục mà yêu cầu truy xuất dữ liệu tại nhiều vị trí qua mạng.Định nghĩa này nhấn mạnh hai khía cạnh quan trọng của cơ sở dữ liệuphân tán:

- Tính phân tán: Dữ liệu thực tế không cư trú ở cùng một vị trí;

- Sự tương quan logic: Các dữ liệu có một số tính chất ràng buộc lẫnnhau

Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại Quảng Bình cócác đặc điểm về xử lý tại các cụm Server:

Cụm Server cấp xã: nhập liệu cán bộ, xử lý thông tin về cá nhân, thống

kê chuyển một phần thông tin về cán bộ mới cập nhật lên cụm Server cấp

Hình 1.2 Môi trường hệ cơ sở dữ liệu phân tán

Trang 14

Cụm Server cấp huyện: nhập liệu cán bộ, xử lý thông tin về cá nhân,thống kê chuyển một phần thông tin về cán bộ mới cập nhật lên cụm Servercấp sở

Cụm Server cấp sở, ban ngành và tương đương: nhập liệu cán bộ, xử lýthông tin về cá nhân, thống kê thông tin về cán bộ, việc cập nhật chỉ tiến hànhcục bộ

1.2.2 Hệ quản trị cơ sở dữ liệu phân tán (DDBMS)

Hệ quản trị cơ sở dữ liệu phân tán là hệ thống phần mềm cho phép quản

lý các hệ cơ sở dữ liệu phân tán và làm cho việc phân tán trở nên trong suốtđối với người sử dụng [3]

Hệ quản trị cơ sở dữ liệu phân tán hỗ trợ việc tạo và bảo trì cơ sở dữ liệuphân tán, chúng có các thành phần tương tự như một hệ quản trị cơ sở dữ liệutập trung và các thành phần hỗ trợ trong việc chuyển tải dữ liệu đến các trạm

và ngược lại

Có ba kiểu kiến trúc DDBMS: Kiến trúc khách/đại lý, kiến trúc nganghàng; kiến trúc phức hệ

Hệ quản trị cơ sở dữ liệu phân tán được phân làm 2 loại :

- Cơ sở dữ liệu phân tán thuần nhất;

- Cơ sở dữ liệu phân tán hỗn tạp

về nhân sự tại Quảng Bình phải có:

- Quản trị dữ liệu: QTDL

- Truyền thông dữ liệu: TTDL

- Từ điển dữ liệu: TDDL dùng để mô tả thông tin về sự phân tán của dữliệu trên mạng

- Cơ sở dữ liệu phân tán: CSDLPT

Trang 15

- Người sử dụng: NSD

Theo hình 1.3, người sử dụng tác động đến truyền thông dữ liệu để yêucầu nguồn thông tin mà mình mong muốn, các hoạt động bên trong hệ thốngngười dùng không quan tâm đến hay cần biết hiện nguồn dữ liệu đang nằm ở

vị trí nào Các kết nối để lựa chọn dữ liệu trên các cụm Server khác được thựchiện dựa trên thành phần là cơ sở dữ liệu phân tán

Hình 1.3 Các thành phần của cơ sở dữ liệu phân tán thông tin nhanh về nhân sự tại Quảng Bình

Trang 16

1.2.3 Các điểm đặc trưng của cơ sở dữ liệu phân tán

Cơ sở dữ liệu phân tán không đơn giản là việc phân tán các cơ sở dữ liệutập trung, nó cho phép thiết kế các hệ thống có các tính chất khác với hệthống tập trung truyền thống So sánh các tính chất đặc trưng của cơ sở dữliệu tập trung và cơ sở dữ liệu phân tán như sau:

và cơ sở dữ liệu phân tánTính chất đặc

Độc lập

dữ liệu

- Tổ chức dữ liệu trong suốtvới lập trình viên Cácchương trình được viết cócái nhìn “quan niệm” về dữliệu

- Ưu điểm: các chương trìnhkhông bị ảnh hưởng bởi sựthay đổi tổ chức vật lý của

dữ liệu

- Tính chất độc lập dữ liệu nhưtrong cơ sở dữ liệu tập trung

- Bổ sung tính chất trong suốtphân tán; tính đúng đắn của cácchương trình ứng dụng không bịảnh huởng bởi sự di chuyển dữliệu từ vị trí này đến vị trí khác

Trang 17

- Tiết kiệm dung lượng nhớ.

- Giảm thiểu dư thừa dữ liệu đảm bảo tính gắn bó

- Nhân bản dữ liệu đến các địa điểm mà các ứng dụng cần đến,giúp việc thực thi các ứng dụngkhông dừng nếu có một địa điểm bị hỏng Tuy nhiên vấn

đề quản lý gắn bó dữ liệu sẽ phức tạp hơn

Các cấu trúc vật lý phức tạp giúp liên lạc dữ liệu trong cơ

Việc chọn lựa cơ sở dữ liệu phân tán sẽ thích hợp đối với các ứng dụngphát triển trong một hệ thống mạng diện rộng do cải tiến hiệu năng, giảmtranh chấp và giảm chi phí truyền bằng cách phân mảnh và phân tán dữ liệuhợp lý Đối với trường hợp xây dựng hệ thống phục vụ thông tin nhanh vềnhân sự tại Quảng Bình, việc lựa chọn cơ sử dữ liệu phân mảnh dọc là bài

Trang 18

toán tối ưu cho ứng dụng quản lý, tra cứu và thống kê nhân sự tại tỉnh và đảmbảo hiệu năng khai thác sử dụng và giảm chi phí truyền.

1.2.4 Kiến trúc tham chiếu của cơ sở dữ liệu phân tán

Kiến trúc tham chiếu không được cài đặt rõ ràng trên tất cả cơ sở dữliệu phân tán, tuy nhiên các mức của nó được khái quát chính xác, thích hợp

để mô tả tổ chức chung cho mọi hệ cơ sở dữ liệu phân tán

- Lược đồ toàn cục: Mô tả tổng thể và thống nhất chung nhất của tất cả

dữ liệu của cơ sở dữ liệu phân tán độc lập với môi trường phân tán

- Lược đồ phân mảnh: Mỗi quan hệ toàn cục có thể được chia thành cácthành phần không trùng nhau được gọi là các phân mảnh Lược đồ phân mảnh

Trang 19

định nghĩa ánh xạ giữa các quan hệ toàn cục và các phân mảnh Ánh xạ này làmột - nhiều: Một số mảnh tương ứng với một quan hệ toàn cục, nhưng chỉ

một quan hệ toàn cục tương ứng với một mảnh Ký hiệu Ri là mảnh thứ i của quan hệ toàn cục R.

- Lược đồ cấp phát: Các mảnh là các thành phần logic của các quan hệtoàn cục, được lưu trữ vật lý tại một hay một số vị trí Lược đồ cấp phát xácđịnh vị trí của một mảnh Kiểu ánh xạ định nghĩa trong lược đồ cục bộ xácđịnh cơ sở dữ liệu phân tán có dư thừa hay không Trong trường hợp ánh xạ làmột-nhiều thì nó dư thừa, ngược lại nếu ánh xạ có kiểu một-một thì nó không

dư thừa Tất cả các mảnh tương ứng với cùng một quan hệ toàn cục R và được lưu trữ tại vị trí j tạo thành ảnh vật lý của quan hệ R tại vị trí j Kí hiệu R j chỉ

ảnh vật lý của quan hệ toàn cục R tại vị trí j.

( R 1

2 chỉ một bản sao của mảnh R2 lưu trữ tại vị trí 1 )

Trang 20

- Lược đồ ánh xạ cục bộ: Ánh xạ các hình ảnh vật lý tới các đối tượngđược thao tác bởi các hệ quản trị cơ sở dữ liệu cục bộ Trong hệ không thuầnnhất ta có các kiểu ánh xạ cục bộ khác nhau tại các vị trí khác nhau.

Ba đối tượng quan trọng nhất của kiến trúc này là sự tách biệt giữa sựphân mảnh dữ liệu và sự cục bộ hóa dữ liệu, điều khiển dư thừa dữ liệu vàtính độc lập ở các hệ quản trị cơ sở dữ liệu cục bộ

1.2.5 Các loại truy xuất CSDL phân tán

a Truy xuất từ xa thông qua các tác vụ cơ bản

Giáo dục và Đào tạo

thuộc huyện Lệ Thủy

Yêu cầu này sẽ được

DDBMS 1 xử lý, sau

khi xử lý xong,

chương trình tiếp tục

gửi yêu cầu truy xuất

CSDL gửi DDBMS2 xử lý và gửi đến vị trí chứa dữ liệu đó Thực hiện xong sẽ

gửi kết quả trả về (theo Hình 1.6)

Trang 21

dụng đang yêu cầu Tại

Sở Nội vụ yêu cầu xem

lý lích trích ngang của Chủ tịch Hội đồng nhân dân từ cấp tỉnh đến cấp xã

Cụm Server 1 sau khi tiếp nhận yêu cầu, lập tức phái sinh chương trình phụ

trợ để lọc và trích xuất thông tin từ các cụm Server khác, các yêu cầu lập tức

xử lý nội bộ và gửi đến cụm Server 2 và cụm Server 2 chuyển tiếp yêu cầu đến cụm Server 3 Sau khi thực hiện xong các yêu cầu và các kết quả trả về,

chương trình phụ trợ sẽ tổng hợp lại và trả kết quả về cho người sử dụng

1.3 CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN

1.3.1 Khái niệm tính trong suốt

Tính trong suốt là tính chất căn bản của hệ phân tán Tính trong suốt của

hệ phân tán được hiểu như là sự che khuất đi các thành phần riêng biệt của hệthống máy tính đối với người sử dụng và những người lập trình ứng dụng.Người sử dụng có quyền truy cập đến dữ liệu đặt tại một vị trí dữ liệu ở xamột cách tự động nhờ hệ thống mà không cần biết đến sự phân tán của tất cả

dữ liệu trên mạng Hệ thống tạo cho người dùng cảm giác là dữ liệu được coinhư đặt tại máy tính cục bộ của mình

Hình 1.7 Truy xuất từ xa thông qua chương trình phụ trợ

Trang 22

Sự che khuất thông tin phụ thuộc hệ thống khỏi người dùng dựa trên việccân bằng giữa tính đơn giản và tính hiệu quả Đáng tiếc, hai tính chất nàyxung đột nhau Bởi vậy, mong muốn một mục tiêu trong suốt hoàn toàn làkhông thích hợp Hệ phân tán tốt là cố gắng đạt được tính trong suốt cao nhất

có thể được

1.3.2 Một số khía cạnh điển hình của tính trong suốt

Tính trong suốt thể hiện trong nhiều khía cạnh, dưới đây là một số khíacạnh điển hình nhất:

- Trong suốt phân đoạn

(trong suốt duyệt lại) theo

trưởng hệ thống theo chiều

dọc là tỷ lệ nghịch với sự tăng

trưởng hệ thống theo chiều

ngang Sự duyệt lại phần mềm

bị che khuất đối với người

dùng Khi dữ liệu đã được

phân mảnh thì việc truy cập

vào cơ sở dữ liệu được thực hiện như lúc chưa phân tán và không ảnh hưởngtới người sử dụng

- Trong suốt định vị

(trong suốt tên): theo Hình

1.9 người dùng không nhận

biết được vị trí của đối tượng

Đối tượng được định vị và chỉ

dẫn theo tên lôgic trong một

hệ thống thống nhất Trong

Trang 23

suốt di trú (còn được gọi là độc lập định vị): là tính chất bổ sung vào trongsuốt định vị theo nghĩa không những đối tượng được chỉ dẫn bằng tên lôgic

mà đối tượng còn được di chuyển tới định vị vật lý khác mà không cần đổitên

Tính trong suốt định vị rất hữu ích, nó cho phép người sử dụng bỏ quacác bản sao dữ liệu đã tồn tại ở mỗi vị trí Do đó, có thể di chuyển một bảnsao dữ liệu từ vị trí này đến vị trí khác và cho phép tạo ra bản sao mới màkhông ảnh hưởng đến các ứng dụng

- Trong suốt đồng thời: cho phép chia sẻ đối tượng dùng chung khônggặp tranh chấp Nó tương tự như khái niệm phân chia thời gian theo nghĩakhái quát

- Trong suốt song song: cho phép các hoạt động song song mà ngườidùng không cần biết hoạt động song song đó xảy ra như thế nào, ở đâu và khinào Tính song song có thể không được người dùng đặc tả

Trang 24

- Trong suốt truy nhập: Truy nhập đối tượng địa phương/toàn cục theocùng một cách thức Sự tách rời vật lý của các đối tượng hệ thống được chekhuất tới người dùng.

- Trong suốt lỗi: cung cấp khả năng thứ lỗi của hệ thống được hiểu là lỗitrong hệ thống có thể được biến đổi thành sự giảm hiệu năng hệ thống mộtcách mềm dẻo hơn chứ không phải chỉ là làm cực tiểu sự đổ vỡ và nguy hiểmđối với người dùng

- Trong suốt hiệu năng: cố gắng giành được tính gắn bó và khẳng định(không cần thiết ngang bằng) mức độ hiệu năng thậm chí khi thay đổi cấu trúc

hệ thống hoặc phân bố tải Hơn nữa, người dùng không phải chịu sự chậm trễhoặc thay đổi quá mức khi thao tác từ xa Trong suốt hiệu năng còn được thểhiện là hiệu năng hệ thống không bị giảm theo thời gian

- Trong suốt kích thước: liên quan đến tính mềm dẻo và tiềm tàng Nócho phép sự tăng trưởng của hệ thống được che khuất đối với người sử dụng.Kích thước hệ thống không tạo ra tác động đối với nhận thức của người dùng

Trang 25

phân mảnh sẽ làm tăng mức độ hoạt động đồng thời và tăng lưu lượng hoạtđộng của hệ thống.

Tuy nhiên việc phân mảnh cũng thể hiện những hạn chế nhất định:

- Nếu ứng dụng có những yêu cầu “xung đột” ngăn cản phân rã thành các

mảnh được sử dụng độc quyền;

- Những ứng dụng có các khung nhìn được định nghĩa trên nhiều mảnh

khác nhau sẽ làm giảm hiệu suất hoạt động của hệ thống, làm tăng chiphí truy xuất dữ liệu đến các mảnh và tăng chi phí kết nối các mảnh;

- Việc kiểm soát ngữ nghĩa, đặc biệt là vấn đề kiểm tra tính toàn vẹn sẽ

khó khăn hơn

Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại Quảng Bình,

dữ liệu được phân rã và phân tán trên 3 cụm Server khác nhau và với mức độyêu cầu tính chất về tra cứu, thống kê thông tin đối với bài toán quản lý nhân

sự được đặt ra tại tỉnh thì hệ thống phân mảnh dọc là thích hợp nhất với điềukiện hiện nay Nhưng với nhu cầu phát triển thì hệ thống có thể sử dụngphương pháp phân mảnh lai sẽ mang lại hiệu quả cao hơn trong việc xây dựngứng dụng và cơ sở dữ liệu phân tán Trong luận văn này, tôi giới thiệu cả baphương pháp phân mảnh nhưng giải pháp của bài toán là lựa chọn phân mảnhdọc, do đó các phương pháp phân tích, thiết kế tập trung vào phân mảnh này

sẽ được trình bày trong Chương 2

b Các quy tắc phân mảnh

Các nguyên tắc để đảm bảo cơ sở dữ liệu khi phân mảnh sẽ đảm bảo tínhkhông thay đổi về ngữ nghĩa Ba qui tắc phải tuân thủ khi phân mảnh cơ sở dữliệu quan hệ:

- Tính đầy đủ

Quan hệ R được phân rã thành các mảnh R1 , R 2, …, R n , thì mỗi mục dữ liệu có trong quan hệ R sẽ được chứa trong ít nhất một mảnh Ri (i=1, , n).

Trang 26

Quy tắc này đảm bảo cho các mục dữ liệu trong R được ánh xạ hoàn toàn vào

các mảnh và không bị mất Mục dữ liệu có thể hiểu là bộ trong phân mảnhngang và thuộc tính trong phân mảnh dọc

Nếu quan hệ R được phân rã ngang thành các mảnh Ri , i = 1, ,n và mục

dữ liệu dj nằm trong một mảnh R j thì nó sẽ không nằm trong mảnh Rk , (k≠j).

Quy tắc này đảm bảo các mảnh phân rã rời nhau Trong trường hợp phânmảnh dọc, khóa chính của quan hệ phải được lặp lại trong tất cả các mảnh Vìvậy tính tách biệt trong phân mảnh dọc được hiểu không liên quan gì đếnkhóa chính của quan hệ

c Mức độ phân mảnh

Phân mảnh cơ sở dữ liệu đến mức độ nào là đủ để không làm ảnh hưởngđến hiệu năng của việc thực hiện truy vấn Mức độ phân mảnh có thể là phânmảnh một quan hệ chưa được phân mảnh, có thể phân mảnh các quan hệ đãđược phân mảnh Có thể phân mảnh theo chiều dọc hoặc theo chiều ngang.Một mức độ ứng phân mảnh thích hợp sao cho tránh được các hạn chếkhi phân mảnh chỉ được định nghĩa ứng với các ứng dụng sẽ chạy trên cơ sở

dữ liệu Trong hệ thống phục vụ thông tin nhanh về nhân sự tại Quảng Bình,

việc phân mảnh dọc sẽ thực hiện phân mảnh trên cụm Server 1 và cụm Server 2; các mảnh được phân dựa trên chi phí cập nhật và tra cứu để tối ưu đối với

ứng dụng được triển khai và chi phí đường truyền cũng như truy vấn trong hệ

d Các phương pháp phân mảnh

Phân mảnh ngang

Trang 27

Chia quan hệ thành nhiều các nhóm bộ Kết quả của quá trình phân mảnhngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều kiện ràngbuộc của các thuộc tính Các bộ trong các quan hệ con là tách biệt nhau Phânmảnh ngang thực chất là phép chọn quan hệ thỏa mãn một biểu thức điều kiêncho trước.

Có hai phương pháp phân mảnh ngang:

- Phân mảnh ngang nguyên thủy: Là phân mảnh ngang được thực

hiện trên các vị từ của chính quan hệ đó

- Phân mảnh ngang dẫn xuất: Là phân rã một quan hệ dựa trên các

Trong đó Fi là biểu thức đại số quan hệ Nếu Fi có dạng chuẩn hội, thì nó

là vị từ hội sơ cấp (mi)

Phân mảnh ngang Ri của quan hệ R gồm tất cả các bộ của R thoả một vị

từ hội sơ cấp mi Vì vậy, cho một tập M các vị từ hội sơ cấp, số lượng phân mảnh ngang của quan hệ R bằng số lượng các vị từ hội sơ cấp Tập các mảnh

ngang được gọi là tập các mảnh hội sơ cấp Định nghĩa phân mảnh ngang phụthuộc vào vị từ hội sơ cấp, vì vậy, cần phải xác định các vị từ đơn giản tạo ra

vị từ hội sơ cấp

Phân mảnh ngang dẫn xuất: dựa trên các quan hệ thành viên của một

đường nối theo phép toán chọn trên quan hệ chủ

Mục tiêu của phân mảnh ngang dẫn xuất là phân chia các quan hệ thànhviên thành các mảnh của quan hệ chủ được định nghĩa trên các thuộc tính củaquan hệ thành viên Vì vậy, liên kết giữa quan hệ chủ và quan hệ thành viênđược định nghĩa như là một nối bằng và nối bằng có thể được cài đặt nối nửa

i

Trang 28

Cho một đường nối L, trong đó, Owner(L) = S và Member(L) = R Phân mảnh ngang dẫn xuất của R được định nghĩa như sau:

- Một quan hệ có thể có nhiều cách phân mảnh Chọn một lược đồ phânmảnh nào cho tối ưu phụ thuộc vào ứng dụng và cấp phát

- Phân mảnh dọc

Phân mảnh dọc quan hệ R sinh ra các mảnh R1, R2, , Rr, sao cho mỗi mảnh chứa một tập con các thuộc tính của quan hệ R và khoá của nó Mục đích của phân mảnh dọc là phân chia quan hệ R thành tập các quan hệ nhỏ

hơn để nhiều ứng dụng có thể chỉ cần thực hiện trên một mảnh Mảnh tối ưu

là mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối thiểu thời gianthực hiện của ứng dụng trên mảnh đó

Kỹ thuật phân mảnh dọc phức tạp, vì số lựa chọn phân hoạch rất lớn

Trong phân mảnh ngang, nếu số vị từ đơn giản trong Pr là n, khi đó sẽ có 2 n

vị từ hội sơ cấp có thể được định nghĩa trên đó Mặt khác, một số vị từ hội sơcấp có thể mâu thuẫn với các phép kéo theo Vì vậy sẽ làm giảm số lượng cácmảnh dự tuyển cần được xem xét Trong trường hợp phân mảnh dọc, nếuquan hệ có m thuộc tính không phải là khoá chính, thì số mảnh có thể có là

B(m) ≈ ≅ m m

Để có được các lời giải tối ưu cho bài toán phân mảnh dọc, phải sử dụnghai phương pháp khám phá (Heuristic) cho phân mảnh dọc các quan hệ toàncục:

Trang 29

(1) Nhóm thuộc tính: bắt đầu gán mỗi thuộc tính cho một mảnh và trong

mỗi bước, nối một số mảnh lại với nhau cho đến khi thỏa điều kiện

(2) Tách mảnh: bắt đầu bằng một quan hệ và quyết định cách phân chia

dựa trên hành vi truy nhập của các ứng dụng trên các thuộc tính

Kỹ thuật tách mảnh thích hợp với phương pháp thiết kế từ trên xuống.Các mảnh không gối chồng lấn lên nhau (không phải là khoá chính) Ngượclại, với phương pháp nhóm thuộc tính thường tạo ra các mảnh gối chồng lênnhau Trong các hệ CSDL phân tán, các mảnh không gối chồng lên nhau đượcquan tâm, nghiên cứu

Việc nhân bản các thuộc tính khóa tại mỗi trạm sẽ bảo đảm tính toàn vẹnngữ nghĩa và làm giảm quá trình trao đổi dữ liệu

Thông tin cần thiết của phân mảnh dọc:

Ma trận giá trị sử dụng thuộc tính: Gọi Q = {q1, q2, , qq} là tập các câu

truy vấn của người dùng hay còn gọi là các ứng dụng của người sử dụng sẽ

thực hiện trên quan hệ R(A1, A2,…, An) Khi đó ma trận giá trị sử dụng thuộc tính có q hàng và n cột Các phần tử được ký hiệu là giá trị câu truy vấn qi , i=1 q sử dụng thuộc tính Aj , j=1 n, ký hiệu là use(qi, Aj) được định

nghĩa như sau:

Use(qi,Aj) =

i=1 q và j=1 n

1 Nếu truy vấn qi tham chiếu thuộc tính Aj

0 Nếu qi không tham chiếu thuộc tính Aj

Ma trận hấp dẫn của thuộc tính: Hầu hết các thông tin cho phân mảnh

dọc có mối quan hệ mật thiết với các ứng dụng Các thuộc tính thường đượctruy nhập chung với nhau, cần phải định nghĩa một giá trị để chỉ ra mức độliên hệ giữa các thuộc tính, được gọi là sự hấp dẫn của thuộc tính

Số đo hấp dẫn giữa hai thuộc tính Ai , A j của quan hệ R(A1 , A 2 , …, A n ) ứng với tập ứng dụng Q = {q1 , q 2 , …, q q} được định nghĩa như sau:

Trang 30

Trong đó, refl(qk) là số truy xuất các thuộc tính (A i , A j ) cho qk tại vị trí

Sl và accl (qk) là số đo tần số truy xuất ứng dụng qk tại vị trí Sl Kết quả tính toán là một ma trận vuông cấp nxn, phần tử (i, j) là số đo sự hấp dẫn của các thuộc tính Ai , A j.

Để nhóm các thuộc tính của một quan hệ dựa trên các giá trị hấp dẫn

thuộc tính trong AA, sử dụng thuật toán năng lượng nối Thuật toán BEA nhận

nguyên liệu là một ma trận hấp dẫn thuộc tính, hoán vị các hàng và các cột rồisinh ra một ma trận hấp dẫn tụ, hoán vị được thực hiện sao cho số đo hấp dẫnchung là lớn nhất

- Phân mảnh hỗn hợp

Trong thực tế, hầu hết các

trường hợp phân mảnh ngang hay

phân mảnh dọc của CSDL không

thoả mãn yêu cầu người sử dụng

Thường CSDL được phân mảnh dọc

sau đó phân mảnh ngang, tạo ra sự

phân chia theo cấu trúc cây Chiến

lược phân mảnh này gọi là phân

mảnh lai, hay phân mảnh trộn, hay

phân mảnh lồng

Tính đúng đắn của phân mảnh hỗn hợp được đảm bảo, vì chiến lượcphân mảnh này dựa theo phân mảnh ngang và phân mảnh dọc, đảm bảo tínhđúng đắn như đã trình bày Để khôi phục quan hệ toàn cục trong trường hợpphân mảnh hỗn hợp, có thể bắt đầu từ các node lá của của cây phân hoạch vàdịch chuyển lên bằng cách thực hiện các phép kết nối và phép hợp Phân

Trang 31

mảnh hỗn hợp đầy đủ nếu các mảnh lá và các mảnh trung gian là đầy đủ Cóthể kiểm tra tính tách biệt của chiến lược phân mảnh hỗn hợp Tính tách biệtđược đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt.

1.4.2 Cấp phát tài nguyên

a Phát biểu Bài toán cấp phát tài nguyên

Giả sử có một tập các mảnh F={F1 , F 2 , , F n} và một mạng bao gồm các

vị trí S={S1 , S 2 , , S m} trên đó có một tập các ứng dụng Q={q1 , q 2 , , q q} đang chạy Bài toán cấp phát tìm một phân phối “tối ưu” của F cho S.

Tính tối ưu có thể được định nghĩa ứng với hai số đo:

- Chi phí nhỏ nhất: Hàm chi phí có chi phí lưu mảnh Fi vào vị trí Sj, chi phí truy vấn mảnh Fi vào vị trí Sj, chi phí cập nhật Fi tại tất cả mọi vị trí có

chứa nó và chi phí tryền dữ liệu Bài toán cấp phát cố gắng tìm một lược đồcấp phát với hàm chi phí tổ hợp nhỏ nhất

- Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệuquả lớn đó là hạ thấp thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tạimỗi vị trí

Để bài toán đơn giản, giả sử rằng:

(1) Tập các ứng dụng Q chỉ có khả năng truy vấn chỉ đọc và cập nhật trên mảnh Fk, bao gồm các đại lượng sau:

T = {t1 , t 2 , …, t m}, với ti là lưu lượng chỉ đọc tại S i cho Fk, và

U = {u 1 , u 2 , …, u m }, với u i là lưu lượng cập nhật tại S i cho Fk.

(2) Giả sử C(T) = {c12 , c 13 , …, c 1m , …, c m-1 m }, với c ij là chi phí truyền một đơn vị cho các yêu cầu chỉ đọc giữa vị trí Si và S j là không thay đổi.

Chi phí cập nhật và chỉ đọc ký hiệu là:

cho các yêu cầu cập nhật giữa các vị trí Si và S j.

(3) Gọi chi phí lưu trữ mảnh Fk tại vị trí S i là di

Trang 32

Ký hiệu D = {d1 , d 2 , …, d m } là chi phí lưu trữ mảnh F k tại mọi vị trí.

(4) Giả sử không có ràng buộc về khả năng lưu trữ tại các vị trí hoặc chođường truyền Khi đó, bài toán cấp phát có thể được đặc tả như là một bàitoán cực tiểu hoá chi phí, trong đó tìm tập I S các nơi lưu trữ các bản sao của

các mảnh

Ký hiệu xj là biến quyết định chọn nơi đặt sao cho:

xj = 1 Nếu mảnh Fk được đặt tại vị trí Sj

0 trong trường hợp ngược lạiKhi đó đặc tả chính xác như sau:

Số hạng thứ nhất tương ứng với chi phí truyền các cập nhật đến các vị trí

có lưu trữ bản sao của mảnh và với chi phí thực hiện các yêu cầu chỉ đọc tại

vị trí đó nhưng với chi phí truyền dữ liệu nhỏ nhất

Số hạng thứ hai của hàm tính tổng chi phí lưu tất cả các bản sao củamảnh

Bài toán cấp phát tổng quát có độ phức tạp là NP-đầy đủ Vì thế cácnghiên cứu đã được dành cho việc tìm ra các thuật giải heuristic tốt để có lờigiải gần tối ưu

b Thông tin cần thiết cho bài toán cấp phát

Ở giai đoạn cấp phát, chúng ta cần các thông tin định lượng về cơ sở dữliệu, về các ứng dụng chạy trên đó, về cấu trúc mạng, khả năng xử lý và giới

Trang 33

hạn lưu trữ của mỗi vị trí trên mạng.

- Thông tin về CSDL: Để thực hiện việc phân mảnh ngang, cần định

nghĩa độ tuyển hội sơ cấp

Ký hiệu là seli (F j ) là độ tuyển của mảnh F j ứng với truy vấn qi ; là số lượng các bộ Fj được truy nhập để xử lý qi.

Kích thước của một mảnh Fj được định nghĩa:

size(F j ) = card(F j ) * length(F j ), (1.4)

Trong đó length(Fj ) là chiều dài (byte) của một bộ trong mảnh F j.

- Thông tin về ứng dụng:

Ký hiệu là RRij là số truy nhập đọc do truy vấn qi thực hiện trên mảnh Fj.

Ký hiêu URij tương ứng với RRij là các truy nhập cập nhật

Định nghĩa hai ma trận UM và RM với các phần tử tương ứng uij và rijđược đặc tả tương ứng như sau:

uij = 1 Nếu truy vấn qi có cập nhật mảnh Fj

0 trong trường hợp ngược lại

0 trong trường hợp ngược lại

Một vectơ O gồm các giá trị o(i) mô tả vị trí đưa ra câu truy vấn qi.

- Thông tin về vị trí: Với mỗi vị trí (trạm) chúng ta cần biết về khả năng

lưu trữ và xử lý của nó Những giá trị này có thể tính được bằng các hàmthích hợp hoặc bằng các phương pháp đánh giá đơn giản Chi phí đơn vị để

lưu trữ dữ liệu tại trạm Sk được ký hiệu là USCk Chi phí xử lý một công việc tại vị trí Sk là LPCk Đơn vị công việc phải giống với đơn vị của RR và UR.

- Thông tin về mạng: Giả sử tồn tại một mạng đơn giản, chi phí để truyền

Trang 34

được định nghĩa theo đơn vị khung dữ liệu Ký hiệu gij là chi phí truyền một khung giữa hai vị trí Si và Sj Hàm fsize tính được kích thước (byte) của một

khung dữ liệu

c Mô hình cấp phát

Mục tiêu của mô hình cấp phát là giảm tối thiểu tổng chi phí xử lý và lưutrữ, đáp ứng các đòi hỏi về thời gian đáp ứng

Mô hình có dạng: min(Total Cost)

Ứng với ràng buộc thời gian đáp ứng, ràng buộc lưu trữ, ràng buộc xử

lý Biến quyết định xij được định nghĩa là:

xij = 1 Nếu mảnh Fi được lưu tại vị trí Sj

0 trong trường hợp ngược lại

(Tổng chi phí lưu tại tất cả vị trí cho mọi mảnh)

- Chi phí xử lý truy vấn cho ứng dụng qi là:

Trang 35

lý như nhau Ký hiệu tổng cho biết tổng các truy nhập cho tất cả các mảnh

được qi tham chiếu Nhân với LPCk sẽ cho chi phí truy nhập tại vị trí Sk Nhân

x jk cho các giá trị chi phí các vị trí lưu các mảnh.

Hàm chi phí truy nhập của việc xử lý một câu truy vấn bao gồm việcphân rã thành các tập con truy vấn Mỗi truy vấn con hoạt tác trên một mảnhđược lưu tại vị trí đó Tiếp theo là truyền kết quả về vị trí đã đưa ra truy vấn

Ở đây mô hình cấp phát sẽ bỏ qua các vấn đề phức tạp của xử lý truy vấn

Thành phần cập nhật của hàm truyền dữ liệu:

- Số hạng thứ nhất trong TCR biểu diễn chi phí truyền yêu cầu chỉ đọc

đến những vị trí có bản sao của mảnh cần truy nhập

- Số hạng thứ hai là truyền các kết quả từ trạm này đến trạm yêu cầu.Phương trình này khẳng định rằng trong số các trạm có bản sao của cùng mộtmảnh, chỉ trạm sinh ra tổng chi phí truyền thấp nhất mới được chọn để thựchiện thao tác này

Hàm chi phí truyền cho truy vấn qi được tính:

Trang 36

TC i = TCU i + TCR i (1.12)

- Ràng buộc thời gian đáp ứng

Là ràng buộc về thời gian thực thi của qi ≤ thời gian đáp ứng lớn nhất

của qi , ∀ q i ∈ Q Thường đặc tả số đo chi phí của hàm theo thời gian, vì đặc tả

đơn giản ràng buộc thời gian thực thi

≤ khả năng lưu trữ tại vị trí Sk , ∀ S k ∈ S (1.13)

và gây ra một dịch chuyển trạng thái trên cơ sở dữ liệu đó

Một giao dịch luôn phải kết thúc ngay cả khi có xảy ra sự cố Giaodịch hoàn thành tác vụ gọi là giao dịch ủy thác, giao dịch phải dừng lạikhi chưa hoàn thành gọi là hủy bỏ

Trang 37

2.5.2 Tính chất của giao dịch

Giao dịch có bốn tính chất là: tính nguyên tử, tính gắn bó, tính biệtlập và tính bền vững; chúng được gọi chung là tính ACID của giao dịch

Tính nguyên tử liên quan đến sự kiện là một giao dịch được xử lý

như một đơn vị hoạt tác Các hành động của giao dịch, hoặc tất cả đềuhoàn tất hoặc không một hành động nào được thực hiện

Tính gắn bó của một giao dịch là tính đúng đắn của nó Một giao

dịch là một chương trình đúng đắn, ánh xạ cơ sở dữ liệu từ trạng thái gắn

bó này sang trạng thái gắn bó khác Xác định giao dịch gắn bó là vấn đềđiều khiển dữ liệu ngữ nghĩa, việc đảm bảo tính gắn bó là mục tiêu củacác cơ chế điều khiển đồng thời

Phân loại tính gắn bó nhóm các cơ sở dữ liệu thành bốn mức độ.Định nghĩa dữ liệu rác là giá trị dữ liệu đã được cập nhật bởi một giaodịch trước khi nó ủy thác

"Độ 3: Giao dịch T thỏa gắn bó độ 3 nếu:

1 T không ghi đè lên dữ liệu rác của các giao dịch khác

2 T không ủy thác bất kỳ thao tác ghi nào cho đến khi nó hoànthành mọi thao tác ghi

3 T không đọc dữ liệu rác của các giao dịch khác

4 Các giao dịch khác không làm cho dữ liệu T đã đọc trước khihoàn tất trở thành dữ liệu rác

Độ 2: Giao dịch T thỏa gắn bó độ 2 nếu:

1 T không ghi đè lên dữ liệu rác của các giao dịch khác

2 T không ủy thác bất kỳ thao tác ghi trước EOT

3 T không đọc dữ liệu rác của các giao dịch khác

Độ 1: Giao dịch T thỏa gắn bó độ 1 nếu:

1 T không ghi đè lên dữ liệu rác của các giao dịch khác

Trang 38

2 T không ủy thác bất kỳ thao tác ghi trước EOT.

Độ 0: Giao dịch T thỏa gắn bó độ 0 nếu:

1 T không ghi đè lên dữ liệu rác của các giao dịch khác.”

Tính biệt lập đòi hỏi mỗi giao dịch phải luôn nhìn thấy cơ sở dữ liệu

gắn bó

Tính bền vững bảo đảm một khi giao dịch ủy thác, kết quả của nó

được duy trì cố định và không bị xóa ra khỏi cơ sở dữ liệu

2.5.3 Phân loại giao dịch

Các giao dịch được phân loại dựa trên một số tiêu chuẩn:

- Phân loại giao dịch theo thời gian hoạt động của giao dịch: giaodịch được phân theo kiểu trực tuyến (được đặc trưng bởi thời gian thựcthi, đáp ứng rất ngắn, truy xuất một phần cơ sở dữ liệu nhỏ), hay theokiểu lô (đặc trưng bởi thời gian thực thi, lớn hơn, truy xuất cơ sở dữ liệukhá lớn)

- Phân loại giao dịch theo việc tổ chức các hành động đọc và ghi:+ Mô hình tổng quát: hành động đọc, ghi không theo bất kỳ một thứ

Trang 39

+ Giao dịch phẳng có một khởi điểm duy nhất và một điểm kết thúcduy nhất.

+ Giao dịch lồng cho phép một giao dịch chứa những giao dịch khácvới điểm bắt đầu và ủy thác của chúng Những giao dịch được đặt vàotrong giao dịch khác được gọi là giao dịch con

Begin_transaction {1}

Begin_transaction {2}

end {2}

Begin_transaction {3}

end {3}

VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH2.1 MÔ TẢ YÊU CẦU

2.1.1 Các căn cứ pháp lý về quản lý nhân sự

Căn cứ Nghị định số 29/2012/NĐ-CP ngày 12/4/2012 của Chínhphủ về tuyển dụng, sử dụng và quản lý viên chức; Thông tư số 11/2012/TT-BNV ngày 17/12/2012 của Bộ Nội vụ quy định chế độ báo cáo thống

kê và quản lý hồ sơ công chức; cơ quan có thẩm quyền quản lý, sử dụngcông chức có thẩm quyền quản lý hồ sơ cán bộ, công chức, viên chứccủa cơ quan, đơn vị mình Quyết định Số 13/2012/QĐ-UBND ngày04/7/2012 của UBND tỉnh Quảng Bình ban hành quy định phân cấp về

Trang 40

tuyển dụng, sử dụng và quản lý viên chức thuộc thẩm quyền quản lý củaUBND tỉnh.

2.1.2 Cơ cấu tổ chức các cơ quan hành chính nhà nước

Tỉnh Quảng Bình hiện có 20 sở, ban, ngành cấp tỉnh và 08 huyện,thành phố Mỗi cơ quan cấp tỉnh có từ 05 đến 32 phòng trực thuộc; Mỗihuyện, thành phố có 13 phòng trực thuộc và có từ 15 đến 30 xã

Hình 2.1 Cơ cấu tổ chức bộ máy các cơ quan hành chính Quảng Bình

2.1.3 Các đối tượng tham gia vào hệ thống

Các đối tượng tham gia sử dụng gồm: Sở Nội vụ; Các sở, ban,ngành thuộc Ủy ban nhân dân tỉnh; Phòng Nội vụ các huyện, thành phố;

Ủy ban nhân dân cấp xã

Cơ sở dữ liệu phân tán về nhân sự tỉnh Quảng Bình được sử dụngtrong khối cơ quan hành chính nhà nước Hồ sơ cán bộ, công chức mỗi

cơ quan, đơn vị là một cơ sở dữ liệu cục bộ

Sở Nội vụ là cơ quan chuyên môn thuộc Ủy ban nhân dân tỉnh, thammưu, giúp Ủy ban nhân dân tỉnh thực hiện chức năng quản lý Nhà nước

về Tổ chức bộ máy; biên chế các cơ quan hành chính, sự nghiệp Nhànước; cán bộ, công chức, viên chức Nhà nước, cán bộ, công chức xã,phường, thị trấn Do vậy, Sở Nội vụ có quyền truy vấn (xem) được tất cảcác thông tin của các cơ sở dữ liệu địa phương

Mỗi cơ quan (các sở, ngành, UBND cấp huyện) có quyền truy vấn

Cấp huyện:

08 UBND huyện, Thành phố

Cấp tỉnh:

20 sở, ban, ngành

Tỉnh Quảng Bình

Cấp xã:

159 UBND

xã, phường, thị trấn

Ngày đăng: 06/07/2015, 09:58

HÌNH ẢNH LIÊN QUAN

Hình 1.1. Sự phân tán các cụm server trong hệ  thống phục vụ thông tin nhanh về nhân sự tại - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 1.1. Sự phân tán các cụm server trong hệ thống phục vụ thông tin nhanh về nhân sự tại (Trang 12)
Hình 1.3. Các thành phần của cơ sở dữ liệu phân tán  thông tin nhanh về nhân sự tại Quảng Bình - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 1.3. Các thành phần của cơ sở dữ liệu phân tán thông tin nhanh về nhân sự tại Quảng Bình (Trang 15)
Hình 1.4. Kiến trúc tham chiếu của cơ sở dữ liệu phân tán - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 1.4. Kiến trúc tham chiếu của cơ sở dữ liệu phân tán (Trang 18)
Hình 1.5. Các phân mảnh và mô hình vật lý cho một quan hệ toàn cục - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 1.5. Các phân mảnh và mô hình vật lý cho một quan hệ toàn cục (Trang 19)
Bảng 2.4. Áp mã cho hệ thống cụ thể mã các huyện - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Bảng 2.4. Áp mã cho hệ thống cụ thể mã các huyện (Trang 43)
Hình 2.3. Sơ đồ thiết kế CSDL phân tán theo mô hình từ trên xuống - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 2.3. Sơ đồ thiết kế CSDL phân tán theo mô hình từ trên xuống (Trang 52)
Hình 2.6. Mô hình cấp phát dữ liệu phân tán - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 2.6. Mô hình cấp phát dữ liệu phân tán (Trang 64)
Hình 2.7. Lược đồ phân tầng tổng quát để xử lý truy vấn phân tán - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 2.7. Lược đồ phân tầng tổng quát để xử lý truy vấn phân tán (Trang 65)
Hình  3.4b. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng tìm kiếm - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
nh 3.4b. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng tìm kiếm (Trang 78)
Hình  3.4c. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng báo cáo - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
nh 3.4c. Biểu đồ luồng dữ liệu mức dưới đỉnh chức năng báo cáo (Trang 79)
Hình 3.9. Cấu trúc truyền giao của khoá 2 pha phân tán - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 3.9. Cấu trúc truyền giao của khoá 2 pha phân tán (Trang 91)
Hình 3.11. Mô hình phân tán và cập nhật mảnh trên các cụm Server - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 3.11. Mô hình phân tán và cập nhật mảnh trên các cụm Server (Trang 98)
Hình 3.14. Các cập nhật thông tin khác - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 3.14. Các cập nhật thông tin khác (Trang 102)
Hình 3.15. Lựa chọn đơn vị để liệt kê nhân sự trực thuộc - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 3.15. Lựa chọn đơn vị để liệt kê nhân sự trực thuộc (Trang 103)
Hình 3.19. Đăng nhập hệ thống (a) và kết quả bảng dữ liệu nhân sự (b) ở cụm - luận văn thạc sĩ xây dựng cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại quảng bình
Hình 3.19. Đăng nhập hệ thống (a) và kết quả bảng dữ liệu nhân sự (b) ở cụm (Trang 106)

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w