MỤC LỤC MỞ ĐẦU 1 1. Tính cấp thiết của đề tài 1 2. Mục tiêu nghiên cứu 2 3. Đối tượng và phạm vi nghiên cứu 2 4. Phương pháp nghiên cứu 3 5. Bố cục luận văn 3 6. Tổng quan tài liệu nghiên cứu 3 CHƯƠNG 1. TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 4 1.1. MẠNG MÁY TÍNH 4 1.2. CƠ SỞ DỮ LIỆU PHÂN TÁN 6 1.2.1. Các khái niệm cơ bản về cơ sở dữ liệu phân tán 6 1.2.2. Hệ quản trị cơ sở dữ liệu phân tán (DDBMS) 7 1.2.3. Các điểm đặc trưng của cơ sở dữ liệu phân tán 8 1.2.4. Kiến trúc tham chiếu của cơ sở dữ liệu phân tán 10 1.2.5. Các loại truy xuất CSDL phân tán 13 1.3. CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN 14 1.3.1. Khái niệm tính trong suốt 14 1.3.2. Một số khía cạnh điển hình của tính trong suốt 14 1.4. PHÂN MẢNH VÀ CẤP PHÁT DỮ LIỆU 17 1.4.1. Phân mảnh dữ liệu 17 1.4.2. Cấp phát tài nguyên 23 2.5. GIAO DỊCH 28 2.5.1. Định nghĩa giao dịch 28 2.5.2. Tính chất của giao dịch 29 2.5.3. Phân loại giao dịch 30 CHƯƠNG 2. PHÂN TÍCH, THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 32 2.1. MÔ TẢ YÊU CẦU 32 2.1.1. Các căn cứ pháp lý về quản lý nhân sự 32 2.1.2. Cơ cấu tổ chức các cơ quan hành chính nhà nước 32 2.1.3. Các đối tượng tham gia vào hệ thống 32 2.1.4. Yêu cầu về các chức năng của hệ thống 33 2.1.5. Hệ thống mã hóa thông tin phục vụ xây dựng chương trình phân tán phục vụ thông tin nhanh về nhân sự tại Quảng Bình 34 2.2. THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 41 2.2.1. Mô hình tổng quát trong thiết kế CSDL phân tán 41 2.2.2. Phân mảnh dữ liệu 46 2.2.3. Cấp phát (chi phí phân bố các mảnh) 52 2.2.4. Xác định vị trí đặt cơ sở dữ liệu và phân nhóm người dùng 55 2.3. XỬ LÝ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 56 2.3.1. Khái niệm truy vấn 56 2.3.2. Các tầng của quá trình xử lý truy vấn phân tán 56 2.4. KIỂM SOÁT TÍNH TOÀN VẸN NGỮ NGHĨA 62 2.4.1. Kiểm soát toàn vẹn ngữ nghĩa tập trung 62 2.4.2. Kiểm soát toàn vẹn ngữ nghĩa phân tán 64 2.4.3. So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung và phân tán 67 CHƯƠNG 3. XÂY DỰNG CHƯƠNG TRÌNH PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 68 3.1. MÔ HÌNH CHỨC NĂNG CỦA HỆ THỐNG 68 3.1.1. Biểu đồ phân cấp chức năng 68 3.1.2. Biểu đồ luồng dữ liệu 68 3.2. TỐI ƯU HÓA TRUY VẤN PHÂN TÁN 70 3.2.1. Hàm chi phí 71 3.2.2. Số liệu thống kê cơ sở dữ liệu 72 3.2.3. Lực lượng của các kết quả trung gian 73 3.3. THUẬT TOAN TỐI ƯU HOA TRUY VẤN PHAN TAN SYSTEM R 75 3.4. ĐIỀU KHIỂN ĐỒNG THỜI PHÂN TÁN 78 3.4.1. Phân loại các cơ chế điều khiển đồng thời 79 3.4.2. Điều khiển đồng thời bằng khóa chốt 79 3.4.3. Thuật toán điều khiển đồng thời bằng dấu 83 3.4.4. Quản lý khóa gài 84 3.5. KIẾN TRÚC CHƯƠNG TRÌNH ỨNG DỤNG PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TỈNH QUẢNG BÌNH 86 3.5.1. Kiến trúc chương trình 86 3.5.2. Các chức năng của chương trình 92 3.6. CÀI ĐẶT VÀ THỬ NGHIỆM 98 KẾT LUẬN VÀ KIẾN NGHỊ 99 1. Kết quả đạt được 99 2. Hạn chế 100 3. Hướng phát triển đề tài 100 DANH MỤC TÀI LIỆU THAM KHẢO 101 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO).
Trang 12 Mục tiêu nghiên cứu 2
3 Đối tượng và phạm vi nghiên cứu 2
4 Phương pháp nghiên cứu 3
5 Bố cục luận văn 3
6 Tổng quan tài liệu nghiên cứu 3
CHƯƠNG 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN 4
1.1 MẠNG MÁY TÍNH 4
1.2 CƠ SỞ DỮ LIỆU PHÂN TÁN 6
1.2.1 Các khái niệm cơ bản về cơ sở dữ liệu phân tán 6
1.2.2 Hệ quản trị cơ sở dữ liệu phân tán (DDBMS) 7
1.2.3 Các điểm đặc trưng của cơ sở dữ liệu phân tán 8
1.2.4 Kiến trúc tham chiếu của cơ sở dữ liệu phân tán 10
1.2.5 Các loại truy xuất CSDL phân tán 13
1.3 CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN 14
1.3.1 Khái niệm tính trong suốt 14
1.3.2 Một số khía cạnh điển hình của tính trong suốt 14
1.4 PHÂN MẢNH VÀ CẤP PHÁT DỮ LIỆU 17
1.4.1 Phân mảnh dữ liệu 17
1.4.2 Cấp phát tài nguyên 23
2.5 GIAO DỊCH 28
2.5.1 Định nghĩa giao dịch 28
2.5.2 Tính chất của giao dịch 29
2.5.3 Phân loại giao dịch 30
CHƯƠNG 2 PHÂN TÍCH, THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 32
Trang 22.1.3 Các đối tượng tham gia vào hệ thống 32
2.1.4 Yêu cầu về các chức năng của hệ thống 33
2.1.5 Hệ thống mã hóa thông tin phục vụ xây dựng chương trình phân tán phục vụ thông tin nhanh về nhân sự tại Quảng Bình 34
2.2 THIẾT KẾ CƠ SỞ DỮ LIỆU PHÂN TÁN 41
2.2.1 Mô hình tổng quát trong thiết kế CSDL phân tán 41
2.2.2 Phân mảnh dữ liệu 46
2.2.3 Cấp phát (chi phí phân bố các mảnh) 52
2.2.4 Xác định vị trí đặt cơ sở dữ liệu và phân nhóm người dùng 55
2.3 XỬ LÝ TRUY VẤN TRONG CƠ SỞ DỮ LIỆU PHÂN TÁN 56
2.3.1 Khái niệm truy vấn 56
2.3.2 Các tầng của quá trình xử lý truy vấn phân tán 56
2.4 KIỂM SOÁT TÍNH TOÀN VẸN NGỮ NGHĨA 62
2.4.1 Kiểm soát toàn vẹn ngữ nghĩa tập trung 62
2.4.2 Kiểm soát toàn vẹn ngữ nghĩa phân tán 64
2.4.3 So sánh việc kiểm soát toàn vẹn ngữ nghĩa tập trung và phân tán 67
CHƯƠNG 3 XÂY DỰNG CHƯƠNG TRÌNH PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH 68
3.1 MÔ HÌNH CHỨC NĂNG CỦA HỆ THỐNG 68
3.1.1 Biểu đồ phân cấp chức năng 68
3.1.2 Biểu đồ luồng dữ liệu 68
3.2 TỐI ƯU HÓA TRUY VẤN PHÂN TÁN 70
3.2.1 Hàm chi phí 71
3.2.2 Số liệu thống kê cơ sở dữ liệu 72
3.2.3 Lực lượng của các kết quả trung gian 73
Trang 33.4.1 Phân loại các cơ chế điều khiển đồng thời 79
3.4.2 Điều khiển đồng thời bằng khóa chốt 79
3.4.3 Thuật toán điều khiển đồng thời bằng dấu 83
3.4.4 Quản lý khóa gài 84
3.5 KIẾN TRÚC CHƯƠNG TRÌNH ỨNG DỤNG PHÂN TÁN PHỤC VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TỈNH QUẢNG BÌNH 86
3.5.1 Kiến trúc chương trình 86
3.5.2 Các chức năng của chương trình 92
3.6 CÀI ĐẶT VÀ THỬ NGHIỆM 98
KẾT LUẬN VÀ KIẾN NGHỊ 99
1 Kết quả đạt được 99
2 Hạn chế 100
3 Hướng phát triển đề tài 100
DANH MỤC TÀI LIỆU THAM KHẢO 101 QUYẾT ĐỊNH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO).
Trang 4length(A i ) Chiều dài của thuộc tính Ai
card(R j ) Số các bộ của quan hệ Rj
CÁC TỪ VIẾT TẮT
Trang 5Bảng 1.1.
Bảng 2.3 Áp mã cho hệ thống cụ thể mã các sở, ngành
Trang 6Hình 1.1 Sự phân tán các cụm server trong hệ thống phục
Hình 3.4
Trang 7Hình 3.7 Biểu đồ khóa 2 pha nghiêm ngặt 81
Hình 3.14
Trang 8MỞ ĐẦU
1 Tính cấp thiết của đề tài
Về cơ cấu tổ chức, tỉnh Quảng Bình có 159 đơn vị hành chính cấp xã, 8huyện, thành phố và 20 sở, ban ngành là các cơ quan hành chính cấp tỉnhthuộc Ủy ban nhân dân tỉnh quản lý Sở Nội vụ là cơ quan chuyên môn, giúp
Ủy ban nhân dân tỉnh quản lý cán bộ, công chức, viên chức toàn tỉnh với 187đầu mối các cơ quan, ban, ngành Việc quản lý nhân sự được bố trí phân tántheo tổ chức và phân cấp quản lý đa tầng
Đến năm 2012, toàn tỉnh Quảng Bình có hơn 20.000 công chức, viênchức Đối với cấp xã, toàn tỉnh hiện có 3.300 cán bộ, công chức và 6.700người hoạt động không chuyên trách Như vậy, trong toàn tỉnh có gần 30.000
hồ sơ cán bộ, công chức, viên chức và những người hoạt động không chuyêntrách cần được quản lý
Hồ sơ cán bộ, công chức là tài liệu quan trọng có tính pháp lý phản ánhtrung thực về lý lịch của từng cá nhân cán bộ, công chức
Trên thực tế, công tác quản lý hồ sơ cán bộ, công chức bằng phươngpháp truyền thống (hồ sơ giấy) nói chung và hồ sơ điện tử về cán bộ, côngchức nói riêng thời gian qua chưa được quan tâm, chỉ đạo để thực hiện mộtcách đầy đủ và nghiêm túc Do vậy, khi các cơ quan Nhà nước có thẩm quyềnyêu cầu số liệu để phục vụ cho việc nghiên cứu hoạch định chính sách đối vớiđội ngũ cán bộ, công chức hoặc ra quyết định về nhân sự thì các cơ quanchuyên môn không cung cấp được hoặc nếu có thì bản thân số liệu đó lại lạchậu và thiếu chính xác, không đầy đủ và thường không kịp thời
Từ thực tế nêu trên, để đáp ứng yêu cầu về tính kịp thời, nâng cao chấtlượng và hiệu quả công cụ quản lý cán bộ, công chức chính quy và hiệnđại, cần thiết xây dựng cơ sở dữ liệu thông tin về cán bộ, công chức hành
Trang 9chính nhà nước của tỉnh Vì vậy, đề tài “Xây dựng cơ sở dữ liệu phân tánphục vụ thông tin nhanh về nhân sự tại Quảng Bình” được lựa chọn làhướng đi phù hợp với hệ thống quản lý đa tầng, phức tạp, phải xử lý theohướng phân tán mới giải quyết được yêu cầu bài toán; đồng thời hỗ trợthực hiện cải cách hành chính, hướng tới chính quyền điện tử là vấn đề tỉnhQuảng Bình đang quan tâm ưu tiên thực hiện trong giai đoạn hiện nay.
2 Mục tiêu nghiên cứu
Nghiên cứu lý thuyết cơ sở dữ liệu phân tán để xây dựng cơ sở dữ liệuphân tán giải quyết bài toán đã đặt ra Tập trung vào hai nội dung chính: tinhọc hóa trong công tác quản lý hành chính nhà nước và trợ giúp thông tin
huyện và xã; có khả năng mở rộng để kết nối với cơ sở dữ liệu Trung ươngtrong tương lai
3 Đối tượng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
- Lý thuyết hệ tin học phân tán; cơ sở dữ liệu phân tán
- Các công cụ, công nghệ được sử dụng để xây dựng cơ sở dữ liệu phântán theo mô hình giải pháp đã lựu chọn
- Hồ sơ cán bộ, công chức, viên chức tỉnh Quảng Bình
Trang 104 Phương pháp nghiên cứu
- Nghiên cứu lý thuyết:
+ Các văn bản quy phạm pháp luật hiện hành quy định về quản
lý cán bộ, công chức;
+ Các nguyên lý về cơ sở dữ liệu phân tán
- Nghiên cứu thực nghiệm:
+ Phân cấp, quy trình quản lý cán bộ, công chức, quản lý hồ sơcán bộ, công chức tại tỉnh Quảng Bình;
+ Cài đặt thực nghiệm cơ sở dữ liệu
5 Bố cục luận văn
Luận văn gồm có 3 chương, gồm:
Chương 1 Tổng quan về cơ sở dữ liệu phân tán
Chương 2 Phân tích, thiết kế cơ sở dữ liệu phân tán phục vụ thông tinnhanh về nhân sự tại Quảng Bình
Chương 3 Xây dựng chương trình phân tán phục vụ thông tin nhanh vềnhân sự tại Quảng Bình
6 Tổng quan tài liệu nghiên cứu
- Quy định hiện hiện hành của Nhà nước về quản lý cán bộ, công chức,viên chức và tình hình thực tế của địa phương;
- Hệ tin học phân phân tán; nguyên lý hệ cơ sở dữ liệu phân tán
- Ngôn ngữ lập trình Java và JSP
- Hệ quản trị cơ sở dữ liệu MySQL
Trang 11CHƯƠNG 1 TỔNG QUAN VỀ CƠ SỞ DỮ LIỆU PHÂN TÁN
Hệ cơ sở dữ liệu phân tán phục vụ thông tin nhanh về nhân sự tại QuảngBình là hệ thống hợp nhất quản lý từ cấp tỉnh đến tất cả các xã trực thuộchuyện, do dó cơ sở dữ liệu phục vụ quản lý phải hợp nhất và là tài nguyêndùng chung để khai thác hiệu quả về công tác quản lý nhân sự
Hệ thống có sự phân cấp khác nhau nhằm mục đích quản lý, tra cứu,thống kê và cập nhật thông tin một cách nhanh chóng, hiệu quả Trên cơ sở
đó, hệ quản lý phân cấp thành 3 cụm Server khác nhau và phân tán trên phạm
vi địa lý khác nhau Cụm thứ nhất quản lý nhân sự cấp sở, ban ngành tươngđương trực thuộc tỉnh Cụm thứ hai quản lý nhân sự cấp huyện, ở đây chủ yếuquản lý nhân sự các phòng trực thuộc huyện Cụm thứ ba quản lý nhân sự cấp
xã, công tác quản lý tập trung là các cán bộ có chức danh thuộc xã
Việc phân tán cơ sở dữ liệu và chương trình trên hệ thống 3 cụm Serverkhác nhau theo Hình 1 buộc phải có sự phân tích, thiết kế và vận hành hệ đảmbảo tính hoạt động ổn định và gắn bó trên hệ Bên cạnh đó, công tác quản lýcác luồng dữ liệu khai thác dùng chung là yếu tố sống còn của hệ, như vậy ta
có thể phân chia hệ thành hai thành phần cơ bản là mạng máy tính và cơ sở dữliệu phân tán
Trang 12- Một mạng máy tính là
một trường hợp đặc biệt của
môi trường xử lý phân tán,
thống phục vụ thông tin nhanh về nhân sự tại
Quảng Bình
Trang 131.2 CƠ SỞ DỮ LIỆU PHÂN TÁN
1.2.1 Các khái niệm cơ bản về cơ sở dữ liệu phân tán
Nguyên lý các hệ cơ
sở dữ liệu phân tán được
xây dựng dựa trên sự kết
hợp của hai hướng tiếp cận
đối với quá trình xử lý dữ
liệu đó là: lý thuyết hệ cơ
sở dữ liệu và công nghệ
mạng máy tính [4]
Một cơ sở dữ liệu
phân tán là một tập hợp
nhiều cơ sở dữ liệu có liên
đới logic và được phân bố
trên một mạng máy tính theo Hình 1.2
Mỗi vị trí có quyền tự quản cơ sở dữ liệu cục bộ của mình và thực thi cácứng dụng cục bộ Mỗi vị trí cũng phải tham gia vào việc thực thi ít nhất mộtứng dụng toàn cục mà yêu cầu truy xuất dữ liệu tại nhiều vị trí qua mạng.Định nghĩa này nhấn mạnh hai khía cạnh quan trọng của cơ sở dữ liệuphân tán:
- Tính phân tán: Dữ liệu thực tế không cư trú ở cùng một vị trí;
- Sự tương quan logic: Các dữ liệu có một số tính chất ràng buộc lẫnnhau
Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại Quảng Bình cócác đặc điểm về xử lý tại các cụm Server:
Cụm Server cấp xã: nhập liệu cán bộ, xử lý thông tin về cá nhân, thống
kê chuyển một phần thông tin về cán bộ mới cập nhật lên cụm Server cấp
Hình 1.2 Môi trường hệ cơ sở dữ liệu phân tán
Trang 14Cụm Server cấp huyện: nhập liệu cán bộ, xử lý thông tin về cá nhân,thống kê chuyển một phần thông tin về cán bộ mới cập nhật lên cụm Servercấp sở
Cụm Server cấp sở, ban ngành và tương đương: nhập liệu cán bộ, xử lýthông tin về cá nhân, thống kê thông tin về cán bộ, việc cập nhật chỉ tiến hànhcục bộ
1.2.2 Hệ quản trị cơ sở dữ liệu phân tán (DDBMS)
Hệ quản trị cơ sở dữ liệu phân tán là hệ thống phần mềm cho phép quản
lý các hệ cơ sở dữ liệu phân tán và làm cho việc phân tán trở nên trong suốtđối với người sử dụng [3]
Hệ quản trị cơ sở dữ liệu phân tán hỗ trợ việc tạo và bảo trì cơ sở dữ liệuphân tán, chúng có các thành phần tương tự như một hệ quản trị cơ sở dữ liệutập trung và các thành phần hỗ trợ trong việc chuyển tải dữ liệu đến các trạm
và ngược lại
Có ba kiểu kiến trúc DDBMS: Kiến trúc khách/đại lý, kiến trúc nganghàng; kiến trúc phức hệ
Hệ quản trị cơ sở dữ liệu phân tán được phân làm 2 loại :
- Cơ sở dữ liệu phân tán thuần nhất;
- Cơ sở dữ liệu phân tán hỗn tạp
về nhân sự tại Quảng Bình phải có:
- Quản trị dữ liệu: QTDL
- Truyền thông dữ liệu: TTDL
- Từ điển dữ liệu: TDDL dùng để mô tả thông tin về sự phân tán của dữliệu trên mạng
- Cơ sở dữ liệu phân tán: CSDLPT
Trang 15- Người sử dụng: NSD
Theo hình 1.3, người sử dụng tác động đến truyền thông dữ liệu để yêucầu nguồn thông tin mà mình mong muốn, các hoạt động bên trong hệ thốngngười dùng không quan tâm đến hay cần biết hiện nguồn dữ liệu đang nằm ở
vị trí nào Các kết nối để lựa chọn dữ liệu trên các cụm Server khác được thựchiện dựa trên thành phần là cơ sở dữ liệu phân tán
Hình 1.3 Các thành phần của cơ sở dữ liệu phân tán thông tin nhanh về nhân sự tại Quảng Bình
Trang 161.2.3 Các điểm đặc trưng của cơ sở dữ liệu phân tán
Cơ sở dữ liệu phân tán không đơn giản là việc phân tán các cơ sở dữ liệutập trung, nó cho phép thiết kế các hệ thống có các tính chất khác với hệthống tập trung truyền thống So sánh các tính chất đặc trưng của cơ sở dữliệu tập trung và cơ sở dữ liệu phân tán như sau:
và cơ sở dữ liệu phân tánTính chất đặc
Độc lập
dữ liệu
- Tổ chức dữ liệu trong suốtvới lập trình viên Cácchương trình được viết cócái nhìn “quan niệm” về dữliệu
- Ưu điểm: các chương trìnhkhông bị ảnh hưởng bởi sựthay đổi tổ chức vật lý của
dữ liệu
- Tính chất độc lập dữ liệu nhưtrong cơ sở dữ liệu tập trung
- Bổ sung tính chất trong suốtphân tán; tính đúng đắn của cácchương trình ứng dụng không bịảnh huởng bởi sự di chuyển dữliệu từ vị trí này đến vị trí khác
Trang 17- Tiết kiệm dung lượng nhớ.
- Giảm thiểu dư thừa dữ liệu đảm bảo tính gắn bó
- Nhân bản dữ liệu đến các địa điểm mà các ứng dụng cần đến,giúp việc thực thi các ứng dụngkhông dừng nếu có một địa điểm bị hỏng Tuy nhiên vấn
đề quản lý gắn bó dữ liệu sẽ phức tạp hơn
Các cấu trúc vật lý phức tạp giúp liên lạc dữ liệu trong cơ
Việc chọn lựa cơ sở dữ liệu phân tán sẽ thích hợp đối với các ứng dụngphát triển trong một hệ thống mạng diện rộng do cải tiến hiệu năng, giảmtranh chấp và giảm chi phí truyền bằng cách phân mảnh và phân tán dữ liệuhợp lý Đối với trường hợp xây dựng hệ thống phục vụ thông tin nhanh vềnhân sự tại Quảng Bình, việc lựa chọn cơ sử dữ liệu phân mảnh dọc là bài
Trang 18toán tối ưu cho ứng dụng quản lý, tra cứu và thống kê nhân sự tại tỉnh và đảmbảo hiệu năng khai thác sử dụng và giảm chi phí truyền.
1.2.4 Kiến trúc tham chiếu của cơ sở dữ liệu phân tán
Kiến trúc tham chiếu không được cài đặt rõ ràng trên tất cả cơ sở dữliệu phân tán, tuy nhiên các mức của nó được khái quát chính xác, thích hợp
để mô tả tổ chức chung cho mọi hệ cơ sở dữ liệu phân tán
- Lược đồ toàn cục: Mô tả tổng thể và thống nhất chung nhất của tất cả
dữ liệu của cơ sở dữ liệu phân tán độc lập với môi trường phân tán
- Lược đồ phân mảnh: Mỗi quan hệ toàn cục có thể được chia thành cácthành phần không trùng nhau được gọi là các phân mảnh Lược đồ phân mảnh
Trang 19định nghĩa ánh xạ giữa các quan hệ toàn cục và các phân mảnh Ánh xạ này làmột - nhiều: Một số mảnh tương ứng với một quan hệ toàn cục, nhưng chỉ
một quan hệ toàn cục tương ứng với một mảnh Ký hiệu Ri là mảnh thứ i của quan hệ toàn cục R.
- Lược đồ cấp phát: Các mảnh là các thành phần logic của các quan hệtoàn cục, được lưu trữ vật lý tại một hay một số vị trí Lược đồ cấp phát xácđịnh vị trí của một mảnh Kiểu ánh xạ định nghĩa trong lược đồ cục bộ xácđịnh cơ sở dữ liệu phân tán có dư thừa hay không Trong trường hợp ánh xạ làmột-nhiều thì nó dư thừa, ngược lại nếu ánh xạ có kiểu một-một thì nó không
dư thừa Tất cả các mảnh tương ứng với cùng một quan hệ toàn cục R và được lưu trữ tại vị trí j tạo thành ảnh vật lý của quan hệ R tại vị trí j Kí hiệu R j chỉ
ảnh vật lý của quan hệ toàn cục R tại vị trí j.
( R 1
2 chỉ một bản sao của mảnh R2 lưu trữ tại vị trí 1 )
Trang 20- Lược đồ ánh xạ cục bộ: Ánh xạ các hình ảnh vật lý tới các đối tượngđược thao tác bởi các hệ quản trị cơ sở dữ liệu cục bộ Trong hệ không thuầnnhất ta có các kiểu ánh xạ cục bộ khác nhau tại các vị trí khác nhau.
Ba đối tượng quan trọng nhất của kiến trúc này là sự tách biệt giữa sựphân mảnh dữ liệu và sự cục bộ hóa dữ liệu, điều khiển dư thừa dữ liệu vàtính độc lập ở các hệ quản trị cơ sở dữ liệu cục bộ
1.2.5 Các loại truy xuất CSDL phân tán
a Truy xuất từ xa thông qua các tác vụ cơ bản
Giáo dục và Đào tạo
thuộc huyện Lệ Thủy
Yêu cầu này sẽ được
DDBMS 1 xử lý, sau
khi xử lý xong,
chương trình tiếp tục
gửi yêu cầu truy xuất
CSDL gửi DDBMS2 xử lý và gửi đến vị trí chứa dữ liệu đó Thực hiện xong sẽ
gửi kết quả trả về (theo Hình 1.6)
Trang 21dụng đang yêu cầu Tại
Sở Nội vụ yêu cầu xem
lý lích trích ngang của Chủ tịch Hội đồng nhân dân từ cấp tỉnh đến cấp xã
Cụm Server 1 sau khi tiếp nhận yêu cầu, lập tức phái sinh chương trình phụ
trợ để lọc và trích xuất thông tin từ các cụm Server khác, các yêu cầu lập tức
xử lý nội bộ và gửi đến cụm Server 2 và cụm Server 2 chuyển tiếp yêu cầu đến cụm Server 3 Sau khi thực hiện xong các yêu cầu và các kết quả trả về,
chương trình phụ trợ sẽ tổng hợp lại và trả kết quả về cho người sử dụng
1.3 CÁC MỨC TRONG SUỐT CỦA CSDL PHÂN TÁN
1.3.1 Khái niệm tính trong suốt
Tính trong suốt là tính chất căn bản của hệ phân tán Tính trong suốt của
hệ phân tán được hiểu như là sự che khuất đi các thành phần riêng biệt của hệthống máy tính đối với người sử dụng và những người lập trình ứng dụng.Người sử dụng có quyền truy cập đến dữ liệu đặt tại một vị trí dữ liệu ở xamột cách tự động nhờ hệ thống mà không cần biết đến sự phân tán của tất cả
dữ liệu trên mạng Hệ thống tạo cho người dùng cảm giác là dữ liệu được coinhư đặt tại máy tính cục bộ của mình
Hình 1.7 Truy xuất từ xa thông qua chương trình phụ trợ
Trang 22Sự che khuất thông tin phụ thuộc hệ thống khỏi người dùng dựa trên việccân bằng giữa tính đơn giản và tính hiệu quả Đáng tiếc, hai tính chất nàyxung đột nhau Bởi vậy, mong muốn một mục tiêu trong suốt hoàn toàn làkhông thích hợp Hệ phân tán tốt là cố gắng đạt được tính trong suốt cao nhất
có thể được
1.3.2 Một số khía cạnh điển hình của tính trong suốt
Tính trong suốt thể hiện trong nhiều khía cạnh, dưới đây là một số khíacạnh điển hình nhất:
- Trong suốt phân đoạn
(trong suốt duyệt lại) theo
trưởng hệ thống theo chiều
dọc là tỷ lệ nghịch với sự tăng
trưởng hệ thống theo chiều
ngang Sự duyệt lại phần mềm
bị che khuất đối với người
dùng Khi dữ liệu đã được
phân mảnh thì việc truy cập
vào cơ sở dữ liệu được thực hiện như lúc chưa phân tán và không ảnh hưởngtới người sử dụng
- Trong suốt định vị
(trong suốt tên): theo Hình
1.9 người dùng không nhận
biết được vị trí của đối tượng
Đối tượng được định vị và chỉ
dẫn theo tên lôgic trong một
hệ thống thống nhất Trong
Trang 23suốt di trú (còn được gọi là độc lập định vị): là tính chất bổ sung vào trongsuốt định vị theo nghĩa không những đối tượng được chỉ dẫn bằng tên lôgic
mà đối tượng còn được di chuyển tới định vị vật lý khác mà không cần đổitên
Tính trong suốt định vị rất hữu ích, nó cho phép người sử dụng bỏ quacác bản sao dữ liệu đã tồn tại ở mỗi vị trí Do đó, có thể di chuyển một bảnsao dữ liệu từ vị trí này đến vị trí khác và cho phép tạo ra bản sao mới màkhông ảnh hưởng đến các ứng dụng
- Trong suốt đồng thời: cho phép chia sẻ đối tượng dùng chung khônggặp tranh chấp Nó tương tự như khái niệm phân chia thời gian theo nghĩakhái quát
- Trong suốt song song: cho phép các hoạt động song song mà ngườidùng không cần biết hoạt động song song đó xảy ra như thế nào, ở đâu và khinào Tính song song có thể không được người dùng đặc tả
Trang 24- Trong suốt truy nhập: Truy nhập đối tượng địa phương/toàn cục theocùng một cách thức Sự tách rời vật lý của các đối tượng hệ thống được chekhuất tới người dùng.
- Trong suốt lỗi: cung cấp khả năng thứ lỗi của hệ thống được hiểu là lỗitrong hệ thống có thể được biến đổi thành sự giảm hiệu năng hệ thống mộtcách mềm dẻo hơn chứ không phải chỉ là làm cực tiểu sự đổ vỡ và nguy hiểmđối với người dùng
- Trong suốt hiệu năng: cố gắng giành được tính gắn bó và khẳng định(không cần thiết ngang bằng) mức độ hiệu năng thậm chí khi thay đổi cấu trúc
hệ thống hoặc phân bố tải Hơn nữa, người dùng không phải chịu sự chậm trễhoặc thay đổi quá mức khi thao tác từ xa Trong suốt hiệu năng còn được thểhiện là hiệu năng hệ thống không bị giảm theo thời gian
- Trong suốt kích thước: liên quan đến tính mềm dẻo và tiềm tàng Nócho phép sự tăng trưởng của hệ thống được che khuất đối với người sử dụng.Kích thước hệ thống không tạo ra tác động đối với nhận thức của người dùng
Trang 25phân mảnh sẽ làm tăng mức độ hoạt động đồng thời và tăng lưu lượng hoạtđộng của hệ thống.
Tuy nhiên việc phân mảnh cũng thể hiện những hạn chế nhất định:
- Nếu ứng dụng có những yêu cầu “xung đột” ngăn cản phân rã thành các
mảnh được sử dụng độc quyền;
- Những ứng dụng có các khung nhìn được định nghĩa trên nhiều mảnh
khác nhau sẽ làm giảm hiệu suất hoạt động của hệ thống, làm tăng chiphí truy xuất dữ liệu đến các mảnh và tăng chi phí kết nối các mảnh;
- Việc kiểm soát ngữ nghĩa, đặc biệt là vấn đề kiểm tra tính toàn vẹn sẽ
khó khăn hơn
Đối với hệ thống phục vụ thông tin nhanh về nhân sự tại Quảng Bình,
dữ liệu được phân rã và phân tán trên 3 cụm Server khác nhau và với mức độyêu cầu tính chất về tra cứu, thống kê thông tin đối với bài toán quản lý nhân
sự được đặt ra tại tỉnh thì hệ thống phân mảnh dọc là thích hợp nhất với điềukiện hiện nay Nhưng với nhu cầu phát triển thì hệ thống có thể sử dụngphương pháp phân mảnh lai sẽ mang lại hiệu quả cao hơn trong việc xây dựngứng dụng và cơ sở dữ liệu phân tán Trong luận văn này, tôi giới thiệu cả baphương pháp phân mảnh nhưng giải pháp của bài toán là lựa chọn phân mảnhdọc, do đó các phương pháp phân tích, thiết kế tập trung vào phân mảnh này
sẽ được trình bày trong Chương 2
b Các quy tắc phân mảnh
Các nguyên tắc để đảm bảo cơ sở dữ liệu khi phân mảnh sẽ đảm bảo tínhkhông thay đổi về ngữ nghĩa Ba qui tắc phải tuân thủ khi phân mảnh cơ sở dữliệu quan hệ:
- Tính đầy đủ
Quan hệ R được phân rã thành các mảnh R1 , R 2, …, R n , thì mỗi mục dữ liệu có trong quan hệ R sẽ được chứa trong ít nhất một mảnh Ri (i=1, , n).
Trang 26Quy tắc này đảm bảo cho các mục dữ liệu trong R được ánh xạ hoàn toàn vào
các mảnh và không bị mất Mục dữ liệu có thể hiểu là bộ trong phân mảnhngang và thuộc tính trong phân mảnh dọc
Nếu quan hệ R được phân rã ngang thành các mảnh Ri , i = 1, ,n và mục
dữ liệu dj nằm trong một mảnh R j thì nó sẽ không nằm trong mảnh Rk , (k≠j).
Quy tắc này đảm bảo các mảnh phân rã rời nhau Trong trường hợp phânmảnh dọc, khóa chính của quan hệ phải được lặp lại trong tất cả các mảnh Vìvậy tính tách biệt trong phân mảnh dọc được hiểu không liên quan gì đếnkhóa chính của quan hệ
c Mức độ phân mảnh
Phân mảnh cơ sở dữ liệu đến mức độ nào là đủ để không làm ảnh hưởngđến hiệu năng của việc thực hiện truy vấn Mức độ phân mảnh có thể là phânmảnh một quan hệ chưa được phân mảnh, có thể phân mảnh các quan hệ đãđược phân mảnh Có thể phân mảnh theo chiều dọc hoặc theo chiều ngang.Một mức độ ứng phân mảnh thích hợp sao cho tránh được các hạn chếkhi phân mảnh chỉ được định nghĩa ứng với các ứng dụng sẽ chạy trên cơ sở
dữ liệu Trong hệ thống phục vụ thông tin nhanh về nhân sự tại Quảng Bình,
việc phân mảnh dọc sẽ thực hiện phân mảnh trên cụm Server 1 và cụm Server 2; các mảnh được phân dựa trên chi phí cập nhật và tra cứu để tối ưu đối với
ứng dụng được triển khai và chi phí đường truyền cũng như truy vấn trong hệ
d Các phương pháp phân mảnh
Phân mảnh ngang
Trang 27Chia quan hệ thành nhiều các nhóm bộ Kết quả của quá trình phân mảnhngang là các quan hệ con, số lượng quan hệ con phụ thuộc vào điều kiện ràngbuộc của các thuộc tính Các bộ trong các quan hệ con là tách biệt nhau Phânmảnh ngang thực chất là phép chọn quan hệ thỏa mãn một biểu thức điều kiêncho trước.
Có hai phương pháp phân mảnh ngang:
- Phân mảnh ngang nguyên thủy: Là phân mảnh ngang được thực
hiện trên các vị từ của chính quan hệ đó
- Phân mảnh ngang dẫn xuất: Là phân rã một quan hệ dựa trên các
Trong đó Fi là biểu thức đại số quan hệ Nếu Fi có dạng chuẩn hội, thì nó
là vị từ hội sơ cấp (mi)
Phân mảnh ngang Ri của quan hệ R gồm tất cả các bộ của R thoả một vị
từ hội sơ cấp mi Vì vậy, cho một tập M các vị từ hội sơ cấp, số lượng phân mảnh ngang của quan hệ R bằng số lượng các vị từ hội sơ cấp Tập các mảnh
ngang được gọi là tập các mảnh hội sơ cấp Định nghĩa phân mảnh ngang phụthuộc vào vị từ hội sơ cấp, vì vậy, cần phải xác định các vị từ đơn giản tạo ra
vị từ hội sơ cấp
Phân mảnh ngang dẫn xuất: dựa trên các quan hệ thành viên của một
đường nối theo phép toán chọn trên quan hệ chủ
Mục tiêu của phân mảnh ngang dẫn xuất là phân chia các quan hệ thànhviên thành các mảnh của quan hệ chủ được định nghĩa trên các thuộc tính củaquan hệ thành viên Vì vậy, liên kết giữa quan hệ chủ và quan hệ thành viênđược định nghĩa như là một nối bằng và nối bằng có thể được cài đặt nối nửa
i
Trang 28Cho một đường nối L, trong đó, Owner(L) = S và Member(L) = R Phân mảnh ngang dẫn xuất của R được định nghĩa như sau:
- Một quan hệ có thể có nhiều cách phân mảnh Chọn một lược đồ phânmảnh nào cho tối ưu phụ thuộc vào ứng dụng và cấp phát
- Phân mảnh dọc
Phân mảnh dọc quan hệ R sinh ra các mảnh R1, R2, , Rr, sao cho mỗi mảnh chứa một tập con các thuộc tính của quan hệ R và khoá của nó Mục đích của phân mảnh dọc là phân chia quan hệ R thành tập các quan hệ nhỏ
hơn để nhiều ứng dụng có thể chỉ cần thực hiện trên một mảnh Mảnh tối ưu
là mảnh sinh ra một lược đồ phân mảnh cho phép giảm tối thiểu thời gianthực hiện của ứng dụng trên mảnh đó
Kỹ thuật phân mảnh dọc phức tạp, vì số lựa chọn phân hoạch rất lớn
Trong phân mảnh ngang, nếu số vị từ đơn giản trong Pr là n, khi đó sẽ có 2 n
vị từ hội sơ cấp có thể được định nghĩa trên đó Mặt khác, một số vị từ hội sơcấp có thể mâu thuẫn với các phép kéo theo Vì vậy sẽ làm giảm số lượng cácmảnh dự tuyển cần được xem xét Trong trường hợp phân mảnh dọc, nếuquan hệ có m thuộc tính không phải là khoá chính, thì số mảnh có thể có là
B(m) ≈ ≅ m m
Để có được các lời giải tối ưu cho bài toán phân mảnh dọc, phải sử dụnghai phương pháp khám phá (Heuristic) cho phân mảnh dọc các quan hệ toàncục:
Trang 29(1) Nhóm thuộc tính: bắt đầu gán mỗi thuộc tính cho một mảnh và trong
mỗi bước, nối một số mảnh lại với nhau cho đến khi thỏa điều kiện
(2) Tách mảnh: bắt đầu bằng một quan hệ và quyết định cách phân chia
dựa trên hành vi truy nhập của các ứng dụng trên các thuộc tính
Kỹ thuật tách mảnh thích hợp với phương pháp thiết kế từ trên xuống.Các mảnh không gối chồng lấn lên nhau (không phải là khoá chính) Ngượclại, với phương pháp nhóm thuộc tính thường tạo ra các mảnh gối chồng lênnhau Trong các hệ CSDL phân tán, các mảnh không gối chồng lên nhau đượcquan tâm, nghiên cứu
Việc nhân bản các thuộc tính khóa tại mỗi trạm sẽ bảo đảm tính toàn vẹnngữ nghĩa và làm giảm quá trình trao đổi dữ liệu
Thông tin cần thiết của phân mảnh dọc:
Ma trận giá trị sử dụng thuộc tính: Gọi Q = {q1, q2, , qq} là tập các câu
truy vấn của người dùng hay còn gọi là các ứng dụng của người sử dụng sẽ
thực hiện trên quan hệ R(A1, A2,…, An) Khi đó ma trận giá trị sử dụng thuộc tính có q hàng và n cột Các phần tử được ký hiệu là giá trị câu truy vấn qi , i=1 q sử dụng thuộc tính Aj , j=1 n, ký hiệu là use(qi, Aj) được định
nghĩa như sau:
Use(qi,Aj) =
i=1 q và j=1 n
1 Nếu truy vấn qi tham chiếu thuộc tính Aj
0 Nếu qi không tham chiếu thuộc tính Aj
Ma trận hấp dẫn của thuộc tính: Hầu hết các thông tin cho phân mảnh
dọc có mối quan hệ mật thiết với các ứng dụng Các thuộc tính thường đượctruy nhập chung với nhau, cần phải định nghĩa một giá trị để chỉ ra mức độliên hệ giữa các thuộc tính, được gọi là sự hấp dẫn của thuộc tính
Số đo hấp dẫn giữa hai thuộc tính Ai , A j của quan hệ R(A1 , A 2 , …, A n ) ứng với tập ứng dụng Q = {q1 , q 2 , …, q q} được định nghĩa như sau:
Trang 30Trong đó, refl(qk) là số truy xuất các thuộc tính (A i , A j ) cho qk tại vị trí
Sl và accl (qk) là số đo tần số truy xuất ứng dụng qk tại vị trí Sl Kết quả tính toán là một ma trận vuông cấp nxn, phần tử (i, j) là số đo sự hấp dẫn của các thuộc tính Ai , A j.
Để nhóm các thuộc tính của một quan hệ dựa trên các giá trị hấp dẫn
thuộc tính trong AA, sử dụng thuật toán năng lượng nối Thuật toán BEA nhận
nguyên liệu là một ma trận hấp dẫn thuộc tính, hoán vị các hàng và các cột rồisinh ra một ma trận hấp dẫn tụ, hoán vị được thực hiện sao cho số đo hấp dẫnchung là lớn nhất
- Phân mảnh hỗn hợp
Trong thực tế, hầu hết các
trường hợp phân mảnh ngang hay
phân mảnh dọc của CSDL không
thoả mãn yêu cầu người sử dụng
Thường CSDL được phân mảnh dọc
sau đó phân mảnh ngang, tạo ra sự
phân chia theo cấu trúc cây Chiến
lược phân mảnh này gọi là phân
mảnh lai, hay phân mảnh trộn, hay
phân mảnh lồng
Tính đúng đắn của phân mảnh hỗn hợp được đảm bảo, vì chiến lượcphân mảnh này dựa theo phân mảnh ngang và phân mảnh dọc, đảm bảo tínhđúng đắn như đã trình bày Để khôi phục quan hệ toàn cục trong trường hợpphân mảnh hỗn hợp, có thể bắt đầu từ các node lá của của cây phân hoạch vàdịch chuyển lên bằng cách thực hiện các phép kết nối và phép hợp Phân
Trang 31mảnh hỗn hợp đầy đủ nếu các mảnh lá và các mảnh trung gian là đầy đủ Cóthể kiểm tra tính tách biệt của chiến lược phân mảnh hỗn hợp Tính tách biệtđược đảm bảo khi các mảnh lá và mảnh trung gian cũng tách biệt.
1.4.2 Cấp phát tài nguyên
a Phát biểu Bài toán cấp phát tài nguyên
Giả sử có một tập các mảnh F={F1 , F 2 , , F n} và một mạng bao gồm các
vị trí S={S1 , S 2 , , S m} trên đó có một tập các ứng dụng Q={q1 , q 2 , , q q} đang chạy Bài toán cấp phát tìm một phân phối “tối ưu” của F cho S.
Tính tối ưu có thể được định nghĩa ứng với hai số đo:
- Chi phí nhỏ nhất: Hàm chi phí có chi phí lưu mảnh Fi vào vị trí Sj, chi phí truy vấn mảnh Fi vào vị trí Sj, chi phí cập nhật Fi tại tất cả mọi vị trí có
chứa nó và chi phí tryền dữ liệu Bài toán cấp phát cố gắng tìm một lược đồcấp phát với hàm chi phí tổ hợp nhỏ nhất
- Hiệu năng: Chiến lược cấp phát được thiết kế nhằm duy trì một hiệuquả lớn đó là hạ thấp thời gian đáp ứng và tăng tối đa lưu lượng hệ thống tạimỗi vị trí
Để bài toán đơn giản, giả sử rằng:
(1) Tập các ứng dụng Q chỉ có khả năng truy vấn chỉ đọc và cập nhật trên mảnh Fk, bao gồm các đại lượng sau:
T = {t1 , t 2 , …, t m}, với ti là lưu lượng chỉ đọc tại S i cho Fk, và
U = {u 1 , u 2 , …, u m }, với u i là lưu lượng cập nhật tại S i cho Fk.
(2) Giả sử C(T) = {c12 , c 13 , …, c 1m , …, c m-1 m }, với c ij là chi phí truyền một đơn vị cho các yêu cầu chỉ đọc giữa vị trí Si và S j là không thay đổi.
Chi phí cập nhật và chỉ đọc ký hiệu là:
cho các yêu cầu cập nhật giữa các vị trí Si và S j.
(3) Gọi chi phí lưu trữ mảnh Fk tại vị trí S i là di
Trang 32Ký hiệu D = {d1 , d 2 , …, d m } là chi phí lưu trữ mảnh F k tại mọi vị trí.
(4) Giả sử không có ràng buộc về khả năng lưu trữ tại các vị trí hoặc chođường truyền Khi đó, bài toán cấp phát có thể được đặc tả như là một bàitoán cực tiểu hoá chi phí, trong đó tìm tập I S các nơi lưu trữ các bản sao của
các mảnh
Ký hiệu xj là biến quyết định chọn nơi đặt sao cho:
xj = 1 Nếu mảnh Fk được đặt tại vị trí Sj
0 trong trường hợp ngược lạiKhi đó đặc tả chính xác như sau:
Số hạng thứ nhất tương ứng với chi phí truyền các cập nhật đến các vị trí
có lưu trữ bản sao của mảnh và với chi phí thực hiện các yêu cầu chỉ đọc tại
vị trí đó nhưng với chi phí truyền dữ liệu nhỏ nhất
Số hạng thứ hai của hàm tính tổng chi phí lưu tất cả các bản sao củamảnh
Bài toán cấp phát tổng quát có độ phức tạp là NP-đầy đủ Vì thế cácnghiên cứu đã được dành cho việc tìm ra các thuật giải heuristic tốt để có lờigiải gần tối ưu
b Thông tin cần thiết cho bài toán cấp phát
Ở giai đoạn cấp phát, chúng ta cần các thông tin định lượng về cơ sở dữliệu, về các ứng dụng chạy trên đó, về cấu trúc mạng, khả năng xử lý và giới
Trang 33hạn lưu trữ của mỗi vị trí trên mạng.
- Thông tin về CSDL: Để thực hiện việc phân mảnh ngang, cần định
nghĩa độ tuyển hội sơ cấp
Ký hiệu là seli (F j ) là độ tuyển của mảnh F j ứng với truy vấn qi ; là số lượng các bộ Fj được truy nhập để xử lý qi.
Kích thước của một mảnh Fj được định nghĩa:
size(F j ) = card(F j ) * length(F j ), (1.4)
Trong đó length(Fj ) là chiều dài (byte) của một bộ trong mảnh F j.
- Thông tin về ứng dụng:
Ký hiệu là RRij là số truy nhập đọc do truy vấn qi thực hiện trên mảnh Fj.
Ký hiêu URij tương ứng với RRij là các truy nhập cập nhật
Định nghĩa hai ma trận UM và RM với các phần tử tương ứng uij và rijđược đặc tả tương ứng như sau:
uij = 1 Nếu truy vấn qi có cập nhật mảnh Fj
0 trong trường hợp ngược lại
0 trong trường hợp ngược lại
Một vectơ O gồm các giá trị o(i) mô tả vị trí đưa ra câu truy vấn qi.
- Thông tin về vị trí: Với mỗi vị trí (trạm) chúng ta cần biết về khả năng
lưu trữ và xử lý của nó Những giá trị này có thể tính được bằng các hàmthích hợp hoặc bằng các phương pháp đánh giá đơn giản Chi phí đơn vị để
lưu trữ dữ liệu tại trạm Sk được ký hiệu là USCk Chi phí xử lý một công việc tại vị trí Sk là LPCk Đơn vị công việc phải giống với đơn vị của RR và UR.
- Thông tin về mạng: Giả sử tồn tại một mạng đơn giản, chi phí để truyền
Trang 34được định nghĩa theo đơn vị khung dữ liệu Ký hiệu gij là chi phí truyền một khung giữa hai vị trí Si và Sj Hàm fsize tính được kích thước (byte) của một
khung dữ liệu
c Mô hình cấp phát
Mục tiêu của mô hình cấp phát là giảm tối thiểu tổng chi phí xử lý và lưutrữ, đáp ứng các đòi hỏi về thời gian đáp ứng
Mô hình có dạng: min(Total Cost)
Ứng với ràng buộc thời gian đáp ứng, ràng buộc lưu trữ, ràng buộc xử
lý Biến quyết định xij được định nghĩa là:
xij = 1 Nếu mảnh Fi được lưu tại vị trí Sj
0 trong trường hợp ngược lại
(Tổng chi phí lưu tại tất cả vị trí cho mọi mảnh)
- Chi phí xử lý truy vấn cho ứng dụng qi là:
Trang 35lý như nhau Ký hiệu tổng cho biết tổng các truy nhập cho tất cả các mảnh
được qi tham chiếu Nhân với LPCk sẽ cho chi phí truy nhập tại vị trí Sk Nhân
x jk cho các giá trị chi phí các vị trí lưu các mảnh.
Hàm chi phí truy nhập của việc xử lý một câu truy vấn bao gồm việcphân rã thành các tập con truy vấn Mỗi truy vấn con hoạt tác trên một mảnhđược lưu tại vị trí đó Tiếp theo là truyền kết quả về vị trí đã đưa ra truy vấn
Ở đây mô hình cấp phát sẽ bỏ qua các vấn đề phức tạp của xử lý truy vấn
Thành phần cập nhật của hàm truyền dữ liệu:
- Số hạng thứ nhất trong TCR biểu diễn chi phí truyền yêu cầu chỉ đọc
đến những vị trí có bản sao của mảnh cần truy nhập
- Số hạng thứ hai là truyền các kết quả từ trạm này đến trạm yêu cầu.Phương trình này khẳng định rằng trong số các trạm có bản sao của cùng mộtmảnh, chỉ trạm sinh ra tổng chi phí truyền thấp nhất mới được chọn để thựchiện thao tác này
Hàm chi phí truyền cho truy vấn qi được tính:
Trang 36TC i = TCU i + TCR i (1.12)
- Ràng buộc thời gian đáp ứng
Là ràng buộc về thời gian thực thi của qi ≤ thời gian đáp ứng lớn nhất
của qi , ∀ q i ∈ Q Thường đặc tả số đo chi phí của hàm theo thời gian, vì đặc tả
đơn giản ràng buộc thời gian thực thi
≤ khả năng lưu trữ tại vị trí Sk , ∀ S k ∈ S (1.13)
và gây ra một dịch chuyển trạng thái trên cơ sở dữ liệu đó
Một giao dịch luôn phải kết thúc ngay cả khi có xảy ra sự cố Giaodịch hoàn thành tác vụ gọi là giao dịch ủy thác, giao dịch phải dừng lạikhi chưa hoàn thành gọi là hủy bỏ
Trang 372.5.2 Tính chất của giao dịch
Giao dịch có bốn tính chất là: tính nguyên tử, tính gắn bó, tính biệtlập và tính bền vững; chúng được gọi chung là tính ACID của giao dịch
Tính nguyên tử liên quan đến sự kiện là một giao dịch được xử lý
như một đơn vị hoạt tác Các hành động của giao dịch, hoặc tất cả đềuhoàn tất hoặc không một hành động nào được thực hiện
Tính gắn bó của một giao dịch là tính đúng đắn của nó Một giao
dịch là một chương trình đúng đắn, ánh xạ cơ sở dữ liệu từ trạng thái gắn
bó này sang trạng thái gắn bó khác Xác định giao dịch gắn bó là vấn đềđiều khiển dữ liệu ngữ nghĩa, việc đảm bảo tính gắn bó là mục tiêu củacác cơ chế điều khiển đồng thời
Phân loại tính gắn bó nhóm các cơ sở dữ liệu thành bốn mức độ.Định nghĩa dữ liệu rác là giá trị dữ liệu đã được cập nhật bởi một giaodịch trước khi nó ủy thác
"Độ 3: Giao dịch T thỏa gắn bó độ 3 nếu:
1 T không ghi đè lên dữ liệu rác của các giao dịch khác
2 T không ủy thác bất kỳ thao tác ghi nào cho đến khi nó hoànthành mọi thao tác ghi
3 T không đọc dữ liệu rác của các giao dịch khác
4 Các giao dịch khác không làm cho dữ liệu T đã đọc trước khihoàn tất trở thành dữ liệu rác
Độ 2: Giao dịch T thỏa gắn bó độ 2 nếu:
1 T không ghi đè lên dữ liệu rác của các giao dịch khác
2 T không ủy thác bất kỳ thao tác ghi trước EOT
3 T không đọc dữ liệu rác của các giao dịch khác
Độ 1: Giao dịch T thỏa gắn bó độ 1 nếu:
1 T không ghi đè lên dữ liệu rác của các giao dịch khác
Trang 382 T không ủy thác bất kỳ thao tác ghi trước EOT.
Độ 0: Giao dịch T thỏa gắn bó độ 0 nếu:
1 T không ghi đè lên dữ liệu rác của các giao dịch khác.”
Tính biệt lập đòi hỏi mỗi giao dịch phải luôn nhìn thấy cơ sở dữ liệu
gắn bó
Tính bền vững bảo đảm một khi giao dịch ủy thác, kết quả của nó
được duy trì cố định và không bị xóa ra khỏi cơ sở dữ liệu
2.5.3 Phân loại giao dịch
Các giao dịch được phân loại dựa trên một số tiêu chuẩn:
- Phân loại giao dịch theo thời gian hoạt động của giao dịch: giaodịch được phân theo kiểu trực tuyến (được đặc trưng bởi thời gian thựcthi, đáp ứng rất ngắn, truy xuất một phần cơ sở dữ liệu nhỏ), hay theokiểu lô (đặc trưng bởi thời gian thực thi, lớn hơn, truy xuất cơ sở dữ liệukhá lớn)
- Phân loại giao dịch theo việc tổ chức các hành động đọc và ghi:+ Mô hình tổng quát: hành động đọc, ghi không theo bất kỳ một thứ
Trang 39+ Giao dịch phẳng có một khởi điểm duy nhất và một điểm kết thúcduy nhất.
+ Giao dịch lồng cho phép một giao dịch chứa những giao dịch khácvới điểm bắt đầu và ủy thác của chúng Những giao dịch được đặt vàotrong giao dịch khác được gọi là giao dịch con
Begin_transaction {1}
Begin_transaction {2}
end {2}
Begin_transaction {3}
end {3}
VỤ THÔNG TIN NHANH VỀ NHÂN SỰ TẠI QUẢNG BÌNH2.1 MÔ TẢ YÊU CẦU
2.1.1 Các căn cứ pháp lý về quản lý nhân sự
Căn cứ Nghị định số 29/2012/NĐ-CP ngày 12/4/2012 của Chínhphủ về tuyển dụng, sử dụng và quản lý viên chức; Thông tư số 11/2012/TT-BNV ngày 17/12/2012 của Bộ Nội vụ quy định chế độ báo cáo thống
kê và quản lý hồ sơ công chức; cơ quan có thẩm quyền quản lý, sử dụngcông chức có thẩm quyền quản lý hồ sơ cán bộ, công chức, viên chứccủa cơ quan, đơn vị mình Quyết định Số 13/2012/QĐ-UBND ngày04/7/2012 của UBND tỉnh Quảng Bình ban hành quy định phân cấp về
Trang 40tuyển dụng, sử dụng và quản lý viên chức thuộc thẩm quyền quản lý củaUBND tỉnh.
2.1.2 Cơ cấu tổ chức các cơ quan hành chính nhà nước
Tỉnh Quảng Bình hiện có 20 sở, ban, ngành cấp tỉnh và 08 huyện,thành phố Mỗi cơ quan cấp tỉnh có từ 05 đến 32 phòng trực thuộc; Mỗihuyện, thành phố có 13 phòng trực thuộc và có từ 15 đến 30 xã
Hình 2.1 Cơ cấu tổ chức bộ máy các cơ quan hành chính Quảng Bình
2.1.3 Các đối tượng tham gia vào hệ thống
Các đối tượng tham gia sử dụng gồm: Sở Nội vụ; Các sở, ban,ngành thuộc Ủy ban nhân dân tỉnh; Phòng Nội vụ các huyện, thành phố;
Ủy ban nhân dân cấp xã
Cơ sở dữ liệu phân tán về nhân sự tỉnh Quảng Bình được sử dụngtrong khối cơ quan hành chính nhà nước Hồ sơ cán bộ, công chức mỗi
cơ quan, đơn vị là một cơ sở dữ liệu cục bộ
Sở Nội vụ là cơ quan chuyên môn thuộc Ủy ban nhân dân tỉnh, thammưu, giúp Ủy ban nhân dân tỉnh thực hiện chức năng quản lý Nhà nước
về Tổ chức bộ máy; biên chế các cơ quan hành chính, sự nghiệp Nhànước; cán bộ, công chức, viên chức Nhà nước, cán bộ, công chức xã,phường, thị trấn Do vậy, Sở Nội vụ có quyền truy vấn (xem) được tất cảcác thông tin của các cơ sở dữ liệu địa phương
Mỗi cơ quan (các sở, ngành, UBND cấp huyện) có quyền truy vấn
Cấp huyện:
08 UBND huyện, Thành phố
Cấp tỉnh:
20 sở, ban, ngành
Tỉnh Quảng Bình
Cấp xã:
159 UBND
xã, phường, thị trấn