Tổng quan về cơ chế then cài: Khi có nhiều giao tác đang được thực thi đồng thời trên những tiến trìnhkhác nhau trong những bộ xử lý khác nhau, một số cơ chế là cần thiết để giữchúng khô
Trang 1ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA
NHỮNG ĐIỂM CẦN CẢI TIẾN
Giáo viên hướng dẫn: PGS TS Lê Văn Sơn Học viên thực hiện: Hồ Phước Duy
Đà Nẵng, 07/2014
Trang 2LỜI MỞ ĐẦU
Ngày nay cùng với sự phát triển nhanh, vượt bậc của nền Khoa học - Công nghệ Mạng máy tính ra đời làm cho thế giới của chúng ta dường như nhỏ lại và mọi người trở nên gần nhau hơn và mọi người có thể trao đổi thông tin với một khối lượng lớn và khoảng cách xa hơn với thời gian nhanh hơn Trên thực tế, một
xu hướng kỹ thuật mới ra đời - xu hướng phân tán các thành phần tạo nên hệ tin học theo hướng tiếp cận nơi sử dụng và sản xuất thông tin trên cơ sở mạng máy tính Vì vậy nếu chúng ta ngồi trước máy vi tính có nối mạng (LAN, WAN, Internet,
…) thì hầu như chúng ta có được mọi thứ Chúng ta có thể trao đổi thông tin, quản
lý toàn bộ nhân sự của một đơn vị với nhiều chi nhánh trên toàn quốc hoặc ở các quốc gia khác nhau, chúng ta có thể ở nhà để đăng ký vé máy bay, vé tàu xe, mua hàng tại siêu thị, thanh toán tiền qua hệ thống E-Banking của ngân hàng, … Song
để khai thác có hiệu quả hệ thống, vấn đề quan trọng là chiến lược khai thác và sử dụng các tài nguyên dùng chung như thế nào ? Chiến lược khai thác các tài nguyên dùng chung này là chức năng cũng như đối tượng nghiên cứu của các hệ tin học phân tán Trong thực tế, hệ tin học phân tán với những nguyên lý, phương pháp của
nó đã và đang được nhiều người quan tâm để có thể vận dụng trong quá trình tác nghiệp của mình Hiện tại, các nội dung mang tính lý thuyết nguyên lý của hệ tin học phân tán còn nhiều vấn đề chưa được giải quyết triệt để và đang là mục tiêu khám phá của nhiều nhà nghiên cứu về công nghệ thông tin.
Trong phạm vi của bài tiểu luận này, với những kiến thức mà tôi đã được học, đọc cũng như tự tìm hiểu thêm từ sách báo và mạng Internet, tôi xin trình bày hai nội dung theo trình tự như sau:
Phần I: Điều khiển đồng thời bằng cơ chế then cài
Phần II: Bài toán sử dụng bộ quản lý khoá cơ bản và những điểm cần cải
tiến
Với một lĩnh vực còn mới mẻ, đa dạng và phức tạp như trên vì vậy việc tìm hiểu của tôi còn nhiều hạn chế Kính mong nhận được sự góp ý, định hướng của Thầy giáo Lê Văn Sơn và các bạn cùng lớp để tôi có thể tiếp tục nghiên cứu và đạt được kết quả tốt hơn trong thời gian tới.
Xin chân thành cảm ơn !
Trang 3PHẦN I ĐIỀU KHIỂN ĐỒNG THỜI BẰNG CƠ CHẾ THEN CÀI
I Tổng quan về cơ chế then cài:
Khi có nhiều giao tác đang được thực thi đồng thời trên những tiến trìnhkhác nhau (trong những bộ xử lý khác nhau), một số cơ chế là cần thiết để giữchúng không cho xâm nhập vào các tiến trình khác Thuật toán điều khiển đồngthời được sử dụng rộng rãi nhất là then cài Trong trường hợp đơn giản nhất, khimột tiến trình cần đọc hay ghi một tập tin giống như một nhiệm vụ của giao tác,thì trước tiên nó phải khoá (cài then) tập tin đó Then cài có thể được dùng nhưmột bộ quản lý khoá tập trung riêng lẽ, hay với một bộ quản lý khoá cục bộ trêntừng máy để quản lý các tập tin cục bộ Trong cả hai trường hợp, bộ quản lý khoábao gồm một danh sách các tập tin bị khoá, và từ chối tất cả mọi cố gắng cài thentập tin mà tập tin đó đã thật sự bị khoá bởi một tiến trình khác Khoá được sinh ra
và được giải thoát một cách tự động bởi hệ thống các giao tác, không phụ thuộcvào hành động của lập trình viên
Sự sắp xếp cơ bản này là hạn chế quá mức và có thể được cải tiến bằng cáchphân biệt khoá đọc và khoá ghi Nếu một khoá đọc được cài đặt trên một tập tin,những khoá đọc khác được chấp nhận Khoá đọc được cài đặt để làm chắc chắnrằng tập tin sẽ không thay đổi, nhưng nó không có lý do nào để ngăn cấm nhữnggiao tác khác không được đọc những tập tin này Ngược lại, khi một tập tin bị khoáquyền ghi, không có bất kỳ loại khoá nào khác được chấp nhận Như vậy, khoá đọc
bị chia sẽ, nhưng khoá ghi chỉ là duy nhất
Để đơn giản, chúng ta giả sử rằng một đơn vị của then cài là một tập tinhoàn chỉnh Trong thực tế, nó có thể là một mục nhỏ, giống như một bản ghi riêng
lẻ hay một trang riêng lẻ, hoặc có thể là một mục lớn, giống như một cơ sở dữ liệuhoàn chỉnh Vấn đề về độ quy mô của mục để khoá được gọi là tính chất của thencài
Ví dụ: Bằng cách không cần đánh dấu một tiến trình mà tiến trình đó muốn
dùng phần cuối cùng của tập tin chỉ bởi vì có một vài tiến trình khác đang sử dụngphần đầu Nói theo cách khác, một cơ chế cài then tốt đòi hỏi có nhiều khoá, lànhiều tốn kém và có nhiều khả năng dẫn đến sự bế tắc
II Cơ chế then cài:
Một giao dịch nào đó đang thực hiện phép then cài trên một đối tượng muốndành quyền sử dụng đối tượng này theo một vài kiểu truy cập nhất định Cơ chếthen cài gán hay không gán quyền truy cập này căn cứ vào qui tắc tiền định nhưloại trừ tương hỗ, luật đọc – hiệu chỉnh thông tin…
Nếu quyền được thừa nhận thì đối tượng bị cài then bởi giao dịch Nếukhông, tiến trình thực hiện giao dịch bị khóa và đối tượng không bị cài then
Cơ chế then cài cho phép một giao dịch có thể giải phóng đối tượng mà nó
đã cài then
Trang 41 Loại trừ tương hỗ:
Một trong những giải pháp đơn giản để đạt được trật tự hoá gắn bó thể hiện ởchổ bắt buộc phải sử dụng trật tự hoá tuần tự Để làm việc đó, toàn bộ giao dịch
được đặt trong cặp hàm nguyên thuỷ mo_giaodich và dong_giaodich Đây là sự
đảm bảo cho việc loại trừ tương hỗ giữa các giao dịch
Nếu ta biết trước các đối tượng được xử lý bởi một giao dịch nào đó, thì ta cóthể cài then công việc truy cập đến các đối tượng Điều đó chỉ cho phép thực hiệnsong song đối với các giao dịch truy cập vào các đối tượng rời rạc
Nếu ta muốn nâng cao hơn nữa khả năng sử dụng song song, thì cần phảithực hiện cài then ở mức độ thấp hơn mức giao dịch
2 Then cài chọn lựa các đối tượng:
Các quy tắc truy cập đối tượng được chú ý Đó là tính hợp thức của việc truycập Nội dung của quy tắc này như sau:
Một giao dịch thay đổi giá trị của đối tượng phải loại trừ tất cả các đối tượng khác muốn truy cập, ngược lại thì việc truy cập được tiến hành theo kiểu tương tranh.
Để đảm bảo điều đó luôn luôn được thực hiện, người ta cho phép tiến hànhcài then một đối tượng trước khi việc sử dụng nó có hiệu lực
Một giao dịch có thể thực hiện ba hàm nguyên thuỷ trên đối tượng e:
1 v_doc(e) Sử dụng khi muốn có được quyền đọc e theo
kiểu chia sẽ
2 v_viet(e) Sử dụng khi muốn có được quyền đọc và viết
vào e theo kiểu loại trừ.
3 giai_phong(e) Giải phóng đối tượng e Giả sử trước đó đã được
cài then bởi cùng giao dịch này
Một giao dịch gọi là phát triển nếu:
+ Một phép toán chỉ được thực hiện trên một đối tượng sau khi đối tượng đó
đã được cài then bởi giao dịch theo kiểu tương thích với phép toán
+ Không có giao dịch nào cài then được trên đối tượng mà trước đó đã bị càithen cũng bởi chính giao dịch đó, ngoại trừ theo kiểu loại trừ trong trường hợptrước đó đã sử dụng kiểu chia sẽ
+ Sau khi chấm dứt một giao dịch, không có đối tượng nào bị cài then
Các then cài được sử dụng để hạn chế một lớp các trật tự hoá có khả năngđược thực hiện
Một trật tự hoá được gọi là hợp thức nếu:
+ Đối tượng được một giao dịch cài then theo kiểu chia sẽ không bị bất cứthen cài nào theo kiểu loại trừ của các giao dịch khác
+ Một đối tượng bị cài then theo kiểu loại trừ thì không bị bất kỳ then cài mớinào nữa
Do vậy, mọi cố gắng cài then không phù hợp với các điều kiện tương hỗ nêutrên đều phải chờ (bị làm chậm lại) cho đến khi mở then
Trang 5Chú ý: Một giao dịch được gọi là tốt, nếu nó sử dụng các then cài phù hợp
với đặc điểm của chúng Một trật tự hoá được gọi là hợp thức, nếu các then càihoạt động phù hợp với các đặc điểm này
3 Giao dịch 2 pha:
Xem xét một giao dịch hình thành hợp thức bằng cách kiểm tra hai điều kiện:
+ Toàn bộ đối tượng bị cài then vẫn ở trong tình trạng cài then cho đến cuối giao dịch.
+ Không có then cài nào có thể diễn ra tiếp theo một then cài khác trong cùng một giao dịch.
Điều kiện này thể hiện ở chổ là dãy các phép toán trên các then cài được phântích thành hai pha nối tiếp nhau Một pha mà trong đó các đối tượng bị cài then,còn pha kia chúng được mở then
Toàn bộ trật tự hoá hợp thức của một tập hợp các giao dịch hình thành tốt haipha là gắn bó, có nghĩa là cùng hiệu ứng với trật tự hoá tuần tự
Ngược lại, nếu các giao dịch của một tập hợp không phải là hình thành tốt và
ở hai pha thì có thể xây dựng các trật tự hoá hợp thức của M là không gắn bó.
Để hiểu rõ hơn, ta xem xét các ví dụ sau
Ví dụ 1:
Hãy truy cập vào tập hợp các đối tượng
Giả sử rằng ta muốn đọc các giá trị của một tập hợp các đối tượng và quy ướcrằng các giá trị này kiểm tra các ràng buộc toàn vẹn Lúc này, ta cần phải cài thentheo kiểu chia sẽ cho mỗi một đối tượng trước khi đọc, mở then diễn ra ở cuối củagiao dịch này Một phép như vậy gọi là đọc gắn bó của tập hợp các đối tượng.Như thế, giao dịch được thể hiện như sau:
là giao dịch đọc gắn bó của tập hợp {a,b,c}
Ví dụ 2:
Quản lý các tài khoản trong một ngân hàng
Mỗi một người mở tài khoản tại ngân hàng sẽ được lưu trữ trong một bản ghicủa cở sở dữ liệu Các trường của bản ghi này bao gồm họ và tên, địa chỉ, điệnthoại và một khoá duy nhất (mã số) cho người đó Mã số đóng vai trò con trỏ đến
cơ sở dữ liệu khác chứa các lần thu tiền vào và rút tiền ra từ tài khoản Cuối cùng,chúng ta phải có cơ sở dữ liệu chứa số dư Số dư là số tiền có trong tài khoản ởthời điểm xem xét của từng người gửi tiền Trạng thái của số dư trong tài khoảnđược khống chế ở mức xác định, ví dụ như số dư không được ≤ N cho trước Điều
v_doc(a) v_doc(b) doc(a) doc(b) v_doc(c) doc(c) giai_phong(a) giai_phong(b) giai_phong(c)
Trang 6đó cũng đồng nghĩa với việc đảm bảo trong tài khoản của người sủ dụng khôngbao giờ có giá trị bằng 0 hay giá trị âm.
Bây giờ chúng ta hãy nghiên cứu vấn đề quản lý truy cập thông tin tài khoảncho phép đảm bảo được tính gắn bó
Sau đây là hai kiểu mô tả khác nhau của giao dịch T và một kiểu mô tả có thể của giao dịch U:
v_viet(A)A:= (1+t)*Av_viet(B)B:= (1+t)*Bgiai_phong(B)giai_phong(A)
Ta kiểm tra rằng tất cả các giao dịch đều là hình thành tốt và T 2 và U đều ở
hai pha và T 1 không có hai pha.
Sau đây là hai trật tự hoá hợp thức S1 và S2 xuất phát từ việc thực hiện songsong của T1 và U và T2 và U2
Trang 7PHẦN II
SỬ DỤNG BỘ QUẢN LÝ KHÓA CƠ BẢN
VÀ NHỮNG ĐIỂM CẦN CẢI TIẾN
I Tổng quan:
Như đã nói ở phần trên, điều khiển đồng thời giải quyết các tính chất biệt lập
và nhất quán của giao dịch Cơ chế điều khiển đồng thời phân tán của một hệ quảntrị cơ sở dữ liệu phân tán bảo đảm rằng tính nhất quán của cơ sở dữ liệu sẽ đượcduy trì trong môi trường phân tán nhiều người dùng Nếu các giao dịch đã nhấtquán nội tại (nghĩa là không vi phạm bất kỳ ràng buộc nhất quán nào), thế thì để cóthể đạt được mục tiêu này, cách đơn giản nhất là thực hiện lần lượt từng giao dịchmột Rõ ràng một chọn lựa như thế chỉ đáng chú ý về mặt lý thuyết và không đượccài đặt trong bất kỳ một hệ thống thực sự nào bởi vì nó làm giảm thiểu lưu lượng
hệ thống Mức độ đồng thời có lẽ là một tham số quan trọng nhất trong các hệ phântán Do vậy, cơ chế điều khiển đồng thời cố gắng tìm ra một phương án thích hợp,vừa duy trì được tính nhất quán của cơ sở dữ liệu, vừa duy trì được mức độ đồngthời cao
Các bộ phận quản lý thực hiện một giao dịch của Hệ quản trị CSDL
Hình 1: Các bộ phận quản lý thực hiện giao dịch
Timestamp: Dấu thời gianLOCK/Release: Khóa/Giải phóng
Trang 8Các bộ phận quản lý thực hiện các giao dịch phân tán của hệ quản trị CSDLphân tán.
Hình 2: Các bộ phận quản lý thực hiện giao dịch phân tán
Trước hết, chúng ta xem lại định nghĩa tính khả tuần tự một cách hình thức:
Một lịch biểu S được gọi là khả tuần tự nếu và chỉ nếu nó tương đương tương tranh
với một lịch biểu tuần tự Tính khả tuần tự được định nghĩa như thế cũng được gọi
là khả tuần tự theo tương tranh bởi vì nó được định nghĩa theo sự tương đươngtương tranh Từ đó, chúng ta có thể chỉ ra rằng chức năng cơ bản của bộ phận điềukhiển đồng thời là tạo ra một lịch biểu khả tuần tự để thực hiện các giao dịch đangchờ
Lịch biểu của một giao dịch là một chuỗi các lệnh được thực hiện trong hệthống theo thứ tự thời gian Một lịch biểu đối với một tập các giao dịch phải baogồm tất cả các lệnh của tất cả các giao dịch này, và phải bảo toàn thứ tự mà cáclệnh xuất hiện trong mỗi giao dịch cá thể theo thứ tự đó Lịch biểu tạo mối liên hệràng buộc giữa các giao dịch với nhau
Ví dụ về lịch biểu khả tuần tự: Có 3 giao dịch T1, T2, T3 (tương ứng với (a),(b), (c)
BEGIN_TRANSACTION
x = 0;
x = x + 3;
END_TRANSACTION (c)
Lịch biểu cho các giao dịch trên:
Trang 9Schedule 1 x = 0; x = x + 1; x = 0; x = x + 2; x = 0; x = x + 3 Hợp lệ
Schedule 2 x = 0; x = 0; x = x + 1; x = x + 2; x = 0; x = x + 3; Hợp lệ
Schedule 3 x = 0; x = 0; x = x + 1; x = 0; x = x + 2; x = x + 3; Bất hợp lệ
II Sử dụng bộ quản lý khóa cơ bản:
Việc điều khiển đồng thời bằng khoá chốt là một cơ chế thường dùng để giảiquyết những vấn đề liên quan đến việc đồng bộ hoá dữ liệu truy cập dùng chung,đảm bảo dữ liệu dùng chung cho các thao tác tương tranh chỉ được truy xuất mộtlần một giao dịch, mỗi phần tử dữ liệu đều có một khoá chốt kết hợp với chúng
Điều này được thực hiện bằng cách liên kết một khoá chốt với mỗi đơn vị khoá.
Khoá này được giao dịch đặt ra trước khi nó truy xuất và được điều chỉnh lại vàolúc nó hết sử dụng Hiển nhiên là một đơn vị khoá không thể truy xuất được nếu đã
bị khoá bởi một giao dịch khác Vì vậy, yêu cầu khoá của một giao dịch chỉ đượctrao nếu khoá đi kèm hiện không bị một giao dịch khác giữ
Bộ xếp lịch đảm bảo rằng chỉ duy nhất giao tác có thể giữ khoá chốt trongmột thời điểm, và chỉ có một giao tác có thể truy xuất dữ liệu đó tại cùng một thờiđiểm
Khoá chốt được bộ xếp lịch (Schedule manager) dùng để đảm bảo tính khảtuần tự
Trước khi một giao tác có thể truy cập dữ liệu dùng chung, bộ xếp lịch sẽkhảo sát trạng thái khoá chốt của những dữ liệu này
Nếu không có giao tác nào khác đang giữ chúng thì bộ xếp lịch sẽ phát lệnhthông báo khoá dữ liệu này lại và sau đó các giao tác thực hiện các lệnh của mìnhtrên dữ liệu đó
Nếu dữ liệu đang bị khoá bởi giao tác T2, thì giao tác này phải chờ cho đếnkhi nào T2 giải phóng khoá đó
Bởi vì chúng ta quan tâm đến việc đồng bộ hóa các thao tác tương tranh củacác giao dịch tương tranh nên có hai loại khóa chốt được kèm với mỗi đơn vị khóa:
Khóa đọc (Read Lock RL), và Khóa Ghi (Write Lock -WL)
+ RLi(x): khoá đọc trên phần tử dữ liệu x của giao tác Ti
+ WLj(x): khoá ghi trên phần tử dữ liệu x của giao tác Tj
Hai khoá pli(x) và qlj(y) đụng độ nếu x=y, i¹j,
Hai khoá đụng độ nhau nếu chúng khoá trên cùng một phần tử dữ liệu,chúng được phát sinh từ hai giao tác khác nhau và một trong hai thao tác là ghi Một giao dịch Ti đang muốn đọc một mục dữ liệu được chứa trong đơn vịkhóa x sẽ nhận được một khóa đọc trên x (ký hiệu là rli(x) và cũng tương tự nhưvậy với thao tác ghi
Tính tương thích của các thực thể khóa được mô tả trong bảng sau:
WLi(x) Không tương thích Không tương thích
Trang 10Những quy tắc quản lý và sử dụng khoá:
Qui tắc 1:
Khi nhận được một thao tác pi[x] từ bộ quản lý giao tác (TransactionManager, TM), bộ xếp lịch kiểm tra nếu pli[x] đụng độ với một vài qlj[x] được đặttrước đó
+ Nếu đúng, nó sẽ trì hoãn pi[x] và buộc Ti chờ cho đến khi nó có thể đặtđược khoá cần thiết
+ Nếu không đụng độ, bộ xếp lịch (scheduler) sẽ đặt pli[x] và gởi pi[x] đến
bộ quản lý dữ liệu (Data Manager, DM)
Quy tắc này nhằm hạn chế hai giao tác truy xuất đồng thời một phần tử dữliệu trong tình trạng đụng độ
Trong các hệ thống dùng khoá, bộ xếp lịch (scheduler) chính là bộ quản lý
khoá (lock manager, LM) Bộ quản lý giao dịch sẽ chuyển cho bộ quản lý khoá các
thao tác cơ sở dữ liệu (đọc hoặc ghi) và các thông tin kèm theo (như mục dữ liệucần truy xuất, định danh của giao dịch đưa ra yêu cầu) Sau đó, bộ quản lý khoá sẽkiểm tra đơn vị khoá có chứa mục dữ liệu đó đã bị khoá hay chưa Nếu đã khoá, vànếu thể thức khoá đó không tương thích với thể thức của giao dịch đang yêu cầu,thao tác sẽ bị hoãn lại Ngược lại, khoá sẽ được đặt với thể thức mong muốn vàthao tác này được chuyển cho bộ xử lý dữ liệu để truy xuất cơ sở dữ liệu thực sự.Sau đó, bộ quản lý giao dịch được thông tin về các kết quả thực hiện Việc kết thúcgiao dịch sẽ giải phóng các khoá của nó và làm khởi hoạt một giao dịch khác đangđợi truy xuất mục dữ liệu này
Thuật toán khoá chốt cơ bản
{Các định nghĩa chuẩn bị cho các thuật toán được trình bày trong tiểu luận}
Declare-type
Operation: một trong số Begin-Transaction, Read, Write, Abort, hoặc
Commit
DataItem : một mục dữ liệu trong cơ sở dữ liệu phân tán
TransactionId: một giá trị duy nhất được gán cho mỗi giao dịch
DataVal: một giá trị có kiểu dữ liệu cơ bản (nghĩa là số nguyên, số thực,…) SiteId: một đinh danh duy nhất cho vị trí
Dbop: một bộ ba gồm {một phép toán trên cơ sở dữ liệu của ứng dụng}
opn: Operation data: DataItem
Trang 11body: thân giao dịch
Message ← một chuỗi ký tự cần được truyền đi