1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Các mô hình lược đồ cơ sở dữ liệu quan hệ hỗ trợ đa người dùng trong tính toán đám mây

27 55 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 27
Dung lượng 1,14 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ LOAN CÁC MÔ HÌNH LƯỢC ĐỒ CƠ SỞ DỮ LIỆU QUAN HỆ HỖ TRỢ ĐA NGƯỜI DÙNG TRONG TÍNH TOÁN ĐÁM MÂY LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƯỜI HƯỚNG DẪ

Trang 1

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

NGUYỄN THỊ LOAN

CÁC MÔ HÌNH LƯỢC ĐỒ CƠ SỞ DỮ LIỆU QUAN HỆ

HỖ TRỢ ĐA NGƯỜI DÙNG TRONG

TÍNH TOÁN ĐÁM MÂY

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS VÕ ĐÌNH HIẾU

Trang 2

MỤC LỤC

1 Đặt vấn đề 4

2 Bố cục luận văn 4

CHƯƠNG 1 TỔNG QUAN 5

1.1 Giới thiệu chung về tính toán đám mây 5

1.1.1 Khái niệm về tính toán đám mây 5

1.1.2 Tính chất cơ bản của tính toán đám mây 5

1.1.3 Các mô hình của tính toán đám mây 5

1.2 Lợi ích và khó khăn của tính toán đám mây 6

1.2.1 Những lợi ích của tính toán đám mây 6

1.2.2 Những khó khăn của tính toán đám mây 6

1.3 Tổng kết chương 6

CHƯƠNG 2 MỘT SỐ KĨ THUẬT ÁNH XẠ LƯỢC ĐỒ CƠ SỞ DỮ LIỆU QUAN HỆ TRONG TÍNH TOÁN ĐÁM MÂY 7

2.1 Đặt vấn đề 7

2.2 Một số kĩ thuật ánh xạ lược đồ cơ sở dữ liệu 7

2.2.1 Bảng riêng 7

2.2.2 Bảng mở rộng 8

2.2.3 Bảng phổ quát 9

2.2.5 Bảng trục 10

2.3 Đánh giá 12

2.3.1 Ưu và nhược điểm của kĩ thuật dùng bảng riêng 12

2.3.2 Ưu và nhược điểm của kĩ thuật dùng bảng mở rộng 12

2.3.3 Ưu và nhược điểm của kĩ thuật dùng bảng phổ quát 12

2.3.4 Ưu và nhược điểm của kĩ thuật XML in DB2 12

2.3.5 Ưu và nhược điểm của kĩ thuật dùng bảng trục 12

2.3.6 Ưu và nhược điểm của kĩ thuật dùng bảng đoạn 12

2.4 Tổng kết chương 12

CHƯƠNG 3 SO SÁNH MỘT SỐ KĨ THUẬT ÁNH XẠ LƯỢC ĐỒ CƠ SỞ DỮ LIỆU 13

3.1 Mô tả bài toán 13

3.1.1 Mô hình lược đồ cơ sở dữ liệu với kĩ thuật ánh xạ bảng phổ quát 14

3.1.2 Mô hình lược đồ cơ sở dữ liệu với kĩ thuật ánh xạ bảng đoạn 15

3.1.3 Mô hình lược đồ cơ sở dữ liệu với kĩ thuật ánh xạ bảng trục 16

Trang 3

3.2 Môi trường thực nghiệm 17

3.3 Kịch bản định lượng ba phương pháp 18

3.4 Đánh giá kết quả 18

3.4.1 Kết quả thực nghiệm trong môi trường 1 18

3.4.2 Kết quả thực nghiệm trong môi trường 2 21

3.5 Đánh giá chung 23

3.6 Tổng kết chương 23

CHƯƠNG 4 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 24

4.1 Kết quả thu được 24

4.2 Hướng phát triển 24

Trang 4

CHƯƠNG 1 TỔNG QUAN

Nội dung của chương 1 trình bày những vấn đề chung nhất của tính toán đám mây như: khái niệm, những tính chất cơ bản của tính toán đám mây, trình bày sơ lược về một số dịch vụ tính toán đám mây và một số mô hình triển khai trong tính toán đám mây

1.1 Giới thiệu chung về tính toán đám mây

1.1.1 Khái niệm về tính toán đám mây

Sự phát triển mạnh mẽ của tính toán đám mây đã thu hút rất nhiều nhà khoa học, các trường đại học và cả các công ty công nghệ thông tin đầu tư nghiên cứu Vì là một công nghệ mới nên có những tranh cãi về việc định nghĩa tính toán đám Theo thống

kê của tạp chí “Cloud Magazine” thì hiện tại có hơn 200 định nghĩa khác nhau về tính

toán đám mây Mỗi hướng nghiên cứu đưa ra định nghĩa và cách tiếp cận khác nhau dẫn đến những định nghĩa khác nhau Dưới đây là ví dụ một số định nghĩa về tính toán đám mây [10]:

Theo những định nghĩa trên, tính năng chủ yếu của tính toán đám mây là cung cấp cơ

sở hạ tầng và các ứng dụng về IT dưới dạng dịch vụ có khả năng mở rộng được Ian Foster và Rajkumar Buyya đã định nghĩa tính toán đám mây dưới góc độ kỹ thuật và đang được sử dụng khá phổ biển và có một số điểm tương đồng

Theo Ian Foster, tính toán đám mây là một mô hình tính toán phân tán có tính co giãn linh hoạt về mặt kinh tế, là nơi chứa sức mạnh tính toán lớn, lưu trữ dựa trên nền tảng

và dịch vụ cung cấp Sự ảo hóa tài nguyên và thay đổi linh hoạt để phù hợp với nhu cầu khách hàng trên Internet [8]

1.1.2 Tính chất cơ bản của tính toán đám mây

Công nghệ tính toán đám mây có năm tính chất nổi bật so với mô hình truyền thống [18]

1.1.2.1 Tự phục vụ theo nhu cầu

1.1.2.2 Truy xuất trên diện rộng

1.1.2.3 Tài nguyên kết hợp

1.1.2.4 Khả năng co giãn nhanh chóng

1.1.2.5 Tính đo lường được

1.1.3 Các mô hình của tính toán đám mây

Các mô hình tính toán đám mây được phân thành hai loại:

Trang 5

 Các mô hình dịch vụ (Service Models): Phân loại các dịch vụ của các nhà cung cấp dịch vụ tính toán đám mây

 Các mô hình triển khai (Deployment Models): Phân loại cách thức triển khai dịch vụ tính toán đám mây đến với khách hàng

1.1.3.1 Mô hình dịch vụ

Hiện tại có rất nhiều nhà cung cấp dịch vụ tính toán đám mây cung cấp nhiều loại dịch

vụ khác nhau Tuy nhiên có ba loại dịch vụ tính toán đám mây cơ bản là: dịch vụ cơ sở

hạ tầng (Infrastructure as a Service – IaaS), dịch vụ nền tảng (Platform as a Service –

PaaS) và dịch vụ phần mềm (Software as a Service – SaaS) Cách phân loại này

thường được gọi là “mô hình SPI” [3]

Hạ tầng hướng dịch vụ

Nền tảng hướng dịch vụ

Phần mềm hướng dịch vụ

1.1.3.2 Mô hình triển khai

Đám mây công cộng

Đám mây riêng

Đám mây lai

Đám mây cộng đồng

1.2 Lợi ích và khó khăn của tính toán đám mây

1.2.1 Những lợi ích của tính toán đám mây

Việc gây ra thắt cổ trai trong việc truyền dữ liệu

Khó khăn trong lưu trữ

1.3 Tổng kết chương

Trong chương này đã trình bày những cái nhìn tổng quan về tính toán đám mây từ định nghĩa, các mô hình dịch vụ, mô hình triển khai, cũng như ưu và nhược điểm của tính toán đám mây

Trang 6

CHƯƠNG 2 MỘT SỐ KĨ THUẬT ÁNH XẠ LƯỢC ĐỒ CƠ

SỞ DỮ LIỆU QUAN HỆ TRONG TÍNH TOÁN ĐÁM MÂY

Chương 2 trình bày một số kĩ thuật ánh xạ lược đồ cơ sở dữ liệu quan hệ để phù hợp với ứng dụng đa người dùng trong tính toán đám mây Một số kĩ thuật trình bày trong chương này là: kĩ thuật dùng bảng riêng, bảng mở rộng, sử dụng XML trong IBM DB2 ,bảng phổ quát, bảng trục, bảng đoạn

2.1 Đặt vấn đề

Việc giảm chi phí đến từ rất nhiều những phương pháp khác nhau Một trong những phương pháp mà người ta có thể nhận ra đầu tiên đó là sự hợp nh ất nhiều khách hàng vào cùng một nhóm để dễ quản lý cũng như việc lưu trữ dữ liệu của họ Vấn đề này trong tính toán đám mây được gọi là việc quản lý dữ liệu đa người thuê (multi tenant) Để hiểu được điều đó , trước tiên ta đi tìm hiểu v ề thuộc tính đa người thuê trong tính

toán đám mây là gì ? Đa người thuê (multi – tenant) là một nguyên lý cấu trúc, trong

đó một ứng dụng chạy một thể hiện - instance phục vụ đồng thời nhiều bên thuê [1][4]

Hiện nay có rất nhiều phương pháp để làm giảm chi phí theo hướng tiếp cận chia sẻ (shared aproach) [2] [7][13]

 Chia sẻ máy (Shared machine)

 Chia sẻ xử lý (Shared process)

 Chia sẻ table (Shared table)

Tổng các chi phí phải trả thông thường được chia ra làm 3 loại chính sau:

 Chi phí về vốn (Capital expenses)

 Chi phí hoạt động (Operation expenses)

 Chi phí người dùng cuối (End user expenses)

2.2 Một số kĩ thuật ánh xạ lược đồ cơ sở dữ liệu

Trang 7

Bảng 2.1 Bảng riêng Recid Name Page Price Publisher Unit

trang trang trang

Recid Name Color Price Trademark Size Unit

90000

94000

70000

Bitis Thượng đình Adias

35

30

30

đôi đôi đôi

2.2.2 Bảng mở rộng

Phương pháp này dựa trên ý tưởng với các phần muốn mở rộng của các bên thuê thì tách riêng ra cùng một bảng Bởi vì trong tập hợp các bên thuê sẽ có những bên thuê

có mối quan tâm đến cùng một lĩnh vực Với quy tắc mỗi bảng mở rộng có một cột lưu

ID của các bên thuê và sẽ được liên kết vào các bảng khác Cột tenant_id cũng được

thêm vào trong các bảng cơ sở khác Trong bảng mở rộng thêm một cột Row [17]

Tenant Row Publisher Price Unit

50000

34000

trang trang

Tenant Row Size Color Trademark Unit

Trang 8

2.2.3 Bảng phổ quát

Bảng 2 3 Bảng phổ quát

Tenant Table Col1 Col2 Col3 Col4 Col5 Col6 Col7

<ext><publisher>NXB kĩ thuật</ publisher ></ext>

<ext> <item_name>Programing C++ </item_name></ext>

<ext><author>Bingade</author></ext>

<ext><page>52</page></ext>

<ext><publisher>NXB kĩ thuật</ publisher ></ext>

<ext> <item_name>Shoes -01 </item_name></ext>

<ext><price>90000</price></ext>

<ext><color>red</color></ext>

Khi người dùng có nhu cầu thao tác dữ liệu ví dụ “phép chọn”, câu truy sẽ được thực

thi sử dụng toán tử XMLTABLE [20]

Universal

Account

Trang 9

2.2.5 Bảng trục

Bảng 2.5 Bảng trục Name Page Price Publisher Unit

Từ ấy NXB Thanh Niên Trang Shoes -01 Red Adias Đôi

Trang 10

2.2.6 Bảng đoạn

Một bảng đoạn cũng tương tự như một bảng trục bao gồm một tập các cột dữ liệu với các kiểu dữ liệu khác nhau có thể có chỉ mục hoặc không có chỉ mục – index Trong

đó cột Col trong phương pháp bảng trục sẽ được thay thế bằng cột chunk Cột này

được thiết lập dữ liệu dựa trên cơ sở một nhóm các cột trong bảng logic sẽ được nhóm vào cùng một chunk - tức là các giá trị của bản ghi đó sẽ có cùng một giá trị trong cột

Trang trang trang

Tenant Table Chunk Row Int Str

30

34000 NULL

90000 NULL

35 NULL

Lão Hạc NXB Văn Học Trang

Từ ấy NXB Thanh Niên Trang Shoes -01 Red Adias Đôi

Trang 11

Trong hình 2.8 bảng Account 1 là bảng lưu giá trị của tenant có ID=1 Bảng này sẽ được tách ra và được lưu vào bảng Chunk Với mỗi một đoạn 1, 2, các giá trị sẽ được

lưu tương ứng vào hai cột Int và Str trong bảng đoạn.

2.3 Đánh giá

2.3.1 Ưu và nhược điểm của kĩ thuật dùng bảng riêng

2.3.2 Ưu và nhược điểm của kĩ thuật dùng bảng mở rộng

2.3.3 Ưu và nhược điểm của kĩ thuật dùng bảng phổ quát

2.3.4 Ưu và nhược điểm của kĩ thuật XML in DB2

2.3.5 Ưu và nhược điểm của kĩ thuật dùng bảng trục

2.3.6 Ưu và nhược điểm của kĩ thuật dùng bảng đoạn

2.4 Tổng kết chương

Trong chương 2 đã trình bày một số kĩ thuật ánh xạ lược đồ – schema mapping techniques để phù hợp trong tính toán đám mây Với mỗi công nghệ đều có ưu và nhược điểm riêng, tùy vào từng ứng dụng mà có thể áp dụng một công nghệ có thể là dùng bảng riêng, dùng bảng mở rộng hay bảng đoạn,… Để đạt được hiệu suất cao trong khi thực thi, cũng như giảm toàn bộ chi phí trong toàn bộ quá trình, và quan trong hơn là mang lại lợi ích cho doanh nghiệp

Trang 12

CHƯƠNG 3 SO SÁNH MỘT SỐ KĨ THUẬT ÁNH XẠ

LƯỢC ĐỒ CƠ SỞ DỮ LIỆU

Chương 3 trình bày hiệu suất thực thi truy vấn khi xây dựng cơ sở dữ liệu theo ba kĩ thuật ánh xạ lược đồ cơ sở dữ liệu dùng bảng trục , bảng đoạn, bảng phổ quát Đưa ra những đánh giá đối với từng phương pháp

3.1 Mô tả bài toán

Một cơ sở dữ liệu được gọi là mềm dẻo nếu nó thỏa mãn hai mong đợi sau:

 Có khả năng phục vụ được nhiều bên thuê

 Thứ hai, xây dựng cơ sở dữ liệu một cách “động” từ lược đồ cơ sở để sao cho việc mở rộng có thể thực hiện được khi hệ thống đang hoạt động

Ngữ cảnh của bài toán đặt ra như sau: Khi một doanh nghiệp phát triển một phần mềm quản lý trong môi trường tính toán đám mây, điều quan trọng họ phải thiết kế một cơ

sở dữ liệu thỏa mãn được hai mong đợi ở trên Hiện tại bài toán được xây dựng khi khách hàng làm trong các lĩnh vực sau : Quản lý sách , quản lý giày, quản lý máy ảnh , quản lý màn hình máy tính Mỗi khách hàng đều có những thuộc thính chung là quản lý tên sản ph ẩm, giá cả,… Tuy nhiên còn một số thuộc tính mà mỗi khách hàng làm trong một lĩnh vực muốn quản lý riêng Ví dụ khách hàng quản lý giày muốn quản lý các thuộc tính như trong hình 3.1 (a) Trong khi khách hàng quản lý sách lại muốn quản lý các thuộc tính như trong hình 3.1(b) Tương tự như vậy khách hàng quản lý màn hình máy tính muốn quản lý các thuộc tính trong hình 3.1 (c) Khách hàng quản

lý máy tính muốn quản lý một số thuộc tính như hình 3.1 (d)

Trang 13

Hình 3.1 Một số thuộc tính quản lý

3.1.1 Mô hình lƣợc đồ cơ sở dữ liệu với kĩ thuật ánh xạ bảng phổ quát

Ngoài những bảng tập trung vào mô hình nghiệp vụ như: bảng lưu trữ thông tin của các bên thuê, bảng lưu trữ các thông tin của khách hàng, hóa đơn,…phương pháp ánh

xạ lược đồ sẽ tập trung vào bảng quản lý các mặt hàng t_item Như đã đề cập ở trên,

với mỗi bảng đều có thêm thuộc tính tenant_id để giúp việc quản lý các bản ghi một

cách rõ ràng

Lược đồ hình 3.3 bên dưới tập trung vào bảng t_item Với cấu trúc bảng hiện tại thì số

lượng cột ColN đang dừng lại ở col20 Tùy vào phạm vi bài toán quản lý khác nhau sẽ

có thể thêm vào rất nhiều cột kiểu này Các cột này đều có kiểu VARCHAR và kích cỡ

Price Color Weight Trademark Image sensor Storage media Sensitivity Operating temperature Number of effective pixel Aperture

File format Accessories included Operating huminity Unit

LCD morniter

(d)

Trang 14

Hình 3.2 Lược đồ cơ sở dữ liệu với phương pháp ánh xạ bảng phổ quát

3.1.2 Mô hình lƣợc đồ cơ sở dữ liệu với kĩ thuật ánh xạ bảng đoạn

Với phương pháp này số lượng bảng t_item xây dựng theo phương pháp ánh xạ lược

đồ dùng bảng đoạn có thể nhiều hơn một Tuy nhiên trong phạm vi quản lý nhỏ lược

đồ cơ sở dữ liệu của bài toán sẽ như hình 3.4 Bảng t _item trong lược đồ hình 3.4 tương đối đơn giản tập trung vào hai cột intdata int(11) và stringdata varchar(500)

dùng để lưu trữ toàn bộ các giá trị của các lĩnh vực quản l ý như đã giới thiệu ở trên

(quản lý sách, quản lý máy ảnh, quản lý màn hình, quản lý giày) Hai cột row và chunk

giúp định vị dữ liệu đúng với bản ghi thực tế và giúp cho hệ quản trị cơ sở dữ liệu

không bị mất kiểm soát khi bảng bị thay đổi cấu trúc – data reconstruct

Trang 15

Hình 3 3 Lược đồ cơ sở dữ liệu sử dụng phương pháp ánh xạ dùng bảng đoạn

3.1.3 Mô hình lƣợc đồ cơ sở dữ liệu với kĩ thuật ánh xạ bảng trục

Với phương pháp này số lượng bảng t_item xây dựng theo phương pháp ánh xạ lược

đồ dùng bảng trục có thể nhiều hơn hai bảng Ví dụ trong bài toán cần quản lý đến ngày tháng thì có thể thêm một bảng quản lý t_item_date liên quan đến ngày tháng Trong phạm vi đặt ra của bài toán hiện tại lược đồ cơ sở dữ liệu chỉ dừng lại ở hai bảng t_item_str và t_item_int Với mỗi bảng t_item_str và t_item_int sẽ lưu trữ kiểu dữ liệu tương ứng với kiểu của dữ liệu

Trang 16

Hình 3 4 Lược đồ cơ sở dữ liệu sử dụng phương pháp ánh xạ dùng bảng trục

3.2 Môi trường thực nghiệm

Trang 17

3.3 Kịch bản định lượng ba phương pháp

Người dùng hay các bên thuê sẽ tương tác với dịch vụ thông qua một phần mềm được xây dựng và cài đặt ở trên máy tính của bên thuê – trong môi trường thực nghiệm của bài toán là máy tính đóng vai trò client Cơ sở dữ liệu được đặt trên một host riêng – máy server Mỗi một bên thuê khi sử dụng phần mềm tương ứng với một phiên thao

tác với cơ sở dữ liệu

Với mỗi phương pháp dùng các kịch bản sau để xác định thời gian đáp trả của ba kĩ thuật ánh xạ lược đồ

 SELECT 1: Chọn toàn bộ các thuộc tính của 1 bản ghi trong cơ sở dữ liệu

 SELECT 500: Chọn toàn bộ các thuộc tính của 500 bản ghi trong cơ sở dữ liệu

 UPDATE 1: Cập nhật một số các thuộc tính của 1 bản ghi trong cơ sở dữ liệu

 UPDATE 500: Cập nhật một số các thuộc tính của 500 bản ghi trong cơ sở dữ liệu

 INSERT 1: Thêm 1 bản ghi vào trong cơ sở dữ liệu

 INSERT 500: Thêm 500 bản ghi vào trong cở sở dữ liệu

Với mỗi kịch bản, thực hiện phép đo đạc khi >50 người dùng thao tác với cơ sở dữ liệu trong môi trường 2 và đo đạc khi 1 người dùng thao tác với cơ sở dữ liệu trong môi trường 1 Số lượng bản ghi có sẵn trong bảng cần đo hiệu suất của mỗi cơ sở dữ liệu là khoảng: Xấp xỉ 1100000 bản ghi

3.4 Đánh giá kết quả

3.4.1 Kết quả thực nghiệm trong môi trường 1

3.4.1.1 So sánh khi không tạo chỉ mục

Với hai câu lệnh Insert 1 và Update 1

0 0.0005 0.001 0.0015 0.002 0.0025 0.003

ins 1 Upd 1

Bảng đoạn Bảng phổ quát

Thời gian đáp trả [giây]

Ngày đăng: 06/03/2020, 00:11

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm