1. Trang chủ
  2. » Luận Văn - Báo Cáo

ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA

20 399 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 883,22 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

R2RML Relational Database to RDF Mapping Language là một ngôn ngữ để thể hiện ánh xạ từ các cơ sở dữ liệu quan hệ RDB sang bộ dữ liệu RDF.. R2RML cũng được định nghĩa là một ánh xạ trực

Trang 1

ỨNG  DỤNG  R2RML  ĐỂ  CHUYỂN  ĐỔI  CƠ  SỞ  DỮ  LIỆU  CHO  

LINKED  DATA    

Trần  Nguyên  Phong,  Hoàng  Hữu  Hạnh  

Đại  học  Huế   E-­‐‑mail:  tnphong@hueuni.edu.vn,  hhhanh@hueuni.edu.vn  

Tóm  tắt:  RDF  (Resource  Description  Framework)  là  chuẩn  mô  tả  dữ  liệu  Web  ngữ  nghĩa,  và  

trở  thành  cơ  sở  của  Linked  Data  và  Web  Dữ  liệu  Việc  chuyển  đổi  các  dữ  liệu  trong  các  cơ  sở  

dữ  liệu  (CSDL)  sang  RDF  được  xem  là  một  trong  những  bước  quan  trọng  cho  việc  xây  dựng   Web  dữ  liệu  R2RML  (Relational  Database  to  RDF  Mapping  Language)  là  một  ngôn  ngữ  để   thể  hiện  ánh  xạ  từ  các  cơ  sở  dữ  liệu  quan  hệ  (RDB)  sang  bộ  dữ  liệu  RDF  Ánh  xạ  này  cung  cấp   khả  năng  xem  dữ  liệu  hiện  có  trong  mô  hình  dữ  liệu  quan  hệ  RDF,  được  thể  hiện  trong  một   cấu  trúc  và  từ  vựng  R2RML  cũng  được  định  nghĩa  là  một  ánh  xạ  trực  tiếp  từ  cơ  sở  dữ  liệu   quan  hệ  sang  RDF  Bài  báo  này  trình  bày  việc  áp  dụng  R2RML  vào  việc  chuyển  đổi  CSDL   quan  hệ  sang  Linked  Data  phục  vụ  cho  Web  Dữ  liệu  

Từ  khóa:  Linked  Data,  Web  of  Data,  Semantic  Web,  ontology,  RDF,  OWL  

1   Giới  thiệu  

Linked  Data  là  một  ứng  dụng  thực  tiễn  dựa  các  công  nghệ  Web  ngữ  nghĩa  hiện  tại,  nhằm  

cung  cấp  một  cơ  chế  xuất  bản  dữ  liệu  có  cấu  trúc  lên  Web,  với  mục  địch  tạo  ra  một  thế  hệ  Web  

mới  –  Web  dữ  liệu  (Web  of  Data)  Linked  Data  được  giới  thiệu  nhằm  mở  ra  một  trào  lưu  xuất  bản  

dữ  liệu  mở,  có  cấu  trúc  và  phá  vỡ  các  ngăn  cách  cho  các  hệ  thống  CSDL  hiện  nay  Từ  sự  khởi  đầu   của  việc  triển  khai  Web  ngữ  nghĩa  đã  có  sự  quan  tâm  ngày  càng  tăng  trong  việc  lập  ra  các  quan  

hệ  dữ  liệu  cho  Web  ngữ  nghĩa  Điều  này  cho  phép  dữ  liệu  được  kết  hợp  với  các  dữ  liệu  khác  trên   Web,  liên  kết  ngữ  nghĩa  trực  tiếp  đến  dữ  liệu  quan  hệ  và  hỗ  trợ  tích  hợp  dữ  liệu  với  các  miền  và   lĩnh  vực  ứng  dụng  rỗng  rãi  hơn    

Hiện  nay  phần  lớn  dữ  liệu  trên  Web  đang  được  lưu  trữ  trong  các  hệ  quản  trị  cơ  sở  dữ  liệu   quan  hệ  (RDBMS)  với  các  ưu  điểm  đã  được  chứng  minh  về  các  mặt:  khả  năng  mở  rộng,  lưu  trữ   hiệu  quả,  tối  ưu  hóa  việc  thực  thi  các  câu  truy  vấn,  độ  an  toàn  Tuy  nhiên,  các  cơ  sở  dữ  liệu  quan  

hệ  (RDB)  thường  là  tách  biệt  nhau,  không  đồng  nhất  về  lược  đồ,  thuật  ngữ,  định  danh  và  mức  độ   chi  tiết  của  sự  biểu  diễn  dữ  liệu,  và  không  có  tính  chia  sẻ  Do  đó,  người  ta  đã  sử  dụng  kỹ  thuật  

để  chuyển  đổi  các  dữ  liệu  trong  RDB  sang  các  dạng  dữ  liêu  thô  hoặc  có  cấu  trúc,  hoặc  giàu  ngữ   nghĩa  như  RDF  và  RDFS  –  là  cơ  sở  của  Linked  Data  Việc  chuyển  dữ  liệu  sang  Linked  Data  nhằm   cung  cấp  một  nền  tảng  cho  việc  tích  hợp  tất  cả  các  nguồn  dữ  liệu  đó  trên  Web  dữ  liệu  

R2RML  (Relational  Database  to  RDF  Mapping  Language)  là  một  ngôn  ngữ  để  thể  hiện  ánh  

xạ  từ  các  cơ  sở  dữ  liệu  quan  hệ  (RDB)  sang  bộ  dữ  liệu  RDF  Ánh  xạ  này  cung  cấp  khả  năng  xem  

dữ  liệu  hiện  có  trong  mô  hình  dữ  liệu  quan  hệ  RDF,  được  thể  hiện  trong  một  cấu  trúc  và  từ  vựng   R2RML  cũng  được  định  nghĩa  là  một  ánh  xạ  trực  tiếp  từ  cơ  sở  dữ  liệu  quan  hệ  sang  RDF  Trong  

Trang 2

các  ánh  xạ  trực  tiếp  của  một  CSDL,  cấu  trúc  của  đồ  thị  RDF  là  kết  quả  phản  ánh  trực  tiếp  cấu  trúc   của  CSDL,  mục  từ  trong  từ  vựng  RDF  phản  ánh  trực  tiếp  tên  của  các  phần  tử  trong  lược  đồ  CSDL   Mỗi  ánh  xạ  R2RML  là  phù  hợp  với  một  lược  đồ  CSDL  và  mục  từ  từ  vựng  Các  đầu  vào  một  ánh  

xạ  R2RML  là  một  cơ  sở  dữ  liệu  quan  hệ  phù  hợp  vào  lược  đồ  đó  Đầu  ra  là  một  tập  dữ  liệu  RDF  

có  sử  dụng  vị  từ  và  các  kiểu  từ  vựng  Bài  báo  này  trình  bày  việc  áp  dụng  R2RML  vào  việc  chuyển   đổi  CSDL  quan  hệ  sang  Linked  Data  phục  vụ  cho  Web  Dữ  liệu,  bên  cạnh  đó,  cũng  trình  bày  các   hướng  tiếp  cận  liên  quan  

2.1   Khung  tham  khảo  cho  chuyển  đổi  RDB  sang  RDF  và  RDFS  

2.1.1   Tạo  các  ánh  xạ  

 Chúng  ta  có  thể  phân  loại  các  phương  pháp  được  sử  dụng  để  tạo  ra  các  ánh  xạ  giữa  RDB  

và  RDF  thành  hai  loại:    

a)   Ánh  xạ  tự  động:    

Một  tập  hợp  các  ánh  xạ  giữa  RDB  và  RDF  cụ  thể  là:  

i)   Một  mẫu  tin  RDB  là  một  nút  của  RDF;  

ii)   Tên  cột  của  một  bảng  RDB  là  một  vị  từ  của  RDF;  

iii)   Một  ô  của  bảng  RDB  là  một  giá  trị  của  RDF  

Nhiều  hệ  thống  sử  dụng  các  ánh  xạ  tự  động  để  ánh  xạ  giữa  RDB  và  RDF  với  một  bảng  của   RDB  như  một  lớp  các  nút  của  RDF  và  các  tên  cột  của  RDB  như  là  vị  từ  của  RDF    

Mặc  dù  các  ánh  xạ  tự  động  tạo  ra  thường  không  nắm  bắt  được  ngữ  nghĩa  được  yêu  cầu   của  nhiều  ứng  dụng,  nhưng  những  ánh  xạ  này  có  thể  là  một  điểm  khởi  đầu  để  tạo  ra  các  tuỳ  chọn   hữu  ích  hơn  Phương  pháp  này  cũng  cho  phép  các  ứng  dụng  Web  ngữ  nghĩa  truy  vấn  các  nguồn   RDB,  nơi  mà  ứng  dụng  ngữ  nghĩa  được  quy  định  về  ánh  xạ  RDB  Phương  pháp  này  còn  được  gọi  

là  "ʺvùng  ánh  xạ  ontology"ʺ  

b)   Ngữ  nghĩa  miền  -­‐‑  định  hướng  ánh  xạ:    

Cách  tiếp  cận  thứ  hai  để  tạo  ra  ánh  xạ  từ  RDB  sang  RDF  bằng  cách  kết  hợp  ngữ  nghĩa  miền  

ẩn  hoặc  không  ẩn  trong  tất  cả  lược  đồ  RDB  Các  mô  hình  về  ngữ  nghĩa  miền  thường  được  mô   hình  hóa  như  là  một  miền  ontology  Trong  thư  viện  RDF,  cho  phép  các  ứng  dụng  phần  mềm  tận   dụng  lợi  thế  "ʺthông  tin  thu  được"ʺ  và  thực  hiện  các  truy  vấn  liên  kết  các  thực  thể  với  nhau[4]   Ngoài  ra,  một  ánh  xạ  được  tạo  ra  bằng  cách  sử  dụng  ngữ  nghĩa  miền  nhằm  làm  giảm  việc   tạo  ra  bộ  dữ  liệu  dư  thừa  hoặc  không  liên  quan  Byrne[4]  thảo  luận  về  việc  giảm  kích  thước  của   các  tập  dữ  liệu  RDF  khoảng  2,8  triệu  bộ    thông  qua  việc  sử  dụng  ngữ  nghĩa  theo  định  hướng  của   tên  miền  ánh  xạ  từ  RDB  sang  RDF  

Phương  pháp  này  còn  được  gọi  là  "ʺmiền  ánh  xạ  ontology"ʺ  và  quá  trình  này  giống  như  một  

kỹ  thuật  ontologies  công  cộng  nơi  mà  các  dữ  liệu  chuyển  đổi  được  định  nghĩa  trong  lược  đồ  

Trang 3

ontologies  Nhiều  công  cụ  ánh  xạ  như  D2RQ[4]  cho  phép  người  sử  dụng  tạo  ra  các  quy  tắc  tạo   ánh  xạ  tùy  ý  ngoài  các  quy  tắc  tạo  ra  tự  động  

2.1.2   Biểu  diễn  các  ánh  xạ  

Các  ánh  xạ  giữa  RDB  và  RDF  có  thể  được  biểu  diễn  như  là  quy  tắc  XPath  trong  một  kiểu   XSLT,  một  ngôn  ngữ  khai  báo  dựa  trên  XML  như  R2O  [4]  hoặc  là  "ʺmô  hình  Quad"ʺ  được  định   nghĩa  trong  Virtuoso  [4]  lược  đồ  siêu  ngôn  ngữ  Các  ánh  xạ,  nếu  chúng  được  tạo  ra  bởi  các  miền   hoặc  tham  khảo  một  miền  Ontology  có  thể  có  ứng  dụng  rộng  rãi  Khuyến  khích  sử  dụng  lại  các   ánh  xạ  để  dễ  dàng  tiếp  cận  cộng  đồng  rộng  lớn  hơn  Do  đó,  chúng  tôi  xem  xét  khả  năng  tiếp  cận   của  ánh  xạ  giữa  RDB  và  RDF  

2.1.3   Cài  đặt  truy  vấn  

Truy  vấn  trong  các  hệ  thống  tạo  ánh  xạ  từ  RDB  sang  RDF  hoặc  trong  SPARQL  được  thực   hiện  dựa  vào  RDF,  hoặc  truy  vấn  SPARQL  có  thể  được  chuyển  đổi  thành  một  hoặc  nhiều  truy   vấn  SQL  được  thực  hiện  dựa  vào  RDB  Cyganiak  [4]  đã  thảo  luận  việc  chuyển  đổi  đại  số  quan  hệ   của  SPARQL  và  tiếp  tục  trong  SQL  Toán  tử  biểu  diễn  như  "ʺSELECTION"ʺ  và  "ʺINNER  JOIN"ʺ  được   thực  hiện  trong  RDF  và  tương  quan  "ʺđại  số  quan  hệ  RDF"ʺ  đến  SQL  

2.1.4   Miền  ứng  dụng  

"ʺTạo  ánh  xạ"ʺ,  một  khía  cạnh  quan  trọng  của  việc  tạo  ánh  xạ  từ  RDB  sang  RDF,  là  sự  kết   hợp  của  miền  ngữ  nghĩa  trong  kết  quả  của  RDF  Do  đó,  danh  sách  các  miền  ứng  dụng  của  công   trình  được  xem  xét  trong  cuộc  khảo  sát  này  (công  cụ  ánh  xạ  không  phải  là  tên  miền  cụ  thể)  

2.1.5   Tích  hợp  dữ  liệu  

Mô  hình  RDF  đại  diện  thông  qua  việc  sử  dụng  của  URI  và  các  mối  quan  hệ  của  mô  hình   một  cách  rõ  ràng  giữa  các  thực  thể  làm  cho  nó  dễ  dàng  hơn  để  tích  hợp  dữ  liệu  có  hiệu  quả  Điều   quan  trọng  là  cần  lưu  ý  rằng  RDF  không  tự  động  giải  quyết  nhiều  việc  không  đồng  nhất,  chẳng   hạn  như  không  đồng  nhất  về  cấu  trúc,  cú  pháp  và  ngữ  nghĩa,  được  mô  tả  trong  dữ  liệu/thông  tin   tích  hợp  Tuy  nhiên,  việc  sử  dụng  các  miền  ontology  dựa  theo  các  quy  tắc  suy  luận  mà  người   dùng  định  nghĩa  để  đối  chiếu  tính  không  đồng  nhất  giữa  các  nguồn  RDB  là  một  cách  tiếp  cận  có   hiệu  quả  cho  việc  tạo  ra  một  hoặc  một  tập  "ʺtương  thích"ʺ  của  RDF  Do  đó,  số  liệu  đánh  giá  các   phương  pháp  tiếp  cận  tạo  ánh  xạ  khác  nhau  liên  quan  đến  tích  hợp  dữ  liệu  

2.2   Các  tiếp  cận  chuyển  lược  đồ  RDB  sang  RDF  và  RDFS  

Trong  phần  này,  chúng  tôi  phân  loại  các  công  việc  khảo  sát  thành  ba  lớp  lớn  cụ  thể  là:  

−   Các  dự  án  nhằm  chứng  minh  các  khái  niệm:  Dự  án  xem  xét  trong  phần  này  là  khám  phá  

cách  tiếp  cận  cụ  thể  để  chuyển  đổi  ánh  xạ  từ  RDB  sang  RDF  với  một  mẫu  tin  hoặc  chứng  minh   thực  hiện  khái  niệm  Công  việc  có  thể  có  hoặc  không  có,  dẫn  đến  việc  phát  triển  một  công  cụ/ứng   dụng  chung  

Trang 4

−   Các  dự  án  ứng  dụng  theo  miền:  Nhiều  dự  án  được  khảo  sát  đã  thúc  đẩy  bởi  yêu  cầu  ứng  

dụng  thế  giới  thực  và  đã  sử  dụng  ngữ  nghĩa  miền  dựa  vào  ánh  xạ  tùy  chọn,  công  cụ  tạo  ánh  xạ   dùng  chung  hoặc  kết  hợp  cả  hai  

−   Công  cụ/ứng  dụng:  Các  dự  án  khảo  sát  bao  gồm  D2RQ,  R2O,  Virtuoso,  Triplify  và  các  

công  cụ  Dartgrid  đã  được  đưa  ra  để  ánh  xạ  RDB  sang  RDF  

Hình 1: Mô hình cấu trúc tham chiếu cho việc chuyển đổi RDB sang RDF   2.2.1   Các  công  cụ  và  ứng  dụng  

Virtuoso  RDF  View  [4]  sử  dụng  phương  pháp  bảng  thành  lớp  (lớp  RDFS),  cột  thành  vị  từ  

và  đưa  vào  xem  xét  trường  hợp  đặc  biệt  chẳng  hạn  như  việc  một  cột  là  một  phần  của  khóa  chính   hoặc  khóa  ngoại  Các  mối  quan  hệ  khóa  ngoại  giữa  các  bảng  được  thực  hiện  rõ  ràng  giữa  các  lớp  

có  liên  quan  để  đại  diện  cho  các  bảng  Các  dữ  liệu  RDB  được  biểu  diễn  là  đồ  thị  Virtuoso  RDF  

mà  không  tạo  vật  lý  của  bộ  dữ  liệu  RDF  Virtuoso  RDF  View  được  tạo  thành  từ  "ʺmô  hình  ánh  xạ   Quad"ʺ  mà  các  ánh  xạ  được  định  nghĩa  từ  một  tập  hợp  bộ  ba  các  cột  của  RDB  Mô  hình  ánh  xạ   quad  được  thể  hiện  không  những  bằng  ngôn  ngữ  siêu  lược  đồ  Virtuoso  mà  còn  hỗ  trợ  SPARQL   –  kiểu  ghi  chú  

Công  cụ  D2RQ  [4]  cung  cấp  một  môi  trường  tích  hợp  với  nhiều  tùy  chọn  để  truy  cập  dữ   liệu  quan  hệ  bao  gồm  cả  "ʺRDF  dumps"ʺ,  truy  cập  dựa  trên  Jena  và  Sesame  API  (gọi  là  API  được   viết  lại  từ  SQL),  và  SPARQL  trên  D2RQ  Server  Các  ánh  xạ  có  thể  được  xác  định  bởi  người  dùng,  

do  đó  cho  phép  kết  hợp  ngữ  nghĩa  miền  trong  quá  trình  ánh  xạ,  mặc  dù  có  một  số  hạn  chế  Các   ánh  xạ  được  thể  hiện  trong  một  "ʺkhai  báo  ngôn  ngữ  ánh  xạ"ʺ  Hiệu  suất  khác  nhau  tùy  thuộc  vào  

Trang 5

phương  pháp  tiếp  cận  và  được  thực  hiện  khá  tốt  cho  các  mô  hình  bộ  ba  cơ  bản  nhưng  các  chức   năng  của  SPARQL  như  FILTER,  LIMIT  được  sử  dụng  

Công  cụ  Triplify  [4]  là  một  phương  pháp  đơn  giản  để  chuyển  RDF  và  dữ  liệu  liên  kết  từ  cơ  

sở  dữ  liệu  quan  hệ  Triplify  dựa  trên  ánh  xạ  các  yêu  cầu  HTTP-­‐‑  URI  vào  các  truy  vấn  cơ  sở  dữ   liệu  quan  hệ  được  thể  hiện  trong  SQL  với  một  số  bổ  sung  Triplify  trình  bày  việc  chuyển  đổi  các   mối  quan  hệ  kết  quả  vào  RDF  và  công  bố  các  dữ  liệu  RDF  trên  web  theo  trình  tự  khác  nhau,  đặc   biệt  là  dữ  liệu  liên  kết  Triplify  được  bổ  sung  bởi  một  thư  viện  các  cấu  hình  cho  lược  đồ  quan  hệ   chung  và  một  REST  cho  phép  nguồn  dữ  liệu  đăng  ký  Kiến  trúc  gọn  nhẹ  của  Triplify  là  có  thể  sử   dụng  để  xuất  bản  bộ  dữ  liệu  rất  lớn,  chẳng  hạn  như  160GB  dữ  liệu  từ  dự  án  OpenStreetMap   Công  cụ  R2O  [4]  là  một  ngôn  ngữ  khai  báo  dựa  trên  XML  để  thể  hiện  ánh  xạ  giữa  các  yếu  

tố  RDB  và  ontology  Ánh  xạ  R2O  có  thể  được  sử  dụng  để  "ʺphát  hiện  mâu  thuẫn  và  không  rõ  ràng"ʺ   trong  định  nghĩa  bản  đồ  Công  cụ  ODEMapster  đã  sử  dụng  một  tài  liệu  R2O  hoặc  là  thực  hiện   việc  chuyển  đổi  để  đáp  ứng  với  một  truy  vấn  hoặc  trong  một  hàng  loạt  các  chế  độ  để  tạo  ra  một   biến  RDF  

RDBToOnto  [4]  là  một  công  cụ  có  cấu  hình  cao  giúp  giảm  bớt  việc  thiết  kế  và  thực  hiện  các   phương  pháp  để  đạt  được  ontology  từ  cơ  sở  dữ  liệu  quan  hệ  Nó  cũng  là  một  công  cụ  định  hướng   người  dùng  trong  quá  trình  chuyển  đổi  cơ  sở  dữ  liệu  đầu  vào  để  tạo  ra  các  ontology  Thiết  lập   các  thông  số  và  kiểm  soát  quá  trình  được  thực  hiện  thông  qua  một  giao  diện  chuyên  dụng  chính   thức  

3.1   Giới  thiệu  R2RML  

R2RML  (Relational  Database  to  Resource  Description  Frameworks  of  mapping  language)  

là  một  ngôn  ngữ  để  thể  hiện  ánh  xạ  từ  các  cơ  sở  dữ  liệu  quan  hệ  sang  bộ  dữ  liệu  RDF  Ánh  xạ   này  cung  cấp  khả  năng  xem  dữ  liệu  hiện  có  trong  mô  hình  dữ  liệu  quan  hệ  RDF,  được  thể  hiện   trong  một  cấu  trúc  và  từ  vựng  [10]  

R2RML  cũng  được  định  nghĩa  là  một  ánh  xạ  trực  tiếp  từ  cơ  sở  dữ  liệu  quan  hệ  sang  RDF   Trong  các  ánh  xạ  trực  tiếp  của  một  cơ  sở  dữ  liệu,  cấu  trúc  của  đồ  thị  RDF  là  kết  quả  phản  ánh   trực  tiếp  cấu  trúc  của  cơ  sở  dữ  liệu,  mục  từ  trong  từ  vựng  RDF  phản  ánh  trực  tiếp  tên  của  các   phần  tử  trong  lược  đồ  cơ  sở  dữ  liệu  Mỗi  ánh  xạ  R2RML  là  phù  hợp  với  một  lược  đồ  cơ  sở  dữ  liệu  

và  mục  từ  từ  vựng  Các  đầu  vào  một  ánh  xạ  R2RML  là  một  cơ  sở  dữ  liệu  quan  hệ  phù  hợp  vào   lược  đồ  đó  Đầu  ra  là  một  tập  dữ  liệu  RDF  có  sử  dụng  vị  từ  và  các  kiểu  từ  vựng  Ánh  xạ  R2RML   được  thể  hiện  dưới  dạng  đồ  thị  RDF  và  cú  pháp  Turtle  

Bảng  1:  Bảng  qui  định  không  gian  tên:  

Prefix   IRI  

rr:   http://www.w3.org/ns/r2rml#  

Trang 6

rdf:   http://www.w3.org/1999/02/22-­‐‑rdf-­‐‑syntax-­‐‑ns#  

rdfs:   http://www.w3.org/2000/01/rdf-­‐‑schema#  

xsd:   http://www.w3.org/2001/01/XMLSchema#  

ex:   http://example.com/ns#  

3.2   Các  thành  phần  R2RML  

3.2.1   Một  số  thuật  ngữ  (Terminology)    

Các  thuật  ngữ  dưới  đây  được  định  nghĩa  trong  khái  niệm  và  cú  pháp  của  RDF  và  được  

sử  dụng  trong  R2RML  [10]:  

•   RDF  graph:  là  một  tập  bộ  ba  của  RDF  

•    RDF  triple:  là  bộ  ba  của  RDF  (chủ  thể,  vị  từ,  đối  tượng)  

•   Literal:  được  sử  dụng  để  xáx  định  số  hoặc  ngày  tháng  bằng  cách  biểu  diễn  từ  vựng  

Nó  là  một  đối  tượng  

•   typed  literal:  là  một  mẫu  từ  vựng  hoặc  tham  chiếu  URI  của  RDF  

•   language  tag:  thẻ  ngôn  ngữ  

•   datatype  IRI:  kiểu  dữ  liệu  của  IRI  

•   blank  node  (nút  trống):  là  một  nút  không  phải  là  một  tham  chiếu  URI  hoặc  một  chữ   Một  nút  trống  là  một  nút  duy  nhất  có  thể  được  sử  dụng  một  hoặc  nhiều  câu  lệnh  

trong  RDF,  nhưng  không  có  tên  bên  trong  

•   blank  node  identifier:  định  danh  nút  trống  để  phân  biệt  với  tất  cả  các  URI  và  literals  

3.2.2   Các  mục  từ  trong  bộ  từ  vựng  R2RML  

a   Lớp:  

Bảng  2:  Các  lớp  trong  R2RML  

rr:BaseTableOrView   SQL  dựa  vào  bảng  hoặc  

khung  nhìn   Thuộc  tính  rr:tableName  

rr:LogicalTable   Bảng  logic   rr:BaseTableOrView  hoặc  rr:R2RMLView   rr:ObjectMap   Ánh  xạ  đối  tượng   rr:TermMap  là  một  giá  trị  thuộc  tính  rr:ob-­‐‑

jectMap   rr:PredicateMap   Ánh  xạ  vị  từ   rr:TermMap  là  một  giá  trị  của  thuộc  tính  

rr:predicateMap   rr:PredicateObjectMap   Ánh  xạ  vị  từ  -­‐‑  đối  tượng   rr:predicate  và  rr:predicateMap  có  ít  nhất  

trong  rr:object  và  rr:objectMap   rr:R2RMLView   Khung  nhìn  R2RML   rr:sqlQuery  là  một  thuộc  tính  

rr:RefObjectMap   Ánh  xạ  đối  tượng  tham  

chiếu     rr:parentTriplesMap  là  một  thuộc  tính   rr:SubjectMap   Ánh  xạ  chủ  thể   rr:TermMap  là  một  giá  trị  của  thuộc  tính  

của  rr:subjectMap     rr:TermMap   Ánh  xạ  mục  từ   rr:constant,  rr:column,  rr:template  

Trang 7

b   Thuộc  tính:  

Bảng  3:  Các  thuộc  tính  trong  R2RML  

rr:column   Tên  cột   cột  giá  trị  thuật  ngữ  ánh  xạ   rr:datatype   Xác  định  kiểu  dữ  liệu   Thuật  ngữ  ánh  xạ  

rr:constant   Giá  trị  hằng  số   Thuật  ngữ  ánh  xạ  giá  trị  liên  tục   rr:joinCondition   Điều  kiện  ràng  buộc   Tham  chiếu  ánh  xạ  đối  tượng   rr:logicalTable   Bảng  logic   Ánh  xạ  bộ  ba  

rr:objectMap   Ánh  xạ  đối  tượng,     Ánh  xạ  vị  từ  -­‐‑  đối  tượng  

rr:parent   Cột  parent     Điều  kiện  ràng  buộc  

rr:parentTriplesMap   Ánh  xạ    bộ  ba  parent     Ánh  xạ  đối  tượng  tham  chiếu  

rr:predicateObjectMap   Ánh  xạ  đối  tượng  –  vị  từ   Ánh  xạ  bộ  ba  

rr:sqlQuery   Truy  vấn  SQL   Khung  nhìn  R2RML    

rr:sqlVersion   Định  danh  phiên  bản  SQL     Khung  nhìn  R2RML    

rr:subject   Thuộc  tính  hằng  số  

Ánh  xạ  bộ  ba   rr:subjectMap   Ánh  xạ  đối  tượng  

4   Chuyển   đổi   cơ   sở   dữ   liệu   quan   hệ   sang   RDF   và   RDFS   với     ngôn   ngữ   R2RML  

4.1   Các  bộ  xử  lý  và  ánh  xạ  R2RML  

Trong  Hình  2,  Ánh  xạ  R2RML  định  nghĩa  một  ánh  xạ  từ  một  cơ  sở  dữ  liệu  quan  hệ  sang   RDF  Nó  là  một  cấu  trúc  bao  gồm  một  hoặc  nhiều  ánh  xạ  bộ  ba[10]  Bộ  xử  lý  R2RML  là  một  hệ   thống,  một  ánh  xạ  R2RML  và  một  cơ  sở  dữ  liệu  đầu  vào  nhằm  cung  cấp  truy  cập  cho  các  dữ  liệu   đầu  ra  Đầu  vào  cho  một  ánh  xạ  R2RML  là  cơ  sở  dữ  liệu  

Phương  pháp  truy  cập  vào  các  dữ  liệu  đầu  ra  được  cung  cấp  bởi  một  bộ  xử  lý  R2RML   tương  ứng  Một  bộ  xử  lý  R2RML  có  thể  cụ  thể  hóa  các  dữ  liệu  đầu  ra  vào  cho  một  tập  tin,  hoặc   cung  cấp  truy  cập  ảo  thông  qua  một  giao  diện  để  truy  vấn  cơ  sở  dữ  liệu  đầu  vào,  hoặc  cung  cấp   bất  kỳ  phương  tiện  cho  các  dữ  liệu  đầu  ra  

Trang 8

 

Hình  2:  Chuyển  đổi  cơ  sở  dữ  liệu  quan  hệ  sang  RDF  

Một  bộ  xử  lý  R2RML  cũng  có  quyền  truy  cập  vào  môi  trường  thực  thi  bao  gồm:  

•   Kết  nối  SQL  vào  cơ  sở  dữ  liệu  đầu  vào,  

•   Sử  dụng  IRI  trong  việc  giải  quyết  các  quan  hệ  được  tạo  ra  bởi  các  ánh  xạ  R2RML  

Dữ  liệu  R2RML  là  một  hệ  thống  đầu  vào  của  một  ánh  xạ  R2RML,  IRI  và  SQL,  và  sẽ  kết  nối   đến  một  cơ  sở  dữ  liệu  đầu  vào  đồng  thời  kiểm  tra  sự  xuất  hiện  của  các  lỗi  dữ  liệu  Khi  kiểm  tra  

cơ  sở  dữ  liệu  đầu  vào,  phải  báo  cáo  bất  kỳ  lỗi  nào  mà  dữ  liệu  được  đưa  ra  trong  quá  trình  tạo  ra   các  dữ  liệu  đầu  ra  

4.1.1   Ánh  xạ  đồ  thị  và  từ  vựng  R2RML  

Một  ánh  xạ  R2RML  được  biểu  diễn  như  một  đồ  thị  RDF  Nói  cách  khác,  RDF  được  sử  dụng   không  chỉ  là  mô  hình  dữ  liệu  của  ánh  xạ,  mà  còn  là  một  hình  thức  đại  diện  cho  ánh  xạ  R2RML   chính  nó  [10]  

Một  đồ  thị  RDF  đại  diện  cho  một  ánh  xạ  R2RML  được  gọi  là  một  đồ  thị  ánh  xạ  R2RML  Từ   vựng  R2RML  là  tập  hợp  các  IRIs  được  bắt  đầu  với  

rr:namespace      IRI:http://www.w3.org/ns/r2rml  #.  

Một  đồ  thị  ánh  xạ  R2RML  bao  gồm:  

−   Không   nên   bắt   đầu   IRI   với   rr:namespace   mà   không   được   định   nghĩa   trong   từ   vựng  

R2RML  

−   Không  nên  sử  dụng  IRI  từ  từ  vựng  R2RML    

−   Nên  tạo  ánh  xạ  các  thành  phần  được  tham  chiếu  bởi  một  số  ánh  xạ  bộ  ba  

−   Có  thể  thêm  bộ  ba  có  điều  kiện  không  thuộc  từ  vựng  R2RML    

−   Có  thể  gán  IRI  hoặc  định  danh  nút  rỗng  cho  bất  kỳ  thành  phần  ánh  xạ  được  phép  tái  

sử  dụng  từ  các  thành  phần  ánh  xạ  trong  đồ  thị  ánh  xạ    

Từ  vựng  R2RML  bao  gồm  các  lớp  R2RML  sau  đây  :  

−   rr:TriplesMap  là  lớp  của    ánh  xạ  bộ  ba  

−   rr:TermMap  là  lớp  của  ánh  xạ  thuật  ngữ  

Nó  có  bốn  lớp  con:  

−   rr:SubjectMap  là  lớp  của  ánh  xạ  chủ  thể  

Trang 9

−   rr:PredicateMap  là  lớp  của  ánh  xạ  vị  từ    

−   rr:ObjectMap  là  lớp  của  ánh  xạ  đối  tượng  

−   rr:GraphMap  là  lớp  của  ánh  xạ  đồ  thị  

−   rr:PredicateObjectMap  là  lớp  ánh  xạ  vị  từ  -­‐‑  đối  tượng  

−   rr:RefObjectMap  là  lớp  của  ánh  xạ  đối  tượng  tham  chiếu  

−   rr:Join  là  lớp  của  điều  kiện  ràng  buộc  

4.1.2   Ánh  xạ  mặc  định  

Một  bộ  xử  lý  R2RML  có  thể  bao  gồm  các  ánh  xạ  mặc  định  R2RML  Đây  là  một  cơ  sở  để   xem  xét  lược  đồ  của  cơ  sở  dữ  liệu  đầu  vào  và  tạo  ra  một  ánh  xạ  R2RML  dưới  hình  thức  một  tài   liệu  ánh  xạ  R2RML  Một  ánh  xạ  như  vậy  được  gọi  là  một  ánh  xạ  mặc  định  Ánh  xạ  mặc  định  coi   đầu  ra  của  nó  là  đồ  thị  trực  tiếp  tương  ứng  với  cơ  sở  dữ  liệu  đầu  vào  

4.2   Định  nghĩa  các  bảng  logic  

 

Hình  3:  Thuộc  tính  của  các  bảng  logic  

Bảng  logic  là  kết  quả  của  một  truy  vấn  SQL  được  ánh  xạ  tới  bộ  ba  của  RDF  Một  bảng   logic  là  một  trong  hai  trường  hợp  sau:  

Ÿ   Bảng  SQL  hoặc  khung  nhìn,  hoặc  

Ÿ   Khung  nhìn  R2RML  

Bảng  logic  là  một  truy  vấn  SQL  hiệu  quả  nếu  thực  hiện  qua  kết  nối  SQL,  sản  phẩm  là  kết   quả  các  nội  dung  của  bảng  logic  Dòng  của  bảng  logic  là  dòng  trong  một  bảng  logic.Tên  cột  là   tên  của  một  cột  trong  một  bảng  logic    

4.2.1   SQL  dựa  vào  các  bảng  và  khung  nhìn  (rr:tableName)  

 SQL  dựa  vào  bảng  hoặc  khung  nhìn  là  một  bảng  logic  có  chứa  dữ  liệu  SQL  từ  một  bảng  

hoặc  khung  nhìn  trong  cơ  sở  dữ  liệu  đầu  vào  Nó  được  đại  diện  bởi  nguồn  tài  nguyên  có  chính  

xác  một  thuộc  tính  rr:tableName  

Giá  trị  của  rr:tableName  xác  định  tên  của  bảng  hoặc  khung  nhìn  Giá  trị  của  nó  phải  là  tên  

một  lược  đồ  có  điều  kiện  cho  bảng  hoặc  khung  nhìn  hiện  có  trong  cơ  sở  dữ  liệu  đầu  vào  

Trang 10

Các  truy  vấn  SQL  có  hiệu  quả  dựa  vào  bảng  hoặc  khung  nhìn  là:    SELECT  *  FROM  {ta-­‐‑

ble},  với  {table}  là  tên  bảng  hoặc  khung  nhìn  

4.2.2   Khung  nhìn  R2RML  (rr:sqlQuery,  rr:sqlVersion)  

Khung  nhìn  R2RML  là  một  bảng  logic  có  nội  dung  là  kết  quả  của  việc  thực  hiện  truy  vấn   SQL  cho  cơ  sở  dữ  liệu  đầu  vào  Nó  được  đại  diện  bởi  nguồn  tài  nguyên  có  chính  xác  một  thuộc  

tính  rr:  sqlquery  

R2RML  đôi  khi  đòi  hỏi  phải  chuyển  đổi  dữ  liệu,  tính  toán,  hoặc  lọc  trước  khi  tạo  ra  từ  cơ  

sở  dữ  liệu  Điều  này  có  thể  đạt  được  bằng  cách  xác  định  SQL  trong  cơ  sở  dữ  liệu  đầu  vào  và  đề  

cập  đến  nó  với  rr:tableName    

Câu  lệnh  truy  vấn  SELECT  trong  ngôn  ngữ  SQL  có  thể  được  thực  hiện  trên  cơ  sở  dữ  liệu   đầu  vào  Trong  câu  lệnh  SQL  kết  thúc  câu  lệnh  truy  vấn  SELECT  là  dấu  chấm  phẩy  Kết  quả  của   việc  thực  hiện  truy  vấn  phải  không  có  tên  cột  trùng  nhau  Đối  tượng  tham  chiếu  cơ  sở  dữ  liệu   trong  các  truy  vấn  SQL  có  thể  có  đủ  điều  kiện  với  tên  danh  mục  hoặc  tên  lược  đồ  

Một  khung  nhìn  R2RML  có  thể  có  một  hoặc  nhiều  phiên  bản  nhận  dạng  SQL  Phải  có  IRIs  

hợp  lệ  và  được  đại  diện  như  là  giá  trị  thuộc  tính  của  rr:sqlVersion  Định  danh  phiên  bản  SQL  sau  

đây  chỉ  ra  rằng  các  truy  vấn  SQL  phù  hợp  với  Core  SQL  2008  

http://www.w3.org/ns/r2rml  #  SQL2008  

Hiệu  quả  câu  lệnh  truy  vấn  SQL  của  khung  nhìn  R2RML  là  giá  trị  thuộc  tính  của  rr:sqlquery  

Ví  dụ:  Một  bảng  logic  của  khung  nhìn  R2RML  phù  hợp  với  Core  SQL  2008  

[] rr:sqlQuery """

Select ('PHONGBAN' || Mapb) AS PHONGID, Mapb, Tenpb

from PHONGBAN

""";

rr:sqlVersion rr:SQL2008

4.2.3   Ánh  xạ  các  bảng  logic  sang  RDF  với  ánh  xạ  bộ  ba  

Một  ánh  xạ  bộ  ba  quy  định  một  quy  tắc  chuyển  đổi  mỗi  hàng  của  một  bảng  logic  có  thể   không  có  hoặc  có  nhiều  bộ  ba  RDF  

Các  bộ  ba  RDF  tạo  ra  từ  một  hàng  trong  bảng  logic  được  chia  sẽ  tất  cả  các  chủ  thể  

Một  ánh  xạ  bộ  ba  được  đại  diện  bởi  một  tham  chiếu  từ  các  tài  nguyên  này  đến  các  tài   nguyên  khác  như  sau:  

−   Phải  có  chính  xác  một  thuộc  tính  rr:logicalTable  Giá  trị  của  nó  là  một  bảng  logic  mà  kết  

quả  truy  vấn  SQL  được  ánh  xạ  tới  bộ  ba  

Ngày đăng: 07/04/2016, 05:57

HÌNH ẢNH LIÊN QUAN

Hình 1: Mô hình cấu trúc tham chiếu cho việc chuyển đổi  RDB sang RDF    2.2.1.    Các  công  cụ  và  ứng  dụng - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
Hình 1 Mô hình cấu trúc tham chiếu cho việc chuyển đổi RDB sang RDF   2.2.1.   Các  công  cụ  và  ứng  dụng (Trang 4)
Hình  2:  Chuyển  đổi  cơ  sở  dữ  liệu  quan  hệ  sang  RDF - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
nh  2:  Chuyển  đổi  cơ  sở  dữ  liệu  quan  hệ  sang  RDF (Trang 8)
Hình  3:  Thuộc  tính  của  các  bảng  logic - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
nh  3:  Thuộc  tính  của  các  bảng  logic (Trang 9)
Hình  4:  Thuộc  tính  của  ánh  xạ  bộ  ba - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
nh  4:  Thuộc  tính  của  ánh  xạ  bộ  ba (Trang 11)
Hình  5:  Thuộc  tính  của  các  ánh  xạ  mục  từ - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
nh  5:  Thuộc  tính  của  các  ánh  xạ  mục  từ (Trang 13)
Bảng  NHANVIEN  (EMPLOYEE)  với  khoá  chính  là  manv. - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
ng  NHANVIEN  (EMPLOYEE)  với  khoá  chính  là  manv (Trang 17)
Hình  8:  Các  bảng  của  RDB  trong  Virtuoso. - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
nh  8:  Các  bảng  của  RDB  trong  Virtuoso (Trang 17)
Bảng  HOADON  (INVOICES) - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
ng  HOADON  (INVOICES) (Trang 18)
Bảng  KHACHHANG  (CUSTOMER)   Bảng  SANPHAM  (PRODUCT) - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
ng  KHACHHANG  (CUSTOMER)   Bảng  SANPHAM  (PRODUCT) (Trang 18)
Hình  10:  Dữ  liệu  RDFS  biểu  diễn  trong  Ontology  dưới  dạng  OWL - ỨNG DỤNG R2RML ĐỂ CHUYỂN ĐỔI CƠ SỞ DỮ LIỆU CHO LINKED DATA
nh  10:  Dữ  liệu  RDFS  biểu  diễn  trong  Ontology  dưới  dạng  OWL (Trang 19)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w