Các CSDL này đã được tiến hành qua nhiều giai đoạn và diễn biến theo thời gian, số liệu ngày càng được bổ sung theo thời gian nhưng chưa có một công trình nghiên cứu tổng thể và thống nh
Trang 1Chuyên ngành: Hệ thống thông tin
Mã số: 61.49.01.04
TÓM TẮT
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Đà Nẵng – Năm 2017
Trang 2Công trình được hoàn thành tại
TRƯỜNG ĐẠI HỌC SƯ PHẠM - ĐHĐN
Người hướng dẫn khoa học: TS Nguyễn Trần Quốc Vinh
Phản biện 1: PGS.TS Lê Văn Sơn
Phản biện 2: TS Trần Thiên Thành
Luận văn được bảo vệ trước Hội đồng chấm Luận văn tốt nghiệp thạc sĩ Hệ thống thông tin họp tại Trường Đại học Sư phạm - ĐHĐN vào ngày 30 tháng 07 năm 2017
Có thể tìm hiểu luận văn tại:
- Thư viện Trường Đại học Sư phạm Đà Nẵng, Đại học Đà Nẵng
- Trung tâm thông tin học liệu, Đại học Đà Nẵng
Trang 3MỞ ĐẦU
1 Lý do chọn đề tài
Vấn đề xây dựng cơ sở dữ liệu ứng dụng cho mô hình quản
lý thảm thực vật đóng một vai trò rất quan trọng Bởi theo quan điểm sinh thái học, thảm thực vật là tấm gương phản ánh khách quan các điều kiện tự nhiên, nhân tố môi trường Đồng thời là thành phần quan trọng của sinh quyển Thực vật không những là một nhóm yếu tố tự nhiên quan trọng của lớp vỏ địa lý mà còn là nguồn tài nguyên có giá trị, cung cấp nguyên vật liệu đáp ứng nhu cầu sống của con người
Dựa trên các công trình nghiên cứu về thảm thực vật [1-3] Các CSDL này đã được tiến hành qua nhiều giai đoạn và diễn biến theo thời gian, số liệu ngày càng được bổ sung theo thời gian nhưng chưa có một công trình nghiên cứu tổng thể và thống nhất với các công trình trước đó nên số liệu về thảm thực vật khác nhau theo các công bố khác nhau Các CSDL này phải được tổ chức và sắp xếp lại sao cho hợp lý hơn
Các thao tác dữ liệu truyền thống chỉ cho phép truy cập dữ liệu ở thời điểm hiện tại, không thể truy cập đến các phiên bản dữ liệu trong quá khứ [4]
Ngày nay, phương pháp mô hình hoá hệ thống Anchor [5] cho phép mô hình hoá các hệ thống lớn cần lưu lại tính lịch sử của
dữ liệu Phương pháp này ra đời nhằm giải quyết được các hạn chế
về việc lưu trữ các dữ liệu lịch sử của các phương pháp mô hình hoá
hệ thống khác như UML, ERM, FCO-IM Bộ công cụ Anchor
Trang 4Modeler tự động sinh CSDL thời gian Anchor cho các hệ quản trị CSDL quan hệ đảm bảo tính toàn vẹn của CSDL Ứng dụng của bộ công cụ này rất lớn khi nó được áp dụng vào các hệ thông thông tin lớn, nơi dữ liệu lịch sử rất quan trọng, như đa dạng hệ sinh học, ngân hàng, bảo hiểm, hàng không, chứng khoán…
Trên quan điểm xây dựng một bộ số liệu cập nhật chính xác, thống nhất làm cơ sở cho việc đánh giá, rà soát tính đa dạng của thảm thực vật về mặt đa dạng loài, đa dạng giá trị sử dụng, dạng sống
và tình trạng bảo tồn của các loài thực vật nhằm phục vụ công tác quản lý bảo tồn hệ sinh thái rừng có hiệu quả hơn
Như vậy, thiết kế CSDL thời gian theo mô hình Anchor (Anchor Modeling - AM) cho phép truy cập đến dữ liệu toàn cảnh ở bất kỳ thời điểm nào trong quá khứ, cung cấp cơ chế mở rộng không hủy, theo đó cho phép khả năng quản trị thay đổi dữ liệu rất mạnh và mềm dẻo là cần thiết cho hệ thống quản lý thảm thực vật hiện nay là cấp thiết
Xuất phát từ những lý do trên được sự đồng ý và hướng dẫn
của TS Nguyễn Trần Quốc Vinh, tôi chọn đề tài “Thiết kế cơ sở dữ
liệu theo mô hình Anchor Modeling cho hệ thống quản lý thảm thực vật” để làm luận văn thạc sỹ
2 Mục tiêu và nhiệm vụ đề tài
Mục tiêu
- Nghiên cứu về AM
- Thiết kế được CSDL thời gian cho hệ thống quản lý thảm thực vật
Trang 5- Xây dựng được hệ thống quản lí thảm thực vật minh hoạ
Nhiệm vụ
- Tìm và đọc tài liệu về AM
- Khai thác các công cụ hỗ trợ xây dựng CSDL theo AM
- Xây dựng CSDL cho hệ thống quản lý thảm thực vật theo AM
- Xây dựng hệ thống thông tin quản lý thảm thực vật sử dụng CSDL theo thời gian cho phép tìm kiếm dữ liệu về thảm thực vật theo bối cảnh thời gian
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
- Dữ liệu GIS được quản lý trên nền geoServer
- Hệ thống thông tin quản lý thảm thực vật trên nền GIS cho phép tìm kiếm và hiển thị kết quả theo bối cảnh thời gian
4 Phương pháp nghiên cứu
Sử dụng hai phương pháp chính là nghiên cứu lý thuyết và nghiên cứu thực nghiệm
Trang 6 Phương pháp nghiên cứu tài liệu
- Tìm hiểu về CSDL và hệ quản trị CSDL, AM
- Nghiên cứu từ các bài báo, phân tích và thiết kế CSDL, các CSDL liên quan về thảm thực vật, các KBT thiên nhiên…
- Đề xuất các chức năng cho ứng dụng dựa trên các kỹ thuật
đã nghiên cứu
Phương pháp thực nghiệm
- Áp dụng mô hình phát triển phần mềm thác nước để xây dựng hệ thống thông tin quản lý thảm thực vật sử dụng CSDL theo thời gian cho phép tìm kiếm dữ liệu về thảm thực vật theo bối cảnh thời gian trên nền GIS
- Thực nghiệm trên dữ liệu đầu vào là thảm thực vật của các
Ý nghĩa khoa học và thực tiễn
Về khoa học: Góp phần phát triển hệ thống thông tin địa lý
về sự đa dạng sinh học ở nước ta
Từ kết quả nghiên cứu của đề tài tìm hiểu sâu hơn về kỹ thuật thiết kế CSDL theo chuẩn AM
Nghiên cứu sâu hơn về thuật toán lưu trữ và quay lại dữ liệu tại thời điểm nào đó trong quá khứ
Trang 7Về thực tiễn: Kết quả nghiên cứu của đề tài thúc đẩy việc áp
dụng công nghệ thông tin vào việc hỗ trợ quản lý đa dạng sinh học, cũng phần nào đáp ứng được các nhu cầu cần thiết về thông tin trong công tác bảo vệ môi trường, bảo tồn đa dạng sinh học của nước nhà
6 Bố cục luận văn
Nội dung của luận văn được trình bày bao gồm các phần chính như sau:
Chương 1 – TỔNG QUAN VỀ MÔ HÌNH ANCHOR
Chương này, luận văn trình bày các cơ sở lí thuyết về dữ liệu
có yếu tố thời gian, dữ liệu tiến hóa, mô hình hóa dữ liệu với AM, các khái niệm cơ bản và truy cập dữ liệu trong AM
Chương 2 – ĐA DẠNG THỰC VẬT
Trong chương 2, luận văn trình bày tổng quan về đa dạng thực vật, các phân tích, thiết kế CSDL thảm thực vật, xây dựng được các mô hình thực thể, mô hình dữ liệu làm tiền đề giải quyết bài toán thiết kế CSDL theo AM cho hệ thống quản lí thảm thực vật
Chương 3 – THIẾT KẾ CƠ SỞ DỮ LIỆU ANCHOR MODELING CHO HỆ THỐNG QUẢN LÝ THẢM THỰC VẬT
Chương 3, tập trung vào thiết kế CSDL theo AM cho hệ thống quản lí thảm thực vật, cài đặt và thực nghiệm chương trình
Cuối cùng là những đánh giá, kết luận và hướng phát triển của đề tài trong tương lai
Trang 8CHƯƠNG 1 TỔNG QUAN VỀ MÔ HÌNH ANCHOR MODELING 1.1 GIỚI THIỆU
AM kết hợp chuẩn hoá lược đồ quan hệ và tính cạnh tranh (emulation) để cung cấp kỹ thuật mô hình hoá CSDL linh hoạt (agile) cho dữ liệu tiến hoá AM cung cấp hệ thống các nguyên tắc [21] theo đó, mô hình thu được có thể được triển khai theo mô hình
dữ liệu quan hệ một cách đơn giản Kết quả trực tiếp là CSDL thời gian đạt chuẩn 6NF
1.2 CƠ SỞ DỮ LIỆU THỜI GIAN
1.2.1 Khái niệm cơ sở dữ liệu có yếu tố thời gian
1.2.2 Thời gian thay đổi
1.2.3 Thời gian ghi
1.2.4 Thời gian diễn ra
1.3 CƠ SỞ DỮ LIỆU CHUẨN HÓA Ở MỨC THẤP
1.4 DỮ LIỆU TIẾN HÓA
1.5 MÔ HÌNH HÓA DỮ LIỆU VỚI ANCHOR MODELING
Nhìn chung, AM mang lại đầy đủ các lợi ích 8] của CSDL đạt dạng chuẩn 6NF:
- Quản lý và xử lý được dữ liệu tiến hoá, đảm bảo tính toàn vẹn của dữ liệu theo thời điểm bất kỳ
- Tăng vòng đời của CSDL so với vòng đời trung bình 5 năm
- Đơn giản hoá các khái niệm mô hình hoá (modeling concepts), giảm thiểu hoá lỗi mô hình hoá
- Cho phép phát triển theo mô-đun và tăng trưởng từng bước
Trang 9- Chuyển đổi sang CSDL vật lý đơn giản
- Cho phép và hỗ trợ công cụ sinh tự động các kịch bản tạo CSDL vật lý cũng như các khung nhìn, các hàm cần thiết
- Đặc biệt, chỉ quét những dữ liệu cần thiết trong quá trình xử
lý truy vấn nhờ mỗi cột được lưu trữ riêng lẻ trong từng bảng
- Không chấp nhận NULL nên khắc phục được vấn đề dữ liệu thưa thớt trong CSDL thông thường
1.6 NHỮNG KHÁI NIỆM CƠ BẢN VỀ MÔ HÌNH HÓA AM (ANCHOR MODELING)
Các khái niệm nền tảng trong AM bao gồm neo (anchor), giới hạn (knot), thuộc tính (attribute), thuộc tính hằng (static attribute), thuộc tính biến thiên (historized attribute), thuộc tính hằng giới hạn (knotted static attribute), thuộc tính biến thiên giới hạn (knotted historized attribute) Các loại mối quan hệ (tie) bao gồm quan hệ hằng (static tie), quan hệ biến thiên (historized tie), quan hệ hằng giới hạn (knotted static tie), quan hệ biến thiên giới hạn (knotted historized tie) [7]
Trong AM có các đối tượng sau:
Anchor: Lưu trữ các định danh của các thực thể
Knot: Lưu trữ miền giá trị của dữ liệu
Attributes: Lưu trữ các giá trị của các thuộc tính
Ties: Lưu trữ mối quan hệ giữa các thực thể
Trang 101.6.1 Tập thực thể (Anchor)
Trong mối tương quan với mô hình thực thể - mối quan hệ rất phổ biến, có thể hiểu, anchor là tập thực thể Anchor biểu diễn ID của thực thể Giới hạn đại diện cho một tập lực lượng nhỏ các giá trị
cố định theo thời gian, thường là những giá trị dùng chung cho nhiều thực thể khác nhau
1.6.2 Giới hạn (Knot)
Một giới hạn được sử dụng để biểu diễn một tập hợp các thực thể cố định, thường là nhỏ, không thay đổi theo thời gian Trong khi các tập thực thể được sử dụng để biểu diễn các thực thể tùy ý, thì các giới hạnđược sử dụng để quản lý các đặc tính chung trong nhiều thực thể của một số tập thực thể
1.6.3 Thuộc tính (Attribute)
Thuộc tính biểu diễn các thuộc tính của tập thực thể, cụ thể là của anchor Cần phân biệt bốn loại thuộc tính: thuộc tính hằng (Static Attribute), thuộc tính biến thiên (Historized Attribute), thuộc tính hằng giới hạn (Knotted Static Attribute), thuộc tính biến thiên giới hạn (Knotted Historized Attribute), xem hình 1.2
Hình 1.2 Kí hiệu tập thực thể
Trang 11Một tập thực thể -Anchor (a) được thể hiện dưới dạng một hình vuông đặc và một giới hạn -Knot (d) được thể hiện dưới dạng hình vuông được vẽ đường viền bên ngoài với góc hơi tròn Một thuộc tính hằng -Static Attribute (b) và một thuộc tính hằng giới hạn
- Knotted Static Attribute (e) được thể hiện dưới dạng hình tròn được
vẽ đường viền bên ngoài.Một thuộc tính biến thiên -Historized Attribute (c) và một thuộc tính biến thiên giới hạn -Knotted Historized Attribute (f) được hiển thị được thể hiện dưới dạng hình tròn với những đường viền bên ngoài kép.Các thuộc tính giới hạn liên quan đến một giới hạn
Định nghĩa 6 (Thuộc tính hằng - Static Attribute) Thuộc tính
hằng là những thuộc tính chấp nhận giá trị không thay đổi theo thời gian, chẳng hạn ngày sinh của một công dân
Định nghĩa 7 (Thuộc tính biến thiên – Historized
Attribute).Thuộc tính biến thiên là thuộc tính chấp nhận các giá trị có thể thay đổi theo thời gian và cần ghi lại sự thay đổi này, chẳng hạn, đơn vị công tác của một công dân
Định nghĩa 8 (Thuộc tính hằng giới hạn – Knotted Static
Attribute) Thuộc tính hằng giới hạn biểu diễn mối quan hệ giữa thực thể và giới hạn, cụ thể thuộc tính chấp nhận một giá trị cố định nào
đó từ tập số lượng nhỏ các giá trị; chẳng hạn, công dân có mã công dân CMT1( chứng minh thư 1) có giới tính nam
Định nghĩa 9 (Thuộc tính biến thiên giới hạn – Knotted
Historized Attribute).Thuộc tính biến thiên giới hạn biểu diễn thuộc tính của một thực thể có thể chấp nhận các giá trị khác nhau từ tập số
Trang 12lượng nhỏ các giá trị; chẳng hạn, công dân có thể được xếp vào các nhóm tuổi khác nhau theo thời gian
1.6.4 Mối quan hệ(Tie)
Một mối quan mô tả liên kết giữa hai hoặc nhiều tập thực thể anchor với nhau và các thực thể giới hạn tùy chọn
Tương tự như các thuộc tính, các mối quan hệ có bốn biến thể: quan hệ hằng (Static Tie), quan hệ biến thiên (Historized Tie), quan hệ hằng giới hạn (Knotted Static Tie), quan hệ biến thiên giới hạn (Knotted Historized Tie) Xem hình 1.3
Hình 1.3 Các mối quan hệ
Một quan hệ hằng – Static Tie (a) và một quan hệ hằng giới hạn – Knotted Static Tie (c) được thể hiện dưới dạng hình thoi đặc Một quan hệ biến thiên – Historized Tie (b) và một quan hệ biến thiên giới hạn – Knotted Historized (d) được thể hiện dưới dạng hình thoi đặc với một đường viền bên ngoài Các quan hệ giới hạn liên quan đến ít nhất một giới hạn Định danh của các liên kết được đánh dấu bằng các vòng tròn màu đen
Trang 13Định nghĩa 12 (Quan hệ hằng–Static Tie).Có thể hiểu mối
quan hệ hằng là mối quan hệ không thay đổi theo thời gian, chẳng hạn, mối quan hệ cha – con sinh học giữa hai anchor công dân Nó cũng có thể là ví dụ cho mối quan hệ hằng giới hạn, mối quan hệ sinh học giữa hai công dân: cha-con, mẹ-con, ông-cháu, bà-cháu, cô/dì/chú/bác – cháu
và không quan hệ huyết thống
Định nghĩa 13 (Quan hệ biến thiên – Historized Tie).Mối
quan hệ quan hệ biến thiên là mối liên kết có thể chấp nhận các giá trị khác nhau theo thời gian từ tập số lượng lớn các giá trị
Định nghĩa 15 (Quan hệ biến thiên giới hạn – Knotted
Historized) Mối quan hệ biến thiên giới hạn đại diện cho mối liên kết chấp nhận các giá trị khác nhau theo thời gian từ một tập số lượng nhỏ các giá trị giữa hai hoặc nhiều thực thể với nhau Chẳng hạn, mối quan hệ bạn bè, người yêu, vợ chồng giữa hai công dân với nhau.
1.6.5 Quy ƣớc đặt tên
Quy ước đặt tên được gợi ý chỉ sử dụng các chữ, số thông thường và các ký tự gạch dưới Điều này đảm bảo rằng các tên gọi giống nhau có thể được sử dụng trong nhiều biểu diễn, chẳng hạn như trong một CSDL quan hệ, XML hoặc một ngôn ngữ lập trình
Trang 14Khung nhìn cuối cho phép truy cập đến dữ liệu ở thời điểm hiện tại theo thời gian thực, thời điểm lớn nhất Hàm theo thời điểm cho phép truy cập đến dữ liệu ở thời điểm trong quá khứ được nhập vào là đối
số của hàm, dữ liệu bao gồm các giá trị mới nhất ở thời điểm đó và thường nhỏ hơn giá trị thời điểm hiện tại theo thời gian thực
1 create view
lAC_part_PR_in_RAT_got as
13 [RAT].RAT_ID = [AC_PR_RAT].RAT_ID_got
11 RAT_Rating [RAT] 23 [sub].PR_ID_in =
[AC_PR_RAT].PR_ID_in
Hình 1.5 Khung nhìn cuối
Trang 151 create function pAC_Actor
(@timepoint date) returns table
17 [GEN].GEN_ID = [AC_GEN].GEN_ID
2 return select 18 left join
9 AC_Actor [AC] 25 max([sub].AC_NAM_ValidFrom)
10 left join 26 from
11 AC_GEN_Actor_Gender
[AC_GEN]
27 AC_NAM_Actor_Name [sub]
13 [AC_GEN].AC_ID = [AC].AC_ID 29 [sub].AC_ID = [AC].AC_ID
14 left join 30 and
15 GEN_Gender [GEN] 31 [sub].AC_NAM_ValidFrom <=
Trang 16Anchor Modeler là một công cụ mô hình hoá CSDL cho phép tạo các mô hình dữ liệu thời gian sử dụng 6NF CSDL AM lưu lại tất cả các phiên bản dữ liệu, cho phép truy cập đến dữ liệu ở bất
kỳ thời điểm nào trong quá khứ với tốc độ truy cập rất cao
Mô hình hóa AM hỗ trợ mô hình hóa thông tin linh hoạt bằng cách đáp ứng yêu cầu rằng toàn bộ miền, doanh nghiệp phải được mô hình hóa trong một bước duy nhất Khả năng của một mô hình bao gồm tất cả không phải là một lựa chọn thực tế Hơn nữa, tại một số thời điểm, một sự thay đổi có thể xảy ra mà không thể lường trước được Mô hình hóa AM được xây dựng dựa trên giả định rằng không bao giờ có thể thực hiện được các dự đoán hoàn hảo Một mô hình không được xây dựng để trở thành mô hình cuối cùng mà nó được xây dựng để được thay đổi