1. Trang chủ
  2. » Công Nghệ Thông Tin

TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO PHƯƠNG PHÁP PHÂN TÍCH CỤM TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN

13 456 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 13
Dung lượng 1,15 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ BÁO CÁO MÔN CƠ SỞ DỮ LIỆU NÂNG CAO ĐỀ TÀI: PHƯƠNG PHÁP PHÂN TÍCH CỤM TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN GVHD : PGS.TS Nguyễn Hà Nam HVTH

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

BÁO CÁO MÔN

CƠ SỞ DỮ LIỆU NÂNG CAO

ĐỀ TÀI:

PHƯƠNG PHÁP PHÂN TÍCH CỤM

TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN

GVHD : PGS.TS Nguyễn Hà Nam HVTH : Khúc Ngọc Hiệp

Nguyễn Quang Minh

Trang 2

 Cơ sở dữ liệu không gian

 Khai phá dữ liệu không gian

 Phân tích cụm

NỘI DUNG TRÌNH BÀY

Trang 3

Guting (1994) định nghĩa :

- Là một cơ sở dữ liệu

- Có các kiểu dữ liệu không gian trong mô hình dữ liệu và ngôn ngữ truy vấn của nó

- Hỗ trợ các kiểu dữ liệu không gian và cung cấp ít nhất là chỉ số không và một thuật toán hiệu quả

cho phép kết không gian

CƠ SỞ DỮ LIỆU KHÔNG GIAN

Trang 4

Các đặc điểm của cơ sở dữ liệu không gian:

Các kiểu dữ liệu không gian Đánh chỉ số dữ liệu không gian

* Phép kết không gian (spatial joins)

Trang 5

KHAI PHÁ DỮ LIỆU KHÔNG GIAN

 Khai phá dữ liệu không gian là một lĩnh vực ứng dụng

đặc biệt của khai phá dữ liệu

 Khai phá dữ liệu không gian là quá trình khám phá các

mẫu đáng chú ý, có ích tiềm tàng, chưa biết trước từ các tập dữ liệu không gian lớn

Trang 6

KHAI PHÁ DỮ LIỆU KHÔNG GIAN

 Đặc điểm của khai phá dữ liệu không gian:

 Cấu trúc dữ liệu không gian

 Tập dữ liệu không gian

 Thu thập dữ liệu không gian

 Phụ thuộc không gian

 Tính tạm thời của dữ liệu không gian

 Các nhân tố khác liên quan đến những kỹ thuật và

khái niệm của kiến thức không gian:

 Các kỹ thuật khai phá dữ liệu không gian

 Các mô hình khái niệm dữ liệu không gian

Trang 7

 Phân tích cụm hay phân cụm là công việc gán một tập các đối tượng lại thành các nhóm

 Phân cụm là một trong những nhiệm vụ chính của

khai phá dữ liệu, là một kỹ thuật chung cho phân tích

dữ liệu thống kê

 Phân tích cụm bản thân nó không phải là một thuật

toán riêng, mà là một nhiệm vụ chung cần được giải quyết

PHÂN TÍCH CỤM

Trang 8

PHÂN TÍCH CỤM

 Các thuật toán phân cụm:

1 Phân cụm thứ bậc 3 Phân cụm dựa vào tâm

2 Phân cụm theo phân bố 4 Phân cụm theo mật độ

 các yêu cầu riêng cho các thuật toán phân cụm:

 Cần các thuật toán hiệu quả và mở rộng được

 Các thuật toán có thể xác định được các hình không theo quy luật

 Các phương pháp phân cụm không nhạy cảm với lượng lớn nhiễu.

 Các thuật toán không nhạy cảm với thứ tự của dữ liệu vào

 Không yêu cầu có kiến thức trước về dữ liệu

Trang 9

PHÂN TÍCH CỤM

Phân cụm theo phân bố:

vào Mỗi bảng ghi đầu vào được đọc liên tiếp Sự giống nhau của mỗi bản ghi với một trong những cụm đã tồn tại được tính toán

 Phân cụm theo phân bố sử dụng tiêu chuẩn gà chọi

để quản lý tính toán của độ giống nhau giữa các bản ghi, giữa bản ghi với các cụm và giữa các cụm với

các cụm

 Thuật toán tối ưu hóa mong muốn (EM-clustering)

Trang 10

PHÂN TÍCH CỤM

Tập dữ liệu thường

được mô hình hóa là

một số cố định (để loại

trừ overfitting) của các

được khởi tạo ngẫu

nhiên và các tham số

của nó được tối ưu

hóa qua các bước lặp

để phù hợp hơn với

tập dữ liệu

Trang 11

CHÂN THÀNH CẢM ƠN!

Trang 12

Hình 1: Kiểu dữ liệu không gian trong Oracle Spatial

Hình 2: Kiểu dữ liệu không gian trong DB2 Spatial Extender

Trang 13

Hình 3: Thứ tự đánh chỉ số trong R-tree

Hình 4: Mối liên hệ không gian giữa các mức trong R-tree

Ngày đăng: 08/07/2015, 16:08

HÌNH ẢNH LIÊN QUAN

Hình 2: Kiểu dữ liệu không gian trong DB2 Spatial Extender - TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO PHƯƠNG PHÁP PHÂN TÍCH CỤM TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN
Hình 2 Kiểu dữ liệu không gian trong DB2 Spatial Extender (Trang 12)
Hình 1: Kiểu dữ liệu không gian trong Oracle Spatial - TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO PHƯƠNG PHÁP PHÂN TÍCH CỤM TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN
Hình 1 Kiểu dữ liệu không gian trong Oracle Spatial (Trang 12)
Hình 4: Mối liên hệ không gian giữa các mức trong R-tree - TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO PHƯƠNG PHÁP PHÂN TÍCH CỤM TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN
Hình 4 Mối liên hệ không gian giữa các mức trong R-tree (Trang 13)
Hình 3: Thứ tự đánh chỉ số trong R-tree - TIỂU LUẬN MÔN CƠ SƠ DỮ LIỆU NÂNG CAO PHƯƠNG PHÁP PHÂN TÍCH CỤM TRONG KHAI PHÁ DỮ LIỆU KHÔNG GIAN
Hình 3 Thứ tự đánh chỉ số trong R-tree (Trang 13)

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w