Tài liệu tóm tắt môn Khai phá dữ liệu, chuyên ngành phần mềm khoa công nghệ thông tin. DeepL (www.deepl.com): Được đánh giá là một trong những trang web dịch ngôn ngữ chính xác nhất, DeepL sử dụng công nghệ AI và máy học sâu để cải thiện chất lượng dịch. Microsoft Translator (www.microsoft.comenustranslator): Công cụ dịch ngôn ngữ miễn phí của Microsoft, cho phép bạn dịch văn bản, từ vựng, câu và cả hình ảnh.
Trang 1Trường Đại học Nha Trang Khoa Công nghệ thông tin
KHAI PHÁ DỮ LIỆU
Trang 2CHỦ ĐỀ 4
PHÂN LỚP (SVM - Binary – nonlinear
separable)
Trang 3SVM – binary – nonlinear separable
Binary – nonlinear separable training dataset?
Trang 4SVM – binary – nonlinear separable
Idea toán học:
Transform các training data (input vector space) sang không gian vector (feature space) có số chiều lớn hơn Lý do?
Trang 5SVM – binary – nonlinear separable
Idea toán học:
Dùng trick: Kernel functions
Một số kernel function thông dụng:
Polynomial kernel
Gaussian kernel
K
( , )i j i j 1 d
K x x x x
2 2
( , ) exp
2
i j
x x
K x x
K đ a th ứ c
Tác d ụ ng c ủ a Kernel: nâng d ữ li ệ u g ố c lên m ộ t không gian có s ố chi ề u cao h ơ n
Trang 6SVM – binary – nonlinear separable
Idea toán học:
Một số kernel function thông dụng:
Laplace RBF kernel
Hyperbolic tangent kernel
Kernel function tự xây dựng?
( , ) expi j xi xj
K x x
( , ) tanhi j i j 0, 0
K x x kx x c k c
Trang 7SVM – binary – nonlinear separable
Minh họa kết quả của input space sau khi dùng kernel function để biến đổi sang feature space
( )
x K x
Trang 8SVM – binary – nonlinear separable