HỌC KHÔNG GIÁM SÁT UNSUPERVISER LEARNING... Dự đoán với mô hình Hồi quy tuyến tính Linear Regression 3... BÀI TOÁN HỒI QUY TUYẾN TÍNH... BÀI TOÁN HỒI QUY TUYẾN TÍNHy: biến phụ thuộc w: c
Trang 1Khoa học dữ liệu Bài 4 - Học máy
Trang 2Tổng quan về học máy
Machine Learning Overview
1
Trang 3ỨNG DỤNG
Trang 4ỨNG DỤNG
Trang 6HỌC MÁY LÀ GÌ
Trang 9DỮ LIỆU
Trang 10DỮ LIỆU HUẤN LUYỆN - DỮ LIỆU KIỂM TRA
Trang 11Các bài toán Học máy cơ bản
Machine Learning Problems
2
Trang 12HỌC CÓ GIÁM SÁT (SUPERVISED LEARNING)
Trang 13HỌC CÓ GIÁM SÁT (SUPERVISED LEARNING)
Trang 14HỌC KHÔNG GIÁM SÁT (UNSUPERVISER LEARNING)
Trang 15HỌC KHÔNG GIÁM SÁT (UNSUPERVISER LEARNING)
Trang 16HỌC BÁN GIÁM SÁT (SEMI-SUPERVISED LEARNING)
Trang 17HỌC TĂNG CƯỜNG (REINFORCEMENT LEARNING)
Trang 18Dự đoán với mô hình Hồi
quy tuyến tính
Linear Regression
3
Trang 19BÀI TOÁN DỰ ĐOÁN
1, y1), (x2, y2), , (xn, yn)
Ví dụ: hàng đã mua - tuổi, hành vi sử dụng - khả năng rời mạng
i, yi tốt nhất có thể
Trang 20BÀI TOÁN HỒI QUY TUYẾN TÍNH
Trang 21BÀI TOÁN HỒI QUY TUYẾN TÍNH
y: biến phụ thuộc
w: các hệ số tuyến tính của mô hình
b: điểm cắt
Hạnh phúc và Số giờ ngủ Chiều cao và Cân nặng
Trang 22BÀI TOÁN HỒI QUY TUYẾN TÍNH
Hạnh phúc và Số giờ ngủ Chiều cao và Cân nặng
Trang 23BÀI TOÁN HỒI QUY TUYẾN TÍNH
Trang 24BÀI TOÁN HỒI QUY TUYẾN TÍNH
HUẤN LUYỆN
▰ Huấn luyện: Tìm một mô hình (hàm số) y = f(x)
▻ Mô tả mối quan hệ giữa các x
i , yi tốt nhất có thể
▰ Với mô hình hồi quy: Tổng (y
i - f(xi))2 là nhỏ nhất
i = yi - f(xi): phần dư (residual) của mẫu dữ liệu thứ i
▰ Trong Python: sử dụng các hàm .fit() trong gói scikit-learn
phần dư
Trang 25BÀI TOÁN HỒI QUY TUYẾN TÍNH
DỰ ĐOÁN
▰ Dự đoán: Sử dụng mô hình y = f(x)
▻ Tính giá trị y của một dữ liệu x mới
▰ Trong Python: sử dụng các hàm .predict() trong gói scikit-learn
phần dư
Trang 26MÔ HÌNH TUYẾN TÍNH VỚI SCIKIT-LEARN
Đọc dữ liệu, chuyển sang numpy với
.values reshape(-1,1)
Tạo mô hình, huấn luyện với .fit()
Dự đoán dữ liệu mới với
.predict
regr = sklearn.linear_model LinearRegression() regr.fit(X, y)
Trang 27BÀI TOÁN HỒI QUY TUYẾN TÍNH
ĐÁNH GIÁ MÔ HÌNH
▰ Đánh giá mô hình sử dụng tập dữ liệu kiểm tra
▻ Tách biệt với tập huấn luyện
▰ Tính tổng giá trị bình phương của lỗi (phần dư)
▰ Tính hệ số r2
▰ Trong Python: sử dụng các hàm trong sklearn.metrics
phần dư
Trang 28BÀI TOÁN HỒI QUY TUYẾN TÍNH
ĐÁNH GIÁ MÔ HÌNH
phần dư