1. Trang chủ
  2. » Nghệ sĩ và thiết kế

Bài giảng 18. Ước lượng quá khớp và kiểm chứng chéo

25 17 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 25
Dung lượng 2,85 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

• Overfitting: “fitting the data more than is warranted” [1] • Fitting the noise... Use Learning Curve to detect Overfitting..[r]

Trang 1

Sonpvh

Trang 2

1. Overfitting

2. Regularization

3. Validation

4. Model selection

Trang 3

We can fit any function … But noise …

& not function

Trang 4

• Overfitting: “fitting the data more than is warranted” [1]

Fitting the noise

Trang 6

y = f x + ϵ 𝑥 = σ 𝑞=0 𝑄 𝛼 𝑖 𝑥 𝑖 + 𝜎 2

Observation Target

Function Noise

Target complexity Noise

𝑄 : target complexity

𝜎2: noise level

N : sample size

Deterministic noise Stochastics noise

Overfitting

Trang 7

𝐸𝑜𝑢𝑡 𝑔 𝐷 = 𝔼𝐷 𝑔 𝐷 𝑥 − ҧ𝑔 x 2 + 𝔼𝐷 ҧ𝑔 x − 𝑓 𝑥 2

+ 𝔼 𝑥 (𝜖 x ) 2

Noise Deterministic Noise Variance Stochastic Noise

Trang 8

x x x

Trang 9

Use Learning Curve to detect Overfitting

Trang 10

▪ Definition: “any modification we make to a learning algorithm that is intended to reduce its generalization error but not its training error ” [3]

𝑄 : target complexity

𝜎2: noise level

N : sample size

Overfitting

Trang 11

1. Parameter Norm Penalties

2. Norm Penalties as Constrained

Trang 12

L1 – Lasso Reg L2 – Ridge Reg

Trang 13

෍ (y − ෍ wixi )2 + 𝜆 ෍ wi or ෍ (y − ෍ wixi )2 + 𝜆 ෍(wi)2

Trang 14

Noise Fitting …

Trang 17

Eout h = Ein h + Overfitting penalty

Regularizationestimate this quantity

Validation estimate this quantity

TOP SECRET

Target complexity

Noise level

VALIDATION

Trang 19

1. K-fold Cross validation

2. Holdout or Train/Test split

3. Stratified K-Fold Cross Validation

4. Repeated Cross validation

5. Leave-one-out cross validation - LOOCV

6. …

Trang 20

Train-Test split+ Simple, cheap

- Waste data …

Trang 22

K-fold CV+ Only waste 𝑁𝐾 data+ Only K times more expensive than train-test split

Trang 23

K-fold (K ==5)

Holdout or Train – Test split Early stopping

Eval

Trang 24

[7]

Trang 25

1. Yaser S Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin-Learning From Data

A short course-AMLBook (2012)

2.

https://medium.com/greyatom/what-is-underfitting-and-overfitting-in-machine-learning-and-how-to-deal-with-it-6803a989c76

3. Ian GoodFellow, Yoshua Bengio, Aaron Courville – Deep learning – Chapter 7

Regularization for Deep Learning

Ngày đăng: 13/01/2021, 05:11

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w