1. Trang chủ
  2. » Công Nghệ Thông Tin

Bài giảng Thước đo đánh giá mô hình hồi quy tuyến tính

14 41 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 14
Dung lượng 1,16 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giảng trình bày đánh giá mô hình hồi quy tuyến tính; mô hình hồi quy tuyến tính; phương pháp Least square; Residuals – độ dao động từ; phân tích phương sai; hai thước đo đánh giá mô hình hồi quan tuyến tính; hệ số xác định; diễn giải hệ số xác định...

Trang 1

Tuan V Nguyen

Senior Principal Research Fellow, Garvan Institute of Medical Research

Professor, UNSW School of Public Health and Community Medicine

Professor of Predictive Medicine, University of Technology Sydney

Adj Professor of Epidemiology and Biostatistics, School of Medicine Sydney, University of Notre Dame Australia

Phân tích dữ liệu và ứng dụng | Đại học Dược Hà Nội | 12/6 to 17/6/2019 © Tuan V Nguyen

Trang 2

Đánh giá mô hình hồi qui tuyến tính

• Khái niệm 'residual' và phương sai

• RMSE – residual mean squared error

• Hệ số xác định (coefficient of determination)

Trang 3

Mô hình hồi qui tuyến tính

• Mô hình

Y = a + b X + e

• Chúng ta không biết α và β

• Nhưng có thể dùng dữ liệu thí nghiệm / thực tế để ước tính 2

tham số đó

• Ước số (estimate) của α và β là a và b

Trang 4

Phương pháp "Least square"

Y

X

i

y ˆ = +

i i

yi

Tìm công thức (estimator) để tính a và b sao cho tổng d2 là nhỏ nhất à Least

square method = Bình phương nhỏ nhất

Trang 5

Residuals – độ dao động dư

• Mô hình cho dữ liệu

y = a + bx + e

Giá trị trung bình: E(y) = yhat = a + bx

• Phát biểu "thường dân"

Dữ liện quan sát = Mô hình tiên lượng + Phần dư (nhiễu)

Phần dư = giá trị quan sát – giá trị tiên lượng

Trang 6

Phân tích phương sai

• Mô hình

pcfat = a + b*age + e

SStotal = SSreg + SSerror

SStotal = total sum of squares

SSreg = sum of squares due to the regression model

SSerror = sum of squares due to random component

Trang 7

age

trung bình mean

SSerror

SStotal

R-square = SSreg / SStotal

Trang 8

Hai thước đo đánh giá mô hình HQTT

• RMSE – residual mean squared error

– có thể xem là 'phương sai' của biến Y sau khi đã hiệu chỉnh cho X

– Phản ảnh bao nhiêu phần trăm dao động của biến Y có thể giải thích bởi biến X (còn gọi là "explained variation")

Trang 9

Hệ số xác định (R 2 )

m1 = lm(pcfat ~ age, data=ob)

anova(m1)

Analysis of Variance Table

Response: pcfat

Df Sum Sq Mean Sq F value Pr(>F) age 1 5917 5916.8 126.52 < 2.2e-16 ***

Residuals 1215 56821 46.8

-Signif codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

R 2 = 5917 / (5917 + 56821) = 0.094

RMSE = 46.8

Trang 10

Diễn giải hệ số xác định

Residual standard error: 6.839 on 1215 degrees of freedom

Multiple R-squared: 0.09431, Adjusted R-squared: 0.09357

F-statistic: 126.5 on 1 and 1215 DF, p-value: < 2.2e-16

Coefficient of determination R2 = 0.094

Diễn giải: Những khác biệt về độ tuổi giải thích khoảng 9.5% tổng phương

sai của tỉ trọng mỡ

Trang 11

Diễn giải RMSE

• RMSE = 46.8 là phương sai của biến Y sau khi đã hiệu chỉnh cho biến X

• Phương sai của pcfat khi chưa có X là

> var(ob$pcfat)

[1] 51.5935

Trang 12

Khác biệt gvề pcfat giữa nam và nữ: diễn giải

Coefficients:

Estimate Std Error t value Pr(>|t|) (Intercept) 34.6724 0.1826 189.9 <2e-16 ***

Mô hình (giả thuyết)

pcfat = α + β(gender) + ε

Phương trình

pcfat = 34.7 – 10.5*gender(M)

Diễn giải: Nam có tỉ trọng mỡ thấp hơn nữ 10.5% (SE 0.34%), và sự khác

biệt này có ý nghĩa thống kê (P < 0.0001)

Trang 13

Khác biệt gvề pcfat giữa nam và nữ: diễn giải

Residual standard error: 5.362 on 1215 degrees of freedom

Multiple R-squared: 0.4432, Adjusted R-squared: 0.4428

F-statistic: 967.3 on 1 and 1215 DF, p-value: < 2.2e-16

Diễn giải: Khác biệt giữa nam và nữ giải thích 44% những khác biệt về

phương sai của tỉ trọng mỡ.

Trang 14

Tóm tắt

Hai thước đo đánh giá mô hình hồi qui tuyến tính

• RMSE (phương sai của Y sau khi đã điều chỉnh cho X)

• Hệ số xác định R2

Ngày đăng: 24/10/2020, 00:16

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm