Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan 2.. Mối quan hệ giữa các hiện KT – XH và phương pháp hồi quy tương quan Phân tích hồi quy được sử dụng đầu tiên
Trang 1PHÂN TÍCH HỒI QUY VÀ
TƯƠNG QUAN
CHƯƠNG 4
Trang 2NHỮNG CHỦ ĐỀ CHÍNH
1. Mối liên hệ giữa các hiện tượng KT-XH và
phương pháp hồi quy tương quan
2. Xác định mô hình hồi quy tuyến tính đơn
3. Đánh giá cường độ của mối liên hệ và sự phù
Trang 31 Mối quan hệ giữa các hiện KT – XH
và phương pháp hồi quy tương quan
Phân tích hồi quy được sử dụng đầu tiên để dự
Phân tích tương quan được sử dụng làm thước
đo độ lớn trong mối liên hệ giữa các biến định
lượng.
Trang 4Biểu đồ phân tán (Scatter)
Đồ thị gồm tất cả các cặp X Yi , i
X
Y
Trang 5Các loại mô hình hồi quy
Mối liên hệ tuyến tính thuận
Mối liên hệ tuyến tính nghịch
Mối liên hệ phi tuyến
Không có mối liên hệ
Trang 62 Xác định mô hình hồi quy
Trang 7Giả định
Mối quan hệ giữa X và Y là tuyến tính
X và Y là biến định lượng
X không có sai số ngẫu nhiên;
Các giá trị của Y độc lập với nhau ( ví dụ Y1
không liên quan tới Y2)
Sai số ngẫu nhiên ei ~ N ( 0 , 2 )
Trang 8EPI 809/Spring 2008 8
Mô hình hồi quy của tổng thể
chung
Giá trị quan sát
Y 0 1 e
Trang 9Tổng thể và mô hình hồi quy mẫu
Trang 10EPI 809/Spring 2008 10
Tổng thể và mô hình hồi quy mẫu
Unknown Relationship
Y b0 b1 e
Trang 11Tổng thể và mô hình hồi quy mẫu
Unknown Relationship
Tổng thể Mẫu ngẫu nhiên
Y b0 b1 e
Trang 12i X
Y b0 b1 e
i i
i b b X
Y 0 1 e
Trang 13Ước lượng mô hình hồi quy
• Mô hình được ước lượng bằng cách
– Thu thập mẫu từ tổng thể
– Tính toán các giá trị thống kê của tổng thể mẫu.
– Xác định đường thẳng đi qua tập dữ liệu
w
w w
Trang 14Phương pháp bình phương tối thiểu
( Ordinary Least Square )
Đường hồi quy tìm được là đường thẳng sao cho tổng bình phương sai số từ điểm quan sát tới
đường thẳng đó là nhỏ nhất
Trang 15Phương pháp bình phương tối thiểu
1
4
(1,2)
2 2
Let us compare two lines
The second line is horizontal
The smaller the sum of squared differences
the better the fit of the line to the data.
Trang 16Phương pháp bình phương tối thiểu
1 2
1
0 1 1
Trang 17Ước lượng hệ số hồi quy
Ta thu được công thức sau:
xy i i
xx i i
SS b
Trang 18Y 70 65 90 95 110 115 120 140 155 150
X 80 100 120 140 160 180 200 220 240 260
Trang 19Thuyết minh kết quả
Trang 20Ước tính bằng R
Chúng ta muốn ước tính mối liên quan giữa việc thích mua sắm và xu hướng mua hàng ngẫu
nhiên của người tiêu dùng
Mô hình hồi quy tuyến tính
R: lm(IB~ShopEnjoy)
IB b b ShopEnjoy e
Trang 21>ibdata = read.spss("DataIBforpractice.sav", to.data.frame=T)
# Tạo biến trung gian
>ibdata$ShopEnjoy = (ibdata$Shopenjoy1+ ibdata$Shopenjoy2+ ibdata$Shopenjoy3+ ibdata$Shopenjoy4+ ibdata$Shopenjoy5+ ibdata$Shopenjoy6)/6
>ibdata$IB = (ibdata$IB1+ibdata$IB2)
>attach(ibdata)
# Phân tích hồi quy
>f = lm(IB~ShopEnjoy)
Trang 22Diễn giải kết quả
Mô hình mô tả tương quan giữa IB và ShopEnjoy
Trang 23Diễn giải kết quả
Ý nghĩa của
Residual standard error: 0.8295 on 784 degrees of freedom
Multiple R-squared: 0.1515, Adjusted R-squared: 0.1504
F-statistic: 140 on 1 and 784 DF, p-value: < 2.2e-16
Trang 24quan sát (observed values)
Trang 25Kết luận về hệ số hồi quy
Trang 263 Đánh giá cường độ của mối liên hệ
và sự phù hợp của mô hình
Các mức độ biến đổi
SSE = Tổng bình phương do sai số
● Sự biến đổi do các nhân tố khác ngoài mối liên hệ giữa
Trang 273 Đánh giá cường độ của mối liên hệ
và sự phù hợp của mô hình
Các mức độ biến đổi
Trang 28Xác định hệ số xác định
Miền xác định của
R 1 hàm hồi quy càng phù hợp
R 0 hàm hồi quy càng không phù hợp
2 SSR regression sum of squares 1 SSE
Trang 29Hệ số tương quan Thước đo cường độ của mối liên hệ
Trả lời câu hỏi “Mối liên hệ tuyến tính giữa hai biến mạnh như thế nào”?
Trang 30 r > 0,8 : tương quan mạnh
r = 0,4 - 0,8 : tương quan trung bình
r < 0,4 : tương quan yếu
r càng lớn thì tương quan giữa X và Y càng mạnh
0 < r 1 gọi là tương quan tuyến tính thuận (X, Y) -1 r < 0 gọi là tương quan tuyến tính nghịch (X, Y)
r = 0 : giữa X và Y không có mối quan hệ tuyến tính
Trang 32Kiểm định sự phù hợp
của mô hình hồi quy
Sử dụng kiểm định t sự phù hợp của hệ số hồi quy
Sử dụng kiểm định F: Sự phù hợp của mô hình (mô hình có giải thích được hiện tượng hay
(1 R )
Trang 334 Ước lượng các giá trị trong tương lai dựa
vào mô hình hồi quy
Ước lượng giá trị trung bình cho Y khi X đạt giá trị cá biệt nào đó
2 0
0 /2, 2
2 1
Trang 34Ước lượng khoảng tin cậy của Y
tại một giá trị cá biệt của X
2 0
2 1
Trang 354 Ước lượng các giá trị trong tương lai dựa
vào mô hình hồi quy
Trang 365 Mô hình hồi quy bội
5.1 Mô hình hồi bội
5.2 Xác định hệ số hồi quy
5.3 Xây dựng mô hình
Trang 375.1 Mô hình hồi quy bội
Mỗi liên hệ giữa 1 biến phụ thuộc với 2 hoặc
Trang 385.1 Mô hình hồi quy bội
Trang 39Ví dụ
Trang 40 Kết quả chạy mô hình
Trang 41Sử dụng mô hình để dự đoán
Ước lượng nhiên liệu bình quân một tháng cho
mỗi hộ gia đình nếu nhiệt độ trung bình là 30 độ F
và độ dày tấm cách nhiệt là 6 inches
ˆ 562.270 5.438 20.027
562.270 5.438.30 20.012.6 278.969
i
Trang 42Xác định hệ số xác định bội
Trang 43Kiểm định mức ý nghĩa chung
Chỉ ra có mối liên hệ giữa tất cả các biến X với
Y hay không
Sử dụng kiểm định F
(Không có mối quan hệ tuyến tính)
Có ít nhất 1 biến độc lập ảnh hưởng tới Y
F>2 Hàm hồi quy có nghĩa
H b b b
Trang 44Kiểm định ý nghĩa cá biệt
Cho biết có mối liên hệ tuyến tính giữa biến và
Y hay khổng
Sử dụng kiểm định thống kê t
Giả thiết:
(không có mối liên hệ tuyến tính)
(có mối liên hệ tuyến tính giữa và Y)
Trang 45Ước lượng khoảng tin cậy cho độ dốc
Trang 465.3 Xây dựng mô hình
1 Mục đích để xây dưng mô hình với số biến
nguyên nhân ít nhất
Thực hiện hồi quy từng bước
Tiếp cận tập hợp con một cách tốt nhất
Trang 47Nghiên cứu các yếu tố ảnh hưởng đến
hành vi mua hàng ngẫu hứng
Trang 48#Tạo các biến trung gian
>Modern = (Modern1+ Modern2+ Modern3+ Modern4+ Modern5)/5
>Trad =(Trad1 +Trad2+Trad3+Trad4+Trad5)/5
>Indiv =(Indiv1+Indiv2+Indiv3+Indiv4+Indiv5+Indiv6+Indiv7)/7
#phân tích
>f2 = lm(IB~ShopEnjoy+Modern+Trad+Indiv+Age)
>summary(f2)
Trang 50Tóm tắt
Các loại mô hình hồi quy
Xác định mô hình hồi quy tuyến tính đơn
Các mức độ biến đổi trong hồi quy tương quan
Ước lượng các giá trị dự đoán
Xác định mô hình hồi quy bối