Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan 2.. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình 4.. Mối quan hệ giữa các hiện tượng KT-XH và phư
Trang 2NHỮNG CHỦ ĐỀ CHÍNH
1 Mối liên hệ giữa các hiện tượng KT-XH
và phương pháp hồi quy tương quan
2 Xác định mô hình hồi quy tuyến tính đơn
3 Đánh giá cường độ của mối liên hệ và sự
phù hợp của mô hình
4 Ước lượng giá trị trong tương lai dựa
vào mô hình hồi quy
5 Mô hình hồi quy bội
Trang 31 Mối quan hệ giữa các hiện tượng
KT-XH và phương pháp hồi quy tương quan
• Phân tích hồi quy được sử dụng đầu tiên để dự đoán
Một mô hình thống kê được sử dụng để dự đoán giá trị của biến phụ thuộc hoặc biến kết quả dựa trên
những giá trị của ít nhất 1 biến độc lập hay biến nguyên nhân.
• Phân tích tương quan được sử dụng làm thước
đo độ lớn trong mối liên hệ giữa các biến định
lượng
Trang 4Biểu đồ phân tán (Scatter)
Trang 5Các loại mô hình hồi quy Mối liên hệ tuyến tính thuận
Mối liên hệ tuyến tính nghịch
Mối liên hệ không tuyến tính
Không có mối liên hệ
Trang 62 Xác định mô hình hồi quy
tuyến tính đơn
i i
• Đường thẳng là phù hợp nhất với dữ liệu
• Mối liên hệ giữa các biến là một phương trình đường thẳng
Sai số ngẫu nhiên
Biến
phụ thuộc
(kết quả)
Biến độc lập (nguyên nhân)
Trang 7Giá trị quan sát
YX 0 1X i
Y i 0 1X i i
Trang 8Mô hình hồi quy tuyến tính
của tổng thể mẫu
i
Y i = Giá trị dự đoán của Y trong quan sát i
X i = Giá trị của X trong quan sát i
b 0 = tham số tự do, dùng để ước lượng tổng thể
chung 0
b 1 = Độ dốc của mẫu được sử dụng để ước
lượng tổng thể chung 1
Trang 9Ví dụ
Bạn muốn kiểm tra mối liên
hệ giữa diện tích các cửa
hàng với doanh thu hàng
năm Dữ liệu mẫu gồm 7
cửa hàng được đưa ra Tìm
phương trình tuyến tính
phù hợp nhất với dữ liệu
này
Doanh Cửa Diện thu hàng tích ($000)
Trang 11Phương trình tuyến tính tốt nhất
i
i
i
X
.
X b
b
Y
487 1
415 1636
1 0
Trang 12Đồ thị tuyến tính tốt nhất
0 2000 4000 6000 8000 10000 12000
Trang 13Thuyết minh kết quả
Y i = 1636.415 +1.487X i
Độ dốc là 1.487, nghĩa là mỗi khi tăng X lên 1 đơn vị,
Y tăng khoảng 1.487 đơn vị.
Mỗi khi diện tích cửa hàng tăng 1 đơn vị , mô hình
dự đoán rằng doanh thu hàng năm mong đợi sẽ
tăn gkhoảng 1487$
Trang 14Sai số chuẩn của mô hình
Độ lệch chuẩn của biến quan sát nằm gần
đường hồi quy.
Trang 15Kết luận về hệ số hồi quy
Kiểm định t
• Kiểm định t về hệ số hồi quy của tổng thể chung
Có mối liên hệ tuyến tính giữa X và Y không?
1
1 1
b S
) X X
(
S S
1
2
1
Và df = n - 2
• Giả thiết “không” và Giả thiết đối
H0: 1 = 0 (Không có mối liên hệ tuyến tính)
H1: 1 0 (Có mối liên hệ tuyến tính )
Trong đó,
Trang 16Ví dụ: Cửa hàng bán quả
Dữ liệu về 7 cửa hàng: Mô hình hồi quy:
Độ dốc của mô hình này
là 1.487.
Có mối liên hệ tuyến tính giữa diện tích và doanh thu hàng năm của các cửa hàng ?
Doanh Cửa Diện thu
Trang 170 2.5706 -2.5706
Trang 18Kết luận về hệ số hồi quy
Ví dụ khoảng tin cậy
Ước lượng khoảng tin cậy cho hệ số hồi quy
Kết luận: Có mối liên hệ tuyến tính ý nghĩa giữa
doanh thu hàng năm và diện tích các cửa hàng
Lower 95% Upper 95%
Intercept 475.810926 2797.01853
X Variable 11.06249037 1.91077694
Trang 193 Đánh giá cường độ của mối liên hệ
và sự phù hợp của mô hình
• đo biến đổi của giá trị Y i quanh giá trị trung bình Y
SSR = Tổng bình phương được giải thích bằng hồi quy
• giải thích sự biến đổi do mối liên hệ giữa X và Y
SSE = Tổng bình phương do sai số
• sự biến đổi do các nhân tố khác ngoài mối liên
hệ giữa X và Y
_
Các mức độ biến đổi:
Trang 20Các mức độ biến đổi
X i
Y i = b 0 + b 1 X i
Y X
_
Trang 22Xác định hệ số xác định
SSR regression sum of squares
SST tổng các bình phương
r 2 = =
Các mức độ về tỷ lệ biến đổi được giải thích
bằng biến độc lập X trong mô hình hồi quy
Trang 24Tương quan: thước đo cường độ
của mối liên hệ
Trả lời câu hỏi “Mối liên hệ tuyến tính
giữa hai biến mạnh như thế nào?”
Đặc điểm của hệ số tương quan
– Hệ số tương quan của tổng thể chung:
(‘Rho’)Rho’)
– Khoảng giá trị: từ -1 đến +1
– Đo mức độ của mối liên hệ
Là căn bậc hai của hệ số xác định
Trang 25Regression Statistics
Multiple R 0.9705572
R Square 0.94198129 Adjusted R Square 0.93037754 Standard Error 611.751517
Ví dụ Kết quả Excel về các cửa hàng:
94% sự biến đổi doanh thu hàng năm có thể được giải thích bằng sự biến đổi về quy mô cửa hàng, đo bằng diện tích
Trang 264 Ước lượng giá trị trong tương lai
dựa vào mô hình hồi quy
Ước lượng khoảng tin cậy cho XY
Giá trị trung bình của Y được tính từ 1 giá trị
n
i
) X X
(
) X X
( n
S t
Yˆ
1
2
2 2
1
Giá trị t value từ
bảng với df=n-2
Sai số chuẩn
của ước lượng
Độ lớn của khoảng tin cậy khác nhau, phụ
thuộc vào khoảng cách từ trung bình, X.
Trang 27Ước lượng giá trị dự đoán
Ước lượng khoảng tin cậy cho một giá trị cá biệt
của Y (Yi) tại 1 giá trị cá biệt của X (Xi)
n
i
) X X
(
) X X
( n
S t
Yˆ
1
2
2 2
1 1
Thêm 1 vào độ rộng khoảng này từ độ
rộng của khoảng tin cậy trung bình Y
Trang 28Ước lượng khoảng tin cậy cho những giá trị khác nhau của X
Y i = b 0 + b 1 X i
_
Trang 29Ví dụ: Cửa hàng quả
Y i = 1636.415 +1.487X i
Dữ liệu về 7 cửa hàng:
Mô hình hồi quy:
Dự đoán doanh thu hàng năm của cửa hàng với diện tích là
2000 feet vuông.
Annual Store Square Sales
Trang 30Ước lượng khoảng tin cậy cho Yi
Tìm khoảng tin cậy 95% cho doanh thu trung bình hàng năm
của cửa hàng rộng 2,000 feet vuông
n
i
) X X
(
) X X
( n
S t
Yˆ
1
2
2 2
Trang 31Ước lượng khoảng tin cậy cho XY
Tìm khảng tin cậy 95% cho doanh thu trung bình hàng năm
của 1 cửa hàng có diện tích 2000 feet vuông
Doanh thu dự đoán: Y i = 1636.415 +1.487X i = 4610.45 ($000)
n
i
) X X
(
) X X
( n
S t
Yˆ
1
2
2 2
1 1
Ví dụ: Cửa hàng quả
Trang 325 Mô hình hồi quy bội
Mô hình hồi quy bội
Xác định hệ số hồi quy
Xây dựng mô hình
Trang 335.1 Mô hình hồi quy bội
i pi
p i
(kết quả) của mẫu
Biến độc lập (nguyên nhân)
trong mô hình mẫu
Sai số ngẫu nhiên
i pi
p i
i
Yˆ 0 1 1 2 2
Trang 34X 2
X 1
Y
pi p
i i
Yˆ 0 1 1 2 2
i pi
p i
Trang 35Oil (Gal) Temp Insulation
275.30 40 3 363.80 27 3 164.30 40 10 40.80 73 6 94.30 64 6 230.90 34 6 366.70 9 6 300.60 8 10 237.80 23 10 121.40 63 3 31.40 65 10 203.50 41 6 441.10 21 3 323.00 38 3 52.50 58 10
Ví dụ
( 0 F)
Xây dựng mô hình ước lượng
nhiên liệu sử dụng cho một hộ gia
đình trong tháng 1 trên cơ sở nhiêt
độ bình quân và độ dày của tấm
cách nhiệt đo bằng inches
Trang 36pi p
i i
Yˆ 562 151 5 437 1 20 012 2
Với mỗi mức tăng lên của
nhiệt độ, lượng nhiên liệu trung
bình được sử dụng giảm
5.437gallons, trong điều kiện độ
dày tấm cách nhiệt không đổi.
Với mỗi inch tăng lên của độ dày tấm cách nhiệt, lượng nhiên liệu trung bình được sử dụng giảm 20.012gallons, trong điều kiện
Ví dụ
Trang 37Sử dụng mô hình để dự đoán
969 278
6 012
20 30
437 5
151 562
012 20
437 5
151
.
.
.
X
X
độ dày tấm cách nhiệt là 6 inches.
Lượng nhiên liệu trung bình
dự tính là 278.97 gallons
Trang 38• Chịu ảnh hưởng
bởi số biến giải thích
và cỡ mẫu
Hệ số xác định bội
Trang 39Kiểm định mức ý nghĩa chung
• Chỉ ra có mối liên hệ tuyến tính giữa tất cả các biến
X với Y hay không
Trang 40p value
= Kiểm định F
Trang 41 = 0.05
F 168.47
(kết quả Excel)
Ví dụ
Trang 42Kiểm định ý nghĩa cá biệt
• Cho biết có mối liên hệ tuyến tính giữa biến X i và
Y hay không
• Sử dụng kiểm định thống kê t
• Giả thiết:
Y)
Trang 43Coefficients Standard Error t Stat
Trang 44chất đốt hàng tháng
Z
0 2.1788 -2.1788
Trang 45Ước lượng khoảng tin cậy cho độ dốc
Tìm khoảng tin cậy 95% cho độ dốc tổng thể chung 1
(ảnh hưởng của nhiệt độ đối với việc tiêu thụ chất đốt).
Trang 465.3 Xây dựng mô hình
Mục đích để xây dựng mô hình với số
biến nguyên nhân ít nhất
– Dễ dàng thuyết minh – Xác suất cộng tuyến nhỏ hơn
Hồi quy từng bước
– Nhằm lựa chọn mô hình phù hợp
Tiếp cận tập hợp con một cách tốt nhất
Trang 47TÓM TẮT
tính đơn
quy tương quan