Bài giảng Thống kê cho khoa học xã hội - Bài 5: Phân tích hồi qui và tương quan trình bày ước lượng mô hình hồi qui tuyến tính; đánh giá mối liên hệ tương quan; kiểm định các hệ số của mô hình hồi qui.
Trang 1GIỚI THIỆU MÔN HỌC
THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS Nguyễn Thị Xuân Mai
Trang 2BÀI 5 PHÂN TÍCH HỒI QUI
VÀ TƯƠNG QUAN
Giảng viên: ThS Nguyễn Thị Xuân Mai
Trang 3MỤC TIÊU BÀI HỌC
• Giới thiệu về mối liên hệ giữa các hiện tượng kinh tế
xã hội
• Trình bày một số khái niệm liên quan trong phân tích hồi
qui tương quan
• Trình bày trình tự các bước ước lượng mô hình hồi qui
• Trình bày phương pháp đánh giá mối liên hệ tương quan trong mô hình, gồm có:đánh giá mức độ phù hợp của mô hình, đánh giá cường độ chặt chẽ và chiều hướngcủa mối liên hệ
• Trình bày phương pháp tính sai số chuẩn của mô hình và xác định khoảng tin cậyước lượng
• Trình bày các kiểm định thống kê nhằm khẳng định mô hình ước lượng được là tốt,
có thể dùng để suy diễn thống kê, gồm có: kiểm định hệ số hồi qui, kiểm định ýnghĩa của hệ số tương quan, kiểm định sự phù hợp của mô hình
Trang 4CÁC KIẾN THỨC CẦN CÓ
Kiến thức chung về kinh tế - xã hội
Trang 5HƯỚNG DẪN HỌC
• Đọc tài liệu tham khảo
• Thảo luận với giáo viên và các sinh viên
khác về những vấn đề chưa hiểu rõ
• Trả lời các câu hỏi của bài học
• Đọc và tìm hiểu thêm về phương pháp phân
tích hồi qui và tương quan
Trang 6CẤU TRÚC NỘI DUNG
Ước lượng mô hình hồi qui tuyến tính
Trang 75.1 ƯỚC LƯỢNG MÔ HÌNH HỒI QUI TUYẾN TÍNH
Trang 85.1.1 MỘT SỐ KHÁI NIỆM LIÊN QUAN
• Hồi qui tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc củamột biến phụ thuộc (biến kết quả) vào một hay nhiều biến độc lập (biếnnguyên nhân)
Ví dụ: Chiều cao và tuổi của một người, Số giờ tự học và điểm số…
• Mối liên hệ phụ thuộc này có thể được biểu hiện ở 2 dạng
Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ, sự thay đổi của hiện tượngnày có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ
không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tượng
số lớn (là tổng thể)
• Mối liên hệ phụ thuộc này được xây dựng bằng một phương trình hồi qui có thể làtuyến tính hay phi tuyến
Trang 95.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI
• Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc
• Vẽ đồ thị phân tán scatterplot
• Xây dựng mô hình toán học mô tả mối liên hệ giữa biến độc lập và các biếnphụ thuộc
• Ước lượng các hệ số của mô hình
• Giải thích ý nghĩa của các hệ số
• Bước 1 Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc
Mối quan hệ hệ nhân - quả, biến phụ thuộc thay đổi do biến độc lập thay đổi
Ví dụ: sự thay đổi của chi phí quảng cáo dẫn đến sự thay đổi lượng hàng bán
Mối quan hệ liên kết, một số nhân tố khác gây ra sự thay đổi trong cả hai biến
Ví dụ: doanh số bán kính mát và kem tăng do thời tiết nóng
Trang 105.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI
• Bước 2: Vẽ đồ thị phân tán scatterplot
X được gọi là biến độc lập (biến nguyên nhân) được biểu diễn ở trục hoành
Y được gọi là biến phụ thuộc (biến kết quả) được biểu diễn ở trục tung
→ Scatterplot có thể cho biết cường độ và chiều hướng của mối liên hệ tuyến tínhgiữa hai biến
Trang 11Thành phần sai sốngẫu nhiên
i i
1 0
Thành phầntuyến tính
Hệ số tự do tổng thể
Hệ số hồiqui tổng thể Sai số
ngẫu nhiên
5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
• Bước 3: Xây dựng mô hình hồi qui tổng thể chung
Mối quan hệ giữa X và Y được mô tả bằng một hàm tuyến tính
Sự thay đổi của Y được giả định là do sự thay đổi của X gây ra
Mô hình hồi qui tuyến tính tổng thể chung là:
Trang 125.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
Sai số ngẫu nhiêncho giá trị Xi
1 0
Trang 13i 1
Giá trị của x choquan sát i
Sai số ngẫu nhiên cá nhân e có trung bình bằng 0
5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
• Bước 4: Ước lượng các hệ số của mô hình
Có n quan sát
Xi là giá trị của biến độc lập thứ i
Yi là giá trị của biến phụ thuộc thứ i
là giá trị trung bình của biến độc lập
là giá trị trung bình của biến phụ thuộc
X
Y
Trang 145.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
• Phương pháp bình phương nhỏ nhất (OLS)
• Xác định giá trị nhỏ nhất của chênh lệch giữa giá trị thực tế và giá trị từ phương trìnhhồi qui lý thuyết (phần dư ei)
• Hệ phương trình chuẩn xác định các hệ số:
• Hay
2 i 1 0
i
2 i i
2 i
)]
x b (b
[y min
) y (y min
e min
SSE min
Trang 155.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
• Bước 5: Giải thích ý nghĩa của các hệ số
b0 là hệ số tự do (hệ số chặn) cho biết giá trị của y khi x bằng 0 (nếu trong tổngthể x có nhận giá trị 0) Hoặc coi đó là ảnh hưởng trung bình của tất cả biếnnguyên nhân khác ngoài biến nguyên nhân x tới biến kết quả y
b1 là hệ số hồi qui (hệ số góc) cho biết ảnh hưởng trực tiếp của biến nguyênnhân x tới biến kết quả y Cụ thể, khi x thay đổi 1 đơn vị thì y thay đổi trung bình
b1 đơn vị Ngoài ra, nó còn cho biết chiều hướng của mối liên hệ giữa x và y
Khi b1 > 0, mối liên hệ thuận (x tăng, y tăng)
b1 < 0, mối liên hệ nghịch (x tăng, y giảm)
Trang 16Số nhân khẩu/hộ (người) x
Thu nhập bình quân/1 nhân khẩu (Triệu đồng) y
5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
Ví dụ: Xây dựng mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số nhân khẩu
trong một hộ và thu nhập bình quân 1 nhân khẩu
Trang 175.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)
• Xác định các tham số:
• Mô hình hồi quy có dạng
• Ý nghĩa các tham số:
b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số nhân khẩu trong 1
hộ tới sự thay đổi của thu nhập bình quân 1 nhân khẩu
b1 = -2,03 nêu lên ảnh hưởng trực tiếp của số nhân khẩu trong 1 hộ tới sự thayđổi của thu nhập bình quân 1 nhân khẩu Khi số nhân khẩu tăng thêm 1 người thìthu nhập bình quân 1 nhân khẩu sẽ giảm đi trung bình 2,03 triệu đồng
2, 031,831
Trang 185.2 ĐÁNH GIÁ MỐI LIÊN HỆ TƯƠNG QUAN
5.2.1 Đánh giá mức độphù hợp của mô hình
5.2.2 Đánh giá cường độchặt chẽ của mối liên hệ
5.2.3 Sai số chuẩn của
mô hình và khoảng tin cậy ước lượng
Trang 195.2.1 ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH
y
Tổng biến thiên (variation) được chia thành hai phần:
SSE
SSR
Biến thiên của biến phụ thuộc
(Total Sum of Squares)
Biến thiên của hồi qui (Regression Sum of Squares)
Biến thiên của phần dư (Error Sum of Squares)
Sự biến thiên do mối quan hệ tuyến tính giữa x và y
Sự biến thiên do các nhân
tố khác ngoài mối quan hệ tuyến tính giữa x và y
Đo lường sự biến thiên của
các giá trị yi quanh giá trị trung
bình của nó
Trang 205.2.1 ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH
• Hệ số xác định là tỷ lệ (lần, %) thay đổi của biến phụ thuộc được giải thích bởi sựthay đổi của biến độc lập, ký hiệu là R2
Trang 215.2.1 ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH (tiếp theo)
r 2 = 1
X Y
X
Liên hệ tuyến tính hoàn hảo giữa X
và Y: 100% sự thay đổi của Y được
giải thích bởi sự thay đổi của X.
X Y
Trang 225.2.2 ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ
• Hệ số tương quan là số tương đối dùng để đánh giá chiều hướng và cường độ củamối liên hệ tương quan tuyến tính
• Công thức:
• Tính chất:
-1 R 1
R = 1: giữa x và y có mối liên hệ hàm số
R = 0: giữa x và y không có mối liên hệ tương quan tuyến tính
R > 0: liên hệ thuận; R < 0: liên hệ nghịch
R → 1: mối liên hệ giữa x và y càng chặt chẽ
2
1
.
Trang 235.2.2 ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ
• Ví dụ: Đánh giá mức độ chặt chẽ của mối liên hệ tuyến tính giữa số nhân khẩu trong
1 hộ và thu nhập bình quân 1 nhân khẩu
• Kết luận: mối liên hệ giữa số nhân khẩu trong 1 hộ và thu nhập bình quân 1 nhânkhẩu là mối liên hệ tương quan tuyến tính nghịch và rất chặt chẽ
Trang 245.2.3 SAI SỐ CHUẨN CỦA MÔ HÌNH
• Sai số chuẩn của ước lượng đo lường biến thiên của các giá trị thực tế y xunhquanh đường hồi qui
• Công thức:
→ Sai số càng lớn, biến thiên càng nhiều, đường hồi qui càng xa các điểm thực tế.Đây là cơ sở để xác định đường hồi qui phù hợp nhất
Y Y
i i
SS Se
Trang 255.2.3 SAI SỐ CHUẨN CỦA MÔ HÌNH
ˆ2
i i b
Se S
Trang 265.3 KIỂM ĐỊNH CÁC HỆ SỐ CỦA MÔ HÌNH HỒI QUI
5.3.1 Kiểm định hệ số
hồi qui
5.3.2 Kiểm định ý nghĩacủa hệ số tương quan
5.3.3 Kiểm định sự phù hợp của mô hình
Trang 275.3.1 KIỂM ĐỊNH HỆ SỐ HỒI QUI
• Kiểm định hệ số hồi quy
Trả lời câu hỏi: giữa X và Y thực sự có mối liên hệ với nhau?
Bước 1: Phát biểu giả thiết không và giả thiết đối của nó
H0: 1 = 0 (x không có mối liên hệ với y)
H1: 1 0 (x có mối liên hệ tuyến tính với y)
Bước 2: Xác định mức ý nghĩa (với 1- là hệ số tin cậy)
Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từmẫu quan sát
Tiêu chuẩn kiểm định:
Bước 4: Xác định miền bác bỏ và kết luận
t > t/2,n-2: bác bỏ H0 và ngược lại
• Khoảng tin cậy ước lượng hệ số hồi qui
Khoảng tin cậy (1-) cho hệ số hồi qui được xác định như sau:
1
b
b t
Trang 285.3.1 KIỂM ĐỊNH HỆ SỐ HỒI QUI
Ví dụ: với mức ý nghĩa 0,05, có thực sự là số nhân khẩu của hộ (x) có mối liên hệ vớithu nhập bình quân 1 nhân khẩu (y) không?
• Cặp giả thuyết:
H0: 1 = 0 (x không có mối liên hệ với y)
H1: 1 0 (x có mối liên hệ tuyến tính với y)
• Tiêu chuẩn kiểm định:
• Tra bảng tìm giá trị tới hạn t/2,n-2 = t0,025;9 = 2,262
S
Trang 295.3.2 KIỂM ĐỊNH Ý NGHĨA CỦA HỆ SỐ TƯƠNG QUAN
• Kiểm định hệ số xác định
Trả lời câu hỏi: liệu R2 có ý nghĩa thống kê hay không?
Bước 1: Phát biểu giả thiết không
H0: R2 = 0
H1: R2 > 0
Bước 2: Xác định mức ý nghĩa
Bước 3: Tiêu chuẩn kiểm định là thống kê F
Bước 4: So sánh thống kê F với giá trị tra bảng ở mức ý nghĩa , với hai bậc tự
2
SSR
k F
Trang 305.3.2 KIỂM ĐỊNH Ý NGHĨA CỦA HỆ SỐ TƯƠNG QUAN
• Kiểm định hệ số tương quan
Trả lời câu hỏi: liệu giữa X và Y thực sự có mối liên hệ tương quan tuyến tính?
Bước 1: Phát biểu giả thiết không
H0: = 0 (không có mối liên hệ tương quan tuyến tính giữa x và y)
Bước 2: Xác định mức ý nghĩa
Bước 3: Tiêu chuẩn kiểm định
có phân phối T-student với bậc tự do n-2
Bước 4: tùy thuộc dạng của giả thuyết đối mà xây dựng miền bác bỏ
H0: > 0 (có mối liên hệ tương quan tuyến tính dương giữa x và y)
t > t/2,n-2 : Bác bỏ H0
2
12
r t
r n
Trang 31TÓM LƯỢC CUỐI BÀI
Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau:
• Các dạng biểu hiện mối liên hệ giữa các hiện tượng kinh tế xã hội;
• Qui trình xây dựng mô hình hồi qui tuyến tính biểu diễn mối liên hệgiữa hai tiêu thức số lượng; cách xác định và giải thích ý nghĩa các
hệ số trong mô hình
• Đánh giá mối liên hệ tương quan tuyến tính trong mô hình hồi qui
• Kiểm định ý nghĩa của các hệ số trong mô hình hồi qui