1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Thống kê cho khoa học xã hội: Bài 5 - ThS. Nguyễn Thị Xuân Mai

31 83 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 31
Dung lượng 764,31 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Bài giảng Thống kê cho khoa học xã hội - Bài 5: Phân tích hồi qui và tương quan trình bày ước lượng mô hình hồi qui tuyến tính; đánh giá mối liên hệ tương quan; kiểm định các hệ số của mô hình hồi qui.

Trang 1

GIỚI THIỆU MÔN HỌC

THỐNG KÊ CHO KHOA HỌC XÃ HỘI

Giảng viên: ThS Nguyễn Thị Xuân Mai

Trang 2

BÀI 5 PHÂN TÍCH HỒI QUI

VÀ TƯƠNG QUAN

Giảng viên: ThS Nguyễn Thị Xuân Mai

Trang 3

MỤC TIÊU BÀI HỌC

• Giới thiệu về mối liên hệ giữa các hiện tượng kinh tế

xã hội

• Trình bày một số khái niệm liên quan trong phân tích hồi

qui tương quan

• Trình bày trình tự các bước ước lượng mô hình hồi qui

• Trình bày phương pháp đánh giá mối liên hệ tương quan trong mô hình, gồm có:đánh giá mức độ phù hợp của mô hình, đánh giá cường độ chặt chẽ và chiều hướngcủa mối liên hệ

• Trình bày phương pháp tính sai số chuẩn của mô hình và xác định khoảng tin cậyước lượng

• Trình bày các kiểm định thống kê nhằm khẳng định mô hình ước lượng được là tốt,

có thể dùng để suy diễn thống kê, gồm có: kiểm định hệ số hồi qui, kiểm định ýnghĩa của hệ số tương quan, kiểm định sự phù hợp của mô hình

Trang 4

CÁC KIẾN THỨC CẦN CÓ

Kiến thức chung về kinh tế - xã hội

Trang 5

HƯỚNG DẪN HỌC

• Đọc tài liệu tham khảo

• Thảo luận với giáo viên và các sinh viên

khác về những vấn đề chưa hiểu rõ

• Trả lời các câu hỏi của bài học

• Đọc và tìm hiểu thêm về phương pháp phân

tích hồi qui và tương quan

Trang 6

CẤU TRÚC NỘI DUNG

Ước lượng mô hình hồi qui tuyến tính

Trang 7

5.1 ƯỚC LƯỢNG MÔ HÌNH HỒI QUI TUYẾN TÍNH

Trang 8

5.1.1 MỘT SỐ KHÁI NIỆM LIÊN QUAN

• Hồi qui tương quan là phương pháp phân tích dựa trên mối liên hệ phụ thuộc củamột biến phụ thuộc (biến kết quả) vào một hay nhiều biến độc lập (biếnnguyên nhân)

Ví dụ: Chiều cao và tuổi của một người, Số giờ tự học và điểm số…

• Mối liên hệ phụ thuộc này có thể được biểu hiện ở 2 dạng

 Liên hệ hàm số: là mối liên hệ hoàn toàn chặt chẽ, sự thay đổi của hiện tượngnày có tác dụng quyết định đến sự thay đổi của hiện tượng liên quan theo một tỷ

 không được biểu hiện trên từng đơn vị cá biệt mà phải thông qua hiện tượng

số lớn (là tổng thể)

• Mối liên hệ phụ thuộc này được xây dựng bằng một phương trình hồi qui có thể làtuyến tính hay phi tuyến

Trang 9

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI

• Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc

• Vẽ đồ thị phân tán scatterplot

• Xây dựng mô hình toán học mô tả mối liên hệ giữa biến độc lập và các biếnphụ thuộc

• Ước lượng các hệ số của mô hình

• Giải thích ý nghĩa của các hệ số

• Bước 1 Phân tích bản chất của mối liên hệ giữa biến độc lập và các biến phụ thuộc

 Mối quan hệ hệ nhân - quả, biến phụ thuộc thay đổi do biến độc lập thay đổi

Ví dụ: sự thay đổi của chi phí quảng cáo dẫn đến sự thay đổi lượng hàng bán

 Mối quan hệ liên kết, một số nhân tố khác gây ra sự thay đổi trong cả hai biến

Ví dụ: doanh số bán kính mát và kem tăng do thời tiết nóng

Trang 10

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI

• Bước 2: Vẽ đồ thị phân tán scatterplot

 X được gọi là biến độc lập (biến nguyên nhân) được biểu diễn ở trục hoành

 Y được gọi là biến phụ thuộc (biến kết quả) được biểu diễn ở trục tung

→ Scatterplot có thể cho biết cường độ và chiều hướng của mối liên hệ tuyến tínhgiữa hai biến

Trang 11

Thành phần sai sốngẫu nhiên

i i

1 0

Thành phầntuyến tính

Hệ số tự do tổng thể

Hệ số hồiqui tổng thể Sai số

ngẫu nhiên

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

• Bước 3: Xây dựng mô hình hồi qui tổng thể chung

 Mối quan hệ giữa X và Y được mô tả bằng một hàm tuyến tính

 Sự thay đổi của Y được giả định là do sự thay đổi của X gây ra

 Mô hình hồi qui tuyến tính tổng thể chung là:

Trang 12

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

Sai số ngẫu nhiêncho giá trị Xi

1 0

Trang 13

i 1

Giá trị của x choquan sát i

Sai số ngẫu nhiên cá nhân e có trung bình bằng 0

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

• Bước 4: Ước lượng các hệ số của mô hình

 Có n quan sát

 Xi là giá trị của biến độc lập thứ i

 Yi là giá trị của biến phụ thuộc thứ i

 là giá trị trung bình của biến độc lập

 là giá trị trung bình của biến phụ thuộc

X

Y

Trang 14

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

• Phương pháp bình phương nhỏ nhất (OLS)

• Xác định giá trị nhỏ nhất của chênh lệch giữa giá trị thực tế và giá trị từ phương trìnhhồi qui lý thuyết (phần dư ei)

• Hệ phương trình chuẩn xác định các hệ số:

• Hay

2 i 1 0

i

2 i i

2 i

)]

x b (b

[y min

) y (y min

e min

SSE min

Trang 15

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

• Bước 5: Giải thích ý nghĩa của các hệ số

 b0 là hệ số tự do (hệ số chặn) cho biết giá trị của y khi x bằng 0 (nếu trong tổngthể x có nhận giá trị 0) Hoặc coi đó là ảnh hưởng trung bình của tất cả biếnnguyên nhân khác ngoài biến nguyên nhân x tới biến kết quả y

 b1 là hệ số hồi qui (hệ số góc) cho biết ảnh hưởng trực tiếp của biến nguyênnhân x tới biến kết quả y Cụ thể, khi x thay đổi 1 đơn vị thì y thay đổi trung bình

b1 đơn vị Ngoài ra, nó còn cho biết chiều hướng của mối liên hệ giữa x và y

 Khi b1 > 0, mối liên hệ thuận (x tăng, y tăng)

 b1 < 0, mối liên hệ nghịch (x tăng, y giảm)

Trang 16

Số nhân khẩu/hộ (người) x

Thu nhập bình quân/1 nhân khẩu (Triệu đồng) y

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

Ví dụ: Xây dựng mô hình hồi quy tuyến tính biểu diễn mối liên hệ giữa số nhân khẩu

trong một hộ và thu nhập bình quân 1 nhân khẩu

Trang 17

5.1.2 TRÌNH TỰ ƯỚC LƯỢNG MÔ HÌNH HỒI QUI (tiếp theo)

• Xác định các tham số:

• Mô hình hồi quy có dạng

• Ý nghĩa các tham số:

 b0 = 19,57 nêu lên ảnh hưởng của các nhân tố khác ngoài số nhân khẩu trong 1

hộ tới sự thay đổi của thu nhập bình quân 1 nhân khẩu

 b1 = -2,03 nêu lên ảnh hưởng trực tiếp của số nhân khẩu trong 1 hộ tới sự thayđổi của thu nhập bình quân 1 nhân khẩu Khi số nhân khẩu tăng thêm 1 người thìthu nhập bình quân 1 nhân khẩu sẽ giảm đi trung bình 2,03 triệu đồng

2, 031,831

Trang 18

5.2 ĐÁNH GIÁ MỐI LIÊN HỆ TƯƠNG QUAN

5.2.1 Đánh giá mức độphù hợp của mô hình

5.2.2 Đánh giá cường độchặt chẽ của mối liên hệ

5.2.3 Sai số chuẩn của

mô hình và khoảng tin cậy ước lượng

Trang 19

5.2.1 ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH

y

Tổng biến thiên (variation) được chia thành hai phần:

SSE

SSR

Biến thiên của biến phụ thuộc

(Total Sum of Squares)

Biến thiên của hồi qui (Regression Sum of Squares)

Biến thiên của phần dư (Error Sum of Squares)

Sự biến thiên do mối quan hệ tuyến tính giữa x và y

Sự biến thiên do các nhân

tố khác ngoài mối quan hệ tuyến tính giữa x và y

Đo lường sự biến thiên của

các giá trị yi quanh giá trị trung

bình của nó

Trang 20

5.2.1 ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH

• Hệ số xác định là tỷ lệ (lần, %) thay đổi của biến phụ thuộc được giải thích bởi sựthay đổi của biến độc lập, ký hiệu là R2

Trang 21

5.2.1 ĐÁNH GIÁ MỨC ĐỘ PHÙ HỢP CỦA MÔ HÌNH (tiếp theo)

r 2 = 1

X Y

X

Liên hệ tuyến tính hoàn hảo giữa X

và Y: 100% sự thay đổi của Y được

giải thích bởi sự thay đổi của X.

X Y

Trang 22

5.2.2 ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ

• Hệ số tương quan là số tương đối dùng để đánh giá chiều hướng và cường độ củamối liên hệ tương quan tuyến tính

• Công thức:

• Tính chất:

 -1  R  1

 R =  1: giữa x và y có mối liên hệ hàm số

 R = 0: giữa x và y không có mối liên hệ tương quan tuyến tính

 R > 0: liên hệ thuận; R < 0: liên hệ nghịch

 R → 1: mối liên hệ giữa x và y càng chặt chẽ

2

1

.

Trang 23

5.2.2 ĐÁNH GIÁ CƯỜNG ĐỘ CHẶT CHẼ CỦA MỐI LIÊN HỆ

• Ví dụ: Đánh giá mức độ chặt chẽ của mối liên hệ tuyến tính giữa số nhân khẩu trong

1 hộ và thu nhập bình quân 1 nhân khẩu

• Kết luận: mối liên hệ giữa số nhân khẩu trong 1 hộ và thu nhập bình quân 1 nhânkhẩu là mối liên hệ tương quan tuyến tính nghịch và rất chặt chẽ

Trang 24

5.2.3 SAI SỐ CHUẨN CỦA MÔ HÌNH

• Sai số chuẩn của ước lượng đo lường biến thiên của các giá trị thực tế y xunhquanh đường hồi qui

• Công thức:

→ Sai số càng lớn, biến thiên càng nhiều, đường hồi qui càng xa các điểm thực tế.Đây là cơ sở để xác định đường hồi qui phù hợp nhất

Y Y

i i

SS Se

Trang 25

5.2.3 SAI SỐ CHUẨN CỦA MÔ HÌNH

ˆ2

i i b

Se S

Trang 26

5.3 KIỂM ĐỊNH CÁC HỆ SỐ CỦA MÔ HÌNH HỒI QUI

5.3.1 Kiểm định hệ số

hồi qui

5.3.2 Kiểm định ý nghĩacủa hệ số tương quan

5.3.3 Kiểm định sự phù hợp của mô hình

Trang 27

5.3.1 KIỂM ĐỊNH HỆ SỐ HỒI QUI

Kiểm định hệ số hồi quy

Trả lời câu hỏi: giữa X và Y thực sự có mối liên hệ với nhau?

 Bước 1: Phát biểu giả thiết không và giả thiết đối của nó

 H0: 1 = 0 (x không có mối liên hệ với y)

 H1: 1  0 (x có mối liên hệ tuyến tính với y)

 Bước 2: Xác định mức ý nghĩa  (với 1- là hệ số tin cậy)

 Bước 3: Chọn tiêu chuẩn kiểm định và tính giá trị của tiêu chuẩn kiểm định từmẫu quan sát

Tiêu chuẩn kiểm định:

 Bước 4: Xác định miền bác bỏ và kết luận

t > t/2,n-2: bác bỏ H0 và ngược lại

Khoảng tin cậy ước lượng hệ số hồi qui

Khoảng tin cậy (1-) cho hệ số hồi qui được xác định như sau:

1

b

b t

Trang 28

5.3.1 KIỂM ĐỊNH HỆ SỐ HỒI QUI

Ví dụ: với mức ý nghĩa 0,05, có thực sự là số nhân khẩu của hộ (x) có mối liên hệ vớithu nhập bình quân 1 nhân khẩu (y) không?

• Cặp giả thuyết:

 H0: 1 = 0 (x không có mối liên hệ với y)

 H1: 1  0 (x có mối liên hệ tuyến tính với y)

• Tiêu chuẩn kiểm định:

• Tra bảng tìm giá trị tới hạn t/2,n-2 = t0,025;9 = 2,262

S

  

Trang 29

5.3.2 KIỂM ĐỊNH Ý NGHĨA CỦA HỆ SỐ TƯƠNG QUAN

• Kiểm định hệ số xác định

Trả lời câu hỏi: liệu R2 có ý nghĩa thống kê hay không?

 Bước 1: Phát biểu giả thiết không

 H0: R2 = 0

 H1: R2 > 0

 Bước 2: Xác định mức ý nghĩa 

 Bước 3: Tiêu chuẩn kiểm định là thống kê F

 Bước 4: So sánh thống kê F với giá trị tra bảng ở mức ý nghĩa , với hai bậc tự

2

SSR

k F

Trang 30

5.3.2 KIỂM ĐỊNH Ý NGHĨA CỦA HỆ SỐ TƯƠNG QUAN

• Kiểm định hệ số tương quan

Trả lời câu hỏi: liệu giữa X và Y thực sự có mối liên hệ tương quan tuyến tính?

 Bước 1: Phát biểu giả thiết không

H0:  = 0 (không có mối liên hệ tương quan tuyến tính giữa x và y)

 Bước 2: Xác định mức ý nghĩa 

 Bước 3: Tiêu chuẩn kiểm định

có phân phối T-student với bậc tự do n-2

 Bước 4: tùy thuộc dạng của giả thuyết đối mà xây dựng miền bác bỏ

H0:  > 0 (có mối liên hệ tương quan tuyến tính dương giữa x và y)

t > t/2,n-2 : Bác bỏ H0

2

12

r t

r n

Trang 31

TÓM LƯỢC CUỐI BÀI

Trong bài học này, chúng ta đã nghiên cứu các nội dung chính sau:

• Các dạng biểu hiện mối liên hệ giữa các hiện tượng kinh tế xã hội;

• Qui trình xây dựng mô hình hồi qui tuyến tính biểu diễn mối liên hệgiữa hai tiêu thức số lượng; cách xác định và giải thích ý nghĩa các

hệ số trong mô hình

• Đánh giá mối liên hệ tương quan tuyến tính trong mô hình hồi qui

• Kiểm định ý nghĩa của các hệ số trong mô hình hồi qui

Ngày đăng: 17/12/2020, 10:01

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w