1. Trang chủ
  2. » Giáo án - Bài giảng

Tài liệu Chương 7 Phân tích hồi quy và tương quan

47 1K 4
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân Tích Hồi Quy Và Tương Quan
Trường học Trường Đại Học Kinh Tế Quốc Dân
Chuyên ngành Thống Kê Kinh Doanh
Thể loại Bài Giảng
Thành phố Hà Nội
Định dạng
Số trang 47
Dung lượng 647,5 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mối liên hệ giữa các hiện tượng KT-XH và phương pháp hồi quy tương quan 2.. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình 4.. Mối quan hệ giữa các hiện tượng KT-XH và phư

Trang 2

NHỮNG CHỦ ĐỀ CHÍNH

1 Mối liên hệ giữa các hiện tượng KT-XH

và phương pháp hồi quy tương quan

2 Xác định mô hình hồi quy tuyến tính đơn

3 Đánh giá cường độ của mối liên hệ và sự

phù hợp của mô hình

4 Ước lượng giá trị trong tương lai dựa

vào mô hình hồi quy

5 Mô hình hồi quy bội

Trang 3

1 Mối quan hệ giữa các hiện tượng

KT-XH và phương pháp hồi quy tương quan

• Phân tích hồi quy được sử dụng đầu tiên để dự đoán

Một mô hình thống kê được sử dụng để dự đoán giá trị của biến phụ thuộc hoặc biến kết quả dựa trên

những giá trị của ít nhất 1 biến độc lập hay biến nguyên nhân.

• Phân tích tương quan được sử dụng làm thước

đo độ lớn trong mối liên hệ giữa các biến định

lượng

Trang 4

Biểu đồ phân tán (Scatter)

Trang 5

Các loại mô hình hồi quy Mối liên hệ tuyến tính thuận

Mối liên hệ tuyến tính nghịch

Mối liên hệ không tuyến tính

Không có mối liên hệ

Trang 6

2 Xác định mô hình hồi quy

tuyến tính đơn

i i

• Đường thẳng là phù hợp nhất với dữ liệu

• Mối liên hệ giữa các biến là một phương trình đường thẳng

Sai số ngẫu nhiên

Biến

phụ thuộc

(kết quả)

Biến độc lập (nguyên nhân)

Trang 7

Giá trị quan sát

YX  0  1X i

Y i  0  1X i  i

Trang 8

Mô hình hồi quy tuyến tính

của tổng thể mẫu

i

Yi = Giá trị dự đoán của Y trong quan sát i

X i = Giá trị của X trong quan sát i

b 0 = tham số tự do, dùng để ước lượng tổng thể

chung 0

b 1 = Độ dốc của mẫu được sử dụng để ước

lượng tổng thể chung 1

Trang 9

Ví dụ

Bạn muốn kiểm tra mối liên

hệ giữa diện tích các cửa

hàng với doanh thu hàng

năm Dữ liệu mẫu gồm 7

cửa hàng được đưa ra Tìm

phương trình tuyến tính

phù hợp nhất với dữ liệu

này

Doanh Cửa Diện thu hàng tích ($000)

Trang 11

Phương trình tuyến tính tốt nhất

i

i

i

X

.

X b

b

Y

487 1

415 1636

1 0

Trang 12

Đồ thị tuyến tính tốt nhất

0 2000 4000 6000 8000 10000 12000

Trang 13

Thuyết minh kết quả

Y i = 1636.415 +1.487X i

Độ dốc là 1.487, nghĩa là mỗi khi tăng X lên 1 đơn vị,

Y tăng khoảng 1.487 đơn vị.

Mỗi khi diện tích cửa hàng tăng 1 đơn vị , mô hình

dự đoán rằng doanh thu hàng năm mong đợi sẽ

tăn gkhoảng 1487$

Trang 14

Sai số chuẩn của mô hình

Độ lệch chuẩn của biến quan sát nằm gần

đường hồi quy.

Trang 15

Kết luận về hệ số hồi quy

Kiểm định t

• Kiểm định t về hệ số hồi quy của tổng thể chung

Có mối liên hệ tuyến tính giữa X và Y không?

1

1 1

b S

) X X

(

S S

1

2

1

Và df = n - 2

• Giả thiết “không” và Giả thiết đối

H0: 1 = 0 (Không có mối liên hệ tuyến tính)

H1: 1  0 (Có mối liên hệ tuyến tính )

Trong đó,

Trang 16

Ví dụ: Cửa hàng bán quả

Dữ liệu về 7 cửa hàng: Mô hình hồi quy:

Độ dốc của mô hình này

là 1.487.

Có mối liên hệ tuyến tính giữa diện tích và doanh thu hàng năm của các cửa hàng ?

Doanh Cửa Diện thu

Trang 17

0 2.5706 -2.5706

Trang 18

Kết luận về hệ số hồi quy

Ví dụ khoảng tin cậy

Ước lượng khoảng tin cậy cho hệ số hồi quy

Kết luận: Có mối liên hệ tuyến tính ý nghĩa giữa

doanh thu hàng năm và diện tích các cửa hàng

Lower 95% Upper 95%

Intercept 475.810926 2797.01853

X Variable 11.06249037 1.91077694

Trang 19

3 Đánh giá cường độ của mối liên hệ

và sự phù hợp của mô hình

• đo biến đổi của giá trị Y i quanh giá trị trung bình Y

SSR = Tổng bình phương được giải thích bằng hồi quy

• giải thích sự biến đổi do mối liên hệ giữa X và Y

SSE = Tổng bình phương do sai số

• sự biến đổi do các nhân tố khác ngoài mối liên

hệ giữa X và Y

_

Các mức độ biến đổi:

Trang 20

Các mức độ biến đổi

X i

Y i = b 0 + b 1 X i

Y X

_

Trang 22

Xác định hệ số xác định

SSR regression sum of squares

SST tổng các bình phương

r 2 = =

Các mức độ về tỷ lệ biến đổi được giải thích

bằng biến độc lập X trong mô hình hồi quy

Trang 24

Tương quan: thước đo cường độ

của mối liên hệ

Trả lời câu hỏi “Mối liên hệ tuyến tính

giữa hai biến mạnh như thế nào?”

Đặc điểm của hệ số tương quan

Hệ số tương quan của tổng thể chung:

(‘Rho’)Rho’)

Khoảng giá trị: từ -1 đến +1

Đo mức độ của mối liên hệ

Là căn bậc hai của hệ số xác định

Trang 25

Regression Statistics

Multiple R 0.9705572

R Square 0.94198129 Adjusted R Square 0.93037754 Standard Error 611.751517

Ví dụ Kết quả Excel về các cửa hàng:

94% sự biến đổi doanh thu hàng năm có thể được giải thích bằng sự biến đổi về quy mô cửa hàng, đo bằng diện tích

Trang 26

4 Ước lượng giá trị trong tương lai

dựa vào mô hình hồi quy

Ước lượng khoảng tin cậy cho XY

Giá trị trung bình của Y được tính từ 1 giá trị

n

i

) X X

(

) X X

( n

S t

1

2

2 2

1

Giá trị t value từ

bảng với df=n-2

Sai số chuẩn

của ước lượng

Độ lớn của khoảng tin cậy khác nhau, phụ

thuộc vào khoảng cách từ trung bình, X.

Trang 27

Ước lượng giá trị dự đoán

Ước lượng khoảng tin cậy cho một giá trị cá biệt

của Y (Yi) tại 1 giá trị cá biệt của X (Xi)

n

i

) X X

(

) X X

( n

S t

1

2

2 2

1 1

Thêm 1 vào độ rộng khoảng này từ độ

rộng của khoảng tin cậy trung bình Y

Trang 28

Ước lượng khoảng tin cậy cho những giá trị khác nhau của X

Y i = b 0 + b 1 X i

_

Trang 29

Ví dụ: Cửa hàng quả

Y i = 1636.415 +1.487X i

Dữ liệu về 7 cửa hàng:

Mô hình hồi quy:

Dự đoán doanh thu hàng năm của cửa hàng với diện tích là

2000 feet vuông.

Annual Store Square Sales

Trang 30

Ước lượng khoảng tin cậy cho Yi

Tìm khoảng tin cậy 95% cho doanh thu trung bình hàng năm

của cửa hàng rộng 2,000 feet vuông

n

i

) X X

(

) X X

( n

S t

1

2

2 2

Trang 31

Ước lượng khoảng tin cậy cho XY

Tìm khảng tin cậy 95% cho doanh thu trung bình hàng năm

của 1 cửa hàng có diện tích 2000 feet vuông

Doanh thu dự đoán: Yi = 1636.415 +1.487X i = 4610.45 ($000)

n

i

) X X

(

) X X

( n

S t

1

2

2 2

1 1

Ví dụ: Cửa hàng quả

Trang 32

5 Mô hình hồi quy bội

Mô hình hồi quy bội

Xác định hệ số hồi quy

Xây dựng mô hình

Trang 33

5.1 Mô hình hồi quy bội

i pi

p i

(kết quả) của mẫu

Biến độc lập (nguyên nhân)

trong mô hình mẫu

Sai số ngẫu nhiên

i pi

p i

i

01 12 2      

Trang 34

X 2

X 1

Y

pi p

i i

01 12 2     

i pi

p i

Trang 35

Oil (Gal) Temp Insulation

275.30 40 3 363.80 27 3 164.30 40 10 40.80 73 6 94.30 64 6 230.90 34 6 366.70 9 6 300.60 8 10 237.80 23 10 121.40 63 3 31.40 65 10 203.50 41 6 441.10 21 3 323.00 38 3 52.50 58 10

Ví dụ

( 0 F)

Xây dựng mô hình ước lượng

nhiên liệu sử dụng cho một hộ gia

đình trong tháng 1 trên cơ sở nhiêt

độ bình quân và độ dày của tấm

cách nhiệt đo bằng inches

Trang 36

pi p

i i

562 1515 437 120 012 2

Với mỗi mức tăng lên của

nhiệt độ, lượng nhiên liệu trung

bình được sử dụng giảm

5.437gallons, trong điều kiện độ

dày tấm cách nhiệt không đổi.

Với mỗi inch tăng lên của độ dày tấm cách nhiệt, lượng nhiên liệu trung bình được sử dụng giảm 20.012gallons, trong điều kiện

Ví dụ

Trang 37

Sử dụng mô hình để dự đoán

969 278

6 012

20 30

437 5

151 562

012 20

437 5

151

.

.

.

X

X

độ dày tấm cách nhiệt là 6 inches.

Lượng nhiên liệu trung bình

dự tính là 278.97 gallons

Trang 38

• Chịu ảnh hưởng

bởi số biến giải thích

và cỡ mẫu

Hệ số xác định bội

Trang 39

Kiểm định mức ý nghĩa chung

• Chỉ ra có mối liên hệ tuyến tính giữa tất cả các biến

X với Y hay không

Trang 40

p value

= Kiểm định F

Trang 41

 = 0.05

F  168.47

(kết quả Excel)

Ví dụ

Trang 42

Kiểm định ý nghĩa cá biệt

• Cho biết có mối liên hệ tuyến tính giữa biến X i và

Y hay không

• Sử dụng kiểm định thống kê t

• Giả thiết:

Y)

Trang 43

Coefficients Standard Error t Stat

Trang 44

chất đốt hàng tháng

Z

0 2.1788 -2.1788

Trang 45

Ước lượng khoảng tin cậy cho độ dốc

Tìm khoảng tin cậy 95% cho độ dốc tổng thể chung 1

(ảnh hưởng của nhiệt độ đối với việc tiêu thụ chất đốt).

Trang 46

5.3 Xây dựng mô hình

Mục đích để xây dựng mô hình với số

biến nguyên nhân ít nhất

– Dễ dàng thuyết minh – Xác suất cộng tuyến nhỏ hơn

Hồi quy từng bước

– Nhằm lựa chọn mô hình phù hợp

Tiếp cận tập hợp con một cách tốt nhất

Trang 47

TÓM TẮT

tính đơn

quy tương quan

Ngày đăng: 29/11/2013, 11:11

HÌNH ẢNH LIÊN QUAN

Đồ thị tuyến tính tốt nhất - Tài liệu Chương 7 Phân tích hồi quy và  tương quan
th ị tuyến tính tốt nhất (Trang 12)
Bảng với df=n-2 - Tài liệu Chương 7 Phân tích hồi quy và  tương quan
Bảng v ới df=n-2 (Trang 26)

TỪ KHÓA LIÊN QUAN

w