1. Trang chủ
  2. » Tất cả

Chương 6 Xác suất thống kê: Tương quan và hồi quy

13 1 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Chương 6 Xác suất Thống Kê: Tương Quan Và Hồi Quy
Trường học Trường Đại học Khoa học Tự nhiên, Đại học Quốc Gia Hà Nội
Chuyên ngành Xác Suất Thống Kê
Thể loại Giáo trình
Thành phố Hà Nội
Định dạng
Số trang 13
Dung lượng 1,8 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

1. Tương quan Mục đích của tương quan là tìm ra một con số biểu thị mối quan hệ giữa 2 biến A và B với nhau. Tương quan phản ánh mức độ liên kết hay độ mạnh trong sự liên kết giữa biến A với biến B. Nếu sự thay đổi của biến A sẽ kéo theo sự thay đổi của biến B và ngược lại. Tương quan là mối quan hệ 2 chiều, A với B cũng như B với A, hệ số tương quan của A đối với B bằng với hệ số tương quan của B đối với A. Trong tương quan, khi 2 biến A và B di chuyển cùng hướng, tức A tăng sẽ làm B tăng và ngược lại B tăng làm A tăng, 2 biến này sẽ được coi là có tương quan dương. Nếu 2 biến di chuyển theo 2 hướng khác nhau, A tăng làm B giảm, hoặc B tăng làm A giảm, 2 biến sẽ có tương quan nghịch. Lượng thay đổi của X bằng lượng thay đổi của Y. Không có sự phân biệt biến độc lập và biến phụ thuộc, vai trò của A và B là như nhau. Tương quan là sự xem xét mối quan hệ giữa từng cặp biến với nhau. 2. Hồi quy Mục đích của hồi quy là đi tìm một phương trình mà khi biểu diễn nó trên đồ thị, chúng ta có một đường thẳng phù hợp nhất và ước tính được biến phụ thuộc Y dựa vào những thay đổi của biến độc lập X. Hồi quy phản ánh sự ảnh hưởng của việc thay đổi giá trị của biến độc lập X lên biến phụ thuộc Y. Chúng ta sẽ đi ước tính Y dựa vào những giá trị của X. Hồi quy là mối quan hệ 1 chiều từ X lên Y. Hệ số hồi quy sẽ khác nhau nếu đổi X thành biến phụ thuộc, đổi Y thành biến độc lập. Trong hồi quy, việc tăng X làm Y tăng nghĩa là biến X có sự tác động thuận chiều lên Y. Nếu X tăng làm Y giảm nghĩa là biến X có sự tác động nghịch chiều lên Y. Lượng thay đổi của X không bằng lượng thay đổi của Y. Có sự phân biệt biến độc lập X và biến phụ thuộc Y, hồi quy chỉ xem xét sự tác động của biến độc lập lên biến phụ thuộc. Hồi quy có thể xem xét sự tác động của nhiều biến độc lập lên 1 biến phụ thuộc.

Trang 1

CHƯƠNG VI:TƯƠNG QUAN VÀ HỒI QUY

Trang 2

1 Hệ số tương quan mẫu

• Cho X, Y là hai BNN, trong phần xác suất ta đã biết hệ

số tương quan giữa hai BNN X và Y :

E[(X EX)(Y EY)] EXY EX.EY R(X,Y)

là đại lượng cho biết mức độ phụ thuộc tuyến tính giữa X

và Y

• Giả sử là mẫu ngẫu nhiên của (X, Y)

(X ,Y ), ,(X ,Y )

Hệ số tương quan mẫu r được tính theo công thức:

n

i i

i 1

r

Trang 3

Ví dụ 1 Theo dõi sự phụ thuộc giữa mức suy giảm đường

X(%) và thời gian chờ chế biến Y, ta có kết quả sau:

X 30 30 35 35 40 40 40 45 45 45 50 50

Y 2 4 4 6 4 6 8 6 8 10 8 10

ni 1 1 3 1 1 2 2 2 3 1 1 2

Hãy tính hệ số tương quan mẫu giữa X và Y

Giải.

Trang 4

 2

i i i i

1

n

X Y

XY XY

s s

Trang 5

2 Đường hồi quy trung bình tuyến tính thực nghiệm

a) Hồi quy bình phương trung bình tuyến tính

• Giả sử X là một biến nào đó, Y là BNN phụ thuộc vào X

a, b là hằng số và phương sai không phụ

thuộc vào x

• Khi đó ta nói: Y hồi quy tuyến tính theo X

• Đường thẳng có phương trình y = a + bX gọi là đường

thẳng hồi quy lý thuyết của Y theo X

• a, b gọi là hệ số hồi quy lý thuyết, X là biến độc lập còn Y

là biến phụ thuộc

Trang 6

Bài toán đặt ra: Cần tìm biểu thức a + bX sao cho xấp xỉ Y tốt nhất theo nghĩa cực tiểu sai số bình phương trung

• Ta có:

2 2

2E (Y EY)(EY bEX a) 2E b(X EX)(EY bEX a)

VY b VX 2bR VX VY (EY bEX a)

• Vế phải đạt cực tiểu khi và chỉ khi tam thức bậc hai theo

b:2

2

Trang 7

• Khi đó:

• Phương trình đường hồi quy trung bình tuyến tính của Y

• Sai số bình phương trung bình khi dùng đường hồi quy

trung bình tuyến tính để xấp xỉ Y là: 2Y X VY(1 R ) 2

Trang 8

b) Hồi quy bình phương trung bình tuyến tính thực nghiệm

• Giả sử là MNN của (X, Y).(X ,Y ), ,(X ,Y )1 1 n n

• Phương trình đường hồi quy tuyến tính thực nghiệm của

X

S

S

• Sai số :

2 2 2

Y

Y X

Trang 9

Ví dụ 2 Qua theo dõi tình hình sản xuất của các công

nhân ở một xí nghiệp, người ta thu được số liệu sau:

Tuổi nghề (năm) 1 3 4 6 7 8 9 10 11 12

NSLĐ (kg/ngày) 5 11 9 13 15 10 20 25 21 28

a Hãy đánh giá mối liên hệ tuyến tính giữa năng suất lao động và tuổi nghề

b Lập hàm hồi quy bình phương trung bình tuyến tính thực nghiệm của năng suất lao động theo tuổi nghề

Trang 10

Giải

a) Gọi X là tuổi nghề, Y là năng suất lao

động, ta có:

X Y

XY XY

S S

Mối liên hệ giữa tuổi nghề và năng suất lao động là rất chặt chẽ

b) Hàm hồi quy tuyến tính thực nghiệm của năng suất lao động theo tuổi nghề :

Y X

S

S

Trang 11

Bài 1 Đo chiều cao của 12 cặp bố và con người ta được kết quả sau:

X - Bố

(inches) 65 63 67 64 68 62 70 66 68 67 69 71

Y - Con

(inches) 68 66 71 66 72 66 74 69 71 70 70 72

a) Tính hệ số tương quan mẫu giữa X và Y

b) Tìm hàm hồi quy tuyến tính thực nghiệm của Y theo X Dựa vào hàm hồi quy, hãy dự đoán chiều cao của con nếu chiều cao của bố là 68,5 inches

Giải

Trang 12

1 4645,0833

i i

xy x y

n

x y

xy x y

r x y

s s

b) Hàm hồi quy tuyến tính thực nghiệm của Y theo X là

x

s

y r x y x x y x

s

Nếu bố có chiều cao x=68,5 inches thì dự đoán con có chiều cao là 71,19 inches

Trang 13

Bài 2 Tiến hành nghiên cứu về mối liên quan giữa cân nặng (kg) và

huyết áp của con người Kết quả khảo sát lâm sàng như sau:

Cân

Huyết

a) Xác định hệ số tương quan tuyến tính mẫu giữa cân nặng và huyết áp của con người

b) Viết phương trình đường hồi quy tuyến tính thực nghiệm của huyết áp theo cân nặng Từ đó dự đoán huyết áp của một người có cân nặng 90 kg

Ngày đăng: 16/02/2023, 15:12

🧩 Sản phẩm bạn có thể quan tâm

w