1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài giảng Các phương pháp nghiên cứu định lượng trong kinh tế: Phần 2 - TS. Chu Thị Thu Thuỷ

84 48 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân Tích Hồi Quy Đa Biến
Trường học Trường Đại Học Kinh Tế
Chuyên ngành Kinh Tế Học
Thể loại bài giảng
Định dạng
Số trang 84
Dung lượng 1,79 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mục tiêu của Bài giảng Các phương pháp nghiên cứu định lượng trong kinh tế nhằm giúp các bạn nắm vững các kiến thức thống kê cơ bản; Nắm vững các kiến thức kinh tế lượng; Hiểu được các nghiên cứu định lượng được thực hiện bởi các nhà nghiên cứu khác; Có thể tự thực hiện được các nghiên cứu định lượng trong kinh tế. Mời các bạn cùng tham khảo nội dung phần 2 sau đây.

Trang 1

Chương III PHÂN TÍCH HỒI QUY ĐA BIẾN (HỒI QUY

BỘI)

Số giờ 10 giờ lý thuyết + 18 giờ thực hành+ Thuyết trình+ kiểm tra

Mục tiêu của chương:

Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:

 Dựa vào vấn đề nghiên cứu biết cách xây dựng mô hình hồi quy nhiều biến

 Phân tích kết quả ước lượng mô hình từ phương pháp OLS (đánh giá tác động của từng biến độc lập đến giá trị trung bình của biến phụ thuộc) với số liệu một mẫu cụ thể

 Dự báo giá trị của biến phụ thuộc tại các mức giá trị cụ thể của biến độc lập

 Đánh giá sự phù hợp của hàm hồi quy trong mẫu qua hệ số xác định

 Linh hoạt phân tích mô hình với các tình huống thường gặp trong kinh tế – xã hội: các khuyết tật, các dạng mô hình

Bài này sẽ tiếp nối ý tưởng phân tích trong bài 2 Nội dung của bài 2 đề cập đến

việc đánh giá tác động của một biến độc lập X lên giá trị trung bình của biến phụ thuộc

Y khi các giả thiết từ 1 đến 3 thỏa mãn Tuy nhiên, mô hình hồi quy đơn (còn gọi là hồi

quy hai biến) thường vi phạm giả thiết 2, một giả thiết quan trọng, do trong thực tế rất

ít khi sự thay đổi của biến phụ thuộc lại chỉ do một nguyên nhân (1 biến độc lập) gây nên Khi đó kết quả ước lượng sẽ không có giá trị sử dụng Do đó, cần phải xây dựng

mô hình hồi quy bội với nhiều biến độc lập (hay còn gọi là hồi quy nhiều biến) Tính ưu việt của mô hình hồi quy bội ở chỗ nó cho phép đánh giá tác động riêng của từng biến độc lập lên biến phụ thuộc trong điều kiện các biến độc lập khác của mô hình là không đổi Đây chính là một tiền đề quan trọng cho việc phân tích tác động giữa các đại lượng trong kinh tế – xã hội Ngoài ra, việc đưa thêm các biến số thích hợp vào mô hình đồng

việc có thêm nhiều nguyên nhân giải thích cho sự thay đổi của biến phụ thuộc, do đó góp phần cải thiện chất lượng dự báo của mô hình Các nội dung trong bài sẽ giới thiệu

về mô hình hồi quy k biến (với k ≥ 2), phương pháp OLS cho mô hình hồi quy bội, hệ

số xác định bội và một vài dạng mô hình, các khuyết tật của mô hình thường gặp trong các tình huống cụ thể trong kinh tế – xã hội

3.1 MÔ HÌNH HỒI QUY

Một trong những bài toán quan trọng trong phân tích kinh té là bài toán đánh giá tác

Trang 2

Ví dụ 3.1: Muốn đánh giá tác động của lượng phân bón lên năng suất lúa trên tổng thể

các ruộng lúa ở đồng bằng sông Cửu Long, ta thường suy luận một cách dễ hiểu như sau, khi tăng lượng phân bón thì năng suất lúa sẽ tăng lên, do đó, hoàn toàn có thể tìm được mối liên hệ phụ thuộc về hàm số giữa các biến này như sau:

Hàm số (3.1) thể hiện mối quan hệ giữa 2 biến NS và PB, tức là nếu biết giá trị của biến

PB sẽ biết giá trị của biến NS một cách chắc chắn, không có sai số Tuy nhiên, trong thực tế, điều này là không phù hợp, vì năng suất còn phụ thuộc vào nhiều yếu tố khác như lượng nước tưới, độ pH của đất, các yếu tố ngẫu nhiên như thời tiết, sâu bệnh, bão lụt… Do đó, để hợp lý hơn ta thường viết hàm (3.1) như sau:

Sai số ngẫu nhiên u là yếu tố đại diện cho các yếu tố có tác động đến biến Y ngoài biến

X (biến độc lập hay còn gọi là biến giải thích, biến điều khiển) Trong mô hình (3.3) chúng ta không có các quan sát về sai số ngẫu nhiên này nên nó thường được gọi là sai

số ngẫu nhiên không quan sát được Do đó, để hàm hồi quy có ý nghĩa cần đưa ra giả thiết cho thành phần này

Tức là, giả thiết: tại mỗi giá trị của X thì kì vọng của u bằng 0: E(u/x)= 0

Nguyên nhân 1: Vì giả thiết trung bình sai số ngẫu nhiên bằng 0 cũng tương đương với trung bình của hàm hồi quy E(Y/Xi) = f(Xi) hay hàm hồi quy tổng thể được xác định là

đi qua đúng các điểm trung bình có điều kiện Nói đơn giản là các sai số ngẫu nhiên chỉ dao động ngẫu nhiên quanh các điểm do PRF xác định, những sự dao động ngẫu nhiên

Trang 3

đó triệt tiêu nhau vì không mang tính hệ thống Tức là sai số ngẫu nhiên không tác động đến xu thế biến động trung bình do biến độc lập X giải thích

Nguyên nhân 2: Theo ví dụ về phân bón ở trên, có nghĩa là tại mỗi mức phân bón bất

kì, tác động tổng hợp các yếu tố như ngày công chăm sóc, lượng nước tưới lên năng suất lúa đều bằng nhau và bằng 0 Giả thiết về trung bình hay vì vọng về sai số ngẫu nhiên này bằng 0 là để đảm bảo ý nghĩa của hệ số : tác động của sự thay đổi của biến X một đơn vị lên giá trị trung bình của biến phụ thuộc Nếu kì vọng trên bị thay đổi và sự thay đổi đó được đo bởi sai số ngẫu nhiên u (giả sử E(u/PB=10) = 0 và E(u/PB=11) = 6) thì lượng thay đổi của năng suất lúa khi phân bón thay đổi 1 đơn vị sẽ là + 6 đơn vị Cũng vì những điều này nên trên thực tế, mô hình hồi quy 2 biến chỉ đánh giá được tác động của 1 biến độc lập X lên giá trị trung bình của biến phụ thuộc Y khi các điều kiện

về mô hình được ước lượng trên cơ sở mẫu ngẫu nhiên với kích thước n và phương sai sai số ngẫu nhiên là bằng nhau tại mọi giá trị Xi

Hay var (u/x) = var ( | ) =

Nguyên nhân 3: Do tương quan giữa biến X với các sai số ngẫu nhiên Theo giả thiết thì tương quan này bằng 0, tương đương: cov[X, u] = 0, tức là nếu X và u tương quan với nhau thì giả thiết về kì vọng của sai số ngẫu nhiên bằng 0 sẽ không được thỏa mãn (Công lao động = CLD)

Với ví dụ về phân bón, ta thấy rõ rằng, ngoài phân bón, công lao động có ý nghĩa rất quan trọng tới hoạt động nâng cao năng suất cây trồng Lượng công lao động càng lớn thì năng suất thu được càng cao Hay giữa biến PB và biến công lao động thường có tương quan cao Điều này nói chung gây ra sự tương quan giữa biến u với biến năng suất  cov(NS, u) khác 0

Chính điều này đã khiến người ta phải đưa thêm 1 biến Công lao động vào mô hình 3 biến như sau:

= + + + (3.4)

Khi chúng ta thêm 1 biến công lao động vào mô hình (3.4) sai số ngẫu nhiên u không còn chứa đựng tác động của yếu tố công lao đông nữa, do đó, nó không còn là nhân tố gây nên sự vi phạm giả thiết về kì vọng của sai số ngẫu nhiên bằng 0, tức là nếu có sự tương quan giữa biến độc lập với biến phụ thuộc thì kì vọng của sai số ngẫu nhiên sẽ khác 0 Lúc này ta gọi biến độc lập trong mô hình có tương quan với sai số ngẫu nhiên

là biến độc lập nội sinh Như vậy, nếu trong mô hình có biến độc lập nội sinh thì các

Trang 4

ước lượng OLS sẽ là ước lượng chệch, mô hình này có vấn đề Trên thực tế thì vấn đề

biến độc lập nội sinh xảy ra khá phổ biến với mô hình hai biến trong phân tích kinh tế

xã hội Do biến phụ thuộc Y thường chịu tác động của nhiều yếu tố và các yếu tố này

có thể tương quan với nhau, khi đó, nếu chỉ chọn 1 yếu tố làm biến độc lập thì biến này

sẽ rất có khả năng tương quan với sai số ngẫu nhiên trong mô hình Và một giải pháp

cho vấn đề này đó chính là đưa thêm biến độc lập vào mô hình, mô hình đó có tên gọi

là mô hình hồi quy bội hay mô hình hồi quy đa biến

* Một số ưu điểm của mô hình hồi quy bội

- Chất lượng dự báo tốt hơn do đưa thêm các biến phù hợp,

làm tăng khả năng giải thích của mô hình về sự thay đổi

của biến phụ thuộc, gia tăng chất lượng dự báo của mô

hình

- Cung cấp dự báo hữu ích hơn do có thể dự báo cho biến

phụ thuộc tại các giá trị cụ thể của từ 2 biến độc lập trở lên

tốt hơn so với 1 biến độc lập nội sinh

- Cho phép sử dụng dạng hàm phong phú hơn như log – log, bán loga, phi tuyến hay đa

thức cho nhiều dạng biến như biến giả

- Cho phép thực hiện các phân tích phong phú hơn do cho phép đánh giá tác động tổng

hợp đồng thời của biến độc lập lên biến phụ thuộc

3.1.1 Dạng và các giả thiết của mô hình

(vii) Dạng của mô hình

Ví dụ 3.2: Nhiều các nghiên cứu trên thế giới quan tâm tới mối quan hệ giữa thu nhập

Trang 5

Nhưng người ta cũng thường quan sát thấy, thu nhập có xu hướng tăng chậm dần khi người

ta càng nhiều tuổi hơn so với thời trẻ Để thể hiện điều đó, chúng ta mở rộng mô hình như

- Hệ số là giá trị trung bình của Y khi X2i = X3i = 0

- Hệ số cho biết khi X2 tăng một đơn vị thì trung bình của Y thay đổi như thế nào trong điều kiện X3 không thay đổi

- Hệ số cho biết khi X3 tăng một đơn vị thì trung bình của Y

thay đổi như thế nào trong điều kiện X2 không thay đổi

- Giả sử mọi giả thiết của phương pháp OLS đều được thoả mãn

Mô hình hồi quy tuyến tính k biến tổng thể có thể viết dưới dạng như sau:

Trong đó: Y là biến phụ thuộc và các Xj (j = 1,2,3…k) là các biến độc lập Lưu ý rằng

dù có đưa bao nhiêu biến độc lập vào mô hình thì vẫn tồn tại những yếu tố có tác động đến biến phụ thuộc mà khó có thể quan sát hết hoặc không muốn đưa vào mô hình, do

đó, tồn tại sai số ngẫu nhiên u, đại diện cho các yếu tố ngoài biến Xj (j=2…k), có tác động đến Y nhưng không đưa vào mô hình như là biến số

Mô hình hồi quy tổng thể là mô hình xây dựng trên toàn bộ các phần tử của tổng thể, toàn bộ các phần tử chứa đựng dấu hiệu nghiên cứu, chứa đứng mối quan hệ đang xem

Trang 6

xét Trên thực tế, tổng thể là những tập hợp rất lớn, không thể thu thập được toàn bộ hệ thống thông tin và cũng không đảm bảo rằng thông tin thu thập được là hoàn toàn chính xác, do đó, việc xây dựng mô hình hồi quy cho toàn bộ tổng thể sẽ mang tính định hướng Do vậy, cần thiết xây dựng hàm hồi quy tổng thể Population Regression Function

để mô tả mối quan hệ giữa trung bình của biến phụ thuộc và biến độc lập, xác định trên toàn bộ tổng thể Hàm hồi quy tổng thể cho biết xu thế biến động về mật trung bình của biến phụ thuộc theo biến độc lập

Như vậy, ta có hàm hồi quy tổng thể k biến:

gọi là các hệ số góc riêng phần (các hệ số hồi quy)

- Giá trị của k cho biết: Số biến và số tham số cần ước lượng của mô hình

thì trung bình của Y thay đổi như thế nào trong điều kiện các biến Xj;( ) không thay đổi

Trang 7

- Giả sử mọi giả thiết của phương pháp OLS đều được thoả mãn

Các giả thiết của mô hình

Xét các giả thiết sau:

Giả thiết 1: Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên, kích thước n: {( , ), = 1,2,3, … }

Khi đó, mô hình trên cho từng quan sát mẫu như sau:

 Giả thiết 2: Trung bình sai số ngẫu nhiên bằng 0: ( | ) = 0

Giả thiết này cho biết tại mỗi giá trị X = bất kì thì trung bình ảnh hưởng của các yếu

tố ngoài X lên Y là bằng 0 Hay theo ví dụ: tại mỗi mức phân bón bất kì, tác động tổng hợp của các yếu tố công lao động, số ngày chăm sóc, lượng nước tưới lên năng suất lúa đều bằng nhau và bằng 0 Giả thiết này nhằm đảm bảo ý nghĩa của hệ số tức là tác động của sự thay đổi biến X một đơn vị lên giá trị trung bình của biến phụ thuộc

* Giả thiết 3: Phương sai của sai số ngẫu nhiên tại các giá trị đều bằng nhau

Phương sai là mức độ dao động, hay độ phân tán, độ phủ của các quan sát Nếu độ phủ này đồng đều có nghĩa là phân phối của sai số ngẫu nhiên u tại mọi X luôn cùng bằng một hằng số nào đó Nếu phương sai sai số ngẫu nhiên mà khác nhau tại các giá trị khác nhau thì ước lượng này bị chệch, có nghĩa là không chính xác

( ) =  Giả thiết 4: Giữa các biến độc lập (j=2-k) không có mối quan hệ đa cộng tuyến hoàn hảo, nghĩa là không tồn tại các hằng số l , l , … l không đồng thời bằng 0 sao cho:

: ( )

PRF E YXPRM Y :  X   U

Trang 8

Nếu các biến có quan hệ đa cộng tuyến hoàn hảo thì sẽ có ít nhất 1 biến trong các biến này suy ra được từ các biến còn lại, nói cách khác, thông tin từ biến này đã được chứa đựng trong các thông tin của các biến còn lại Giả thiết 4 đặt ra là để loại trừ vấn

đề này

Hình III-1 Biến phụ thuộc Y và các biến Xj không chứa hiện tượng đa cộng

tuyến

Hình III-2 Các trường hợp đa cộng tuyến

Giải thích về điều này như sau:

Thuật ngữ đa cộng tuyến do Ragnar Frisch đề nghị Khởi đầu nó có nghĩa là sự tồn tại mối quan hệ tuyến tính “hoàn hảo” hoặc chính xác giữa một số hoặc tất cả các biến giải thích trong một mô hình hồi qui Đối với hồi qui k biến liên quan đến các biến X1, X2, , Xk (với X1 = 1 đối với mọi quan sát kể cả số hạng tung độ gốc), một quan hệ tuyến tính chính xác được cho là tồn tại khi thỏa điều kiện sau:

l + l + l + ⋯ + l = 0 (3.10)

trong đó l1, l2, , lk là các hằng số và không đồng thời bằng 0

Trang 9

Tuy nhiên, ngày nay, thuật ngữ đa cộng tuyến được dùng với nghĩa rộng hơn, bao gồm trường hợp đa cộng tuyến hoàn hảo như công thức trên cũng như trường hợp các biến

X có tương quan với nhau nhưng không hoàn hảo như dưới đây:

l + l + l + ⋯ + l + = 0 (3.11)

với i là số hạng sai số ngẫu nhiên

Tại sao mô hình hồi qui tuyến tính cổ điển giả định rằng không có vấn đề đa cộng tuyến giữa các biến X? Lý do là: Nếu đa cộng tuyến hoàn hảo theo (a), các hệ số hồi qui của các biến X là vô định và các sai số chuẩn là không xác định Nếu đa cộng tuyến chưa hoàn hảo, như trong (b), các hệ số hồi qui, mặc dù là xác định nhưng lại có sai số chuẩn (liên quan đến bản thân các hệ số) lớn, có nghĩa là không thể ước lượng các hệ số này với độ chính xác cao

Hình III-3 Quan điểm của Ballentine về đa cộng tuyến

Ví dụ 3.3: Giả sử để xem xét tác động của các hình thức đầu tư lên GDP sử dụng hàm

hồi quy sau đây:

Trong đó: GI: đầu tư của khu vực nhà nước

PI: đầu tư của khu vực tư nhân

FDI: đầu tư trực tiếp nước ngoài

I là tổng đầu tư

Mô hình này vi phạm giả thiết 4 do giữa các biến độc lập trong mô hình trên có quan hệ

đa cộng tuyến hoàn hảo:

GI + PI + FDI – I = 0 (3.13)

Trang 10

Ví dụ 3.4: Đánh giá từng loại phân bón có tác động đến năng suất lúa không, chúng ta

sử dụng mô hình hồi quy sau:

Trong đó: HC: lượng phân bón hữu cơ

VC: lượng phân bón vô cơ

Nếu lượng phân bón hữu cơ và vô cơ là không có liên hệ gì với nhau thì mô hình trên không vi phạm giả thiết về không có đa cộng tuyến hoàn hảo Tuy nhiên, nếu 10kg phân hữu cơ, người nông dân lại sử dụng 1kg phân vô cơ thì khi đó ta có quan hệ đa cộng tuyến hoàn hảo giữa 2 biến này

Giả thiết 5: Các sai số ngẫu nhiên không tương quan với nhau

( , ) = 0; (∀ ≠ )

 Ý nghĩa của các hệ số hồi quy:

Các hệ số hồi quy trong mô hình hồi quy bội còn được gọi là hệ số hồi quy bội

Hàm hồi quy tổng thể:

( | 2, … , ) = b1 + b2 2 + … + b

Hệ số 1: bằng giá trị trung bình của biến phụ thuộc Y khi các biến độc lập trong mô

hình nhận giá trị bằng 0 Tuy nhiên, trong thực tế, hệ số này ít được quan tâm

Các hệ số góc bj ( j = 2, 3, , k): thể hiện tác động riêng của biến Xj lên giá trị trung bình của biến phụ thuộc (còn được gọi là hệ số hồi quy riêng), là tác động của biến Xj lên giá trị trung bình của biến phụ thuộc khi các yếu tố Xs (s khác j) là không đổi Cụ thể, khi Xj tăng hoặc giảm 1 đơn vị, trong điều kiện các biến độc lập khác không đổi, thì

Y trung bình sẽ thay đổi bj đơn vị

Có thể nhận thấy ba khả năng có thể xảy ra đối với các hệ số góc:

 Hệ số bj > 0: khi đó mối quan hệ giữa Y và Xj là thuận chiều, nghĩa là khi Xj tăng (hoặc giảm) trong điều kiện các biến độc lập khác không đổi thì Y cũng sẽ

tăng (hoặc giảm)

 Hệ số bj < 0: khi đó mối quan hệ giữa Y và Xj là ngược chiều, nghĩa là khi Xj tăng (hoặc giảm) trong điều kiện các biến độc lập khác không đổi thì Y sẽ giảm

(hoặc tăng)

 Hệ số bj = 0: có thể cho rằng giữa Y và Xj không có tương quan với nhau, cụ thể là Y có thể không phụ thuộc vào Xj hay là Xj không thực sự ảnh hưởng tới Y

Trang 11

Dựa vào kết quả ước lượng với một mẫu cụ thể, ta có thể đánh giá được mối quan hệ giữa biến phụ thuộc và các biến độc lập trong mô hình một cách tương đối Sau đây, ta

sẽ nghiên cứu một ví dụ để hiểu rõ về ý nghĩa của các hệ số trong mô hình hồi quy Tiếp tục với ví dụ 3.4 khi phân tích tác động của lượng phân bón hữu cơ và lượng phân bón vô cơ lên năng suất lúa, ta có thể xây dựng mô hình như sau:

= b1 + b2 + b3 + (3.15)

Trong đó NS là năng suất lúa/ha là biến phụ thuộc

Các biến độc lập: HC là lượng phân bón hữu cơ/ha, VC là lượng phân bón vô cơ/ha Kết

quả ước lượng mô hình với số liệu của 30 vùng chuyên canh nông nghiệp như sau:

= 1,5  0,35  0,12

Giải thích về mối quan hệ giữa các biến như sau:

 Khi không sử dụng phân bón cả hai loại hữu cơ và vô cơ (biến HC = VC = 0), năng suất lúa/ha trung bình đạt 1,5 đơn vị

 Nếu lượng phân bón hữu cơ tăng (giảm) 1 đơn vị và mức phân bón vô cơ không thay đổi thì năng suất lúa/ha trung bình sẽ tăng (giảm) 0,35 đơn vị

Nếu lượng phân bón vô cơ tăng (giảm) 1 đơn vị và mức phân bón hữu cơ không thay đổi thì năng suất lúa/ha trung bình sẽ tăng (giảm) 0,12 đơn vị

3.1.2 Ước lượng của mô hình

(viii) a Mô tả phương pháp

Xét Mô hình k biến:

Giả sử có một mẫu quan sát với giá trị thực tế là (Yi, X2i, …, Xki) với (i = 1, 2, …, n)

Ta sẽ sử dụng thông tin từ mẫu để xây dựng các ước lượng cho các hệ số  (j = 1, 2,

…, k), ký hiệu là (j = 1, 2, …, k) Từ các giá trị ước lượng này có thể viết thành hàm

hồi quy mẫu như sau:

Trang 12

Tương tự như mô hình hồi quy hai biến, phương pháp OLS nhằm xác định các giá trị

(j = 1, 2, …, k) sao cho tổng bình phương các phần dư là bé nhất:

Đặt ( , , , ) = ∑ ( − − − ⋯ − ) khi đó , , , là nghiệm của hệ phương trình

Với điều kiện số quan sát trong mẫu lớn hơn số hệ số hồi quy cần ước lượng và giả thiết

4 được thỏa mãn thì hệ phương trình trên sẽ có nghiệm duy nhất Việc giải hệ phương

Trang 13

trình khá dễ dàng qua các phần mềm kinh tế lượng và thống kê nếu số biến không quá lớn Các giá trị ước lượng bằng phương pháp OLS dựa trên số liệu mẫu cụ thể được xem như là các ước lượng điểm của các hệ số trong tổng thể

Ở mô hình hồi quy bội (hồi quy k biến với k > 2), việc giải hệ phương trình để tìm các

ước lượng hệ số  ( j 1, 2, , k ) sẽ trở nên khó khăn hơn so với mô hình hồi quy 2

biến do đó ta sẽ có được các kết quả này với sự giúp của các phần mềm kinh tế lượng

Từ kết quả ước lượng từ phương pháp OLS, ta có thể khai thác các thông tin để đánh giá tác động của biến độc lập đối với sự thay đổi của biến phụ thuộc thông qua ý nghĩa các hệ số hồi quy

Với các giả định này, dùng phương pháp bình phương tối thiểu ta nhận được ước lượng các hệ số như sau, ở mô hình 3 biến độc lập:

 = +  Hàm hồi quy mẫu đi qua gốc tọa độ

Ở ma trận k biến, ước lượng OLS như sau:

Trang 14

Khi đó = (X’X)-1X’Y là ước lượng tuyến tính không chệch tốt nhất của 

Để giải được hệ trên điều kiện cần là ma trận X ’ X không suy biến, hay các biến độc lập

không có quan hệ cộng tuyến với nhau

Ma trận X không suy biến, nên ′ cũng không suy biến, do đó tồn tại ( ′ ) Từ đó,

Trang 15

= ( ′ ) ( ′ ) =

31.980670.650051.10986Vậy hàm hồi quy mẫu là:

Trang 16

- Do chưa biết nên được thay bởi một ước lượng điểm của nó:

Ví dụ 3.6 Số liệu trong mẫu chọn ngẫu nhiên 100 hộ gia đình trên địa bàn thành phố

Hà Nội (VHLSS 2012) Biến phụ thuộc là tổng chi tiêu trong năm của hộ (CT, đơn vị tính là triệu đồng/năm), hai biến độc lập đưa vào mô hình là tổng thu nhập trong năm của hộ (TN, triệu đồng/năm) và số người trong hộ (SN, đơn vị tính là người)

Trang 17

Ta giải thích kết quả ước lượng như sau:

Hệ số chặn = – 3,961 Hệ số chặn trong mô hình này không có ý nghĩa thực tế vì nó mang giá trị âm

Hệ số góc = 0.612 thể hiện tác động riêng của thu nhập lên chi tiêu của hộ gia đình

Cụ thể giá trị này cho biết nếu thu nhập của hộ gia đình tăng (hoặc giảm) 1 triệu đồng/năm và số người trong hộ không thay đổi thì mức chi tiêu trung bình trong năm của hộ gia đình tăng 0,612 triệu đồng Con số này chính là khuynh hướng tiêu dùng cận biên Giá trị này phù hợp với lý thuyết kinh tế vì khuynh hướng tiêu dùng cận biên nằm trong khoảng từ 0 đến 1, nghĩa là khi thu nhập tăng thì chi tiêu cũng tăng nhưng mức tăng nhỏ hơn so với mức tăng của thu nhập

Hệ số góc =15.432 thể hiện tác động riêng của số người trong hộ lên chi tiêu của hộ Khi số nhân khẩu trong hộ tăng thêm một người, trong khi thu nhập vẫn giữ nguyên ở mức cũ thì số tiền chi tiêu trung bình của hộ sẽ tăng thêm 15,432 triệu/năm

Trang 18

Cũng có thể cho rằng nếu thu nhập gia tăng 1 triệu đồng và hộ có thêm 1 người thì mức chi tiêu trung bình của hộ sẽ tăng khoảng 16,044 triệu (= 0,612 + 15,432)

Có thể dự báo mức chi tiêu của hộ tại một mức thu nhập và số nhân khẩu cụ thể từ kết quả ước lượng mô hình Cụ thể là nếu tổng thu nhập của hộ là 150 triệu/năm và hộ có 4 người thì mức chi tiêu trung bình là:

= −3,961 + 0.612 ∗ 150 + 15.432 ∗ 4 = 149,567 Như vậy các gia đình sẽ chi tiêu gần hết thu nhập của họ Nếu thu nhập là 200 triệu/năm

và gia đình vẫn chỉ có 4 người thì hộ sẽ chi tiêu số tiền là 180,212 triệu, nghĩa là các gia đình bắt đầu có tiền tiết kiệm (trung bình là 19,788 triệu/năm)

(ix) c Sự phù hợp của hàm hồi quy

Làm thế nào chúng ta đo lường mức độ phù hợp của hàm hồi quy tìm được cho dữ liệu mẫu Thước đo độ phù hợp của mô hình đối với dữ liệu là R2 Để có cái nhìn trực quan

về R2, chúng ta xem xét đồ thị sau

Hình III-4 Phân tích độ thích hợp của hồi quy

− : biến thiên của biến phụ thuộc Y, đo lường độ lệch của giá trị Yi so với giá trị trung bình

− : biến thiên của Y được giải thích bởi hàm hồi quy

= − : biến thiên của Y không giải thích được bởi hàm hồi quy hay sai số hồi quy Trên mỗi Xi chúng ta kỳ vọng ei nhỏ nhất, hay phần lớn biến thiên của biến phụ thuộc được giải thích bởi biến độc lập Nhưng một hàm hồi quy tốt phải có tính chất mang

Trang 19

tính tổng quát hơn Trong hồi quy tuyến tính cổ điển, người ta chọn tính chất tổng bình phương biến thiên không giải thích được là nhỏ nhất

TSS (Total Sum of Squares): tổng biến động tổng hợp của biến phụ thuộc hay độ dao

động trong mẫu của biến phụ thuộc, thể hiện sự biến động của biến Y quanh giá trị trung bình mẫu của nó

ESS (Explained Sum of Squares): tổng biến động của biến phụ thuộc được giải thích bởi

mô hình – các biến độc lập hay độ dao động của giá trị ước lượng, thể hiện sự biến động của các giá trị ước lượng Ŷ quanh giá trị trung bình mẫu của nó

RSS (Residual Sum of Squares): tổng biến động của biến phụ thuộc được giải thích bởi

các yếu tố nằm ngoài mô hình – yếu tố ngẫu nhiên RSS còn gọi là tổng bình phương các sai số

Như vậy, trong mô hình có hệ số chặn: TSS = ESS + RSS

Sự biến đổi của biến Y là tổng của hai thành phần: của sự biến đổi của phần dư – thể hiện các yếu tố không đưa vào mô hình và sự biến đổi được thể hiện bởi mô hình, kí hiệu bởi ESS

Chia 2 vế của phương trình trên với TSS ta có:

Trang 20

1 = + (3.16)

Tỷ số thể hiện phần trăm sự biến đổi của biến Y trong mẫu được giải thích bởi mô

hình, còn được gọi là hệ số xác định của hàm hồi quy, được kí hiệu R 2

(2) R2 không xét đến quan hệ nhân quả

là hệ số xác định (Coefficient of Determination): cho biết tỷ lệ (%) sự biến động của

biến phụ thuộc được giải thích bởi sự biến động của các biến độc lập (hay sự biến động của biến phụ thuộc được giải thích bởi mô hình – tính trong mẫu)

Trường hợp đặc biệt, khi hoàn toàn không có sai lệch giữa giá trị quan sát và giá trị ước lượng, ei=0 (i=1 n), khi đó, RSS = 0 và ESS = 100% hay R2= 1, biến X giải thích được 100% sự thay đổi của biến phụ thuộc Và khi R2= 0, biến X hoàn toàn không giải thích được sự thay đổi của biến Y, khi đó, mô hình là không phù hợp, có nghĩa quan hệ giữa biến X và biến Y được thể hiện bởi mô hình hồi quy mẫu là hoàn toàn không phù hợp với số liệu mẫu Vì vậy, có thể cho rằng, mô hình hồi quy tổng thể cũng không phù hợp Với ví dụ về thu nhập và chi tiêu như trên ta có:

2 i

n

1 i i i 2

x

x y ˆ

Trang 21

Hệ số xác định R2 trong mô hình này bằng 0.7233 hay 72.33%, tức là biến thu nhập giải thích được 72.33% sự thay đổi của chi tiêu và (100% - 72.33%) 26.67% còn lại trong

sự biến đổi của chi tiêu là do các yếu tố không đưa vào mô hình gây ra, như trình độ học vấn, lĩnh vực sản xuất, địa điểm làm việc…

Hệ số xác định R2 cũng chính là bình phương của hệ số tương quan mẫu giữa X và Y Như vậy, mô hình hai biến có chứa hệ số chặn thì R2 = 0 khi và chỉ khi = 0

Với mô hình ba biến:

Một tính chất quan trọng của R 2 là nó sẽ tăng khi ta đưa thêm biến độc lập vào mô hình

Dễ dàng thấy rằng ∑ = ∑ ( − ) không phụ thuộc vào số biến giải thích trong mô hình nhưng ∑ lại giảm Do đó, nếu tăng số biến độc lập trong mô hình

thì R 2 cũng tăng Như vậy, việc đưa thêm một biến số bất kỳ vào mô hình nói chung sẽ

làm gia tăng R 2, không kể nó có giúp giải thích thêm cho biến phụ thuộc hay không

Điều này ngụ ý rằng R 2 chưa phải là thước đo tốt khi muốn so sánh các mô hình với số biến khác nhau

Ngoài ra, theo phân tích trong chương 2, việc đưa thêm một biến số mới vào mô hình cũng tạo ra những tác động không tốt đến chất lượng của các ước lượng Để tổng hòa

giữa tác động tích cực của việc đưa thêm biến, thể hiện bằng sự gia tăng trong R 2 và tác động tiêu cực này, ta xem xét khái niệm R 2 hiệu chỉnh, ký hiệu là R2 và được định nghĩa

Trang 22

- Biến phụ thuộc phải ở dạng giống nhau Biến độc lập có thể ở bất cứ dạng nào

(x) d Tính chất tốt nhất của ước lượng OLS – Định lý Gauss – Markov

Định lý Gauss – Markov: Khi các giả thiết từ 1 đến 4 thỏa mãn thì các ước lượng thu được từ phương pháp OLS là ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch

Hay nói một cách khác, nếu giả thiết từ 1 đến 4 được thỏa mãn thì ước lượng OLS là ước lượng tốt nhất trong lớp các ước lượng tuyến tính không chệch

Để đánh giá độ chính xác của các ước lượng ta sử dụng giá trị phương sai của các ước lượng hệ số, ký hiệu là ( ) và được tính như sau:

=(1 − ) ∑Trong đó, là hệ số xác định của mô hình hồi quy Xj theo hệ số chặn và các biến độc

lập còn lại trong mô hình = −

Do là tham số chưa biết nên có thể thay bằng ước lượng của nó là và được tính như sau:

=∑

−Trong thực tế, ta có thể đánh giá độ chính xác của các ước lượng hệ số sai số chuẩn (độ

lệch chuẩn) của , ký hiệu là ( ) được tính như sau: ( ) = ( )

Trong kết quả ước lượng với một mẫu cụ thể với các phần mềm chuyên dụng, ( ) sẽ được tính cụ thể Nếu giá trị này càng nhỏ (càng gần 0) thì độ chính xác của ước lượng

hệ số càng cao

Trang 23

Định lý: Khi các giả thiết 1 đến 4 được thỏa mãn thì các ước lượng OLS là các ước

lượng tuyến tính, không chệch, tốt nhất (trong lớp các ước lượng tuyến tính không

chệch), còn gọi là BLUE: Best Linear Unbiased Estimator Ước lượng vững (consistent estimator): khi kích thước mẫu rất lớn thì ước lượng hệ số trong mẫu tiệm cận hệ số

trong tổng thể, tính chất vững của ước lượng phản ánh chất lượng của ước lượng khi mẫu lớn, vì vậy tính chất này còn gọi là tính chất mẫu lớn của ước lượng

▪ Nếu các giả thiết OLS được thỏa mãn thì ước lượng OLS là ước lượng vững

▪ Nếu mẫu lớn, có thể thay giả thiết 2 bởi những giả thiết bớt chặt hơn mà vẫn đảm bảo tính vững

▪ Khi không thể có ước lượng không chệch, ước lượng vững cũng có thể dùng được

3.1.3 Kiểm định giả thuyết hệ số mô hình

(xi) A Khoảng tin cậy cho các hệ số hồi quy

1) Khoảng tin cậy cho một hệ số hồi quy: đánh giá tác động khi một biến độc lập thay đổi

Cặp giả thuyết quan trọng:

H : β = 0

H : β ≠ 0 T =

βSe(β )

H0: biến không giải thích cho biến phụ thuộc, hệ số là không có ý nghĩa thống kê (statistically insignificant)

Với độ tin cậy ( − ) cho trước, khoảng tin cậy của một hệ số:

Do nhận bất kì giá trị trong đoạn [0,1] nên ( ) là giá trị tới hạn của quy luật

Student với n-k bậc tự do với mức ý nghĩa Nghĩa là khi biến tăng 1 đơn vị và các yếu tố khác không đổi thì trung bình của biến Y gia tăng trong khoảng này

Khoảng tin cậy trên là đối xứng, thông dụng trong phân tích hồi quy Đôi khi chúng ta còn đề cập đến khoảng tin cậy 1 phía như

Khoảng tin cậy bên trái (max β j ):

* Khoảng tin cậy bên phải (min β j ):

)) ˆ ( ˆ

;

(  jt(nk)SEj

) );

ˆ ( ˆ

(  (  )  

j k

n

j t SE

 

Trang 24

2) Khoảng tin cậy cho hai hệ số hồi quy: đánh giá tác động khi hai biến

độc lập cùng thay đổi =( ) ∗

( ± ) = Var( ± ) = Var( ) + Var( ) ± 2 ( , )

Nếu xây dựng khoảng tin cậy cho ± (a, b là hằng số) thì ta xây dựng tương tự

như trên và lưu ý

Khoảng tin cậy đối xứng của + :

* Khoảng tin cậy bên trái (max β j ):

* Khoảng tin cậy bên phải (min β j ):

Thực tế phân tích hồi quy, thường chỉ có một mẫu duy nhất, và một khoảng tin cậy cụ

thể, ta hy vọng khoảng tin cậy này nằm trong số 95% số khoảng tin cậy có chứa β j

3) Khoảng tin cậy cho sai số ngẫu nhiên

Khoảng tin cậy cho sai số ngẫu nhiên

( )

( ) < 2 < (( ))

Khoảng tin cậy hai phía, bên phải, bên trái

Do đó với độ tin cậy cho trước ta tìm được một cặp giá trị sao cho:

và hai giá trị tới hạn thoả mãn điều kiện:

))ˆˆ(ˆ

ˆ

;

( aibjt(nk)SE aibj

) );

ˆ ˆ ( ˆ

Trang 25

[( )

( ) < < ( )

( )] = 1 −

- Trong thực tế người ta thường sử dụng một trong ba trường hợp sau:

+ Khoảng tin cậy hai phía ( ):

( )

( )< < ( )

( ) + Khoảng tin cậy bên phải dùng để ước lượng giá trị tối thiểu ( ):

>( )

( ) + Khoảng tin cậy bên trái dùng để ước lượng giá trị tối đa ( ):

< ( )

( )

(xii) B Kiểm định giả thuyết hệ số của mô hình hồi quy đa biến

1) a Kiểm định giả thuyết về một hệ số hồi quy

Do chưa có tổng thể nên ta chưa biết được các , nhưng có thể cho rằng nó bằng ∗(với ∗ cho trước ) hay không ? khi ấy ta đưa ra giả thuyết : = ∗

Để kiểm định giả thuyết này ta chọn tiêu chuẩn kiểm định =

∗ ( ) Nếu giả thuyết : = ∗ là đúng thì =

∗ ( )~ ( − ), do vậy với mức ý nghĩa cho trước tùy thuộc vào giả thuyết đối H1 mà ta xây dựng được các miền bác bỏ giả thuyết H0 tương ứng với các trường hợp sau

-) Nếu ta kiểm định cặp giả thuyết

: = ∗

: ≠ ∗ thì = { =

∗ ( ); | | > ( )} Với mẫu cụ thể và với cho trước mà qs > ( ) thì ta bác bỏ H0

-) Nếu ta kiểm định cặp giả thuyết

: = ∗

: > ∗ thì = { =

∗ ( );   > ( )} Với mẫu cụ thể và với cho trước mà > ( ) thì ta bác bỏ H0

-) Nếu ta kiểm định cặp giả thuyết

2

2 1

Trang 26

: = ∗

: < ∗ thì = { =

∗ ( );   < − ( )}

- Với mẫu cụ thể và với cho trước mà < − ( ) thì ta bác bỏ H0

Giả thuyết

: = 0 : ≠ 0 Trị thống kê trở thành

t-stat =

( )

Quy tắc quyết định

 Nếu /t-stat/ > t(n-2,97,5%) thì bác bỏ H0

 Nếu /t-stat/ ≤ t(n-2,97,5%) thì không thể bác bỏ H0.

Tra bảng phân phối Student chúng ta thấy khi bậc tự do n trên 20 thì trị thống kê t97,5%

thì xấp xỉ 2

Có thể sử dụng phương pháp kiểm định bằng giá trị P-value (P-value là mức xác suất nhỏ nhất để bác bỏ giả thuyết H

0), thường ký hiệu là P

Quy tắc kết luận với mức ý nghĩa  cho trước như sau:

- Với cặp giả thuyết (1)

+ Nếu  > P thì bác bỏ giả thuyết H

0

+ Nếu  < P thì không có cơ sở bác bỏ giả thuyết H

0

- Với cặp giả thuyết (2) và (3)

+ Nếu  > P/2 thì bác bỏ giả thuyết H

Do chưa có tổng thể nên ta chưa biết được các , nhưng có thể cho rằng ± bằng

∗ (với ∗ cho trước ) khi ấy ta đưa ra giả thuyết : ± = ∗ Để kiểm định giả

thuyết này ta chọn tiêu chuẩn kiểm định =( ± ) ∗

( ± ) (với mẫu cụ thể, thay số tính

được Tqs) Nếu giả thuyết : ± = ∗ là đúng thì =( ± )

∗ ( ± ) ~ ( − ) do

Trang 27

vậy với mức ý nghĩa cho trước tùy thuộc vào giả thuyết đối H1 mà ta xây dựng được các miền bác bỏ giả thuyết H0 tương ứng với các trường hợp sau

Có thể mở rộng cho kiểm định giả thuyết về hơn hai hệ số, chẳng hạn + + hay

tổ hợp của các hệ số + (với a, b là các hằng số cho trước)

Trang 28

2)

c Kiểm định giả thuyết về nhiều ràng buộc của các hệ số hồi quy – Kiểm định

F

• Xét mô hình k biến, ký hiệu là UR (Unrestricted Model)

• Nếu có cơ sở cho rằng một số biến nào đó của mô hình là không cần thuyết, chẳng hạn: Xm+1, Xm+2,…,Xk Khi đó ta kiểm định cặp giả thuyết:

• Nếu giả thuyết H0 là đúng thì mô hình trở thành mô hình mới R (Restricted Model) – mô hình m biến

- Bước 2: Sử dụng tiêu chuẩn kiểm định:

Chú ý: Công thức (*) chỉ áp dụng được khi biến phụ thuộc trong hai mô hình (UR) và (R) là như nhau

- Miền bác bỏ với mức ý nghĩa α cho trước

Trang 29

Thống kê F kiểm định một lần tất cả các thành phần của kiểm định đồng thời

d Kiểm định giả thuyết về phương sai

Kiểm định giả thuyết đối với

- Tiêu chuẩn kiểm định: nếu giả thuyết H0 là đúng

-Miền bác bỏ tốt nhất với mức ý nghĩa cho trước được xác định như sau:

+ Cặp giả thuyết (1):

+ Cặp giả thuyết (2):

C Kiểm định mức ý nghĩa chung của mô hình

Xét mô hình hồi quy k biến, hệ số xác định của mô hình trong tổng thể cho biết độ biến

động của biến phụ thuộc được giải thích bởi các biến độc lập trong mô hình Nếu R2

tổng thể bằng 0 thì các biến độc lập trong mô hình không giải thích được cho sự biến động của biến phụ thuộc, khi ấy ta nói hàm hồi quy không phù hợp Ngược lại nếu R2

tổng thể lớn hơn 0 thì có nghĩa là trong mô hình có ít nhất một biến độc lập có giải thích cho sự biến động của biến phụ thuộc, khi ấy ta nói hàm hồi quy phù hợp Để kiểm định

sự phù hợp của hàm hồi quy, ta kiểm định cặp giả thuyết sau (với R2 trong tổng thể )

H H

H H

H H

1 2

:

n k W

Trang 30

Ta chọn tiêu chuẩn kiểm định

=

ESS k-1 RSS n-k

Chú ý: R2 trong tiêu chuẩn kiểm định F là R2 ước lượng

Khi ấy với mức ý nghĩa cho trước miền bác bỏ giả thuyết H0 là

= { =

1-  ×

n-k-1;   > ( -1; )} Với mẫu cụ thể và với mức ý nghĩa cho trước mà > ( ;  ) thì ta bác bỏ H0

tức là ta kết luận hàm hồi quy phù hợp Trường hợp ngược lại thì ta chưa có cơ sở bác

bỏ H0 ta kết luận hàm hồi quy không phù hợp

Giả thuyết: : = =⋅⋅⋅= = 0 ( hay = 0);

Tất cả các biến giải thích không giải thích cho Y

Ít nhất một biến giải thích có giải thích cho Y

+ Nếu  > P thì bác bỏ giả thuyết H0

+ Nếu  < P thì không có cơ ơở bác bỏ giả thuyết H0

Trang 31

SS( − 1)( − )

=( − ) SS(k-1)RSS =

( − 1)(1 − )

( − )

D Kiểm định thu hẹp hồi qui

Xét mô hình hồi quy k biến (hay k tham số)

Nghi ngờ m biến độc lập Xk-m+1, Xk-m+2, …, Xk không giải thích cho biến phụ thuộc Y,

hay nói khác đi m biến này không có ý nghĩa trong mô hình Khi đó ta kiểm định cặp

giả thuyết sau

: ∃ ≠ 0  [∀ = ( − + 1) ÷ ]

Ho: Tất cả m biến giải thích không giải thích cho Y

H1: Ít nhất một biến giải thích có giải thích cho Y

Nếu giả thuyết H0 là đúng thì từ mô hình có k tham số (gọi là mô hình Lớn – ký hiệu L)

có thể thu hẹp về mô hình còn (k - m) tham số (gọi là mô hình Nhỏ - ký hiệu N)

Nếu với mẫu cụ thể và với mức ý nghĩa cho trước mà > ( ;  ) thì ta bác bỏ H0

, điều này có nghĩa trong các biến Xk-m+1, Xk-m+2, … , Xk có ít nhất một biến có giải thích cho biến phụ thuộc Y

Một số trường hợp đặc biệt

Trang 32

-) Trường hợp m = 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm định về từng hệ

số hồi quy, Fqs trong trường hợp này bằng bình phương Tqs ứng với hệ số đó

-) Trường hợp m = k – 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm định về sự

phù hợp của hàm hồi quy

-) Kiểm định mở rộng hàm hồi quy tương đương với kiểm định thu hẹp hàm hồi quy,

chú ý rằng k luôn là số tham số của mô hình lớn, dù là kiểm định về thu hẹp hay mở

Miền bác bỏ với mức ý nghĩa cho trước được xác định như sau:

Cách 2: Sử dụng kiểm F về sự thu hẹp hàm hồi quy

Nếu giả thuyết H0 đúng thì khi đó thay và mô hình trở thành:

3.1.4 Dự báo

Xét mô hình hồi quy k biến:

(xiii) A Dự báo giá trị trung bình của biến phụ thuộc

- Giả sử trong tương lai biết ta cần dự báo giá trị E(Y/X0)

- SRF cho ta một ước lượng điểm của E(Y/X0) là

- Biến ngẫu nhiên có phân phối chuẩn với:

Trang 33

- Thống kê: Do đó với độ tin cậy cho trước tìm

được một cặp giá trị sao cho: và hai giá trị tới hạn

thoả mãn điều kiện:

var ( ) = 2

ˆ

′( ′ ) ⇒ Se ( )= ′( ′ )

Khi đó ta có:

- / ( − )Se ( ) ≤ ( | ) ≤ + / ( − )Se ( )

- Khoảng tin cậy bên phải:

- Khoảng tin cậy bên trái:

(xiv) B Dự báo giá trị cá biệt

- Giả sử trong tương lai biết ta cần dự báo giá trị cá biệt (Y/X0), ký hiệu là Y0

- SRF cho ta một ước lượng điểm của Y0 là

- Biến ngẫu nhiên ( ) phân phối chuẩn với:

Trang 34

- Thống kê: Do đó với độ tin cậy cho trước tìm được

một cặp giá trị sao cho: và hai giá trị tới hạn thoả mãn điều kiện:

- Khoảng tin cậy đối xứng:

- Khoảng tin cậy bên phải:

- Khoảng tin cậy bên trái:

Biến phân loại (Biến giả-Dummy variable)

Trong các mô hình hồi quy mà chúng ta đã khảo sát từ đầu chương 3 đến đây đều dựa trên biến độc lập và biến phụ thuộc đều là biến định lượng Thực ra mô hình hồi quy cho phép sử dụng biến độc lập và cả biến phụ thuộc là biến định tính Trong giới hạn chương trình chúng ta chỉ xét biến phụ thuộc là biến định lượng Trong phần này chúng

ta khảo sát mô hình hồi quy có biến định tính

Đối với biến định tính chỉ có thể phân lớp, một quan sát chỉ có thể rơi vào một lớp Một

số biến định tính có hai lớp như:

Bảng III-1.Biến nhị phân

Biến định tính Lớp 1 Lớp 2

Người ta thường gán giá trị 1 cho một lớp và giá trị 0 cho lớp còn lại Ví dụ ta ký hiệu

S là giới tính với S =1 nếu là nữ và S = 0 nếu là nam

Trang 35

Các biến định tính được gán giá trị 0 và 1 như trên được gọi là biến giả (dummy variable), biến nhị phân, biến phân loại hay biến định tính

Trong các mô hình hồi quy tuyến tính ở các phần trước thì các biến độc lập đều là các biến định lượng Nếu các biến độc lập của mô hình là các biến định tính thì phải dùng biến giả để đặc trưng cho chúng Trong phần này ta sẽ nghiên cứu mô hình hồi quy với biến độc lập là biến định tính còn biến phụ thuộc là biến định lượng

(xv) A Mô hình có một biến độc lập là biến định tính

1) a Biến định tính có hai phạm trù

- Để đặc trưng cho biến định tính có hai phạm trù thì dùng một biến giả

- Ví dụ: Hồi quy thu nhập của công chức (Y) phụ thuộc vào giới tính (D)

Nếu là nam

Nếu là nữ + Mô hình hồi quy:

cho biết thu nhập trung bình của công chức nữ

cho biết thu nhập trung bình của công chức nam

+ Hệ số phản ánh chênh lệch giữa thu nhập trung bình của công chức nam và thu nhập trung bình của công chức nữ

2) b Biến định tính có k phạm trù (k > 2)

- Để đặc trưng cho biến định tính có k phạm trù (k>2) thì dùng k-1 biến giả

- Ví dụ: Hồi quy chi tiêu cho văn hoá phẩm (Y) phụ thuộc vào trình độ học vấn (D) + Theo mục đích nghiên cứu ta chia trình độ văn hóa (học vấn) thành các thứ bậc: chưa tốt nghiệp tiểu học (thất học); tốt nghiệp tiểu học (cấp 1), tốt nghiệp trung học cơ sở (cấp 2) và tốt nghiệp trung học (cấp 3)

Nếu tốt nghiệp tiểu học

Nếu tốt nghiệp trình độ khác Nếu tốt nghiệp trung học cơ sở

Nếu tốt nghiệp trình độ khác

1 0

i

D   

Trang 36

Nếu tốt nghiệp trung học

Nếu tốt nghiệp trình độ khác

+ Mô hình hồi quy:

người thất học;

phẩm của người học tiểu học;

phẩm của người học trung học cơ sở;

phẩm của người học trung học phổ thông

+ Các hệ số phản ánh chênh lệch giữa chi tiêu trung bình về văn hoá phẩm của người đang xét với người thất học

(xvi) B Mô hình có hai biến độc lập là biến định tính

- Với mỗi biến độc lập là biến định tính tuỳ thuộc vào số phạm trù của nó mà ta đưa số biến giả thích hợp vào mô hình

- Ví dụ: Hồi quy thu nhập của công chức (Y) phụ thuộc vào giới tính và khu vực làm việc

+ Khu vực làm việc được chia thành: Khu vực nông thôn, khu vực thành thị và khu vực miền núi

Nếu là nam

Nếu là nữ Nếu làm việc ở nông thôn

Nếu làm việc ở khu vực khác

4

1 0

i

D   

Trang 37

Nếu làm việc ở thành thị

Nếu làm việc ở khu vực khác

+ Mô hình hồi quy:

việc ở khu vực miền núi

nữ làm việc ở khu vực nông thôn

nữ làm việc ở khu vực thành thị

nam làm việc ở khu vực miền núi

chức nam làm việc ở khu vực nông thôn

công chức nam làm việc ở khu vực thành thị

- Nhận xét:

+ Nếu mô hình có k biến độc lập là biến định tính với số phạm trù tương ứng là

thì tổng cộng số biến giả phải dùng tránh rơi vào hiện tượng đa cộng tuyến

(xvii) C Sử dụng biến giả để phân tích sự biến động mùa vụ

- Trong kinh tế có nhiều chỉ tiêu mà sự thay đổi của nó mang tính chất thời vụ Thời vụ

là biến định tính nên để tách biệt ảnh hưởng của yếu tố mùa vụ ta sử dụng kỹ thuật biến giả

+ Nếu yếu tố thời vụ theo tháng (12 tháng/năm) ta sử dụng 11 biến giả

4

1 0

Trang 38

+ Nếu yếu tố thời vụ theo quí (4 quí/năm) ta sử dụng 3 biến giả

- Ví dụ: Hồi quy tiêu dùng về quần áo, dụng cụ gia đình của hộ gia đình (Y) phụ thuộc vào thu nhập (X) và yếu tố mùa vụ

Nếu quan sát nằm ở quý 2

Nếu quan sát nằm ở quý khác Nếu quan sát nằm ở quý 3

Nếu quan sát nằm ở quý khác Nếu quan sát nằm ở quý 4

Nếu quan sát nằm ở quý khác

- Để phân tích ảnh hưởng của yếu tố mùa vụ lên chi tiêu ta sử dụng mô hình:

3.2.2 Hàm theo logarit của Y và/hoặc X

Một số dạng hàm phi tuyến có thể biến đổi thành dạng tuyến tính nhờ hàm ln(X) = logarit

tự nhiên của X Chuyển sang dạng logarit cho phép mô hình hóa các quan hệ theo tỷ lệ

phần trăm

Hàm mũ, điển hình là hàm sản xuất Cobb-Douglas: (hệ số co dãn không đổi):

= 2 3

Các hệ số βj là hệ số co dãn của Y theo các biến Xj

Ý nghĩa: Xj tăng 1% thì Y tăng βj % và ngược lại (điều kiện các yếu tố khác không đổi)

2

1 0

Trang 39

Lý do: ln(x+x) – ln(x) = 1 + 

(từ giải tích: ( )= )

Có 3 dạng:

1 Tuyến tính-log Yi = 0 + 1ln(Xi) + ui

2 log-tuyến tính ln(Yi) = 0 + 1Xi + ui

3 log-log ln(Yi) = 0 + 1ln(Xi) + ui

(xviii) Hàm tuyến tính-log

Yi = 0 + 1ln(Xi) + ui (a)

Thay đổi X: Y + Y = 0 + 1ln(X + X) (b)

Lấy (b) – (a): Y = 1[ln(X + X) – ln(X)]

Thay đổi X: ln(Y + Y) = 0 + 1(X + X) (b)

Lấy (b) – (a): ln(Y + Y) – ln(Y) = 1X

Vì ln(Y +Y) – ln(Y)  Nên  1X

Vì 100 = % thay đổi của Y, như vậy giải thích 1 như sau: khi X thay đổi 1 đơn vị

(X = 1) làm cho Y thay đổi 1001% (Y tăng theo số nhân 1+1 )

Ví dụ đặc trưng của Mô hình Logarit-tuyến tính này là mô hình tăng trưởng

Gọi g là tốc độ tăng trưởng, t chỉ thời kỳ Mô hình tăng trưởng như sau

= (1 + )

Lấy logarit hai vế của phương trình trên, ta có :

Trang 40

Đặt ∗ = ( ), và ta được mô hình hồi quy

Biến T là biến xu thế thời gian, hệ số β2 là hệ số tăng trưởng ngắn hạn của biến Y theo thời gian Y tăng β2 % sau mỗi đơn vị thời gian Antilog(β2) – 1 là hệ số tăng trưởng dài hạn của Y

(xx) Dạng LOG – LOG

ln(Yi) = 0 + 1ln(Xi) + ui (a)

Thay đổi X: ln(Y + Y) = 0 + 1ln(X + X) (b)

(b)-(a): ln(Y + Y) – ln(Y) = 1[ln(X + X) – ln(X)]

/ (khi X nhỏ)

Vì 100 = % thay đổi của Y, and 100 = % thay đổi của X, nên có thể giải thích 1

như sau: với 1% thay đổi của X thì Y thay đổi 1 % Trong dạng log-log, 1 là độ co

)g1

1

b b2 ln(1g)

Ngày đăng: 01/03/2022, 11:04

TỪ KHÓA LIÊN QUAN

TRÍCH ĐOẠN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w