1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Bài giảng kinh tế lượng

70 156 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 70
Dung lượng 1,02 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Mặt khác mô hình kinh tế lượng mà ta thiết lập chịu ảnh hưởng của lý thuyết kinh tế được xác lập từ trước và ảnhhưởng của các kết quả nghiên cứu trong quá khứ, do đó kết quả có được khi

Trang 1

Bài giảng

KINH TẾ LƯỢNG

Trần Minh Nguyệt

Tháng 8 năm 2011

Trang 2

Chương 1

Giới thiệu về Kinh tế lượng

1 Tổng quan về kinh tế lượng

1.1 Kinh tế lượng là gì?

• Kinh tế lượng có nghĩa là đo lường kinh tế Trong tiếng Anh, thuật ngữ được sử dụng là

"Econometrics" (economy= kinh tế, mmetrics= đo lường)

• Kinh tế lượng là một phương pháp phân tích thực nghiệm để định lượng các vấn đề kinh

tế, dựa trên cơ sở số liệu thực tế, các lý thuyết kinh tế và thống kê toán

1.2 Mục đích của kinh tế lượng

1 Định lượng các mối quan hệ kinh tế, các cơ chế tác động dẫn đến các kết cục về hành vicủa các tác nhân kinh tế trong kinh tế vi mô và tăng trưởng, ổn định trong kinh tế vĩ mô

2 Dự báo các khả năng phát triển kinh tế hay diễn biến của các hiện tượng kinh tế có thểxảy ra trong tương lai dựa vào các mô hình đã được ước lượng

3 Phân tích chính sách kinh tế dựa vào kết quả chạy các mô hình kinh tế lượng

Ba mục đích này thường gắn bó nhau trong quá trình xây dựng và sử dụng các mô hình kinh tếlượng Có thể nói, ngày nay hầu hết các lĩnh vực quản lí kinh tế như kế hoạch, tài chính, ngânhàng, kinh doanh, tiếp thị, ngoại thương, đều sử dụng kinh tế lượng như một công cụ phổbiến

2 Phương pháp luận của kinh tế lượng

Phân tích kinh tế lượng được thực hiện theo các bước sau đây:

1 Nêu các giả thuyết hay giả thiết về các mối quan hệ giữa các biến kinh tế

Chẳng hạn kinh tế vĩ mô khẳng định rằng nhu cầu về một loại hàng hóa phụ thuộc theoquan hệ ngược chiều với giá của hàng hóa đó

2 Thiết lập các mô hình toán học để mô tả mối quan hệ giữa các biến số này

Chẳng hạn lý thuyết kinh tế cho biết mối quan hệ ngược chiều giữa lượng cầu về một loại

Trang 3

2 Phương pháp luận của kinh tế lượng 3

hàng hóa và giá của hàng hóa đó, nhưng không nêu rõ cụ thể dạng hàm Hàm cầu có thể

có dạng phi tuyến, cũng có thể có dạng tuyến tính

Giả sử ta chọn đường cầu dạng tuyến tính thì dạng hàm sẽ là:

Q = B1 + B2P (1.1)

với Q là lượng cầu, P là giá, B1, B2là các tham số

3 Thiết lập mô hình kinh tế lượng

Phương trình (1.1) xác định một quan hệ chính xác giữa nhu cầu hàng hóa với giá của nó

Với mỗi giá trị của giá P xác định duy nhất một lượng cầu Q Do các mối quan hệ kinh

tế nói chung là không hoàn toàn chính xác, vì vậy:

Q = B1+ B2P + u (1.2)

với u là sai số ngẫu nhiên Sai số ngẫu nhiên u phân biệt mô hình kinh tế lượng (1.2) với

mô hình toán học (1.1)

4 Thu thập số liệu

5 Ước lượng các tham số của mô hình

Khi đã thiết lập được mô hình và thu thập dữ liệu phù hợp thì thì nhiệm vụ quan trọng làphải ước lượng cho những tham số chưa biết của mô hình

Ví dụ ta đã có mô hình về lượng cầu và giá của một loại hàng hóa là:

Q = B1+ B2P + u

Với một bộ dữ liệu về lượng cầu Q và giá P , ta cần ước lượng các hệ số B1, B2, để từ

đó xác định được sự phụ thuộc của lượng cầu Q vào giá P

6 Phân tích kết quả: Phân tích xem các kết quả nhận được có phù hợp với lý thuyết kinh tếkhông, kiểm định giả thuyết

Vì dữ liệu thường được thu thập trên một mẫu rút ra từ tổng thể nghiên cứu nên thông tin

do dữ liệu cung cấp không phản ánh đầy đủ toàn bộ thông tin của tổng thể, vì vậy việc ướclượng các tham số dựa trên dữ liệu chỉ cho các đánh giá gần đúng Mặt khác mô hình kinh

tế lượng mà ta thiết lập chịu ảnh hưởng của lý thuyết kinh tế được xác lập từ trước và ảnhhưởng của các kết quả nghiên cứu trong quá khứ, do đó kết quả có được khi ước lượngtham số có thể chưa phù hợp với thực tế hoặc chưa giải thích được hết sự ảnh hưởng củacác biến kinh tế Vì vậy ta cần kiểm định giả thuyết về các tham số và về sự phù hợp của

Trang 4

Ta có thể tóm tắt các bước trên bằng sơ đồ sau:

3 Phân tích hồi quy

Hồi quy là một công cụ cơ bản của kinh tế lượng Thuật ngữ "Hồi quy" đã được Francis Galton

sử dụng vào năm 1986 Trong một bài báo nổi tiếng của mình, ông đã cho rằng có một xu hướngchung về chiều cao của những đứa trẻ được sinh do cha mẹ cao không bình thường hoặc thấpkhông bình thường Người ta gọi xu hướng này là luật Galton Trong bài báo của mình Galtondùng cụm từ "regression to mediocrity" - quy về trung bình Từ đó vấn đề hồi quy được nhiềungười quan tâm, hoàn thiện và được ứng dụng rộng rãi

3.1 Khái niệm và ví dụ

Phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của một biến (gọi là biến phụ thuộc haybiến được giải thích) theo một hay nhiều biến khác (được gọi là các biến độc lập hay biến giảithích)

Ta kí hiệu biến phụ thuộc (biến được giải thích) là Y , các biến độc lập (biến giải thích) là

X1, X2, , Xk Trong đó biến phụ thuộc Y là đại lượng ngẫu nhiên, có quy luật phân phối

xác suất, các biến độc lập không phải là biến ngẫu nhiên, giá trị của chúng đã được cho trước.Phân tích hồi quy giải quyết các vấn đề sau đây:

1 Ước lượng giá trị trung bình của biến phụ thuộc với các giá trị đã cho của biến độc lập

2 Kiểm định giả thuyết về bản chất của sự phụ thuộc

3 Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập

Trang 5

3 Phân tích hồi quy 5

4 Kết hợp các vấn đề trên

Ví dụ 1.1 Luật Galton Karl Pearson nghiên cứu sự phụ thuộc chiều cao của các con trai vào

chiều cao của bố Trong ví dụ này thì chiều cao của con trai là biến phụ thuộc, chiều cao của

bố là biến độc lập.

Ví dụ 1.2 Một người nghiên cứu sự phụ thuộc của lượng cầu về một loại hàng hóa vào giá

hàng hóa đó và thu nhập của người tiêu dùng.

Trong trường hợp này, lượng cầu là biến phụ thuộc, giá của hàng hóa và thu nhập của người tiêu dùng là các biến độc lập.

3.2 Số liệu cho phân tích hồi quy

Các loại số liệu

Có ba loại số liệu: Các số liệu theo thời gian (chuỗi thời gian), các số liệu chéo và các số liệuhỗn hợp

• Các số liệu theo thời gian là các số liệu được thu thập trong một thời kì nhất định Số liệu

có thể được thu thập hàng tuần, hàng tháng, hàng quý, hàng năm

Ví dụ 1.3 Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) trong tuần từ 18-12-2005 đến

24-12-2005 như sau:

Ngày 18-12 19-12 20-12 21-12 22-12 23-12 24-12

• Các số liệu chéo là các số liệu về một hoặc nhiều biến được thu thập tại một thời điểm ở

nhiều địa điểm khác nhau

Ví dụ 1.4 Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) ngày 18-12-2005 tại 4 địa

điểm: Thành phố Hồ Chí Minh, Hà Nội, Đà Nẵng, Cần Thơ như sau:

Địa điểm TP Hồ Chí Minh Hà Nội Đà Nẵng Cần Thơ

• Các số liệu hỗn hợp theo thời gian và không gian: số liệu được thu thập ở nhiều địa điểm

khác nhau tại nhiều thời điểm khác nhau

Ví dụ 1.5 Số liệu về giá vàng SJC bán ra (ngàn đồng/chỉ) trong tuần tại bốn địa điểm

như sau:

Ngày 18-12 19-12 20-12 21-12 22-12 23-12 24-12 Nơi

Trang 6

Nguồn gốc các số liệu

Số liệu sử dụng trong phân tích hồi quy có thể được thu thập từ hai nguồn: số liệu điều tra thực

tế và số liệu thực nghiệm

• Số liệu thực nghiệm có được nhờ vào việc tiến hành thử nghiệm theo những điều kiện

nhất định nào đó, thí dụ như để phân tích ảnh hưởng của việc bón phân đối với năng suấtcủa một loại cây trồng, người ta có thể tiến hành bón phân với số lượng khác nhau trêncác mảnh đất cùng loại Sản lượng thu hoạch của các mảnh đất khác nhau phản ánh tácđộng của việc bón phân lên cây trồng

• Số liệu điều tra thực tế không bị kiểm soát bởi nhà nghiên cứu, thí dụ như số liệu về giá

vàng, giá bất động sản, tỷ lệ thất nghiệp không nằm trong tầm kiểm soát của người điềutra Điều này thường gây khó khăn trong việc tìm ra nguyên nhân chính xác ảnh hưởngđến một tình huống riêng biệt Thí dụ, có phải lượng cung về tiền ảnh hưởng đến GDPhay còn có nguyên nhân nào khác?

Phân tích hồi quy trong kinh tế lượng chủ yếu khai thác nguồn số liệu điều tra thực tế

Mặc dù số liệu phục vụ cho nghiên cứu kinh tế trong thực tế rất phong phú nhưng chất lượngcủa số liệu thường không đủ tốt Điều đó do các nguyên nhân sau đây:

• Hầu hết các số liệu trong khoa học xã hội đều là các số liệu phi thực nghiệm, do vậy có

thể có sai số quan sát hoặc bỏ sót quan sát hoặc cả hai

• Ngay cả các số liệu thu thập bằng thực nghiệm cũng có sai số của phép đo.

• Trong các cuộc điều tra bằng câu hỏi, gặp vấn đề không nhận được câu trả lời hoặc có trả

lời nhưng không trả lời hết các câu hỏi

• Các số liệu kinh tế thường có sẵn ở mức tổng hợp cao, không cho phép đi sâu vào các đơn

vị nhỏ

• Ngoài ra còn có những số liệu thuộc bí mật quốc gia mà không phải ai cũng có thể sử dụng

được

3.3 Mô hình hồi quy tổng thể

Xét ví dụ phân tích hồi quy chỉ gồm một biến phụ thuộc Y và một biến độc lập X Trung bình

có điều kiện của Y sẽ là một hàm của X:

E(Y |X) = f(X) (1.3)

trong đó: E(Y |X) là kì vọng điều kiện của biến ngẫu nhiên Y với giá trị đã cho của biến X,

f (X) là một hàm nào đó của biến X.

Hàm (1.3) được gọi là mô hình hồi quy tổng thể hay hàm hồi quy tổng thể (PRF)

Hàm f (X) có dạng như thế nào chúng ta không biết, bởi vì trong thực tế chúng ta thường không

có tổng thể để có thể tính toán ra được Nếu f (X) là hàm tuyến tính, tức là f (X) = B1+B2X

thì thì mô hình (1.3) trở thành:

E(Y |X) = B1+ B2X.

Mô hình này được gọi là mô hình hồi quy tuyến tính hai biến

Trang 7

3 Phân tích hồi quy 7

Trong thực tế không thể nghiên cứu toàn bộ tổng thể, do đó chỉ có thể đưa ra dạng của hàm hồiquy tổng thể chứ không thể xác định hàm này một cách chính xác Để ước lượng hàm hồi quytổng thể phải dựa vào một mẫu được rút ra ngẫu nhiên từ tổng thể Hàm hồi quy được xây dựngdựa trên mẫu được gọi là hàm hồi quy mẫu (SRF) Chắc chắn rằng ta không thể ước lượng mộtcách chính xác PRF dựa trên mẫu ngẫu nhiên, và đối với các mẫu ngẫu nhiên khác nhau sẽ chonhững hàm hồi quy mẫu SRF khác nhau

Giả sử hàm hồi quy tổng thể PRF có dạng:

Khi X nhận giá trị Xi thì E(Y |Xi) là một giá trị cụ thể, nhưng ta không biết giá trị đó bằng

bao nhiêu vì ta không nghiên cứu được tổng thể Dựa vào mẫu ngẫu nhiên ta có phương trìnhước lượng cho (1.4) là:

ˆ

Yi = b1+ b2Xi (1.5)

trong đó: ˆYi là ước lượng cho E(Y |Xi).

b1 là ước lượng cho B1

b2 là ước lượng cho B2

Phương trình (1.5) được gọi là phương trình hồi quy mẫu hoặc hàm hồi quy mẫu (SRF)

3.5 Sai số ngẫu nhiên

Giả sử ta đã có hàm hồi quy tổng thể:

E(Y |X) = f(X)

Với mỗi giá trị của X thì E(Y |X) là giá trị trung bình của Y khi X nhận giá trị cụ thể ấy, khi

đó giá trị của biến ngẫu nhiên Y sẽ dao động quanh giá trị trung bình E(Y |X) Đặt:

Từ (1.6) lấy kì vọng điều kiện hai vế ta có:

E(Yi|Xi) = E(Y |Xi) + E(ui|Xi)

Trang 8

Từ đó ta có E(ui|Xi) = 0 Như vậy, những cách viết sau là đồng nhất và cùng được gọi là

mô hình hồi quy tuyến tính tổng thể PRF (đối với biến phụ thuộc Y và biến độc lập X):

E(Y |X) = B1 + B2X E(Y |Xi) = B1 + B2Xi

Y = B1 + B2X + u

Yi = B1 + B2Xi+ ui

Phương trình (1.6) cho ta thấy rằng ngoài các biến giải thích trong mô hình vẫn còn những yếu

tố khác ảnh hưởng đến biến phụ thuộc Vì vậy ta gộp chúng lại và gọi đó là các sai số ngẫu

nhiên khi biểu diễn Y qua các biến giải thích X Nhưng về mặt trung bình thì sự ảnh hưởng

của các nhiễu ngẫu nhiên này đến biến phụ thuộc là bằng 0 Vậy liệu có thể đưa ra được hết cácyếu tố ảnh hưởng đến biến phụ thuộc hay không và khi ấy có thể loại bỏ được sự có mặt của

nhiễu ngẫu nhiên uihay không Câu trả lời là sai số ngẫu nhiên vẫn luôn tồn tại vì một số lý donhư sau:

• Việc xác định được hết các yếu tố ảnh hưởng đến biến phụ thuộc Y là rất khó.

• Do điều kiện kĩ thuật và kinh tế nên ta muốn có một mô hình đơn giản nhât, tức là một

mô hình mà với một lượng vừa đủ biến độc lập ta cũng có thể giải thích được cho hành

vi của biến phụ thuộc Vì thế cần gộp vào uithay thế cho các biến giải thích khác mà cóảnh hưởng nhỏ đến hành vi của biến phụ thuộc

Giả sử phương trình hồi quy mẫu có dạng:

ˆ

Yi = b1+ b2Xi

Đặt ei = Yi − ˆ Yita có:

Yi = b1 + b2Xi+ ei

Phương trình này cũng được gọi là phương trình hồi quy mẫu

eiđược gọi là phần dư và eichính là một ước lượng điểm của ui

Trang 9

3 Phân tích hồi quy 9

.Yi

Trang 10

Chương 2

Các mô hình hồi quy tuyến tính

1 Mô hình hồi qui tuyến tính hai biến

Xét mô hình hồi quy tuyến tính hai biến gồm một biến phụ thuộc Y và một biến độc lập X:

E(Y |X) = B1 + B2X (2.1)

B1được gọi là hệ số chặn (hoặc hệ số tung độ gốc) của đường hồi quy tổng thể

B2được gọi là hệ số độ dốc của đường hồi quy tổng thể Từ phương trình (2.1) ta thấy:

• E(Y |X = 0) = B1, như vậy B1cho biết giá trị trung bình của Y khi X = 0.

• Khi X thay đổi 1 đơn vị thì E(Y |X) thay đổi B2 đơn vị Như vậy B2 cho biết giá trị

trung bình của Y thay đổi như thế nào khi X thay đổi 1 đơn vị Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào dấu của B2 là dương hay âm

1.1 Phương pháp bình phương nhỏ nhất thông thường

Trong phân tích hồi quy chúng ta phải ước lượng giá trị trung bình của biến phụ thuộc Y Trong phương trình (2.1), các giá trị của X đã biết, do vậy việc ước lượng đó trở thành việc ước lượng các tham số chưa biết B1, B2 Có nhiều phương pháp để ước lượng cho B1, B2 Mộttrong những phương pháp phổ biến nhất là phương pháp bình phương nhỏ nhất thông thường(Ordinary Least Squares - OLS)

b2 là ước lượng cần tìm cho B2 (b2 được gọi là hệ số độ dốc của đường hồi quy mẫu)

Ta tìm b1, b2 sao cho các ˆYi càng gần với Yi càng tốt, tức là các phần dư

ei = Yi− ˆ Yi = Yi− b1 − b2Xi

Trang 11

1 Mô hình hồi qui tuyến tính hai biến 11

càng nhỏ càng tốt Do các ei, i = 1, n có thể âm, có thể dương, vì vậy ta tìm b1, b2 sao chotổng bình phương các phần dư là nhỏ nhất

Vậy, ý tưởng của phương pháp bình phương nhỏ nhất thông thường là tìm b1, b2 sao cho tổngbình phương:

1.2 Các tính chất của các ước lượng bình phương nhỏ nhất

1 b1, b2được xác định một cách duy nhất ứng với n cặp quan sát (Xi, Yi).

2 b1, b2 là các ước lượng điểm của B1, B2 và là các đại lượng ngẫu nhiên, với các mẫukhác nhau chúng có giá trị khác nhau

Trang 12

3 Hàm hồi quy mẫu SRF: ˆYi = b1 + b2Xicó các tính chất sau đây:

i SRF đi qua trung bình mẫu (X, Y ), nghĩa là:

1.3 Các giả thiết cơ bản của mô hình hồi quy tuyến tính cổ điển

Giả thiết 1: Các biến giải thích là phi ngẫu nhiên, tức là các giá trị của chúng là các số đã được

xác định

Giả thiết 2: Kỳ vọng của các nhiễu ngẫu nhiên bằng 0, tức là:

E(ui|Xi) = 0.

Giả thiết này có nghĩa là các yếu tố không có trong mô hình (mà ui đại diện cho chúng)

không có ảnh hưởng hệ thống đến giá trị trung bình của Y Về mặt hình học giả thiết này

được mô tả bằng đồ thị sau:

Trang 13

1 Mô hình hồi qui tuyến tính hai biến 13

Trang 14

Phương sai không thuần nhất

Giả thiết 4: Không có tương quan giữa các ui:

Cov(ui, uj) = 0 ∀i ̸= j.

1.4 Tính chất BLUE của các ước lượng bình phương nhỏ nhất

Tính chất BLUE (Best Linear Unbiased Estimator) của các ước lượng bình phương nhỏ nhấtđược thể hiện qua định lý sau đây:

Định lý 2.1 (Gauss-Markov) Với các giả thiết 1-4 đã nêu trên, các ước lượng bình phương nhỏ

nhất là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch.

Tuyến tính tức là các ước lượng bình phương nhỏ nhất (2.2) là các hàm tuyến tính của Yi.

Không chệch tức là:

E(b1) = B1, E(b2) = B2.

Phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch tức là: Nếu ˜b1, ˜ b2 là các

hàm ước lượng tuyến tính không chệch bất kì lần lượt cho hai tham số B1, B2thì:

V ar(˜ b1 ) ≥ V ar(b1), V ar(˜ b2 ) ≥ V ar(b2).

Trang 15

1 Mô hình hồi qui tuyến tính hai biến 15

TSS(Total Sum of Squares - Tổng bình phương độ lệch) là tổng bình phương của tất cả các

sai lệch giữa các giá trị quan sát Yivới giá trị trung bình của chúng

ESS(Explained Sum of Squares - Tổng bình phương độ lệch được giải thích) là tổng bình

phương của tất cả các sai lệch giữa các giá trị của biến phụ thuộc Y nhận được từ hàm hồi quy

mẫu với giá trị trung bình của chúng ( ˆY = Y ) Phần này đo độ chính xác của hàm hồi quy.

RSS(Residual Sum of Squares - Tổng bình phương phần dư) là tổng bình phương của tất cả

các sai lệch giữa các giá trị quan sát Yi và các giá trị nhận được từ hàm hồi quy Về mặt hìnhhọc có thể minh họa trên hình sau:

Ta chứng minh được:

T SS = ESS + RSS.

Như vậy, tổng bình phương độ lệch (TSS) được chia thành hai phần: một phần được giải thích(ESS) do đường hồi quy mẫu gây ra và một phần không được giải thích (RSS) do các yếu tốngẫu nhiên gây ra

Từ biểu thức trên ta được:

R2được gọi là hệ số xác định, được sử dụng để đo độ thích hợp của đường hồi quy mẫu với các

số liệu quan sát Hệ số R2 cho biết tỷ lệ (tỷ lệ phần trăm) của phần biến thiên được giải thích

trong toàn bộ biến thiên của Y

Về hệ số xác định R2có một số lưu ý sau đây:

Trang 16

nên ˆYi ≡ Yi Nếu biểu diễn trên đồ thị thì tất cả các điểm dữ liệu quan sát đều nằm trên

đường thẳng hồi quy mẫu SRF Khi R2 = 1 thì ESS = T SS nên ta còn nói: Y được

giải thích hoàn toàn qua X.

3 Khi R2 = 0 thì đường hồi quy hoàn toàn không thích hợp Khi đó ESS = 0 nên ta còn

nói: Y hoàn toàn không được giải thích qua X.

4 Trong thực tế, rất hiếm khi R2 = 0 hoặc R2 = 1 mà chỉ có R2 gần 0 hay gần 1 Nếu

R2càng gần 1 thì mức độ phù hợp của đường hồi quy càng cao

5 Không có tiêu chuẩn chung để xác định R2 bao nhiêu là cao hay thấp và không nên chỉ

căn cứ vào R2 để đánh giá mô hình tốt hay không tốt Để xem xét một mô hình tốt hay

không ta phải căn cứ vào nhiều yếu tố: R2, dấu của hệ số hồi quy, kinh nghiệm thực tế,khả năng dự báo chính xác

Theo kinh nghiệm, với số liệu chuỗi thời gian thì R2 > 0.9 được xem là tốt, với số liệu

chéo thì R2 > 0.7 được xem là tốt.

1.6 Mối quan hệ giữa hệ số tương quan tuyến tính mẫu và hệ số xác định

1.7 Phân phối xác suất của các tham số mẫu

Để nhận được phân phối xác suất của các tham số mẫu, ngoài 4 giả thiết đã nêu của mô hình hồi

quy tuyến tính cổ điển, ta đưa thêm giả thiết thứ 5 sau:

5 uituân theo phân phối chuẩn N (0, σ2) với mọi i.

Ta quan tâm đến các tham số mẫu sau:

Trang 17

1 Mô hình hồi qui tuyến tính hai biến 17

n − 2 được gọi là sai số chuẩn của đường hồi quy (Standard error of

regression) hoặc sai số chuẩn của ước lượng (Standard error of estimate)

Nếu 5 giả thuyết đã nêu trên được thỏa mãn thì ta có:

• b1 tuân theo phân phối chuẩn với trung bình và độ lệch chuẩn như sau:

E(b1) = B1, se(b1) = σ

vuuuuuuut

n

i=1

Xi2n

• ˆσ2là một ước lượng không chệch của phương sai nhiễu σ2(n − 2)ˆσ2

σ2 tuân theo phân

phối khi bình phương với (n − 2) bậc tự do.

(se: standard error - độ lệch chuẩn.)

Chú ý 2.2 Trong các công thức tính se(b1), se(b2) thì σ2 là phương sai của nhiễu ui

không được biết nên σ2được ước lượng bằng ˆ σ2, vì vậy b1− B1

se(b1 )

b2 − B2

se(b2 ) cùng tuân theo

phân phối student với (n − 2) bậc tự do Điều này là cơ sở để thực hiện bài toán ước lượng

khoảng và kiểm định sau đây.

1.8 Ước lượng và kiểm định giả thiết về hệ số hồi quy

Trong phần này ta chú ý các kí hiệu:

tn−2,α/2 là giá trị thỏa mãn: P (tn−2 > tn−2,α/2) = α/2.

tn−2,α là giá trị thỏa mãn: P (tn−2 > tn−2,α) = α.

trong đó: tn−2là biến ngẫu nhiên tuân theo phân phối student với (n − 2) bậc tự do.

Trang 18

Khoảng tin cậy

• Khoảng ước lượng với độ tin cậy 100(1 − α)% cho B1là:

b1− tn−2,α/2se(b1 ) ≤ B1 ≤ b1 + tn−2,α/2se(b1 )

• Khoảng ước lượng với độ tin cậy 100(1 − α)% cho B2là:

b2− tn−2,α/2se(b2 ) ≤ B2 ≤ b2 + tn−2,α/2se(b2 ) Kiểm định về các hệ số hồi quy

Các bài toán kiểm định trình bày sau đây đều dựa trên cơ sở: b1− B1

se(b1 )

b2 − B2

se(b1 ) cùng tuân

theo phân phối student với (n − 2) bậc tự do.

Các bước thực hiện kiểm định như sau:

1 Chọn cặp giả thuyết H0, H1

2 Tính giá trị kiểm định t.

3 Kết luận (Bác bỏ H0hay chấp nhận H0- Có thể so sánh giá trị kiểm định t với giá trị tới

hạn hoặc tính p-value để kết luận)

Ta có thể tóm tắt bằng các bảng 2.1, 2.2.

Bảng 2.1: Kiểm định giả thuyết về hệ số B1

Giả thuyết Giả thuyết đối Giá trị Miền bác bỏ p-value

Có hai loại dự báo:

• Dự báo giá trị trung bình có điều kiện của Y khi X = X0(Dự báo cho E(Y |X0 )).

• Dự báo giá trị cá biệt của Y khi X = X0 (Dự báo cho Y0)

Trang 19

1 Mô hình hồi qui tuyến tính hai biến 19

Bảng 2.2: Kiểm định giả thuyết về hệ số B2

Giả thuyết Giả thuyết đối Giá trị Miền bác bỏ p-value

Giả sử X = X0 Khi đó, ước lượng điểm cho E(Y |X0) và Y đều là ˆ Y0 = b1 + b2X0

Khoảng tin cậy 100(1− α)% cho E(Y |X0 ) là:

ˆ

Y0−tn−2,α/2σˆ

vuuuut

Ví dụ 2.3 File số liệu GiaNhaDienTich.txt chứa giá bán và diện tích của 14 căn nhà dành cho

một gia đình, trong đó Y : giá bán (nghìn USD), X: diện tích (feet vuông).

1 Xác định hàm SRF của Y theo X Nêu ý nghĩa của các hệ số của SRF.

2 Vẽ biểu đồ tán xạ cho X và Y Vẽ thêm đường thẳng SRF vào biểu đồ tán xạ.

3 Tính T SS, ESS, RSS, ˆ σ, se(b1), se(b2).

4 Tìm hệ số xác định R2, nêu ý nghĩa.

5 Xác định khoảng tin cậy 99% cho hệ số độ dốc của PRF.

6 Ở mức ý nghĩa 5% hãy kết luận diện tích có ảnh hưởng đến giá bán nhà hay không?

7 Có nhận định cho rằng: Khi diện tích tăng lên 1 (feet vuông) thì giá nhà tăng lên ít nhất

0.5 (nghìn USD) Ở mức ý nghĩa 5% hãy kết luận về nhận định trên.

8 Tìm ước lượng khoảng với độ tin cậy 99% cho giá bán của một căn nhà có diện tích 2500

feet vuông.

9 Tìm ước lượng khoảng với độ tin cậy 99% cho giá bán trung bình khi diện tích là 2500

feet vuông.

Trang 20

2 Mô hình hồi quy ba biến

2.1 Mô hình hồi quy tổng thể PRF

Xét mô hình hồi quy tuyến tính ba biến gồm một biến phụ thuộc Y và hai biến độc lập X2, X3:

E(Y |X2, X3) = B1 + B2X2 + B3X3 (2.3)

B1được gọi là hệ số chặn (hoặc hệ số tung độ gốc) của đường hồi quy tổng thể

B2, B3 được gọi là các hệ số hồi quy riêng của đường hồi quy tổng thể Từ phương trình (2.3)

ta thấy:

• E(Y |X2 = 0, X3 = 0) = B1, như vậy B1 cho biết giá trị trung bình của Y khi

X2 = 0, X3 = 0.

• Khi X2 thay đổi 1 đơn vị, X3 không thay đổi thì E(Y |X2, X3) thay đổi B2 đơn vị

Như vậy B2cho biết giá trị trung bình của Y thay đổi như thế nào khi X2 thay đổi 1 đơn

vị còn X3 không đổi Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào

dấu của B2 là dương hay âm

• Khi X3 thay đổi 1 đơn vị, X2 không thay đổi thì E(Y |X2, X3) thay đổi B3 đơn vị

Như vậy B3cho biết giá trị trung bình của Y thay đổi như thế nào khi X3 thay đổi 1 đơn

vị còn X2 không đổi Sự thay đổi này có thể cùng chiều hay ngược chiều phụ thuộc vào

dấu của B3 là dương hay âm

Giả sử (Y, X2i, X3i), i = 1, n là n quan sát về Y, X2, X3

Trang 21

2 Mô hình hồi quy ba biến 21

2.3 Các giả thiết của mô hình hồi quy 3 biến

• Giả thiết 1: X2, X3không ngẫu nhiên, giá trị của chúng là xác định

• Giả thiết 2: E(ui = 0) ∀i.

• Giả thiết 3: Các uicó phương sai bằng nhau (phương sai thuần nhất):

V ar(ui) = σ2 ∀i.

• Giả thiết 4: Không có tương quan giữa các sai số:

Cov(ui, uj) = 0 ∀i ̸= j.

• Giả thiết 5: Không có quan hệ tuyến tính giữa X2và X3

• Giả thiết 6: ui ∼ N(0, σ2) với mọi i.

Nếu các giả thiết trên được thỏa mãn thì các ước lượng bình phương cực tiểu (2.4) có tính chất

BLUE

2.4 Phân phối xác suất của các tham số mẫu

Nếu các giả thiết 1-6 thỏa mãn thì:

• b1 tuân theo phân phối chuẩn:

Trang 22

σ2 tuân theo phân phối khi

bình phương với (n − 3) bậc tự do.

Chú ý 2.4 Trong các công thức tính se(b1), se(b2) thì σ2 là phương sai của nhiễu ui

không được biết nên σ2được ước lượng bằng ˆ σ2, vì vậy b1− B1

se(b1 )

b2 − B2

se(b2 ) cùng tuân theo

phân phối tn−3 Điều này là cơ sở để thực hiện bài toán ước lượng khoảng và kiểm định cho các hệ số (tương tự như mô hình hai biến).

Ví dụ 2.5 Cho bộ số liệu sau:

X2 3 4 5 6 7 3 2 5

X3 7 6 5 4 4 7 8 5

trong đó: Y là lượng hàng bán được của một loại hàng (tấn/tháng)

X2 là thu nhập của người tiêu dùng (triệu đồng/tháng)

X3 là giá bán của mặt hàng này (ngàn đồng/kg)

1 Tìm phương trình hồi quy tuyến tính mẫu Nêu ý nghĩa của các hệ số hồi quy riêng.

2 Kiểm định xem thu nhập của người tiêu dùng có ảnh hưởng đến lượng hàng bán được hay

không? (dùng mức ý nghĩa 5%)

3 Kiểm định giả thuyết H0 : B2 = −1, H1 : B2 ̸= −1 (dùng mức ý nghĩa 5%)

(số liệu có trong file LuongGiaTN.txt)

3 Mô hình hồi quy tuyến tính k biến - Phương pháp ma trận

3.1 Mô hình hồi quy tuyến tính k biến

Mô hình hồi quy tuyến tính tổng thể k biến gồm một biến phụ thuộc Y và (k − 1) biến độc lập

X2, X3, , Xkcó dạng như sau:

Yi = B1 + B2X2i+ B3X3i +· · · + BkXki + ui

trong đó B1 được gọi là hệ số chặn, B2, , Bk được gọi là các hệ số hồi quy riêng của môhình hồi quy tổng thể Về ý nghĩa của các hệ số này cũng tương tự như của mô hình hồi quy babiến

Trang 23

3 Mô hình hồi quy tuyến tính k biến - Phương pháp ma trận 23

Giả sử ta có n quan sát, mỗi quan sát là một bộ k giá trị (Yi, X2i, , Xki), i = 1, n.

PRF có thể viết chi tiết thành hệ phương trình như sau:

3.2 Các giả thiết cơ bản

• Giả thiết 1: X2, , Xkkhông ngẫu nhiên, giá trị của chúng là xác định

• Giả thiết 2: E(ui) = 0 ∀i.

• Giả thiết 3: Các uicó phương sai bằng nhau (phương sai thuần nhất):

V ar(ui) = σ2 ∀i.

• Giả thiết 4: Không có tương quan giữa các sai số:

Cov(ui, uj) = 0 ∀i ̸= j.

• Giả thiết 5: Không có quan hệ tuyến tính giữa các Xi

• Giả thiết 6: ui ∼ N(0, σ2) với mọi i.

3.3 Ước lượng các tham số bằng OLS

Phương trình hồi quy mẫu có dạng:

Trang 24

Dựa vào mẫu gồm n quan sát (Yi, X2i, , Xki), i = 1, n, ta đi tìm b sao cho∑n

i=1e2

i đạtgiá trị nhỏ nhất

Giải ra ta được:

b = (XtX)−1XtY

(giả thiết thứ 5 suy ra ma trận XtX khả nghịch, vì vậy luôn tìm được b) b được xác định như

trên được gọi là ước lượng bình phương nhỏ nhất Nếu các giả thiết 1-6 thỏa mãn thì ước lượngnày có tính chất BLUE

• Ta luôn muốn dùng một số lượng biến giải thích vừa đủ sao cho vẫn có được mô hình phù

hợp mà không quá tốn kém khi phải thu thập thông tin của qúa nhiều biến giải thích

• Nhiều khi đưa thêm một số biến độc lập vào mô hình thì tác động riêng phần của các biến

độc lập đó tới biến phụ thuộc lại không có ý nghĩa thống kê, tuy nhiên R2vẫn tăng lên

Một trong các tiêu chuẩn khắc phục được hạn chế này là hệ số xác định hiệu chỉnh ¯R2 của R2,cho bằng biểu thức:

Trang 25

3 Mô hình hồi quy tuyến tính k biến - Phương pháp ma trận 25

• Nếu k > 1 thì ¯ R2 ≤ R2 ≤ 1.

• Khi số biến độc lập tăng lên thì ¯ R2cũng tăng lên nhưng tăng chậm hơn so với R2

• R2 ≥ 0 nhưng ¯ R2 có thể âm Thường thì khi ¯R2 nhận giá trị âm người ta gán lại cho nó

giá trị bằng 0.

Chú ý 2.6 Trong thực hành, khi muốn đánh giá sự phù hợp của mô hình hồi quy bội thì hệ số

xác định hiệu chỉnh ¯ R2 thường được dùng hơn so với hệ số xác định bội R2.

3.5 Ước lượng khoảng và kiểm định cho hệ số hồi quy

Nếu các giả thiết 1-6 thỏa mãn thì:

• b ∼ N(B, σ2(XtX)−1) Gọi dj là phần tử thứ j trên đường chéo chính của ma trận

se(bj) tuân theo phân phối tn−k Điều này

là cơ sở để thực hiện bài toán ước lượng khoảng và kiểm định cho các hệ số (tương tự như mô

hình hai biến - chỉ thay phân phối t với (n-2) bậc tự do thành (n-k) bậc tự do).

3.6 Kiểm định sự có ý nghĩa của mô hình

Xét mô hình hồi quy bội:

Yi = B1 + B2X2i+ B3X3i +· · · + BkXki + ui, i = 1, n

Mô hình được gọi là không giải thích được sự thay đổi của biến phụ thuộc Y nếu toàn bộ các hệ

số hồi quy riêng đều bằng 0 Vì vậy, bài toán kiểm định sự có ý nghĩa của mô hình là bài toán

H0 : B2 = B3 = · · · = Bk = 0

H1 : Tồn tại i ∈ {2, , k} sao cho Bj ̸= 0.

Tiêu chuẩn kiểm định F:

F = ESS/(k − 1) RSS/(n − k)

F tuân theo phân phối Fisher với (k − 1) và (n − k) bậc tự do Fk−1,n−k Vậy với mức ý

nghĩa α ta có quy tắc kiểm định sau:

• Nếu F > Fk−1,n−k,αthì bác bỏ H0

Trang 26

• Nếu F ≤ Fk−1,n−k,αthì không bác bỏ H0.

trong đó giá trị Fk−1,n−k,αxác định bởi:

P (Fk−1,n−k > Fk−1,n−k,α) = α.

Chú ý 2.8 Ta có thể tính giá trị kiểm định F trong bài toán kiểm định đồng thời qua hệ số xác

định bội R2 bằng công thức sau:

F = R

2/(k − 1)

(1− R2)/(n − k) .

Có hai loại dự báo:

• Dự báo giá trị trung bình có điều kiện của Y khi X = X0(Dự báo cho E(Y |X0 )).

• Dự báo giá trị cá biệt của Y khi X = X0(Dự báo cho Y0)

Giả sử X = X0 Khi đó, ước lượng điểm cho E(Y |X0) và Y đều là ˆ Y0 = X0b.

Khoảng tin cậy 100(1− α)% cho E(Y |X0 ) là:

Ví dụ 2.9 Lấy lại tập dữ liệu LuongGiaTN.txt, trong đó: Y là lượng hàng bán được của một

loại hàng (tấn/tháng), X2 là thu nhập của người tiêu dùng (triệu đồng/tháng), X3 là giá bán

của mặt hàng này (ngàn đồng/kg) Hồi quy theo mô hình:

Yi = B1 + B2X2i + B3X3i + ui

1 Tìm hệ số xác định và hệ số xác định hiệu chỉnh.

2 Kiểm định sự có ý nghĩa của mô hình.

3 Tìm ước lượng khoảng cho lượng hàng bán được khi giá bán là 6 ngàn đồng/kg và thu

nhập của người tiêu dùng là 5 triệu đồng/tháng.

Trang 27

4 Một số dạng mô hình hồi quy 27

4 Một số dạng mô hình hồi quy

4.1 Mô hình log tuyến tính

trong đó B1 = ln A Mô hình (2.6) được gọi là mô hình log tuyến tính (hoặc mô hình log-log,

mô hình log kép) Đặt Yi∗ = ln Yi, Xi∗ = ln Xita được mô hình:

Yi∗ = B1 + B2Xi∗+ ui

Đây là mô hình hồi quy tuyến tính nên có thể dùng phương pháp OLS để ước lượng các hệ số

Gọi b1, b2 là các ước lượng bằng OLS cho mô hình (2.6) thì:

• b2 là một ước lượng không chệch cho B2

• b1 là một ước lượng không chệch cho ln A Vì vậy eb1 là một ước lượng cho A, tuy

nhiên đây là một ước lượng chệch

Mô hình log tuyến tính và hệ số co giãn

Ta biết hệ số co giãn của Y theo X được xác định như sau:

Vậy, khi X thay đổi 1% thì Y thay đổi B2 %.

Ví dụ 2.10 Tập dữ liệu CaPhe.csv cho biết kết quả khảo sát nhu cầu tiêu thụ cà phê ở Mỹ trong

giai đoạn 1970-1980, trong đó Y là số tách/người/ngày, X là giá cà phê (USD/pound) Xét mô

hình:

ln Yi = B1+ B2ln Xi+ ui

1 Ước lượng mô hình trên.

2 Khi giá cà phê tăng 1% thì nhu cầu tiêu thụ cà phê thay đổi như thế nào?

4.2 Mô hình hồi quy log tuyến tính bội

Mô hình log tuyến tính k biến có dạng:

ln Yi = B1+ B2ln X2i +· · · + Bkln Xki+ ui

Tương tự như đối với mô hình log tuyến tính, hệ số Bi, i = 2, k chính là hệ số co giãn riêng

εY Xi, cho biết phần trăm thay đổi của Y khi Xi thay đổi 1% còn Xj, j ̸= i không thay đổi.

Trang 28

Ví dụ 2.11 Cho Bảng số liệu sau:

2 Các ước lượng tìm được của α, β cho ta thông tin gì?

4.3 Mô hình nửa log (semilog): Mô hình lin-log và mô hình log-lin

Mô hình log-lin và tốc độ tăng trưởng

Nghiên cứu công thức tính lãi suất kép:

Yt = Y0(1 + r)t

trong đó:

t là thời gian, nhận các giá trị là 1, 2, 3, , đơn vị có thể là tháng, quý, năm,

r là tỉ lệ lãi suất kép trên mỗi kì.

Y0 là giá trị của biến phụ thuộc Y tại thời điểm t = 0.

Yt là giá trị của biến phụ thuộc Y tại thời điểm t.

Lấy logarit hai vế ta được:

Như vậy r cho biết tỉ lệ tăng trên mỗi đơn vị thời gian của Y (100r% -tỉ lệ phần trăm).

2 Từ biểu thức Yt = Y0(1 + r)tsuy ra:

Trang 29

4 Một số dạng mô hình hồi quy 29

3 Mô hình log-lin thích hợp trong những tình huống khảo sát tốc độ tăng của các biến kinh

tế tầm vĩ mô như: dân số, lượng lao động, GDP, GNP, lượng cung tiền,

Ví dụ 2.13. Bảng sau cho biết Tổng sản phẩm trong nước (GDP)

Đây là mô hình tuyến tính với biến phụ thuộc là Y và biến độc lập là ln X nên ta có thể sử dụng

phương pháp OLS để ước lượng các tham số B1, B2

2723 1633.1 3052.6 1795.5

3405.7 2185.2 3772.2 2363.6 4014.9 2562.6 4240.3 2807.7 4526.7 2901

1 Hãy ước lượng mô hình:

GDP = B1 + B2ln M2+ u

2 Khi M2tăng 1% thì GDP thay đổi như thế nào?

Trang 30

và ta có thể sử dụng phương pháp OLS để ước lượng cho các hệ số B1, B2.

Một số trường hợp quan trọng của mô hình nghịch đảo

Trang 31

4 Một số dạng mô hình hồi quy 31

Ví dụ 2.15 File ThuNhapThatNghiep.txt chứa số liệu về thu nhập (Y ) và tỉ lệ thất nghiệp

4.5 Mô hình hồi quy đa thức

Mô hình hồi quy đa thức bậc k có dạng:

Các ước lượng cho hệ số có thỏa mãn các điều kiện của đường tổng chi phí bậc 3 không?

3 Kiểm định giả thuyết B3 < 0.

• Cùng số biến độc lập (nếu không thì dùng hệ số xác định hiệu chỉnh).

• Biến phụ thuộc xuất hiện trong mô hình hồi quy có cùng dạng (biến độc lập có thể ở những

dạng khác nhau)

Trang 32

Ví dụ 2.17 Khi hồi quy thu nhập theo tỉ lệ thất nghiệp (dữ liệu ThuNhapThatNghiep.txt), nên

lựa chọn mô hình tuyến tính hay mô hình nghịch đảo, nếu dựa trên tiêu chuẩn R2.

Trong trường hợp biến phụ thuộc xuất hiện ở những dạng khác nhau thì ta phải quy đổi hệ sốxác định rồi mới so sánh với nhau Ví dụ, xét hai mô hình sau:

Y = B1 + B2X + u (1)

ln Y = C1 + C2ln X + v (2)

Để so sánh hệ số xác định R2 của hai mô hình này ta thực hiện các bước sau:

1 Hồi quy mô hình (2), tính được [ln Yi, từ đó tính ˆYi = eln Y[i

5 Mô hình hồi quy với biến giả

5.1 Khái niệm về biến giả

Các mô hình hồi quy ta đã xét trong các mục trước có các biến giải thích đều là biến định lượng.Thực tế có những trường hợp biến giải thích là biến định tính, thí dụ như giới tính, tôn giáo,hình thức sở hữu của doanh nghiệp (tư nhân hay nhà nước), Để đưa được những thuộc tínhcủa biến định tính vào mô hình hồi quy ta cần phải lượng hóa các thuộc tính, bằng cách sử dụng

kĩ thuật biến giả (dummy variables)

Ví dụ 2.19 Khảo sát lương của giáo viên theo trình độ (cử nhân hay thạc sĩ).

Đặt Y là biến phụ thuộc biểu thị lương của giáo viên (Y là biến định lượng) Biến độc lập biểu thị cho trình độ của giáo viên và là biến định tính, ta lượng hóa bằng biến giả D như sau:

Lương trung bình của giáo viên có trình độ thạc sĩ: E(Y |D = 1) = B1 + B2

Suy ra B2biểu thị mức chênh lệch giữa lương trung bình của thạc sĩ so với cử nhân Như vậy mức lương trung bình của giáo viên có trình độ cử nhân là tiêu chuẩn để so sánh, ta gọi thuộc

tính "cử nhân" là thuộc tính cơ sở (hay phạm trù cơ sở), tương ứng với D = 0.

Trang 33

5 Mô hình hồi quy với biến giả 33

Chú ý 2.20 Trong bài toán trên, biến định tính có hai thuộc tính (cử nhân hay thạc sĩ) ta dùng

một biến giả với hai giá trị 0, 1 Trong trường hợp tổng quát, biến định tính có k thuộc tính ta dùng (k − 1) biến giả, mỗi biến giả nhận hai giá trị 0, 1.

Ví dụ 2.21 Tiếp theo ví dụ trên, ta mở rộng đối tượng điều tra gồm cả những giáo viên có trình

độ tiến sĩ thì ta có ba thuộc tính: tiến sĩ, thạc sĩ, cử nhân Ta dùng hai biến giả D2, D3 với quy ước như sau:

Như vậy mức lương trung bình của giáo viên có trình độ cử nhân là tiêu chuẩn để so sánh, ta

gọi thuộc tính "cử nhân" là thuộc tính cơ sở (hay phạm trù cơ sở), tương ứng với cặp D2 =

0, D3 = 0.

Ví dụ 2.22 Khảo sát chi tiêu của một người theo thu nhập và trạng thái tình cảm (độc thân, có

gia đình, đang yêu) Hãy lập mô hình hồi quy.

Gọi Y : chi tiêu, X: thu nhập Biến định tính "trạng thái tình cảm" có ba thuộc tính, vì vậy ta

dùng hai biến giả như sau:

Trang 34

Mô hình hồi quy tổng thể có dạng:

Ta suy ra ý nghĩa của các hệ số trong mô hình như sau:

B1là mức chi tiêu trung bình của một người độc thân khi không có thu nhập.

B2là chênh lệch giữa mức chi tiêu trung bình của người có gia đình so với mức chi tiêu trung bình của người độc thân khi có cùng mức thu nhập.

B3 là chênh lệch giữa mức chi tiêu trung bình của người đang yêu so với mức chi tiêu trung bình người độc thân khi có cùng mức thu nhập.

B4là mức thay đổi về chi tiêu trung bình của một người theo thu nhập: Khi một người có thu

nhập tăng thêm 1 đơn vị thì tiêu dùng của người đó thay đổi B4 đơn vị, bất kể người đó đang trong trạng thái tình cảm nào.

5.2 Mô hình hồi quy với biến giả

Xét bài toán khảo sát lương của giáo viên (Y ) theo số năm giảng dạy (X) Ta sử dụng mô hình

hồi quy sau:

Y = A + BX + u

Trong mô hình này, hệ số A cho biết lương khởi điểm của giáo viên, B cho biết tốc độ tăng

lương của giáo viên theo số năm giảng dạy

Giả sử ta xét thêm yếu tố trình độ (đại học và sau đại học) ảnh hưởng đến tiền lương của giáo

viên như thế nào, ta đưa thêm vào mô hình biến giả D như sau:

TH1: Lương khởi điểm của giáo viên có trình độ đại học và sau đại học khác nhau nhưng tốc

độ tăng lương theo số năm giảng dạy của hai nhóm này là như nhau

TH2: Lương khởi điểm là như nhau nhưng tốc độ tăng lương là khác nhau

TH3: Lương khởi điểm khác nhau và tốc độ tăng lương cũng khác nhau

Ta sử dụng biến giả với từng tình huống như sau:

Trang 35

5 Mô hình hồi quy với biến giả 35

TH1: Dịch chuyển số hạng tung độ gốc

Đặt A = A1+ A2D, khi đó PRF có dạng:

Y = A1+ A2D + BX + u

Ví dụ 2.23 Tập dữ liệu 'LuongGV.rda' là một mẫu về lương (Y ) của 20 giáo viên phổ thông

cùng với số năm giảng dạy (X) và trình độ của họ (đại học và sau đại học).

1 Lập biến giả D ứng với biến định tính "trình độ" (D = 0: đại học, D = 1: sau đại

học).

2 Hãy ước lượng mô hình Y = A1 + A2D + BX + u, nêu ý nghĩa của các hệ số của

phương trình hồi quy mẫu.

3 Tách ra hai phương trình hồi quy mẫu theo các trình độ khác nhau.

4 Kiểm định xem trình độ của giáo viên có ảnh hưởng đến lương của họ không?

Biểu đồ sau vẽ các điểm dữ liệu và hai đường hồi quy mẫu ứng với từng trình độ

Ngày đăng: 13/12/2017, 23:08

TỪ KHÓA LIÊN QUAN

w