Khái niệm: - Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biếnbiến phụ thuộc hay còn gọi là biến được giải thích vào một hay nhiều biến khácbiến độc lập hay còn gọi là biến giải
Trang 110/2/2007 Thanh Thai 1
ECONOMETRICS
Trang 210/2/2007 Thanh Thai 2
Chapter 0: Outline Of Econometrics
Trang 310/2/2007 Thanh Thai 3
z Aùp dụng các phương pháp thống kê
trong kinh tế
z Sự hợp nhất
+ Lý thuyết kinh tế
+ Công cụ toán học
+ Phương pháp luận thống kê
Trang 410/2/2007 Thanh Thai 4
z Ước lượng các mối quan hệ kinh tế
z Kiểm định giả thuyết về các hành vi
kinh tế
z Dự báo
Trang 510/2/2007 Thanh Thai 5
NGHIÊN CỨU THỰC NGHIỆM
z Thiết lập mô hình
z Thu thập dữ liệu
z Ước lượng mô hình
z Kiểm định giả thiết
z Diễn dịch kết quả
Trang 610/2/2007 Thanh Thai 6
NGHIÊN CỨU THỰC NGHIỆM
LÝ THUYẾT KINH TẾ, KINH NGHIỆM, NGHIÊN CỨU KHÁC
THIẾT LẬP MÔ HÌNH ƯỚC LƯỢNG MÔ HÌNH KIỂM ĐỊNH GIẢ THUYẾT
DIỄN DỊCH KẾT QUẢ THIẾT LẬP LẠI MÔ HÌNH
CÁC QUYẾT ĐỊNH VỀ
Trang 7Thành Thái Introductory Econometrics 1
Chapter 1: The Simple Linear Regression
Model - Some Essential Issues.
Trang 8Thành Thái Introductory Econometrics 2
I Bản chất của phân tích hồi qui
1 Khái niệm:
- Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến(biến phụ thuộc hay còn gọi là biến được giải thích) vào một hay nhiều biến khác(biến độc lập hay còn gọi là biến giải thích) với ý tưởng cơ bản là ước lượng(hay dự đoán) giá trịtrung bình của biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập
- Một số ví dụ:
Vd1: Công ty địa ốc rất quan tâm đến việc liên hệ giữa giábán một ngôi nhà với các đặc trưng của nó như kích thước, diện tích sử dụng, số phòng ngủ và phòng tắm, các loại thiết bịgia dụng, có hồ bơi hay không, cảnh quan có đẹp không,
Trang 9Thành Thái Introductory Econometrics 3
Vd2: Cho đến nay việc hút thuốc lá là nguyên nhân chính gây tử vong do ung thư phổi được ghi chép cẩn thận Một
mô hình hồi qui tuyến tính đơn cho vấn đề này là:
DEATHS .SMOKING = α + β + u
I Bản chất của phân tích hồi qui
- Một số ví dụ:
1 Khái niệm:
Trang 10Thành Thái Introductory Econometrics 4
Trang 11Thành Thái Introductory Econometrics 5
- Một số ví dụ:
zVd4: Gám đốc tiếp thị của một công ty có thể muốn biết mức cầu đối với sản phẩm của công ty có quan hệ như thế nào với chi phí quảng cáo Một nghiên cứu như thế sẽ rất có ích cho việc xác định độ co dãn của cầu đối với chi phí quảng cáo Tức là tỷ lệphần trăm thay đổi về mức cầu khi ngân sách quảng cáo thay đổi 1% Kiến thức này rất có ích cho việc xác định ngân sách quảng cáo tối ưu
I Bản chất của phân tích hồi qui
1 Khái niệm:
zVd5: Sau cùng một nhà nông học có thể quan tâm tới việc nghiên cứu sự phụ thuộc của sản lượng lúa vào nhiệt độ, lượng mưa, nắng, phân bón,
Trang 12Thành Thái Introductory Econometrics 6
Chúng ta có thể đưa ra vô số ví dụ như trên về sự phụthuộc của một biến vào một hay nhiều biến khác Các kỹ thuật phân tích hồi qui thảo luận trong chương này nhằm nghiên cứ sựphụ thuộc như thế giữa các biến số
zTa ký hiệu: Y - biến phụ thuộc(hay biến được giải thích)
X j - biến độc lập(hay biến giải thích) thứ j
Trong đó, biến phụ thuộc Y là đại lượng ngẫu nhiên, có
quy luật phân phối xác suất Các biến độc lập Xj không phải làngẫu nhiên, giá trị của chúng đã được biết trước
1 Khái niệm:
I Bản chất của phân tích hồi qui
Trang 13Thành Thái Introductory Econometrics 7
2 Phân tích hồi qui giải quyết các vấn đề sau:
- Ước lượng giá trị trung bình của biến phụ thuộc với giá trị đã cho của biến độc lập.
- Kiểm định giả thiết về bản chất của sự phụ thuộc.
- Dự đoán giá trị trung bình của biến phụ thuộc khi biết giá trị của các biến độc lập.
- Kết hợp các vấn đề trên.
Trang 14Thành Thái Introductory Econometrics 8
I Bản chất của phân tích hồi qui
3 Phân biệt các quan hệ trong phân tích hồi qui:
- Quan hệ thống kê và quan hệ hàm số
- Hồi qui và nhân quả
- Hồi qui và tương quan
Trang 15Thành Thái Introductory Econometrics 9
II.Bản chất và nguồn số liệu
cho phân tích hồi qui.
2.Nguồn của số liệu.
3.Nhược điểm của số liệu.
Trang 16Thành Thái Introductory Econometrics 10
1.Hàm hồi qui tổng thể:
Xét ví dụ giả định sau: Giả sử ở một địa phương
có cả thảy 60 gia đình và chúng ta quan tâm đến việc nghiên cứu mối quan hệ giữa:
Y-Tiêu dùng trong tuần của các gia đình
X-Thu nhập khả dụng trong tuần của các hộ gia đình.
Các số liệu giả thuyết cho ở bảng sau:
III.Hàm hồi qui hai biến
Trang 17Thành Thái Introductory Econometrics 11
Thu nhập và chi tiêu trong một tuần của tổng thể
Trang 18Thành Thái Introductory Econometrics 12
Các số liệu ở bảng trên được giải thích như sau:
Với thu nhập trong một tuần, chẳng hạn X=100 $ thì
có 6 gia đình mà chi tiêu trong tuần của các gia đình trong nhóm này lần lượt là 65; 70; 74; 80; 85 và 88 Tổng chi tiêu trong tuần của nhóm này là 462 $ Như vậy mỗi cột của bảng cho ta một phân phối của chi tiêu trong tuần Y với mức thu nhập đã cho X.
III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Trang 19Thành Thái Introductory Econometrics 13
Từ số liệu cho ở bảng trên ta dễ dàng tính được các xác suất có điều kiện:
Chẳng hạn: P(Y=85/X=100)=1/6; P(Y=90/X=120)=1/5,
Từ đó ta có bảng các xác suất có điều kiện và kỳ vọng toán
có điều kiện của Y điều kiện là X=Xi
Kỳ vọng toán có điều kiện(trung bình có điều kiện) của Y với điều kiện là X=Xi được tính theo công thức sau:
Trang 20Thành Thái Introductory Econometrics 14
Xác suất có điều kiện P(Y/X) và kỳ vọng có điều kiện E(Y/Xi)
Trang 21Thành Thái Introductory Econometrics 15
z Biểu diễn các điểm (Xi;Yj) và
các điểm (Xi; E(Y/Xi)) ta được đồ
thị như hình bên
0 20 40 60 80 100 120 140 160 180 200
Theo hình bên ta thấy trung
bình có điều kiện của mức chi
tiêu trong tuần nằm trên đường
Trang 22Thành Thái Introductory Econometrics 16
Hàm (*) được gọi là hàm hồi qui tổng thể (PRF-Population Regression Function) Nếu PRF có một biến độc lập thì được gọi là
hồi qui đơn, nếu có từ hai biến độc lập trở lên được gọi là hồi qui bội.
III.Hàm hồi qui hai biến
Trang 23Thành Thái Introductory Econometrics 17
Chúng ta xét trường hợp đơn giản nhất là PRF có dạng tuyến tính: E(Y/Xi) = β1 + β2Xi
Trong đó : β1, β2 là các tham số chưa biết nhưng cố định, và được gọi là các hệ số hồi qui
-β1: là hệ số tự do (hệ số tung độ góc) Nó cho biết giá trị trung bình của biến phụ thuộc Y bằng bao nhiêu khi biến độc lập X nhận giá trị 0 Điều này chỉ đúng về mặt lý thuyết, trong thực tế nhiều khi
hệ số này không có ý nghĩa
III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
zÝ nghĩa của hàm PRF:
Trang 24Thành Thái Introductory Econometrics 18
III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
zÝ nghĩa của hàm PRF:
-β2: là hệ số góc (hệ số độ dốc) - Cho biết giá trị trung bình
của biến phụ thuộc Y sẽ thay đổi (tăng hoặc giảm) bao nhiêu đơn vịkhi giá trị của biến độc lập X tăng một đơn vị với điều kiện các yếu
tố khác không thay đổi
- E(Y/Xi) là trung bình có diều kiện của Y với điều kiện X nhận giá trị Xi
Trang 25Thành Thái Introductory Econometrics 19
Thuật ngữ “tuyến tính” ở đây được hiểu theo hai nghĩa: Tuyến tính đối với tham số và tuyến tính đối với các biến
Thí dụ: E(Y/Xi) = β1 + β2Xi2 là hàm tuyến tính đối với tham số nhưng phi tuyến đối với biến
E(Y/Xi) = β1 + β23 Xi là hàm tuyến tính đối với biến nhưng không tuyến tính với tham số
Hàm hồi quy tuyến tính luôn được hiểu là tuyến tính với các tham
số, nó có thể không tuyến tính đối với biến
III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
zÝ nghĩa của hàm PRF:
Trang 26Thành Thái Introductory Econometrics 20
Giả sử chúng ta đã có hàm hồi quy tổng thể E(Y/Xi), vì E(Y/Xi)
là giá trị trung bình của biến Y với giá trị Xi đã biết, cho nên các giátrị cá biệt Yi không phải bao giờ cũng trùng với E(Y/Xi) mà chúng xoay quanh E(Y/Xi)
Ta ký hiệu Ui là chênh lệch giữa giá trị cá biệt Yi và E(Y/Xi):
Ui = Yi - E(Y/Xi) hay Yi = E(Y/Xi) +Ui (**)
Ui là đại lượng ngẫu nhiên, người ta gọi Ui là yếu tố ngẫu nhiên (hoặc nhiễu) và (**) được gọi là PRF ngẫu nhiên
Nếu như E(Y/Xi) là tuyến tính đối với Xi thì:
Yi = β1 + β2Xi + UiIII.Hàm hồi qui hai biến
2 Sai số ngẫu nhiên và bản chất của nó
Trang 27Thành Thái Introductory Econometrics 21
III.Hàm hồi qui hai biến
2 Sai số ngẫu nhiên và bản chất của nó
Å) Sự tồn tại của U i bởi một số lý do sau đây:
- Chúng ta có thể biết một cách chính xác biến giải thích X vàbiến phụ thuộc Y, nhưng chúng ta không biết hoặc biết không rõ vềcác biến khác ảnh hưởng đến Y Vì vậy, Ui được sử dụng như yếu tố đại diện cho tất cả các biến không có trong mô hình
- Ngay cả khi biết các biến bị loại khỏi mô hình là các biến nào, khi đó chúng ta có thể xây dựng mô hình hồi quy bội, nhưng có thể
không có số liệu cho các biến này
Trang 28Thành Thái Introductory Econometrics 22
- Ngoài các biến giải thích đã có trong mô hình còn có một sốbiến khác nhưng ảnh hưởng của chúng đến Y rất nhỏ Trong trường hợp này, chúng ta cũng sử dụng Ui đại diện cho chúng
III.Hàm hồi qui hai biến
2 Sai số ngẫu nhiên và bản chất của nó
Å) Sự tồn tại của U i bởi một số lý do sau đây:
- Về mặt kỹ thuật và kinh tế, chúng ta mong muốn một mô hình đơn giản nhất có thể được Nếu như chúng ta có thể giải thích được hành vi của biến Y bằng một số nhỏ nhất các biến giải thích vànếu như ta không biết tường minh những biến khác là biến nào có thể
bị loại ra khỏi mô hình thì ta dùng yếu tố Ui để thay cho tất cả các biến này
Trang 29Thành Thái Introductory Econometrics 23
Nếu hàm PRF có dạng tuyến tính thì hàm hồi quy mẫu códạng:
Ŷi là ước lượng điểm của E(Y/Xi)
1
β : là ước lượng điểm của β1
: là ước lượng điểm của2
Hàm hồi quy được xây dựng trên cơ sở của một mẫu được gọi
là hàm hồi quy mẫu (SRF – The Sample Regression Function)
III.Hàm hồi qui hai biến
3 Hàm hồi quy mẫu:
Trong thực tế nhiều khi ta không có điều kiện để điều tra toàn
bộ tổng thể Khi đó ta chỉ có thể ước lượng giá trị trung bình của biến phụ thuộc Y từ số liệu của một mẫu
Trang 30Thành Thái Introductory Econometrics 24
Dạng ngẫu nhiên của (***) là:
III.Hàm hồi qui hai biến
3 Hàm hồi quy mẫu:
Trang 3110/2/2007 Thành Thái - NTU 1
BIẾN: VẤN ĐỀ ƯỚC LƯỢNG
Prepared by Pham Thanh Thai
Trang 3210/2/2007 Thành Thái - NTU 2
I PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS).
Ta nhắc lại hàm PRF hai biến:
Y = β + β X + U Tuy nhiên, như đã lưu ý trong Chương 1, hàm PRF không thể quan sát trực tiếp được Ta ước lượng nó từ hàm SRF:
Y = β + β X + e
Y =Y + e Hay:
Trang 3310/2/2007 Thành Thái - NTU 3
Nhưng ta sẽ xác định hàm SRF như thế nào? Để thấy được điều này, ta hãy tiến hành như sau Đầu tiên, ta biểu thị SRF thành :
i i ˆ i
e =Y -Y
I PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS).
i ˆ ˆ1 2 i
=Y -β -β X
Trang 34i ˆ ˆ X
Yˆ = β + β
I PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS).
Trang 3510/2/2007 Thành Thái - NTU 5
I PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS).
Theo nguyên lý của phương pháp OLS để tìm SRF, chúng ta phải cực tiểu tổng bình phương các phần dư, có nghĩa là:
Trang 36I PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS).
Trang 37∑ ∑
Và:
I PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS).
β = Y - β X
Trang 3810/2/2007 Thành Thái - NTU 8
II CÁC TÍNH CHẤT CỦA PHƯƠNG
PHÁP OLS
- SRF đi qua các giá trị trung bình mẫu của Y và X
- Giá trị trung bình Y ước lượng bằng giá trị trung
bình của Y thực Nghĩa là: Y = Y ˆ
- Giá trị trung bình của các phần dư e i bằng 0
- Các phần dư là không tương quan với Yi ước lượng Nghĩa là:
ie
i i
e Y =0
∑
Trang 39- lần lượt là các ước lượng điểm của β1 , β2
và là các đại lượng ngẫu nhiên.
1 2
β ,β
II CÁC TÍNH CHẤT CỦA PHƯƠNG
PHÁP OLS
Trang 40cố định trong các mẫu lập lại Nói rõ hơn, X được giả thiết là
không ngẫu nhiên.
Giả thiết 3: Giá trị trung bình bằng không của các nhiễu
U i Cho trước giá trị của X, giá trị trung bình hay kỳ vọng của các số hạng nhiễu U i bằng 0 Nói rõ hơn, giá trị trung bình có
điều kiện của U i là 0 Về mặt ký hiệu, ta có: =0E (U X ) i i
Trang 4110/2/2007 Thành Thái - NTU 11
III CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Bằng hình học, giả thiết này có thể được vẽ trên hình sau,
nó chỉ ra một vài giá trị của biến X và tổng thể Y liên kết với chúng Như đã thấy, mỗi một tổng thể Y tương ứng với một X
cho trước được phân phối xung quanh giá trị trung bình của nó(có thể thấy được nhờ những chấm được khoanh tròn trên
PRF) cùng với một vài giá trị Y ở phía trên và dưới nó
Khoảng cách phía trên và dưới đối với giá trị trung bình không
là gì nhưng U i và cái mà giả thiết 3 đòi hỏi là giá trị trung bình
của các độ lệch này tương ứng với bất kỳ X đã cho phải bằng
0
Trang 421 + β X β
Trang 43i i i i i
2
i i 2
Var(U X )=E[U -E(U ) X ]
=E(U X )
=σ
Trang 4610/2/2007 Thành Thái - NTU 16
III CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 5: Không có tự tương quan giữa các
nhiễu Cho trước hai giá trị X bất kỳ, Xi và Xj (i ≠ j),
tương quan giữa Ui và Uj bất kỳ (i ≠ j) bằng 0 Về
mặt ký hiệu ta có:
Trang 4710/2/2007 Thành Thái - NTU 17
III CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 6: Đồng phương sai zero giữa Ui và Xi ,
hay là E(UiXi) = 0
Trang 48Giả thiết 8: Các giá trị X trong một mẫu cho trước
không thể tất cả đều bằng nhau Nói theo từ ngữ kỹ
thuật, var(X) phải là một số dương hữu hạn.
2 i
(X -X) Var(X)=
n-1
∑ , trong đó n là cỡ mẫu.
Trang 4910/2/2007 Thành Thái - NTU 19
III CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 10: Không có tính đa cộng tuyến hoàn
toàn Nghĩa là không có các mối tương quan tuyến
tính hoàn toàn trong các biến giải thích.
Giả thiết 9: Mô hình hồi quy được xác định một cách đúng đắn Nói cách khác, các mô hình được sử
dụng trong phân tích thực nghiệm không có độ
thiên lệch hoặc sai số đặc trưng.
Trang 5110/2/2007 Thành Thái - NTU 21
IV TÍNH CHÍNH XÁC HAY LÀ CÁC SAI SỐ CHUẨN CỦA CÁC ƯỚC LƯỢNG BÌNH
PHƯƠNG TỐI THIỂU
Các phương sai và sai số chuẩn của các ước lượng bình phương tối thiểu thông thường OLS như sau:
2
2 2
i
σ ˆ
i
X ˆ
i
X ˆ
Trang 5210/2/2007 Thành Thái - NTU 22
Trong đó: var là phương sai, se là sai số chuẩn và σ2 làphương sai có điều kiện không đổi hay phương sai hằng số của
U i, trong giả thiết 4
Trừ đại lượng σ2, tất cả các số lượng nhập vào công thứctrên đều có thể tính từ dữ liệu, σ2 tự nó được tính bằng côngthức sau:
2 i
Trang 5310/2/2007 Thành Thái - NTU 23
IV TÍNH CHÍNH XÁC HAY LÀ CÁC SAI SỐ CHUẨN CỦA CÁC ƯỚC LƯỢNG BÌNH
PHƯƠNG TỐI THIỂU
Trong đó: là ước lượng không chệch củaˆσ2 σ2
Do đó, trong tính toán thường người ta thay bằng Khi đó, phương sai và sai số chuẩn ước lượng của các ướclượng OLS sẽ là:
i
σ ˆ
i
Xˆ
Trang 5410/2/2007 Thành Thái - NTU 24
V HỆ SỐ XÁC ĐỊNH (r 2 ) : ĐẠI
LƯỢNG ĐO “SỰ THÍCH HỢP”.
Trước khi chỉ rõ r 2 được tính như thế nào ta hãy xét sự giải
thích có tính khai phá đối với r 2 bằng đồ thị, đó là phương
pháp đồ thị Venn , hay là Ballentine, như trên hình 2.5 sau
Quan điểm Ballentine đối với r 2 : (a) r 2 = 0; (f) r 2 = 1
Trang 5510/2/2007 Thành Thái - NTU 25
Trong hình này, vòng tròn Y tượng trưng cho biến thiên trong biến phụ thuộc Y và vòng tròn X tượng trưng cho biến thiên trong biến giải thích X Vùng chồng lên nhau của hai
vòng tròn (vùng tối) chỉ rõ phạm vi mà độ biến thiên trong Y được giải thích bởi biến thiên trong X (cho là theo hướng hồi
quy các bình phương tối thiểu thông thường OLS) Phạm vi
vùng chồng lên càng lớn, độ biến thiên trong Y được giải thích bởi X càng lớn r 2 đơn giản là đại lượng đo bằng số cho vùngtối này Khi không có vùng tối, r 2 rõ ràng bằng 0, nhưng khi
vùng tối đã hoàn chỉnh, r 2 bằng 1, và 100% độ biến thiên của Y được giải thích bởi X Ta nói ngắn gọn rằng r 2 nằm giữa 0 và 1
V HỆ SỐ XÁC ĐỊNH (r 2 ) : ĐẠI
LƯỢNG ĐO “SỰ THÍCH HỢP”.
Trang 5610/2/2007 Thành Thái - NTU 26
LƯỢNG ĐO “SỰ THÍCH HỢP”.
Để tính r 2, ta làm như sau:
Trang 5710/2/2007 Thành Thái - NTU 27
V HỆ SỐ XÁC ĐỊNH (r 2 ) : ĐẠI
LƯỢNG ĐO “SỰ THÍCH HỢP”.
- Gọi TSS :độ lệch tổng cộng của giá trị thực của Y so với trung
bình mẫu của chúng, nó có thể được gọi là tổng bình phương
- Gọi ESS : Tổng bình phương tất cả các sai lệch giữa giá trị
ước lượng của Y với trung bình của chúng