gọi là biến phụ thuộc dependent variable vào một hay nhiều biến khác, gọi là biến độc lập independent variable, trong đó ước lượng giá trị trung bình kỳ vọng của biến phụ thuộc theo các
Trang 1CHƯƠNG 1 NHỮNG VẤN ĐỀ CƠ BẢN CỦA MÔ HÌNH HỒI QUY ĐƠN
Trang 2Nội dung
1.1 Phân tích hồi quy
1.2 Số liệu trong phân tích hồi quy
1.3 Hồi quy tổng thể
1.4 Sai số ngẫu nhiên
1.5 Hồi quy mẫu
Trang 31.1 Phân tích hồi quy
1.1.1 Bản chất của phân tích hồi quy
Thuật ngữ “regression” - hồi quy do Francis Galton đề cập lần đầu vào năm
1886 trong bài báo nghiên cứu chiều cao của những đứa trẻ có cha mẹ cao và thấp không bình thường Khi đó ông sử dụng thuật ngữ “regression to mediocrity” - quy về trung bình
gọi là biến phụ thuộc (dependent variable) vào một hay nhiều biến khác, gọi là biến độc lập (independent variable), trong đó ước lượng giá trị trung bình (kỳ vọng) của biến phụ thuộc theo các giá trị xác định của biến độc lập
Trang 41.1 Phân tích hồi quy
Có nhiều cách gọi tên biến
Biến phụ thuộc: Biến được giải thích, biến được dự báo, biến được hồi quy, biến phản ứng, biến nội sinh
Biến độc lập: Biến giải thích, biến dự báo, biến hồi quy, biến tác nhân, biến kiểm soát, biến ngoại sinh
Trang 51.1 Phân tích hồi quy
trong một khu dân cư khi biết thu nhập khả dụng (Nguồn: Gujarati, trang 38)
Biến phụ thuộc Y: Chi tiêu hàng tuần của hộ gia đình (đơn vị: USD)
Biến độc lập X: Thu nhập khả dụng hàng tuần của hộ gia đình (đơn vị: USD)
Mẫu nghiên cứu: Số liệu chi tiêu và thu nhập của 60 hộ gia đình Kết quả
Trang 61.1 Phân tích hồi quy Bảng 1.1: Số liệu thu thập theo tuần được sắp tăng dần theo thu nhập
Thu nhập
X 80 100 120 140 160 180 200 220 240 260Tiêu dùng
Trang 71.1 Phân tích hồi quyBảng 1.2: Xác suất có điều kiện của tiêu dùng theo các mức thu nhập
Trang 81.1 Phân tích hồi quy
Thu nhập theo tuần ($)
Điểm trung bình có điều kiện
Mật độ phân phối xác suất của tiêu dùng ứng với mức thu nhập 220 $
Hình 1.1: Hàm mật độ xác suất của Y với từng giá trị thu nhập X
Trang 91.1 Phân tích hồi quy
Kết quả nghiên cứu:
Như vậy ứng với mức thu nhập hàng tuần xác định tiêu dùng của hộ gia đình sẽ là một khoảng, dao động quanh giá trị trung bình
Khi thu nhập hàng tuần tăng thì tiêu dùng của gia đình cũng tăng nhưng mức tăng của tiêu dùng luôn nhỏ hơn thu nhập (hệ số góc lớn hơn 0, nhỏ hơn 1) Điều này phù hợp với lý thuyết kinh tế
Trang 101.1 Phân tích hồi quy
Một số mối quan hệ kinh tế khác
Lượng cầu của người tiêu dùng về một hàng hóa (ký hiệu Y) phụ thuộc vào giá của hàng hóa đó (X)
Tỷ lệ thay đổi của tiền lương (Y) phụ thuộc vào tỷ lệ thất nghiệp (X)
Tỷ lệ tiền mặt nắm giữ trong tổng thu nhập (Y) phụ thuộc vào tỷ lệ lạm phát (X)
Mức cầu về một mặt hàng (Y) phụ thuộc mức chi cho quảng cáo (X)
Sản lượng của một loại nông sản (Y) phụ thuộc lượng phân bón, lượng mưa, nhiệt độ, v.v…
Trang 111.1 Phân tích hồi quy
1.1.2 Mục đích của phân tích hồi quy
Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị xác định của biến độc lập
Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc
và biến độc lập mà lý thuyết kinh tế đưa ra
Dự báo giá trị trung bình và giá trị cá biệt của biến phụ thuộc ứng với giá trị dự đoán của các biến độc lập phù hợp với mẫu
Trang 121.1 Phân tích hồi quy
1.1.3 Phân tích hồi quy và các mối quan hệ khác
Phân tích hồi quy và quan hệ hàm số (functional relationship)
Phân tích hồi quy và phân tích tương quan (correlation analysis)
Phân tích hồi quy và quan hệ nhân quả (causation relationship)
Trang 131.2 Số liệu trong phân tích hồi quy
Trang 141.2 Số liệu trong phân tích hồi quy
Bảng 1.2 Tốc độ tăng trưởng GDP của Việt Nam qua các năm
Trang 151.2 Số liệu trong phân tích hồi quy
Bảng 1.3 Chỉ số giá tiêu dùng của các mặt hàng của Việt Nam
Chỉ tiêu Tháng 1/2019
Chỉ số giá tiêu dùng 0.1 Hàng ăn và dịch vụ ăn uống 0.66
Ăn uống ngoài gia đình 0.28
Đồ uống và thuốc lá 0.69 May mặc, giày dép mũ nón 0.39 Nhà ở và vật liệu xây dựng 0.35 Thiết bị và đồ dùng gia đình 0.16 Thuốc và dịch vụ y tế 0.01
Trang 161.2 Số liệu trong phân tích hồi quy
Bảng 1.4 Chỉ số giá tiêu dùng của các mặt hàng của Việt Nam
Trang 171.2 Số liệu trong phân tích hồi quy
Số liệu từ các nguồn được phát hành như: Niên giám thống kê, tạp chí,…hoặc có thể do các cơ quan Nhà nước, các tổ chức quốc tế, các công ty tư nhân thu thập
Số liệu từ các cuộc điều tra thực tế hoặc đi mua
Trang 181.2 Số liệu trong phân tích hồi quy
Phần lớn là các số liệu phi thực nghiệm nên mức độ tin cậy không cao
Đối với kinh tế học nói riêng và khoa học xã hội nói chung rất khó bố trí thí nghiệm có kiểm soát
Kết quả các nghiên cứu không chỉ phụ thuộc vào mô hình được lựa chọn mà
còn phụ thuộc rất nhiều vào chất lượng của số liệu.
Trang 191.2 Số liệu trong phân tích hồi quy
Các số liệu kinh tế thường đã được tổng hợp, không cho phép đi sâu vào phân tích các đơn vị nhỏ
Trang 211.3 Hồi quy tổng thểBảng 1.5 Phân phối xác suất đồng thời của X và Y.
Y1 P(Y1,X1) P(Y1,X2) … P(Y1,Xk)
Y2 P(Y2,X1) P(Y2,X2) … P(Y2,Xk)
Trang 221.3 Hồi quy tổng thể
Bảng phân phối xác suất có điều kiện của Y theo Xi ( )
E(Y/X) là hàm số biểu diễn sự phụ thuộc của giá trị trung bình của Y theo X, gọi là hàm hồi quy tổng thể (Population Regression Function - PRF)
2
Y
1
Trang 24Giả sử hàm hồi quy có dạng tuyến tính:
trong đó: là hệ số chặn (intercept coefficient)
Trang 251.3 Hồi quy tổng thể
1.3.2 Mô hình hồi quy tổng thể
Nếu hàm hồi quy tổng thể là tuyến tính thì mô hình hồi quy tổng thể tương ứng có dạng tuyến tính (Population Regression Model - PRM)
PRM:
Mô hình hồi quy tuyến tính được hiểu là mô hình có dạng tuyến tính đối với các tham số, nên mô hình có thể là tuyến tính hoặc phi tuyến đối với các biến số Ví dụ một số dạng mô hình hồi quy tuyến tính:
Trang 261.3 Hồi quy tổng thểBảng 1.7 Mô tả hàm hồi quy tổng thể trên đồ thị
Ui
Trang 271.4 Sai số ngẫu nhiên
1.4.1 Bản chất của sai số ngẫu nhiên (SSNN)
SSNN đại diện cho những yếu tố không biết, không có số liệu hay các nhân
tố ngoài biến độc lập có tác động đến biến phụ thuộc nhưng có trung bình ảnh hưởng đến biến phụ thuộc bằng 0
Sự tồn tại của SSNN là tất yếu khách quan và có vai trò đặc biệt quan trọng trong mô hình kinh tế lượng, SSNN cần phải thoả mãn những điều kiện nhất
Trang 281.4 Sai số ngẫu nhiên
1.4.2 Nguyên nhân tồn tại của sai số ngẫu nhiên (SSNN)
Sự mập mờ về lý thuyết kinh tế
Tầm quan trọng khác nhau giữa các biến giải thích
Sự kém tin cậy của số liệu thống kê
Khả năng chỉ định sai dạng hàm
Sự tình cờ trong hành vi của con người đôi lúc mang tính ngẫu nhiên không tuân theo quy luật thường lệ
Trang 291.5 Hồi quy mẫu
1.5.1 Hàm hồi quy mẫu
Từ tổng thể lập một mẫu ngẫu nhiên kích thước n:
W= {(X i ,Y i ) ; i =1÷n}
Hàm hồi quy được xây dựng dựa trên mẫu ngẫu nhiên được gọi là hàm hồi quy mẫu - SRF (Sample Regression Function) Dạng hàm hồi quy mẫu tương tự như hàm hồi quy tổng thể và là một ước lượng của hàm hồi quy tổng thể
Trang 301.5 Hồi quy mẫu
Giả sử PRF có dạng: thì SRF có dạng:
trong đó:
: là các hệ số hồi quy mẫu
: (Fitted value) là ước điểm của E(Y/Xi)
Khi mẫu chưa được chọn cụ thể thì các ước lượng là biến ngẫu nhiên Chúng có quy luật phân phối xác suất và có tương quan với nhau
Khi mẫu được chọn cụ thể thì là các con số và là các ước lượng điểm của tham số , tương ứng
Trang 311.5 Hồi quy mẫu
1.5.2 Mô hình hồi quy mẫu (Sample Regression Model - SRM):
SRM:
trong đó: gọi là phần dư (Residual)
Phần dư là sai số ngẫu nhiên của mẫu, là ước lượng điểm của các sai số ngẫu nhiên trong tổng thể
Bản chất cũng như nguyên nhân tồn tại của được giải thích giống như sự tồn tại của sai số ngẫu nhiên
Trang 32Phân biệt tổng thể và mẫu
Tổng thể (Population) (Sample) Mẫu
Trang 33Các thuật ngữ cơ bản
Regression analysis Phân tích hồi quy
Dependent variable Biến phụ thuộc
Explanatory variable/ Independent variable Biến giải thích/ biến độc lập
Time series data Số liệu theo thời gian
Cross section data Số liệu chéo
Pooled data Số liệu kết hợp
PRF – Population Regression Function Hàm hồi quy tổng thể
PRM - Population Regression Model Mô hình hồi quy tổng thể
Trang 34Các thuật ngữ cơ bản
Simple regression Hồi quy đơn
Multiple regression Hồi quy bội
Intercept coefficient Hệ số chặn hoặc hệ số tự do
Slope coefficient Hệ số góc
Random error Sai số ngẫu nhiên
SRF – Sample Regression Function Hàm hồi quy mẫu
SRM – Sample Regression Model Mô hình hồi quy mẫu
Estimated regression coefficient Các hệ số hồi quy ước lượng