Bài giảng Kinh tế lượng do Cao Tấn Bình biên soạn trình bày các vấn đề chung về kinh tế lượng, ôn tập về xác suất và thống kê, hồi quy hai biến, mô hình hồi quy tuyến tính bội, giới thiệu một số vấn đề liên quan đến mô hình hồi quy, dự báo với mô hình hồi quy, các mô hình dự báo măng tính thống kê.
Trang 22
1.1 Giới thiệu về môn học kinh tế lượng
Kinh tế lượng có tên tiếng Anh là Econometrics, do nhà kinh tế học người Na uy A K Ragnar Frisch sử dụng lần đầu tiên vào khoảng 1930
Kinh tế lượng là một môn khoa học về đo lường các mối quan hệ kinh tế diễn ra trong thực tế, là sự kết hợp giữa các lý thuyết kinh tế hiện đại, thống kê toán học và máy vi tính nhằm định lượng các mối quan hệ kinh tế, dự báo khả năng phát triển của hiện tượng kinh tế và phân tích các chính sách kinh tế
Nền tảng của kinh tế lượng:
Lý thuyết kinh tế: Nêu lên bản chất các mối quan hệ kinh tế dưới dạng định tính Chẳng hạn mối quan hệ giữa lượng cầu và giá cả, sản lượng và số lượng công nhân, thu nhập và chi tiêu, năng suất cây trồng và lượng phân bón, doanh thu và chi phí quảng cáo, giá nhà và hướng nhà, sự chi tiêu và sự giàu có,…
Mô hình toán kinh tế: Sử dụng công cụ toán học để mô hình hóa lý thuyết kinh tế dưới dạng mô hình toán học, chưa quan tâm đến việc kiểm chứng xem liệu những
mô hình toán học này có đúng đắn về mặt thực nghiệm hay không
Thống kê: Có vai trò quan trọng trong việc thu thập, xử lý số liệu, và những số liệu sơ cấp ban đầu này không thể thiếu cho một nhà kinh tế lượng
Mục đích của kinh tế lượng
Thiết lập mô hình toán học để nêu ra các giả thiết cũng như các giả định về mối quan hệ giữa các biến số kinh tế với nhau
Thực hiện việc ước lượng tham số để xem xét mức độ ảnh hưởng giữa các biến số
Kiểm định giả thuyết
Đưa ra dự báo và mô phỏng hiện tượng kinh tế
Đề xuất giải pháp, chính sách dựa trên kết quả của được phân tích từ mô hình kinh
tế lượng
1.2 Phương pháp luận nghiên cứu của kinh tế lượng
Nêu vấn đề nghiên cứu và các giả thuyết: Nghiên cứu quan hệ giữa thu nhập và tiêu dùng, mức lãi suất thay đổi và cầu về tiền, năng suất lao động với vốn, lao động và khoa học công nghệ,…
Thiết lập mô hình: Dựa vào lý thuyết kinh tế để định dạng các mô hình cụ thể cho các bài toán cụ thể Chẳng hạn, người ta có thể sử dụng hàm tuyến tính để mô tả mối quan hệ giữa thu nhập Y và tiêu dùng X như sau:
Trang 33
Y X
Tuy nhiên trong thực tế, với cùng một mức thu nhập thì chi tiêu tiêu dùng có thể khác nhau Do vậy mô hình toán học thuần túy như trên chưa phản ánh được tình huống kinh tế này Mô hình kinh tế lượng được đề xuất một cách hợp lý với nhiễu ngẫu nhiên U như sau:
Y X U
Thu thập và xử lý số liệu: Quan tâm đến số liệu của mẫu và số liệu của tổng thể
Ước lượng các tham số của mô hình: Sử dụng các phương pháp như phương pháp bình phương tối thiểu OLS (Ordinary Least Squares), phương pháp ước lượng hàm hợp lý tối đa MLE (Maximum Likelihood Estimation),… Chẳng hạn, phương trình mô tả quan hệ giữa tiêu dùng Y và thu nhập X từ chuỗi số liệu của Mỹ giai đoạn 1982-1996 bằng phương pháp OLS là:
ý nghĩa thống kê hay không
Dự báo và sử dụng mô hình để quyết định chính sách: Dựa vào kết quả của mô hình trên, có thể dự báo tác động của chính sách kinh tế Ngoài ra, kết quả hồi quy này có thể giúp ích cho Chính phủ trong việc phân tích chính sách đầu tư, chính sách thuế (giảm thuế -> tăng thu nhập khả dụng -> tăng tiêu dùng -> tăng tổng cầu)
1.3 Số liệu cho nghiên cứu kinh tế lƣợng
Có ba dạng dữ liệu kinh tế có bản: Dữ liệu theo thời gian (Time Series Data), dữ liệu theo không gian (dữ liệu chéo) (Cross Data) và dữ liệu hỗn hợp (dữ liệu bảng) (Panel Data) Nguồn số liệu:
Các cơ quan nhà nước: Tổng cục thống kê, Uỷ ban Nhân dân thành phố,…
Các cơ quan quốc tế: Ngân hàng thế giới (WB), Qũy tiền tệ thế giới (IMF),…
Trang 4 Nhầm lẫn khi quan sát, ghi nhận thông tin
Sai số do dụng cụ đo lường
Sai số khi chọn mẫu không có tính đại diện cao
Mức độ tổng hợp và bảo mật của số liệu sử dụng
Đối tượng cung cấp thông tin thiếu trung thực, không đầy đủ hoặc từ chối trả lời
1.5 Vai trò của máy vi tính và phần mềm chuyên dụng
Hầu hết các bài toán trong kinh tế lượng liên quan đến việc xử lý một khối lượng số liệu rất lớn, do đó cần đến sự trợ giúp của máy vi tính và các chương trình hỗ trợ tính toán, chẳng hạn như: Excel, EVIEWS, SPSS, STATA, R,…
Trang 55
2.1 Mô hình và một số khái niệm
2.1.1 Mô hình hồi quy
Mô hình hồi quy tuyến tính hai biến:
Y X U (2.1.1)
Y: Biến phụ thuộc hay biến được giải thích (explained variable)
X: Biến độc lập hay biến giải thích (explanatory variable)
U: Sai số ngẫu nhiên, giả thiết ( | ) 0E U X
: Hệ số chặn, bằng giá trị trung bình của biến 1 Y khi X = 0
: Hệ số góc, thể hiện quan hệ giữa 2 X và ( | )E Y X
: Khi X tăng (giảm) một đơn vị thì ( | )E Y X tăng (giảm) đơn vị 2
: Khi X tăng (giảm) một đơn vị thì ( | )E Y X giảm (tăng) đơn vị 2
2.1.3 Hàm hồi quy mẫu
Để phản ánh hàm hồi quy tổng thể cho tổng thể, cần xây dựng hàm hồi quy mẫu trên mẫu Nếu hàm hồi quy tổng thể mô tả xu thế biến động về mặt trung bình của biến phụ thuộc theo biến độc lập trong tổng thể, thì hàm hàm hồi quy mẫu là hàm số mô tả xu thế biến động đó nhưng trong mẫu Vì hàm hồi quy mẫu dùng để phản ánh cho hàm hồi quy tổng thể nên phải có dạng giống hàm hồi quy tổng thể
Giả sử ( , ),X Y i i i 1,n là mẫu ngẫu nhiên kích thước n của ( , )X Y Khi đó ta có biểu diễn
dưới đây được gọi là hàm hồi quy mẫu SRF (Sample Regression Function)
1 2
Trang 6 Đường hồi quy mẫu đi qua điểm X Y ,
2.1.4 Tính tuyến tính trong mô hình hồi quy
Tính tuyến tính của mô hình hồi quy được hiểu là tuyến tính theo tham số Dưới đây là một số mô hình hồi quy dạng tuyến tính thường gặp:
Trang 77
2 1
2.2 Phương pháp ước lượng OLS (Ordinary Least Squares)
Xét mô hình hồi quy tổng thể:
Trang 8Chi tiêu (triệu đồng/tháng) 7 8 9 9 10 12 11 13 14 15
Dependent Variable: CHITIEU Method: Least Squares Date: Time: 09:51 Sample: 1 10
Included observations: 10 Variable Coefficient Std Error t-Statistic Prob
THUNHAP 0.673035 0.042320 15.90340 0.0000
R-squared 0.969339 Mean dependent var 10.80000 Adjusted R-squared 0.965506 S.D dependent var 2.658320 S.E of regression 0.493715 Akaike info criterion 1.603140 Sum squared resid 1.950037 Schwarz criterion 1.663657 Log likelihood -6.015701 Hannan-Quinn criter 1.536753 F-statistic 252.9182 Durbin-Watson stat 2.400147 Prob(F-statistic) 0.000000
Ta có kết quả hồi quy Y i 1.848641 0.673035 X i
Ý nghĩa các hệ số ước lượng:
11.848641: Chi tiêu dự định trung bình của mẫu gồm 10 hộ gia đình khi không
có thu nhập
2 0.673035: Khuynh hướng tiêu dùng trung bình bằng 0.673035, có nghĩa là khi thu nhập tăng thêm 1 triệu đồng thì chi tiêu trung bình tăng thêm khoảng 0.673035 triệu đồng
Trang 99
2.3 Tính không chệch và độ chính xác của ước lượng OLS
2.3.1 Các giả thiết của phương pháp OLS
Xét mô hình hồi quy tuyến tính hai biến (2.1.1):
Y X Uthỏa mãn các giả thiết sau đây:
Giả thiết 1: Mô hình được ước lượng trên mẫu ngẫu nhiên
Trang 1010
Định lý: Khi các giả thiết 1, giả thiết 2 và giả thiết 3 được thỏa mãn thì phương sai của
các hệ số ước lượng được xác định bởi
2
2 1
1
n i i n i i
X Var
1
n i i n i i
n i i
Trang 11190.5 0.001790996 0.341184789
n i i n i i
X Var
2.4 Độ phù hợp của hàm hồi quy mẫu
Hàm SRF được gọi là phù hợp tốt với số liệu mẫu quan sát nếu Y i gần Y i
Quan sát hai hình vẽ dưới đây, nhận thấy rằng hàm hồi quy mẫu trong Hình 2.4.1 tốt hơn
so với hàm hồi quy mẫu trong Hình 2.4.2
Trang 12R được gọi là hệ số xác định (Coefficient of determination) của hàm hồi quy
Vì 0R2 nên thường đổi thành tỷ lệ % cho thuận tiện trong phân tích Chẳng hạn, 1khi tính được hệ số xác định bằng 0,8 thì có thể nói rằng mô hình và biến độc lập giải thích được 80% sự biến động của biến phụ thuộc và 20% là do yếu tố ngẫu nhiên khác giải thích
Trang 1313
Nếu R , tức là RSS=TSS2 0 Y i Y i, thì SRP không thích hợp, biến độc lập không giải thích được cho biến phụ thuộc
Trong thực tế rất hiếm khiR hay2 1 R mà chỉ có 2 0 R gần 0 hay gần 1 2
Theo kinh nghiệm, với số liệu chuỗi thời gian thìR 2 0,9 được xem là tốt, với số liệu chéo thì R 2 0,7 được xem là tốt Để xem xét một mô hình tốt hay không ta không nên chỉ căn cứ vào R mà còn dựa trên các yếu tố khác như: dấu của hệ số 2hồi quy, kinh nghiệm thực tế, khả năng dự báo chính xác,…
Đối với hai mô hình hồi quy tuyến tính hai biến, mô hình nào có hệ số xác định lớn hơn sẽ được coi là tốt hơn
2.5 Mô hình hồi quy qua gốc tọa độ
Khi 10, mô hình hồi quy tổng thể (2.1.1)
Y X Utrở thành
2
Y X U (2.5.1)
và được gọi là mô hình hồi quy qua gốc tọa độ
Khi đó, các hàm hồi quy tổng thể, hàm hồi quy mẫu được viết lại như sau:
2
( | )
Trang 142 1
n
i i i n i i
X Y X
n i i
U RSS
R hay có thể âm, không có ý nghĩa Do vậy người ta đưa ra các hệ số mới, chẳng hạn
2
1 2
X Y R
Ví dụ 2.5.1: Trong lý thuyết danh mục đầu tư hiện đại, mô hình định giá tài sản vốn
(CAPM-Capital Asset Pricing Model) có dạng mô hình hồi quy tuyến tính qua gốc tọa độ:
2.6 Đơn vị đo lường trong phân tích hồi quy
Với mô hình hồi quy tổng thể ban đầu
Trang 15m m
, 1 a Y 2a X , 1 Y a Y , Y 2 2
Trang 162.7 Hồi quy với phần mềm Eviews
Dưới sự hỗ trợ của phần mềm Eviews, bài toán về mô hình hồi quy được giải quyết một cách nhanh chóng và gọn nhẹ Từ ví dụ 2.2.1, sử dụng phần mềm Eviews, ta có bảng sau đây:
Dependent Variable: CHITIEU Method: Least Squares Date: Time: 08:27 Sample: 1 10
Included observations: 10 Variable Coefficient Std Error t-Statistic Prob
THUNHAP 0.673035 0.042320 15.90340 0.0000
R-squared 0.969339 Mean dependent var 10.80000 Adjusted R-squared 0.965506 S.D dependent var 2.658320 S.E of regression 0.493715 Akaike info criterion 1.603140 Sum squared resid 1.950037 Schwarz criterion 1.663657 Log likelihood -6.015701 Hannan-Quinn criter 1.536753 F-statistic 252.9182 Durbin-Watson stat 2.400147 Prob(F-statistic) 0.000000
Chú thích cho bảng kết quả như sau:
Dependent Variable: Biến phụ thuộc Y
Method: Least Squares: Sử dụng phương pháp bình phương tối thiểu OLS
Date, Time: Ngày, giờ thực hiện
Sample: Phạm vi của mẫu quan sát
Included observations: Tống số quan sát (cỡ mẫu)
Variable: Danh sách các biến độc lập trong mô hình hồi quy, trong đó C chính là
hệ số 1
Coefficient: Các ước lượng hệ số của mô hình (1 1.848641,2 0.673035)
Std Error: Sai số chuẩn của và 1 (2 Se 1 0.584110,Se 2 0.042320)
t-Statistic: Giá trị (quan sát) của thống kê T
Trang 1717
Prob.: Giá trị p-value của thống kê T
R-squared: Hệ số xác định (hệ số tương quan toàn phần) R2(R 2 0.969339)
Adjusted R-squared: Hệ số xác định đã được hiệu chỉnh 2
R (R 2 0.965506)
S.E of regression: Sai số tiêu chuẩn của hàm hồi quy ( 2 0.493715)
Sum squared resid: Tổng bình phương sai số RSS ( RSS 1.950037)
Log likelihood: Logarit cơ số e của hàm hợp lý
F-statistic: Giá trị thống kê của thống kê F ( F 252.9182)
Prob(F-statistic): P F( F statistic)
Mean dependent var: Trung bình của biến phụ thuộc ( Y 10.80000)
S.D dependent var: Độ lệch chuẩn của biến phụ thuộc
Akaike info criterion: Tiêu chuẩn Akaike
Schwarz criterion: Tiêu chuẩn Schwarz
Hannan-Quinn criter.: Tiêu chuẩn Hannan-Quinn
Durbin-Watson stat: Thống kê Durbin-Watson
Trang 1818
Trong thực tế, các mối quan hệ kinh tế thường phức tạp, một biến số kinh tế có thể chịu
sự tác động của nhiều biến số kinh tế khác nhau Chẳng hạn, khi nghiên cứu nhu cầu về một loại hàng hóa nào đó thì nhu cầu này phụ thuộc đồng thời vào nhiều yếu tố như thu nhập của người tiêu dùng, giá bán của hàng hóa đó, thị hiếu người tiêu dùng,… Do đó cần thiết phải nghiên cứu mô hình hồi quy nhiều hơn hai biến, còn gọi là mô hình hồi quy bội (multiple regression)
3.1 Mô hình hồi quy bội tuyến tính
j, j1,k: Hệ số hồi quy bội
U : Sai số ngẫu nhiên, đại diện cho các yếu tố khác ngoài X có tác động đến j Y
nhưng không được đưa vào mô hình với lý do chúng ta không có quan sát về nó, hoặc không muốn đưa nó vào mô hình, hoặc không thể đưa nó vào mô hình
Các giả thiết cho mô hình (3.1.1):
Giả thiết 1: Mô hình được ước lượng trên mẫu ngẫu nhiên
(X Y ji, ) :i i1, ,n j2,k
Giả thiết 2: Kỳ vọng có điều kiện bằng 0
2( | i, , ki) 0, 1,
Giả thiết 3: Phương sai có điều kiện không đổi
2 2
Var( |U X i, ,X ki) , i 1,n
Trang 1919
Giả thiết 4: Giữa các biến độc lập X j j, 2,k không có mối quan hệ đa cộng tuyến hoàn hảo, có nghĩa là không tồn tại các hằng số j, j2,k không đồng thời bằng không sao cho
Ví dụ 3.1.1: Để xem tác động của các hình thức đầu tư lên GDP, người ta sử dụng hàm
hồi quy bội tuyến tính
GDP GI PI FDI I Uvới GI, DI, FDI, I lần lượt là đầu tư của khu vực nhà nước, đầu tư từ khu vực tư nhân, đầu tư trực tiếp từ nước ngoài và tổng đầu tư
Vì I GI PI FDI GI PI FDI I nên mô hình này vi phạm Giả thiết 4 do 0giữa các biến độc lập GI, DI, FDI, I có quan hệ đa cộng tuyến hoàn hảo
Với Giả thiết 2 được thỏa mãn thì từ mô hình (3.1.1) ta được
Nếu có j nào đó bằng 0, ta nói biến Y không phụ thuộc vào biến độc lập X , có nghĩa j
là biến X không giải thích cho Y Nếu tất cả j j đều bằng 0, ta nói các biến độc lập đều không giải thích cho biến phụ thuộc Y, và hàm hồi quy trong trường hợp này được gọi là không phù hợp Ngược lại, chỉ cần có ít nhất một biến độc lập giải thích cho biến phụ thuộc Y thì hàm hồi quy được gọi là phù hợp
Ví dụ 3.1.2: Giả sử ta có mô hình hồi quy bội về lạm phát như sau
0,01 0,2 0,15
Trong đó LP, m, gdp lần lượt là tỷ lệ lạm phát, mức tăng trưởng cung tiền và mức tăng trưởng GDP (đơn vị %) Khi đó ta có phiên giải từ mô hình trên như sau:
Trang 203.2 Phương pháp ước lượng OLS (Ordinary Least Squares)
Xét mô hình hồi quy tổng thể:
Trang 2121
với
1 1
1
n i i n
i i T
i
n
ki i i
Ví dụ 3.2.1: Có số liệu quan sát của 15 cửa hàng khác nhau thuộc cùng một công ty kinh
doanh cùng loại sản phẩm về lượng hàng bán được Y (tấn/tháng), chi phí quảng cáoX2
(triệu đồng/tháng) và giá bánX3 (ngàn đồng/kg) như sau:
Trang 2222
46.06 3.12 8.013.12 0.22 0.548.01 0.54 1.42
Từ đó có nhận xét về ý nghĩa kinh tế của các tham số hồi quy:
119.87: Khi doanh nghiệp không quảng cáo và ngay cả khi bán giá cực thấp (X 3 0) thì lượng hàng bán được tối thiểu bình quân khoảng 19.87 tấn/tháng
2 0.67 0 : Nếu giữ nguyên giá bán, khi tăng (giảm) mức quảng cáo một triệu đồng/tháng thì sản lượng tiêu thụ tăng (giảm) bình quân khoảng 0.67 tấn/tháng
3 2.25 0 : Nếu giữ nguyên chi phí quảng cáo, khi tăng (giảm) giá bán một ngàn đồng/kg thì sản lượng hàng bán được giảm (tăng) bình quân khoảng 2.25 tấn/tháng
Sử dụng phần mềm Eviews, ta có bảng như sau:
Dependent Variable: Y Method: Least Squares Date: Time:
Sample: 1 15 Included observations: 15 Variable Coefficient Std Error t-Statistic Prob
X2 0.669642 0.187374 3.573835 0.0038 X3 -2.252705 0.473382 -4.758751 0.0005 R-squared 0.983684 Mean dependent var 17.30000 Adjusted R-squared 0.980965 S.D dependent var 2.877251 S.E of regression 0.396969 Akaike info criterion 1.166937 Sum squared resid 1.891008 Schwarz criterion 1.308547 Log likelihood -5.752028 Hannan-Quinn criter 1.165429 F-statistic 361.7403 Durbin-Watson stat 1.755206 Prob(F-statistic) 0.000000
Trang 23n i i
Các sai số chuẩn của j,j1,k là Se j Var j
Từ số liệu của Ví dụ 3.2.1, dễ dàng tính được:
2 2 1
11.5
i
n i
Trang 2424
Sử dụng Eviews, ta được
C 7.25838 -0.49728 -1.26153 X2 -0.49728 0.03510 0.08444 X3 -1.26153 0.08444 0.22409
Định lý Gauss-Markov: Khi các giả thiết 1-4 được thỏa mãn thì các ước lượng thu được
từ phương pháp OLS là các ước lượng tuyến tính, không chệch và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không chệch (tính chất BLUE-Best Linear Unbiased Estimator)
3.3 Độ phù hợp của hàm hồi quy mẫu
Tương tự như hồi quy hai biến, ta có định nghĩa các tổng bình phương độ lệch và hệ số xác định như sau:
Chú ý rằng hệ số xác định trong mô hình hồi quy tuyến tính k biến là một hàm tăng theo
số biến độc lập Thật vậy, TSS không phụ thuộc vào số biến độc lập trong mô hình với bậc tự do là (n-1), RSS là hàm giảm theo số biến độc lập trong mô hình với bậc tự do là
Trang 2525
(n-k), do đó khi số biến độc lập càng tăng thì hệ số xác định càng lớn và mô hình sẽ phức tạp hơn, khó phân tích hơn Ngoài ra, khi số biến độc lập tăng lên sẽ làm tăng mối tương quan giữa các biến độc lập, đồng thời làm giảm bậc tự do của ESS, RSS Do vậy cần cân nhắc cẩn thận trước khi thêm biến độc lập vào mô hình
Với những chú ý trên, người ta điều chỉnh hệ số xác định bằng cách đưa thêm bậc tự do của các tổng bình phương vào công thức để được hệ số xác định hiệu chỉnh R (Adjustted 2
R-Squared) sau đây:
Việc đưa thêm biến độc lập vào mô hình là cần thiết khi trị số của R trong mô hình mới 2
tăng lên, đồng thời hệ số hồi quy của biến độc lập đưa vào khác 0 và có ý nghĩa thống kê Trở lại Ví dụ 3.2.1, sử dụng phần mềm Eviews để kiểm tra sự thay đổi của hệ số xác định trong hai trường hợp: (a) Lượng hàng bán được Y (tấn/tháng) chỉ phụ thuộc vào giá bán (ngàn đồng/kg) X3 (triệu đồng/tháng), (b) Lượng hàng bán được Y (tấn/tháng) phụ thuộc vào cả chi phí quảng cáoX2 (triệu đồng/tháng) và giá bánX3 (ngàn đồng/kg):
Dependent Variable: Y Method: Least Squares Date: Time:
Sample: 1 15 Included observations: 15 Variable Coefficient Std Error t-Statistic Prob
X3 -3.863273 0.200042 -19.31231 0.0000
R-squared 0.966318 Mean dependent var 17.30000 Adjusted R-squared 0.963727 S.D dependent var 2.877251 S.E of regression 0.547984 Akaike info criterion 1.758423 Sum squared resid 3.903718 Schwarz criterion 1.852830 Log likelihood -11.18817 Hannan-Quinn criter 1.757417 F-statistic 372.9654 Durbin-Watson stat 1.411550 Prob(F-statistic) 0.000000
Trường hợp (a)
Trang 2626
Dependent Variable: Y Method: Least Squares Date: Time:
Sample: 1 15 Included observations: 15 Variable Coefficient Std Error t-Statistic Prob
X2 0.669642 0.187374 3.573835 0.0038 X3 -2.252705 0.473382 -4.758751 0.0005 R-squared 0.983684 Mean dependent var 17.30000 Adjusted R-squared 0.980965 S.D dependent var 2.877251 S.E of regression 0.396969 Akaike info criterion 1.166937 Sum squared resid 1.891008 Schwarz criterion 1.308547 Log likelihood -5.752028 Hannan-Quinn criter 1.165429 F-statistic 361.7403 Durbin-Watson stat 1.755206 Prob(F-statistic) 0.000000
3.4 Một số dạng mô hình hồi quy tuyến tính nhiều biến
3.4.1 Mô hình logarit kép (log-log)
Xét mô hình hồi quy mũ (cho từng quan sát ):
Lấy logarit hai vế của (3.4.1.1), ta được
1 2
lnY ln lnX U (3.4.1.2) Đặt *
Trang 2727
gọi là mô hình log-log hay logarit kép Đây là mô hình tuyến tính theo các tham số *
1
và 2
nên có thể ước lượng chúng bằng phương pháp OLS
Mộ cách tổng quát, mô hình hồi quy dạng logarit kép có dạng như sau:
lnY lnX klnX k U
Với mỗi j2,3, ,k, ta có j
j j
Y Y dX X
, có nghĩa là nếu X tăng (giảm) 1% và các yếu tố j
khác trong mô hình không đổi thì trung bình Y tăng (giảm) j%, và j được gọi là hệ
số co giãn của Y theo X j
Ví dụ 3.4.1.1: Chẳng hạn có hàm cầu về thịt lợn như sau
lnQ1.5 0.6ln P U Khi đó hệ số co giãn về nhu cầu thịt lợn theo giá là -0.6, điều này có nghĩa là khi giá thịt lợn tăng 1% thì cầu trung bình về thịt lợn giảm 0.6%
3.4.2 Mô hình bán logarit
Trang 2828
Trong thực tế, có những trường hợp mô hình logarit kép không còn phù hợp, chẳng hạn quan hệ giữa tiền lương và số năm kinh nghiệm của người lao động, hoặc tiền lương và trình độ học vấn,…Khi đó người ta có thể sử dụng các mô hình bán logarit dưới đây:
Mô hình log-lin
Dạng mô hình:
1 2
lnY X U (3.4.2.1) Trong mô hình này, hệ số 2 được giải thích như sau: Khi X tăng 1 đơn vị thì Y trung bình tăng 2%
Trong nghiên cứu thực nghiệm, mô hình log-lin thích hợp với những tình huống như khảo sát tốc độ tăng trưởng hay giảm sút của các biến kinh tế tầm vĩ mô như: Dân số, lượng lao động, GDP, GNP, lượng cung tiền, năng suất, thâm hụt thương mại,…
Chú ý thêm rằng mô hình log-lin chỉ thích hợp nếu số liệu chuỗi thời gian là dừng
Ví dụ 3.4.2.1: Giả sử quan hệ giữa thu nhập (TN) và trình độ học vấn (Ed) là
lnTN2.5 5.6 Ed U Khi đó ta có thể nói rằng cứ thêm mỗi năm đi học, mức thu nhập trung bình tăng 5.6%
Ví dụ 3.4.2.2: Từ công thức tính lãi gộp
0(1 )t t
Lấy logarit hai vế
0
lnY t lnY tln(1r)Đặt 1 ln ,Y0 2 ln(1r) Hơn nữa, nếu có thêm yếu tố ngẫu nhiên vào, ta được mô hình log-lin là
Trang 2929
Trong mô hình này, hệ số 2 được giải thích như sau: Khi X tăng 1% thì Y trung bình tăng 2 đơn vị
Trong nghiên cứu thực nghiệm, ta có thể vận dụng mô hình này để khảo sát một số quan
hệ như: lượng cung tiền ảnh hưởng tới GDP, diện tích trồng trọt tác động tới sản lượng cây trồng, diện tích sử dụng của căn nhà tác động tới giá nhà,…
Ví dụ 3.4.2.3: Có mô hình lin-log về quan hệ giữa số giờ mà người lao động muốn làm
(L) và mức trả cho một giờ lao động (TL) như sau:
7 0.6ln
Kết quả trên cho thấy rằng khi mức trả cho một giờ lao động tăng 1% thì người lao động
sẽ vui lòng làm thêm 0.6 giờ
Việc sử dụng mô hình dạng logarit có ưu thế là kết quả của ước lượng không phụ thuộc vào đơn vị đo của các biến số Tuy nhiên, với những biến số mang cả giá trị
âm (lợi nhuận công ty, lợi nhuận cổ phiếu) thì việc lấy logarit một cách trực tiếp là không thực hiện được
3.4.3 Mô hình nghịch đảo
Dạng mô hình:
1 2
1
Khi biến độc lập X tăng ra vô hạn thì 1
X dần về 0, và khi đó biến phụ thuộc Y sẽ
dần về 1, gọi là tiệm cận ngang
Trang 30 Quan hệ giữa tỷ lệ thay đổi tiền lương Y và tỷ lệ thất nghiệp X biểu diễn bằng đường cong Phillips: Khi tỷ lệ thất nghiệp tăng nhưng vẫn ở dưới mức tỷ lệ thất nghiệp tự nhiên U thì tiền lương tăng (Y>0) nhưng mức tăng lương có khuynh N
hướng giảm dần Khi tỷ lệ thất nghiệp tăng vượt quá mức tỷ lệ thất nghiệp tự nhiên U thì tiền lương sẽ giảm (Y<0) nhưng mức giảm của tiền lương có khuynh N
hướng tăng dần, và tỷ lệ giảm sút tiền lương không vượt quá 1
% thay đổi tiền lương Y
1 0, 2 0
N U
Trang 3131
Quan hệ chi tiêu của người tiêu dùng đối với một loại hàng Y với tổng chi tiêu hay tổng thu nhập X biểu diễn bằng đường cong Engel: Lý thuyết kinh tế khẳng định rằng chi tiêu hàng hóa tăng khi thu nhập hoặc tổng chi tiêu tăng Tuy nhiên, đối với một số loại hàng hóa thì thu nhập của người tiêu dùng phải đạt ở mức tối thiểu
mà ta gọi là thu nhập tới hạn hay ngưỡng thu nhập thì người tiêu dùng mới sử dụng loại hàng này Mặt khác nhu cầu về loại hàng này là hữu hạn, ta xác định mức tiêu dùng bảo hòa của loại hàng này lập độc lập1
Chi tiêu của một loại hàng Y
Y X X X U (3.4.4.1) Đây là mô hình tuyến tính theo các tham số j nên nó được ước lượng bằng phương pháp OLS Mô hình hồi quy dạng đa thức thường được dùng để nghiên cứu hàm chi phí hoặc tiền lương
3.4.5 Ví dụ
Ví dụ 3.4.5.1: Để tìm hiểu giá bán thịt lợn (ngàn) và giá bán thịt gà (ngàn) có ảnh hưởng
lên mức tiêu thụ thịt lợn hay không (kg/ngày), người ta khảo sát về mức tiêu thụ thịt lợn bình quân một ngày tại một siêu thị như sau:
Giá thị lợn Giá thịt gà Thịt lợn tiêu thụ
Trang 32GIATHITLON -5.174643 1.989065 -2.601546 0.0287 GIATHITGA 6.969852 2.480846 2.809466 0.0204
R-squared 0.983099 Mean dependent var 994.9167 Adjusted R-squared 0.979344 S.D dependent var 145.5125 S.E of regression 20.91355 Akaike info criterion 9.130989 Sum squared resid 3936.388 Schwarz criterion 9.252216 Log likelihood -51.78594 Hannan-Quinn criter 9.086107 F-statistic 261.7614 Durbin-Watson stat 0.999101 Prob(F-statistic) 0.000000
LOGX1 -213.3038 89.26039 -2.389680 0.0406 LOGX2 618.5673 116.0147 5.331799 0.0005
C -707.8697 849.9657 -0.832822 0.4265 R-squared 0.984665 Mean dependent var 994.9167
Trang 3333
Adjusted R-squared 0.981257 S.D dependent var 145.5125 S.E of regression 19.92154 Akaike info criterion 9.033798 Sum squared resid 3571.810 Schwarz criterion 9.155025 Log likelihood -51.20279 Hannan-Quinn criter 8.988916 F-statistic 288.9389 Durbin-Watson stat 1.227190 Prob(F-statistic) 0.000000
+ Mô hình log-log:
Dependent Variable: LOGY Method: Least Squares Date: Time:
Sample: 1 12 Included observations: 12 Variable Coefficient Std Error t-Statistic Prob
LOGX1 -0.111773 0.118087 -0.946533 0.3686 LOGX2 0.768074 0.153482 5.004325 0.0007
R-squared 0.974658 Mean dependent var 6.892549 Adjusted R-squared 0.969027 S.D dependent var 0.149752 S.E of regression 0.026355 Akaike info criterion -4.221979 Sum squared resid 0.006251 Schwarz criterion -4.100753 Log likelihood 28.33188 Hannan-Quinn criter -4.266862 F-statistic 173.0717 Durbin-Watson stat 1.072395 Prob(F-statistic) 0.000000
Trang 3434
4.1 Quy luật phân phối xác suất của một số thống kê mẫu
Xét mô hình hồi quy tuyến tính:
Giả thiết 5: Sai số ngẫu nhiên tuân theo quy luật chuẩn, tức là U i N0,2
Khi giả thiết 1-5 thỏa mãn thì phương pháp OLS là phương pháp ước lượng tốt nhất (BLUE) cho mô hình hồi quy (4.1.1)
Định lý: Khi các giả thiết 1-5 được thỏa mãn, các tính chất sau đây đúng
với a, b không đồng thời bằng 0
4.2 Khoảng tin cậy cho các hệ số hồi quy
4.2.1 Khoảng tin cậy cho một hệ số hồi quy
Trang 3535
Thừa hưởng kết quả của môn học Lý thuyết xác suất và thống kê toán, với độ tin cậy
1 cho trước, ta có các khoảng tin cậy của j như sau:
Khoảng tin cậy đối xứng:
Ý nghĩa: với độ tin cậy 1 , khi biến X tăng 1 đơn vị và các yếu tố khác không j
đổi thì trung bình của biến Ytăng trong khoảng này
Khoảng tin cậy trên trái:
Ví dụ 4.2.1.1: Giả sử có số liệu về doanh số bán hàng Y (triệu đồng/tháng), chi phí chào
hàng X2(triệu đồng/tháng) và chi phí quảng cáo X3(triệu đồng/tháng) tại 12 doanh nghiệp của một công ty như sau:
Quan sát Doanh số bán hàng Chi phí chào hàng Chi phí quảng cáo
Trang 36Included observations: 12 Variable Coefficient Std Error t-Statistic Prob
CHIPHIQUANGCAO 2.571877 0.395324 6.505743 0.0001 CHIPHICHAOHANG 4.554520 0.479784 9.492861 0.0000
R-squared 0.962815 Mean dependent var 1413.917 Adjusted R-squared 0.954552 S.D dependent var 232.4824 S.E of regression 49.56187 Akaike info criterion 10.85664 Sum squared resid 22107.41 Schwarz criterion 10.97787 Log likelihood -62.13983 Hannan-Quinn criter 10.81176 F-statistic 116.5173 Durbin-Watson stat 2.307457 Prob(F-statistic) 0.000000
Hàm hồi quy mẫu:
+ Ý nghĩa kinh tế của các hệ số hồi quy:
2 4.554520 0, 32.571877 0 : Cho biết biến DOANHSOBANHANG đồng biến với các biến CHIPHIQUANGCAO và CHIPHICHAOHANG
1333.1426: Cho biết khi doanh nghiệp không chào hàng và thực hiện quảng cáo (X2 X3 0) thì doanh số bán hàng bình quân của một doanh nghiệp là 333.1426 triệu đồng/tháng
2 4.554520: Cho biết khi chi phí quảng cáo không đổi, doanh số bán hàng bình quân của một doanh nghiệp sẽ tăng (giảm) 4.554520 triệu đồng/tháng nếu chi phí chào hàng tăng (giảm) 1 triệu đồng/tháng
Trang 3737
3 2.571877: Khi chi phí chào hàng không đổi, doanh số bán hàng bình quân của một doanh nghiệp sẽ tăng (giảm) 2.571877nếu chi phí quảng cáo tăng (giảm) 1 triệu đồng/tháng
Khoảng tin cậy cho các hệ số hồi quy:
Với độ tin cậy 1 95%, ta có 0.05, / 2 0.025 và ( ) (12 3) (9)
Ý nghĩa kinh tế: Khi chi phí quảng cáo không đổi, doanh số bán hàng bình quân
của một cửa hàng tăng trong khoảng từ 3.469 đến 5.640 triệu đồng khi chi phí chào hàng tăng 1 triệu đồng/tháng
Khoảng tin cậy cho 3:
2.571877 0.395324 2.262 3 2.571877 0.395324 2.262
Hay
3
(1.677654112 3.466099888)
Ý nghĩa kinh tế: Khi chi phí chào hàng không đổi, doanh số bán hàng bình quân
của một cửa hàng tăng trong khoảng từ 1.678 đến 3.466 triệu đồng khi chi phí quảng cáo tăng 1 triệu đồng/tháng
4.2.2 Khoảng tin cậy cho biểu thức của hai hệ số hồi quy
Trong nhiều tình huống, ta muốn biết tác động đồng thời hai biến độc lập lên biến phụ thuộc, chẳng hạn như doanh nghiệp muốn biết sự gia tăng trong sản lượng đầu ra khi mua thêm 1 máy sản xuất và thuê thêm 5 lao động để vận hành máy này Khi đó chúng ta cần xây dựng khoảng tin cậy cho tác động tổng hợp của hai biến số
Trang 3838
Với mô hình (4.1.1), giả sử X2 và X3 cùng tăng (giảm) 1 đơn vị, khi đó giá trị trung bình của Y tăng (giảm) 23 đơn vị, do đó để ước lượng mức tăng của trung bình của
Y ta cần xây dựng khoảng tin cậy cho 23
Với độ tin cậy 1 cho trước, khoảng tin cậy cho 23 là:
2 3 Se 2 3 tn k/ 2 , 2 3 Se 2 3 tn k/ 2
Với a, b là là hai số thực bất kỳ, khoảng tin cậy cho mức tăng của trung bình của
Y khi X2 tăng a đơn vị và X3 tăng b đơn vị là:
a b Se a b t a b Se a b t với
Ví dụ 4.2.2.1: Cũng với số liệu trong ví dụ 4.2.1.1, khi chi phí chào hàng giảm 2 triệu
đồng và chi phí quảng cáo tăng 7 triệu đồng thì doanh số bán hàng bình quân thay đổi như thế nào với độ tin cậy 95%?
Để trả lời cho câu hỏi trên, ta cần tìm khoảng tin cậy cho hệ số 2273 sau đây:
Trang 3939
Có nghĩa là với độ tin cậy 95%, doanh số bán hàng bình quân của một cửa hàng tăng lên trong khoảng từ 1.415 đến 16.374 triệu đồng khi chi phí quảng cáo tăng 7 triệu đồng và chi phí chào hàng giảm 2 triệu đồng/tháng
4.2.3 Khoảng tin cậy của phương sai nhiễu (sai số ngẫu nhiên)
Với giả thiết U i N0,2, ta có
Với độ tin cậy 1 , ta có các khoảng tin cậy của phương sai như sau:
Khoảng tin cậy hai phía:
Với 2 là ước lượng điểm của 2-phương sai của sai số ngẫu nhiên U
Ví dụ 4.2.3.1: Từ kết quả hồi quy trong ví dụ 4.2.1.1, ta được
Trang 4040
4.2.4 Ý nghĩa của khoảng tin cậy
Với độ tin cậy 1.100 %, khoảng tin cậy của j được hiểu như sau: Nếu lấy nhiều lần các mẫu một cách ngẫu nhiên từ cùng một tổng thể thì có khoảng 1.100 % số khoảng tin cậy được xây dựng từ các mẫu này có chứa j Trong thực tế phân tích hồi quy, thường chỉ lấy một mẫu duy nhất và thu được một khoảng tin cậy cụ thể tương ứng,
ta hy vọng rằng khoảng tin cậy này nằm trong số 1.100 % khoảng tin cậy có chứa
j
Khi độ tin cậy 1 càng lớn thì xác suất để mẫu được chọn có khoảng tin cậy tương ứng chứa j càng lớn, tuy nhiên đổi lại là độ chính xác càng giảm Khi độ tin cậy 100% , tức 0
, thì khoảng tin cậy là , và nó không có giá trị thông tin nào cả Trong ,
và trở nên không đáng kể khi kích thước mẫu khá lớn Ngoài ra, mối tương quan tuyến tính giữa X và các biến độc lập còn lại trong mô hình được đo bởi j 2
4.3 Kiểm định giả thuyết thống kê về hệ số hồi quy
Việc kiểm định các giả thuyết liên quan tới mức độ tác động của biến độc lập lên biến phụ thuộc trong mô hình hồi quy cũng là bài toán thường được quan tâm trong phân tích hồi quy Chẳng hạn liệu chi phí quảng cáo có giúp tăng lợi nhuận hay không, số năm kinh nghiệm có ảnh hưởng đến năng suất lao động hay không,…
4.3.1 Kiểm định giả thuyết một hệ số hồi quy
Xét mô hình hồi quy:
Y X X U (4.3.1.1)