Thu thập một mẫu thống k gồm cc cặp X, Y , trong đĩ X chỉ lượng thu nhập khả dụng của hộ gia đình đơn vị ngn đồng v Y chỉ lượng chi tiu cho tiu dng của hộ gia đình đĩ đơn vị ngn đồng t
Trang 1MỞ ĐẦU
Kinh tế lượng với thuật ngữ tiếng Anh l “Econometrics” được Gio sư
Kinh tế học người Na Uy, A.K Ragnar Frisch (Nobel kinh tế năm 1969), sử
dụng đầu tin vo khoảng năm 1930 Từ ny được ghp từ hai từ gốc l “Econo”
cĩ nghĩa l kinh tế v “Metrics” cĩ nghĩa l đo lường
Từ đĩ, kinh tế lượng cĩ thể hiểu l “đo lường kinh tế” mặc d ngy nay
phạm vi của kinh tế lượng đ được mở rộng hơn nhiều v người ta đ đưa ra
nhiều định nghĩa khc nhau để giải thích Tuy nhin, phạm vi của gio trình ny
tự giới hạn trong nỗ lực trình by một khía cạnh quan trọng của kinh tế
lượng :
Xác định về thực nghiệm các quy luật kinh tế.
Cc lý thuyết kinh tế thường nu ra cc giả thuyết về chất (định tính) v khi
đĩ, kinh tế lượng cố gắng lượng hĩa cc giả thuyết ny (bằng cch định lượng
cc quan hệ) Chẳng hạn, kinh tế học vi mơ khẳng định rằng khi cc điều kiện
khc khơng thay đổi, nếu giảm gi một loại hng hĩa no đĩ thì sẽ lm tăng lượng
cầu về loại hng hĩa ny v ngược lại Giả thuyết ny cho biết quan hệ giữa gi cả
v lượng cầu l nghịch biến v kinh tế lượng cố gắng lượng hĩa chng, chẳng
hạn cho biết lượng cầu sẽ tăng/giảm bao nhiu khi ta giảm/tăng một đơn vị
gi cả Nói khc đi, kinh tế lượng quan tm đến việc kiểm định về mặt thực
nghiệm cc lý thuyết kinh tế
Để làm điều này, kinh tế lượng sử dụng các số liệu thống kê vê các
phương pháp thống kê tốn để tìm ra bản chất mối quan hệ giữa các đại
lượng
1 Phương php Kinh tế lượng.
Nội dung của phương php kinh tế lượng thường gồm cc bước sau :
Bước 1 Đặt vấn đề cần khảo st của lý thuyết kinh tế lin quan đến giả
thuyết về cc mối quan hệ giữa cc biến kinh tế
Ví dụ, ta khảo st giả thuyết của kinh tế học vĩ mơ cho rằng mức tiu dng
của cc hộ gia đình cĩ quan hệ cng chiều với thu nhập khả dụng của họ
Bước 2 Thiết lập mơ hình tốn học để mơ tả mối quan hệ giữa cc biến
kinh tế khảo st
Chẳng hạn, với biến Y chỉ lượng chi tiu cho tiu dng một hộ gia đình v
biến X chỉ thu nhập khả dụng của hộ gia đình đĩ, ta thnh lập một mơ hình
tuyến tính dạng
Y X ,trong đĩ 1 v 2 l cc tham số cần ước lượng m ta gọi l cc tham số của mơ
hình v l yếu tố ngẫu nhin m nguồn gốc tồn tại của nĩ l do quan hệ giữa cc
biến kinh tế nĩi chung l ngẫu nhin, khơng chính xc
Bước 3 Sử dụng cc số liệu thống k thu thập được để ước lượng cc tham
số của mơ hình
Chẳng hạn, dựa trn mẫu thống k khảo st trn n hộ gia đình, ta được n cặp
số liệu X , Y , với 1 i ni i , trong đĩ X v i Y lần lượt l lượng thuinhập khả dụng v lượng chi tiu cho tiu dng của hộ gia đình thứ i Dng một
phương php thống k tốn, m người ta gọi l phương php hồi quy, nhằm ước
lượng cc tham số 1 v 2
Bước 4 Phn tích kết quả dựa trn giả thuyết kinh tế
Ví dụ, với mơ hình Y 1 2X nu trong bước 2 v với mẫu thống
k trong bước 3 được dng để ước lượng tham số, nếu ước lượng 0 2 1được kiểm định chấp nhận, ta thấy nĩ ph hợp với giả thuyết kinh tế trongbước 1 vì 2 0 cho thấy khi lương thu nhập khả dụng tăng (X tăng) thìlượng chi tiu cho tiu dng tăng (Y tăng) đồng thời 2 1 ph hợp với giảthuyết lượng chi tiu cho tiu dng hộ gia đình khơng vượt qu mức thu nhậpkhả dụng của hộ gia đình đĩ (Y X ) Khi đĩ, ta cĩ thể nĩi rằng mơ hình tốnhọc trong bước 2 l ph hợp về mặt kinh tế Trường hợp mơ hình đ chọnkhơng ph hợp về mặt kinh tế, ta cần trở lại bước 2 để thnh lập một mơ hìnhkhc với mong muốn rằng mơ hình ny sẽ tốt hơn
Bước 5 Khai thc kết quả.
Khi mơ hình nhận được ph hợp với giả thuyết kinh tế, ta cĩ thể dng mơhình ny để :
- Dự bo kết quả
- Kiểm tra hay đề ra chính sch
Ví dụ, với mơ hình Y 1 2X được chấp nhận v với một mứcthu nhập khả dụng X cho trước của một hộ gia đình, ta dự bo lượng chi tiucho tiu dng của hộ gia đình đĩ
Ta minh họa cc bước trn qua ví dụ số cụ thể sau :
Bước 1 Giả thuyết kinh tế : mức chi tiu cho tiu dng của cc hộ gia đình cĩ
quan hệ cng chiều với thu nhập khả dụng của họ
Trang 2Bước 2 Xt mơ hình Y 1 2X , với Y chỉ lượng chi tiu cho tiu
dng v X chỉ lượng thu nhập khả dụng của một hộ gia đình, 1 v 2 l cc
tham số cần ước lượng
Bước 3 Thu thập một mẫu thống k gồm cc cặp X, Y , trong đĩ X chỉ
lượng thu nhập khả dụng của hộ gia đình (đơn vị ngn đồng) v Y chỉ lượng
chi tiu cho tiu dng của hộ gia đình đĩ (đơn vị ngn đồng) trong cng một đơn
vị thời gian, ta cĩ cc số liệu
Biểu diễn cc điểm ny trn trục tọa độ với trục hồnh chỉ thu nhập v trục
tung chỉ chi tiu như trong hình 1
Hình 1
R rng với cng một mức thu nhập khả dụng X như nhau, chi tiu cho tiudng Y l một biến ngẫu nhin lấy nhiều gi trị khc nhau v điều ny giải thích sựtồn tại tham số ngẫu nhin trong mơ hình khảo st sự lin hệ của chi tiu Ytheo thu nhập X Một trong những giải thuật đơn giản để xc định cc tham số1
v 2 l ứng với mỗi gi trị của X, ta thay thế cc gi trị Y tương ứng bằng
gi trị trung bình của nĩ (điểm đnh dấu trong hình 2) v tìm đường thẳng điqua cc điểm ny Chẳng hạn, với gi trị X 80, ta cĩ cc gi trị Y tương ứng l
Trang 3Bước 4 Do hệ số 2 0.4833 thỏa điều kiện 0 2 1 nn kết quả
ny ph hợp với giả thuyết kinh tế trong Bước 1
Bước 5 Ta cĩ thể dng mơ hình nhận được trong Bước 3 để dự bo Chẳng
hạn, nếu biết thu nhập khả dụng của một hộ gia đình l X 300, ta dự đốn
chi tiu cho tiu dng trung bình của hộ gia đình ny l Y 171.3233
Cc bước trn cần được thực hiện tuần tự v mỗi bước cĩ một vai trị khc
nhau trong qu trình phn tích một vấn đề kinh tế Tuy nhin, việc tìm ra bản
chất một vấn đề kinh tế l khơng đơn giản Do đĩ, qu trình nu trn thường
được lặp đi lặp lại nhiều lần cho đến khi ta thu được một mơ hình chấp
nhận được Qu trình phn tích kinh tế lượng như thế cĩ thể biểu diễn bằng sơ
đồ sau
Hình 3Hơn nữa, cần nhấn mạnh rằng thnh cơng của bất kỳ một qu trình phntích kinh tế no cũng đều phụ thuộc vo việc sử dụng cc số liệu thích hợpcũng như phương php sử lý cc số liệu đĩ Cĩ ba loại số liệu : Số liệu theothời gian (chuỗi thời gian), số liệu cho v số liệu hỗn hợp
Số liệu theo thời gian l cc số liệu thu thập tại từng thời điểm nhất định.
Chẳng hạn như số liệu về GDP bình qun của Việt Nam theo cc năm từ 1998– 2006 được cho trong bảng sau :
Bảng 1 : Số liệu theo thời gian
Số liệu cho l số liệu thu thập tại một thời điểm ở nhiều nơi, địa phương,
đơn vị, khc nhau Chẳng hạn như số liệu về GDP bình qun trong năm 2006của cc nước Brunei, Campuchia, Indonesia, Lo, Malaysia, Myanmar,Philippines, Singapore, Thi Lan, Việt Nam được cho như sau
Trang 4Indonesia 1581 Singapore 30162
Bảng 2 : Số liệu cho
Số liệu hỗn hợp l số liệu tổng hợp của hai loại trn, nghĩa l cc số liệu thu
thập tại nhiều thời điểm khc nhau ở nhiều địa phương, đơn vị khc nhau
Chẳng hạn như số liệu về GDP bình qun của cc nước, từ 1998 – 2006
Bảng 3 : Số liệu tổng hợp Nguồn : Tổng hợp bo co IMF v ASEAN
Cc số liệu ny thường l cc số liệu về lượng, nghĩa l chng cĩ thể định lượng
bằng những con số như gi cả, thu nhập, v.v Đối với cc số liệu về chất,
nghĩa l số liệu định tính như nam/nữ, cĩ/chưa cĩ gia đình, nơng thơn / thnh
thị, v.v , người ta thường lượng hĩa cc biến ny bằng cc biến giả (dummy),
chẳng hạn biến X, với X 0 chỉ nam, hay cĩ gia đình v X 1 chỉ nữ, hay
chưa cĩ gia đình, v.v
Ví dụ 1 Số liệu cho trong bảng sau cho biết tiền lương (Y : đơn vị USD)
trong một thng của 49 nhn vin, được so snh bởi giới tính ( D0 : Nữ ,
bỏ sĩt quan st, v.v
2 Đnh gi sơ bộ số liệu thống k.
Khi cĩ cc số liệu thống k, trước hết người ta cĩ thể biểu diễn chng bằng
cc điểm trn một hệ trục tọa độ để cĩ một nhận định sơ bộ gọi l biểu đồ rờirạc (hay biểu đồ phn tn số liệu) Ngồi ra, người ta cịn cĩ thể ước lượng mốiquan hệ giữa chng bằng một số cc tham số thống k
Xt cc bộ số liệu X , Y , i 1, , ni i , của hai biến ngẫu nhin X, Y với
cc trung bình
Trang 5Một cch trực quan, khi X,Y 0, đa số những gi trị của X lớn hơn gi
trị trung bình của nĩ, Xi X 0, đi km với những gi trị của Y lớn hơn gi
trị trung bình của nĩ, Yi Y 0, v ta cĩ thể nĩi rằng X, Y cĩ quan hệ
đồng biến với nhau.
Ngược lại, khi X,Y 0, đa số những gi trị của X lớn hơn gi trị trung
bình của nĩ, Xi X 0, đi km với những gi trị của Y nhỏ hơn gi trị
trung bình của nĩ, Yi Y 0, v ta nĩi X, Y cĩ quan hệ nghịch biến với
X,Y 0
Ngồi ra, khi X v Y cĩ quan hệ tuyến tính với nhau m ta cịn gọi l cĩ hiện
tượng cộng tuyến giữa X v Y, nghĩa l tồn tại 0 sao cho Y X ,thì vì Yi Xi , với mọi i, ta suy ra
tuyến với nhau.
Ví dụ 2 Khảo st mối quan hệ giữa điểm điểm trung bình ở PTTH v Đại
học của 50 học sinh ở một trường đại học của Mỹ ta cĩ bảng số liệu sau :
2.88 3.13 2.34 3.35 3.22 3.33 3.43 3.15 2.86 3.72.15 3.27 3.13 3.61 2.53 3.56 3.22 3.41 2.56 3.5
3.31 4.13 2.92 3.56 3.12 4.05 2.64 3.45 2.34 3.16
Trang 6dng một phần mềm my tính Chẳng hạn với Eview, ta được
Hình 6
Đồ thị trn cho thấy khơng cĩ mối quan hệ tuyến tính giữa DTBDH v
DTBPTTH Trong trường hợp ny người ta cho rằng chng độc lập nhau
Ví dụ 3 Bảng sau cho số liệu về tỷ lệ lạm pht v tỷ lệ thất nghiệp của Mỹ
Hình 7
Đồ thị trn cho thấy khơng cĩ mối quan hệ tuyến tính giữa TLLAMPHAT
v TLTHATNGHIEP Trong trường hợp ny người ta cho rằng chng cĩ quan
hệ phi tuyến với nhau
Tuy nhin ta khơng thể chỉ dựa vo đồ thị phn tn để đnh gi mối hệ giữa cc
bộ số liệu, m ta cịn sử dụng cc cơng cụ của tốn học để đnh gi cc quan hệtrn Chẳng hạn, để đo lường mức độ chặt chẽ của sự tương quan giữa haibiến số ngẫu nhin, độc lập với đơn vị đo lường của cc biến số ngẫu nhin,
người ta dng hệ số tương quan tuyến tính, hay vắn tắt l hệ số tương quan,
X,Y
r , xc định bởi
X,Y X,Y
X Y
r
,trong đĩ X v Y lần lượt l độ lệch chuẩn của X v Y,
Trang 7(ii) 1 r X,Y 1 v rX,Y 0 khi v chỉ khi X,Y 0.
(iii) Nếu X v Y cĩ quan hệ tuyến tính với nhau, nghĩa l Y X, thì
do Y X, 2Y , nghĩa l2 2X
X Y
r 0, nghĩa l rX,Y 1, thì X v Y cĩ quan hệ đồng biến chặt Ngược
lại, nếu rX,Y 0, nghĩa l rX,Y 1, thì X v Y cĩ quan hệ nghịch biến
chặt.
Ví dụ 4 : Ta khảo st dữ liệu về gi vng (GP), chỉ số gi tiu dng (CPI) v chỉ
số chứng khốn trn thị trường chứng khốn NewYork (NYSE) từ năm 1977
Trước hết, ta vẽ đồ thị rời rạc của GP theo CPI v của NYSE theo CPI, tađược
Đồ thị cho thấy khơng cĩ sự tương quan chặt giữa GP v CPI Ngược lại,
cĩ sự tương quan đồng biến chặt giữa NYSE v CPI Bằng cơng cụ thống k,
Trang 8Ví dụ 5 : Người ta khảo st hai lý thuyết khc nhau lin quan đến hnh vi tiu
dng của dn chng :
- Theo Keynes, tổng tiu dng, CONS (Consumption Expenditure), cĩ quan
hệ đồng biến với tổng thu nhập (khả dụng), YD (Disposable Income)
- Trong khi đĩ, cc nh kinh tế học cổ điển tin rằng tiu dng cĩ quan hệ
nghịch biến với li suất, RR (Real Interest Rate), trong nền kinh tế
Bằng cch thu thập số liệu về CONS, YD v RR từ năm 1955 đến năm
1986, người ta cĩ số liệu sau
Hình 10
v hệ số tương quan giữa chng l rCONS,YD 0.998.Tương tự, với CONS v RR, ta cĩ đồ thị rời rạc
Hình 11
Trang 9v hệ số tương quan rCONS,RR 0.348.
Từ đồ thị rời rạc cũng như hệ số tương quan, ta kết luận :
Với mơ hình của Keynes : Giả thuyết CONS đồng biến theo YD l đng.
Khoảng 99% bộ số liệu của CONS v YD khẳng định giả thuyết ny
Với mơ hình kinh tế học cổ điển : Giả thiết CONS nghịch biến theo RR
khơng chính xc Khảng 35% bộ số liệu của CONS v RR cho thấy quan hệ
giữa chng l tuyến tính (nhưng lại l quan hệ đồng biến)
3 Cc ký hiệu chung.
Với X, Y, Z, hay X , 1 X , 2 X , để chỉ cc biến số ngẫu nhin, cc gi3
trị của chng lần lượt được ký hiệu l X , j Y , j Z , hay j X , 1, j X2,j, X3,j
, , trong đĩ chỉ số j chỉ số liệu thứ j của biến tương ứng Đặc biệt đối với
chuỗi thời gian, người ta thường dng chỉ số t thay cho j, nhằm nhấn mạnh
yếu tố thời gian, chẳng hạn Y v t X lần lượt chỉ số liệu của cc biến Y v1,t
1
X tại thời điểm t
Với biến số ngẫu nhin X lấy cc gi trị X , 1 X , , 2 X , trung bìnhn
(mean), hay kỳ vọng (expectation) của biến số ngẫu nhin X, ký hiệu E X ,
X
hay X , xc định bởi
n i
phương sai (variance) của X, ký hiệu hay var(X) , được định nghĩa l2X
kỳ vọng của biến X E(X) 2, nghĩa l
var(X) E X E(X) ,
v căn bậc hai của phương sai, ký hiệu X hay se(X) , được gọi l độ lệch
chuẩn (standard error) của X,
se(X) var(X) Ngồi ra, để tiện ký hiệu cho nhiều trường hợp, với biến số ngẫu nhin X
lấy cc gi trị X , 1 X , , 2 X v cĩ trung bình X , ta định nghĩa biến số ngẫun
nhin x tương ứng bởi
x X X, yi Yi Y, i 1, 2, , n.
Với vectơ ngẫu nhin X, Y lấy cc gi trị X , Y , i 1, 2, , ni i , hiệp
phương sai (covariance), ký hiệu X,Y hay cov(X, Y) , được định nghĩa l
X Y
cov(X, Y)r
MƠ HÌNH HỒI QUY HAI BIẾN
Hồi quy với thuật ngữ tiếng Anh l “Regression” được Francis Galton sửdụng vo năm 1886 trong một cơng trình nghin cứu nổi tiếng của ơng vềchiều cao của những đứa trẻ cĩ cha cao hoặc thấp khơng bình thường sinh
ra Ơng quan st sự phụ thuộc về chiều cao của cc chu trai vo chiều cao chacủa chng Lập đồ thị phn bố, ơng thấy
Với chiều cao cho trước của người cha thì chiều cao của cc chu traitương ứng sẽ nằm trong một khoảng, dao động quanh gi trị trungbình
Chiều cao của cha tăng thì chiều cao trung bình của cc chu traitương ứng cũng tăng
Hơn nữa, ơng cịn nhận thấy rằng chiều cao trung bình của cc chu traicủa nhĩm cĩ cha cao nhỏ hơn chiều cao của cha v chiều cao trung bình của
cc chu trai của nhĩm cĩ cha thấp lớn hơn chiều cao của cha
Trang 10Trong cơng trình nghin cứu của mình, Galton dng cụm từ “regression to
mediocrity”, quy về trung bình, để chỉ xu hướng ny m sau ny người ta gọi l
luật Galton Từ đĩ, vấn đề hồi quy được nhiều người quan tm v hồn thiện,
đồng thời hầu hết cc ứng dụng của phn tích hồi quy đ cĩ nội dung rộng hơn
nhiều
1 Phn tích hồi quy
Phn tích hồi quy nghin cứu mối lin hệ phụ thuộc của một biến, gọi l biến
phụ thuộc hay biến được giải thích, theo một hay nhiều biến khc, gọi l cc
biến độc lập hay biến giải thích.
Chẳng hạn, trong nghin cứu của Galton, biến “chiều cao con” l biến phụ
thuộc, biến “chiều cao cha” l biến độc lập v phn tích hồi quy của Galton
nhằm nghin cứu mối lin hệ giữa hai biến ny
Ta cĩ thể đưa ra rất nhiều ví dụ về sự phụ thuộc của một biến vo một hay
nhiều biến khc Kỹ thuật phn tích hồi quy gip ta nghin cứu mối quan hệ như
vậy giữa cc biến Ta thường ký hiệu
Y chỉ biến phụ thuộc hay biến được giải thích,
i
X chỉ biến độc lập hay biến giải thích thứ i
Phn tích hồi quy giải quyết cc vấn đề sau :
Ước lượng v dự đốn gi trị trung bình của biến phụ thuộc với gi trị đ
cho của biến độc lập
Kiểm định giả thiết về bản chất sự phụ thuộc
Ch ý rằng trong mơ hình hồi quy, biến độc lập l biến khơng ngẫu nhin,
nĩ cĩ gi trị xc định, cịn biến phụ thuộc l biến ngẫu nhin cĩ phn phối xc suất,nghĩa l ứng với mỗi gi trị của biến độc lập, biến phụ thuộc cĩ thể lấy nhiều
gi trị khc nhau nhưng cc gi trị ny tun theo một luật phn phối xc suất xc định,thường l phn phối chuẩn
Chẳng hạn, trong phn tích hồi quy hai biến, ta xt
Y l biến phụ thuộc,
X l biến độc lập,biến độc lập X lấy cc gi trị xc định X , 1 X , , 2 X v ứng với mỗi gi trịncủa X của X, với i 1, 2, , ni , ta cĩ m(i) gi trị tương ứng của Y, Y ,i,1 i,2
Y , , Yi,m(i) trình by trong bảng 1 Như vậy, ứng với một gi trị X1của X, ta cĩ m(1) số liệu tương ứng của Y, ứng với gi trị X của X, ta cĩ2m(2) số liệu tương ứng của Y, , ứng với gi trị X của X, ta cĩ m(n) sốnliệu tương ứng của Y, v do đĩ ta cĩ cả thảy m(1) m(2) m(n) k
Yn,m(n)
i,m(i)YBảng 1Chẳng hạn, với phn tích hồi quy thu nhập/chi tiu giới thiệu trong chương
mở đầu, ta cĩ biến độc lập X chỉ lượng thu nhập khả dụng của một hộ giađình v biến phụ thuộc Y chỉ lượng chi tiu cho tiu dng hộ gia đình đĩ
Trang 11Giả sử ta cĩ cc bộ số liệu X , Yi i, j cho tổng thể, với i 1, 2, , n ,
j 1, 2, , m(i) Ứng với mỗi gi trị của X, X X i, với i 1, 2, , n , ta
cĩ thể cĩ nhiều gi trị của Y tương ứng nn quan hệ của Y theo X khơng l quan
hệ “hm số” Tuy nhin, ứng với mỗi gi trị của X, X X i, ta cĩ duy nhất gitrị trung bình E Y X X i, nn quan hệ ny trở thnh quan hệ hm số
v hm số ny được gọi l hm hồi quy tổng thể, PRF (Population Regression Functions) m trong trường hợp ny, ta cịn gọi l hm hồi quy đơn (hồi quy hai
biến), do nĩ chỉ cĩ một biến độc lập Trường hợp cĩ nhiều hơn một biến độc
lập, ta gọi l hm hồi quy bội.
Trước hết, giả sử PRF l hm tuyến tính
hồi quy; 1 gọi l hệ số tự do hay hệ số chặn, 2 gọi l hệ số gĩc (nĩ cho biết
tỷ lệ thay đổi của Y đối với X)
Tính tuyến tính ở đy đng đối với cả tham số cũng như đối với cc biến.Điều ny khơng đng trong nhiều trường hợp khc, chẳng hạn hm
E Y X X tuyến tính đối với tham số nhưng khơng tuyến tính(phi tuyến) đối với biến Ngược lại, hm E Y X 1 2X tuyến tínhđối với biến nhưng phi tuyến đối với tham số
Ch ý rằng trong phn tích hồi quy tuyến tính, hm hồi quy tổng thể đượchiểu l tuyến tính đối với tham số nhưng khơng nhất thiết tuyến tính theo ccbiến
Ngồi ra, do Y l biến số ngẫu nhin, nn ứng với quan st thứ i trong tổngthể, X X i, gi trị Y Y i tương ứng sai khc với gi trị trung bình
1 2 iX
một đại lượng sai số ngẫu nhin, ký hiệu i Do đĩ, ta cịn viết
Y X , (2.1.2)
trong đĩ l một đại lượng ngẫu nhin v (2.1.2) được gọi l hm hồi quy tổng
thể ngẫu nhin Thơng thường, đại lượng ngẫu nhin được ngầm hiểu v khi
đĩ, hm hồi quy tổng thể (ngẫu nhin) được viết tắt l
Trang 121 2
Y X
2.2 Hm hồi quy mẫu.
Cũng như vấn đề về mẫu v tổng thể trong lý thuyết thống k, chng ta hoặc
khơng cĩ tổng thể, hoặc cĩ nhưng khơng thể nghin cứu được tồn bộ tổng thể
Do đĩ, ta chỉ cĩ thể ước lượng hm hồi quy tổng thể với những thơng tin từ cc
mẫu ngẫu nhin lấy ra từ tổng thể
Hm hồi quy xy dựng trn cơ sở của một mẫu ngẫu nhin được gọi l hm hồi
quy mẫu, SRF (Sample Regression Function), hay hồi quy mẫu.
R rng l với nhiều mẫu khc nhau, ta cĩ nhiều SRF khc nhau Do đĩ, vấn đề
đặt ra l cần ước lượng PRF bằng SRF tốt nhất theo nghĩa l SRF ny cĩ cc tính
chất : tuyến tính, khơng chệch, cĩ độ lệch chuẩn nhỏ nhất
Cụ thể, với hm hồi quy tổng thể tuyến tính, hm hồi quy mẫu cĩ dạng
Y X,trong đĩ Y l ước lượng điểm của E Y X , l ước lượng điểm của ˆ1 v1
Phương php bình phương nhỏ nhất, OLS (Ordinary Least Square), do nh
tốn học Đức Carl Fredrich Gauss đưa ra Với phương php ny, km theo một
vi giả thiết, cc ước lượng thu được cĩ một số tính chất đặc biệt m nhờ đĩ nĩ
trở thnh phương php hồi quy mạnh v phổ biến nhất
3.1 Nội dung phương php OLS.
Giả sử Y 1 2X l PRF cần tìm Ta tìm cch ước lượng nĩ bằng cch
từ một mẫu gồm n quan st X , Y , với i 1, 2, , ni i
Khi đĩ, ứng với mỗi i, sai biệt giữa gi trị chính xc, Y , v gi trị ước lượng,i
sao cho tổng bìnhphương cc phần dư, ni 1 ie2, l nhỏ nhất Ch ý rằng tổng bình phương ccphần dư ny l hm theo hai biến 1 2
ˆ ˆ,
Trang 13 nhận được bằng cc cơng thức trn được gọi l cc ước
lượng bình phương nhỏ nhất của 1 v 2
Ch ý rằng cơng thức (3.1.1) cĩ thể viết lại l (xem phần phụ lục)
trong đĩ X,Y, rX,Y lần lượt l hiệp phương sai, hệ số tương quan của X, Y
v S , X S lần lượt l độ lệch chuẩn (khơng hiệu chỉnh) của X, Y.Y
Ví dụ 1 Bảng sau cho số liệu về li suất ngn hng (Y) v tỷ lệ lạm pht (X)
trong năm 1988 ở 9 nước
Từ hm hồi quy mẫu ny, ta kết luận rằng khi X thay đổi một đơn vị thì Y
thay đổi 1.249407 đơn vị Nĩi khc đi, khi tỷ lệ lạm pht tăng/giảm 1% thì li
r r 0.996637168;
ta suy ra
X,Y 2
3.2 Cc giả thiết của mơ hình.
Để cĩ thể dng cc cơng cụ của thống k tốn nhằm đnh gi chất lượng của
mơ hình hồi quy tuyến tính, ta cần cc giả thiết sau trn biến số X v đại lượngsai số ngẫu nhin ,
Giả thiết 1 Biến giải thích X l biến phi ngẫu nhin, nghĩa l cc gi trị của nĩ
được hồn tồn xc định Giả thiết ny đương nhin được thỏa trong mơ hình hồiquy tuyến tính
Giả thiết 2 Kỳ vọng của sai số ngẫu nhin bằng 0, nghĩa l
E E X X 0 Giả thiết ny cĩ nghĩa l cc yếu tố khơng xuất
Trang 14hiện trong mơ hình, được đại diện bởi đại lượng ngẫu nhin , khơng ảnh
hưởng một cch cĩ hệ thống đến gi trị trung bình của Y
Giả thiết 3 Phương sai của sai số khơng đổi (phương sai thuần nhất),
nghĩa l Var i Var j 2, với mọi i, j Giả thiết ny cĩ nghĩa l cc gi
trị cụ thể của Y tương ứng với cng một gi trị của X đều được phn bố xung
quanh gi trị trung bình của nĩ với cng một mức độ phn tn như nhau
Giả thiết 4 Khơng cĩ tương quan giữa cc sai số, nghĩa l cov( , ) 0 i j ,
với mọi i, j Giả thiết ny cĩ nghĩa l sai số ở số liệu quan st ny khơng ảnh
hưởng gì tới sai số ở số liệu quan st khc
Giả thiết 5 Sai số v biến giải thích khơng cĩ tương quan, nghĩa l
cov( , X) 0 Giả thiết ny l cần thiết vì nĩ cho php tch bạch ảnh hưởng
của X v của cc yếu tố khơng xuất hiện trong mơ hình đến cc gi trị của Y
Giả thiết ny đương nhin được thỏa do X l phi ngẫu nhin
3.3 Tính chất của cc ước lượng bình phương nhỏ nhất.
Với cc giả thiết cho trong 3.2, ta cĩ
3.3.1 Định lý Gauss – Markov Với cc giả thiết 1-5 của mơ hình hồi quy
tuyến tính, cc ước lượng cho bởi phương php OLS l cc ước lượng tuyến
tính, khơng chệch v cĩ phương sai nhỏ nhất trong lớp cc ước lượng tuyến
được xc định một cch duy nhất ứng với mỗi mẫu gồm n cặp
quan st X , Y Ứng với cc mẫu khc nhau, chng cĩ gi trị khc nhau.i i
ii) ˆ1
v 2
ˆ
l cc ước lượng điểm của 1 v 2 v l cc đại lượng ngẫu nhin
với phương sai cho bởi
n 2 i
2
i 1
2 i
i 1
Xˆ
i 1
ˆvar
của nĩ,
2 i
Trang 153.3.3 Tính chất cho hm hồi quy mẫu
Hm hồi quy mẫu ˆ ˆ1 ˆ2
Y X cĩ cc tính chất i) SRF đi qua trung bình mẫu X, Y , nghĩa l
Y X.ii) Gi trị trung bình của Y bằng với gi trị trung bình quan st Y, nghĩa l
ˆ
Y Y iii) Gi trị trung bình của phần dư e bằng 0, nghĩa l e 1nni 1 i e 0.iv) Phần dư e v Y khơng tương quan, nghĩa l n
Trang 164 Hệ số xc định mơ hình.
Gọi TSS (Total Sum of Squares) l tổng bình phương cc sai số giữa gi trị
quan st Y với gi trị trung bình của chng,i
ESS (Explained Sum of Squares) l tổng bình phương cc sai lệch giữa gi
trị của Y tính theo hm hồi quy mẫu với gi trị trung bình,
RSS (Residual Sum of Squares) l tổng bình phương cc sai lệch giữa gi
trị quan st của Y v cc gi trị nhận được từ hm hồi quy mẫu,
TSS đo độ chính xc của số liệu thống k,
ESS đo độ chính xc của hm hồi quy so với trung bình, v
RSS đo độ chính xc của hm hồi quy mẫu so với hm hồi quy tổng thể
Nhận xt rằng
TSS ESS RSS Nếu cc số liệu quan st của Y đều nằm trn SRF thì RSS 0 v
để đo mức độ ph hợp của hm hồi quy
Ta cĩ 0 R 2 v 1 R2 rX,Y2, với rX,Y l hệ số tương quan giữa
X v Y Do đĩ, Khi R2 , ta được đường hồi quy “hồn hảo”, mọi sai lệch của Y (so với1trung bình) đều giải thích được bởi mơ hình hồi quy
Khi R2 , X v Y khơng cĩ quan hệ tuyến tính.0
Cc tham số lin quan đến hệ số xc định mơ hình cịn cĩ thể tính bằng cccơng thức sau :
Trang 17r l hệ số tương quan giữa X v Y Ngồi ra, đẳng thức (3.3.6) cịn được
viết lại thnh (xem phụ lục)
X 2
(so snh với rX,Y2 0.9966371682 0.993285644)
By giờ, trong ứng dụng, người ta nĩi rằng biến X giải thích được trn
99% sự thay đổi của biến Y Nĩi khc đi, sự thay đổi của tỷ lệ lạm pht giải
thích được trn 99% sự thay đổi của li suất ngn hng
Nhìn chung cc kết quả tính tốn trn kh phức tạp khi số liệu quan st lớnhay trong cc mơ hình khc Trn thực tế, người ta thường dng cc phần mềmkinh tế lượng để hỗ trợ cho việc tính tốn Chẳng hạn, với phần mềm Eview(xem phần phụ lục), ta được cc kết quả cho trong bảng sau
Hình 3 : Bảng kết quả hồi quyGiải thích cc kết quả trong bảng
Dependent Variable : Biến phụ thuộc l Y Method : Phương php ước lượng l phương php OLS Date – Time : Ngy giờ thực hiện
Sample : Số liệu mẫu 1 – 9
Included observations : Cở mẫu l 9
Cột Variable : Cc biến giải thích cĩ trong mơ hình (trong đĩ C l biến số
Trang 18Adjusted R – Squared : Hệ số R điều chỉnh 2
S.E of regression : Gi trị ước lượng cho : 1.724951
Sum squared resid : Tổng bình phương cc phần dư ( RSS )
Log likelihood : Tiu chuẩn ước lượng hợp lý
Durbin – Watson stat : Thống k Durbin – Watson
Mean dependent var : Gi trị trung bình của biến phụ thuộc
S.D dependent var : Độ lệch chuẩn của biến phụ thuộc
- Akaike info criterion : Tiu chuẩn Akaike
- Schwarz info criterion : Tiu chuẩn Schwarz
- F – Statistic : Gi trị của thống k F1035.543
- Prob( F – Statistic) : Gi trị p-value của thống k F tương ứng
P(F 1035.543) 0.0000 Với F l biến ngẫu nhin cĩ phn phối Fisher
cĩ bậc tự do (k 1, n k)
5 Phn phối xc suất của cc ước lượng.
Như trình bầy trong phần 2.2 về hm hồi quy mẫu, ứng với mỗi một mẫu
khc nhau, ta nhận được một hm hồi quy mẫu với cc hệ số hồi quy khc nhau
Ví dụ, ta coi như số liệu trong phần 1 về sự tương quan giữa biến X chỉ
lượng thu nhập khả dụng của một hộ gia đình v biến phụ thuộc Y chỉ lượng
chi tiu cho tiu dng hộ gia đình đĩ như l số liệu của tổng thể cần xc định Từ
số liệu tổng thể ny, ta lấy ba mẫu khc nhau:
Trang 19hồi quy tổng thể 1, 2 cũng như hm hồi quy tổng thể (PRF) bằng cc hệ số
hồi quy mẫu cũng như hm hồi quy mẫu (SRF) m cịn phải kiểm tra bản chất
sự biến thin của cc hệ số hồi quy mẫu Ngồi ra, người ta cịn cần thiết phải
khai thc cc thơng tin nhận được từ hm hồi quy mẫu, chẳng hạn như thực
hiện cc dự bo hay kiểm định cc giả thuyết về mơ hình đặt ra Để lm được cc
điều ny, cần thiết phải biết cc phn phối xc suất của ˆ1
1
2ˆ 1 1
5.1 Khoảng tin cậy cho 2.
se tính được từ mẫu nn từ độ tin cậy cho trước, ta suy
ra khoảng tin cậy cho T v từ đĩ suy ra khoảng tin cậy cho 2
5.2 Khoảng tin cậy cho 1.
Tương tự, từ thống k
Trang 20
1 1 1
ta suy ra khoảng tin cậy cho 1 với độ tin cậy cho trước
5.3 Khoảng tin cậy cho 2
Từ thống k
2 2 2
nn với độ tin cậy 0.9, tra bảng phn phối Student với n 9 2 7 độ
tự do, ta được gi trị C 1.895 v suy ra khoảng tin cậy cho 1 v 2 lần
với độ tin cậy 0.9, tra bảng phn phối chi-bình phương với
n 9 2 7 độ tự do, ta được khoảng tin cậy cho l 2 2.167;14.067
số giả thiết lin quan đến cc hệ số hồi quy
ta bc bỏ H, chấp nhận H Đặc biệt, với 2 0
, giả thiết H cĩ nghĩa l “biến độc lập X khơng ảnh
hưởng gì tới biến phụ thuộc Y” Khi đĩ, thống k tương ứng l
2 2
Trang 21
2 2
ˆ1.249407
0.0388se
H, chấp nhận H v ta kết luận rằng tỷ lệ lạm pht cĩ ảnh hưởng đến li suất
ngn hng, với nguy cơ sai lầm 0.05
5.5 So snh 1 với cho trước.1
Dng thống k (5.2) Với nguy cơ sai lầm cho trước, nếu nằm trong1
khoảng tin cậy của 1 với độ tin cậy 1 , ta chấp nhận H Ngược lại,
Dng thống k (5.3) Với nguy cơ sai lầm cho trước, nếu nằm trong20
khoảng tin cậy của với độ tin cậy 2 1 , ta chấp nhận H Ngược
lại, ta bc bỏ H, chấp nhận H
6 Kiểm định sự ph hợp của hm hồi quy Phn tích hồi quy v phn tích
phương sai.
Trong phần ny, ta khảo st việc phn tích hồi quy theo quan điểm của phn
tích phương sai Việc phn tích ny cung cấp cho ta một phương php hữu ích
khc trong việc giải quyết vấn đề phn đốn thống k
2 X
S
2 1
Trang 222 2
Do đĩ, qu trình phn tích phương sai cho php ta đưa ra cc phn đốn thống k
về độ thích hợp của hm hồi quy
Chẳng hạn, với số liệu của ví dụ 1, ta cĩ
Ngồi phương php kiểm định cc hệ số hồi quy bằng khoảng tin cậy, ta cịn
cĩ phương php kiểm định bằng gi trị p – value được thực hiện như sau :
i
Tse
Bước 2 : Tính p value P( T T )0 , trong đĩ TSt(n 2)
Bước 3 : So snh gi trị p – value với mức ý nghĩa cho trước, nếu
p value : Bc bỏ giả thuyết H
Tương tự cho bi tốn kiểm định sự ph hợp của mơ hình, với gi trị
Chẳng hạn như trong ví dụ 1, ta cĩ p–value
P( T 32.17985) 0.0000 0.05
7 Ứng dụng phn tích hồi quy vo dự bo.
Ta cĩ thể dng hm hồi quy mẫu để dự bo gi trị của biến phụ thuộc Y
tương ứng với một gi trị của biến độc lập X Cĩ hai loại dự bo
Dự bo trung bình cĩ điều kiện của Y ứng với X X 0
Dự bo gi trị c biệt của Y ứng với X X 0
Trang 230 0
Ngồi ra, do trong cơng thức của 0 ˆ0
se Y Y , ta thay chưa biết2bằng ˆ2
Từ phn phối ny, ta suy ra ước lượng khoảng cho gi trị ring biệt Y 0
Chẳng hạn, với số liệu của ví dụ 1, ta xt cc vấn đề :
Dự bo mức li suất trung bình nếu tỷ lệ lạm pht l X0 5%
Do đĩ với 0.1, tra bảng phn phối Student với độ tự do
n 9 2 7 , ta được C 1.895 Từ đĩ, suy ra khoảng ước lượng cho
2.975456987 1
9 9 14.809339733.33539492
0
Y 8.9887285 1.895 1.82630636
8 Ví dụ tổng hợp
Ví dụ 2 Số liệu về năng suất (Y, đơn vị tạ/ha) v mức phn bĩn (X, đơn vị
tạ/ha) cho một loại cy trồng tính trn một ha trong 10 năm từ 1988 đến 1997cho trong bảng sau
b) Giải thích ý nghĩa kinh tế của cc hệ số nhận được
c) Tính độ lệch tiu chuẩn của cc ˆ
d) Với mức ý nghĩa 5%, hy cho biết mức phn bĩn cĩ ảnh hưởng đến năngsuất loại cy ny khơng ?
e) Tìm khoảng tin cậy 95% cho cc hệ số hồi quy
f) Tính R v giải thích ý nghĩa kết quả nhận được.2g) Với mức phn bĩn l 20 tạ/ha, hy dự bo gi trị trung bình v gi trị c biệtcủa năng suất với độ tin cậy 95%
Giải a) Trước hết, ta cĩ đồ thị sau
Trang 24Hình 5
Đồ thị trn mơ tả quan hệ giữa “năng suất” Y v “phn bĩn” X v ta thấy cĩ
khả năng quan hệ giữa phn bĩn v sản lượng l cĩ dạng tuyến tính
Để ước lượng hm hồi quy tổng thể E Y X 1 2X, ta xt hm hồi
b) Ý nghĩa của cc hệ số hồi quy.
Về lý thuyết, khi tăng lượng phn bĩn thì năng suất cy trồng sẽ tăng Hệ
số ˆ2
1.66 0
cho thấy kết quả trn ph hợp với lý thuyết Số 1.66 cho
biết nếu tăng thm 1 tạ phn bĩn trn 1 ha, năng suất trung bình sẽ tăng 1.66 tạ
(Hệ số ˆ1
27.125
cho thể diễn tả rằng khi khơng bĩn phn ( X0) thì
năng suất trung bình của loại cy trn l 27.125 tạ/ha)
c) Độ lệch chuẩn của cc hệ số hồi quy.
Phương sai của cc hệ số hồi quy cho bởi cơng thức
d) Mức phn bĩn cĩ ảnh hưởng đến năng suất loại cy ny khơng ?
Để trả lời cu hỏi ny, ta phải kiểm định giả thiết sau
2 2
Trang 25
2 2
ˆ1.659722222
0.101321089se
Do T C, ta bc bỏ H, chấp nhận H , nghĩa l : mức phn bĩn cĩ ảnh
hưởng đến năng suất
e) Khoảng tin cậy cho cc hệ số hồi quy.
Để tìm khoảng tin cậy cho cc hệ số hồi quy 1 v 2, ta dng cc thống k
1 1 1
v do đĩ, khoảng ước lượng cho 2 l 1.43;1.89
Ta cĩ thể giải thích rằng : Nếu tăng thm 1 tạ phn bĩn trn 1 ha, năng suất
trung bình sẽ tăng ít nhất 1.43 tạ v nhiều nhất 1.89 tạ trn 1 ha, với độ tin cậy
Ta nĩi sự biến thin của lượng phn bĩn giải thích được xấp xỉ 97% sự biến
thin của năng suất
g) Dự bo gi trị trung bình v gi trị c biệt khi mức phn bĩn l X0 20
ˆ0 ˆ1 ˆ2 0
Y X 27.125 1.659722222 20 60.31944444 60.32
Từ đĩ, với độ tin cậy 95%, từ bảng phn phối Student với
10 2 8 độ tự do, ta được C 2.306 v ta suy ra ước lượng cho
Trang 262 0 2 X
2 2
10 10 7.589466384
5.913194794 16.545578126
v ta nhận được ước lượng khoảng cho Y l 0 54.42; 66.22
Ví dụ 3 Bảng sau cho số liệu về Gi bn (Y đơn vị : ngn USD / ft ) v2
- Mơ hình hồi quy : Y 52.35091 0.13875X
- Độ lệch chuẩn của cc hệ số hồi quy
Trang 27- Diện tích cĩ ảnh hưởng đến Gi bn khơng? với mức ý nghĩa 5%
Để trả lời cu hỏi ny, ta xt bi toan kiểm định sau
2 2
Ví dụ 4 Bảng sau cho số liệu về thu nhập (X đơn vị nghìn USD / thng) v
chi tiu cho việc chăm sĩc sức khoẻ (Y đơn vị nghìn USD / thng ) của 51 c
a) Hy ước lượng mơ hình hồi quy
b) Tính độ lệch tiu chuẩn của cc
c) Với mức ý nghĩa 5%, hy cho biết thu nhập cĩ ảnh hưởng đến chi tiu
cho sức khoẻ c nhn khơng ?
d) Tính R v giải thích ý nghĩa kết quả nhận được.2
e) Với mức với mức thu nhập X 100 nghìn USD, hy dự bo gi trị
trung bình v gi trị c biệt của chi tiu cho sức khoẻ c nhn, với độ tin cậy 95%
Giải Ta cĩ đồ thị phn tn số liệu
Hình 8
Đồ thị trn mơ tả quan hệ giữa “Chi tiu cho chăm sĩc sức khoẻ” Y v “Thunhập c nhn” X v ta thấy cĩ khả năng quan hệ giữa phn bĩn v sản lượng l cĩdạng tuyến tính
Ta cĩ bảng kết quả hồi quy sau
Hình 9Dựa vo bảng kết quả hồi quy ta cĩ thể trả lời cc cu hỏi sau :
- Mơ hình hồi quy
Y 0.176496 0.141652 X
- Độ lệch tiu chuẩn của cc
Trang 28mơ hình hồi quy trn giải thích được xấp xĩ 98.02% bộ số liệu quan st
Với mức thu nhập X0 100 nghìn USD ta cĩ,
Từ đĩ, với độ tin cậy 95%, từ bảng phn phối Student với
51 2 49 độ tự do, ta được C 1.96 v ta suy ra,
Khoảng ước lượng cho E Y X 100 l : 10.3885;18.2949
Khoảng ước lượng cho gi trị c biệt Y l : 0 9.300606;19.38282
Chương 2
MƠ HÌNH HỒI QUY BỘI
Trong thực tế, một đại lượng thay đổi thường chịu sự tc động của nhiều
hơn một đại lượng Chẳng hạn nhu cầu Y của một loại hng hĩa thường lệ
thuộc vo nhiều yếu tố như thu nhập người tiu dng, gi của hng hĩa đĩ, gi của
hng hĩa thay thế Do đĩ, ta cần tổng qut hĩa mơ hình hồi quy hai biến trình
bầy trong chương 1 cho trường hợp cĩ nhiều hơn hai biến, m ta gọi l hồi quy
bội.
Trước hết, ta xt trường hợp đơn giản nhất của mơ hình hồi quy bội : mơhình hồi quy ba biến Mơ hình ny khảo st một biến phụ thuộc Y theo haibiến độc lập X v 2 X Sau đĩ, mơ hình ny được mở rộng cho trường hợp3tổng qut k biến trong đĩ biến Y phụ thuộc theo cc biến X , 2 X , , 3 X kNhắc lại rằng ta chỉ xt trường hợp mơ hình tuyến tính theo tham số vkhơng nhất thiết phải l tuyến tính theo cc biến
1 Mơ hình hồi quy tuyến tính ba biến.
l hệ số tự do, 2 v 3 l cc hệ số hồi quy ring theo cc biến.
Với tổng thể gồm N bộ gi trị X ; X ; Y , i 1,2, , N2,i 3,i i , trong đĩi
Y sai khc với kỳ vọng cĩ điều kiện một đại lượng sai số ngẫu nhin, ký hiệui
, nghĩa l
Y E Y X X , X X X X
1.2 Cc giả thiết của mơ hình.
Giả thiết 1 Gi trị trung bình cc sai số bằng 0, E X , X2 3 0
Giả thiết 2 Phương sai của cc sai số i l hằng, var , i i 2
Giả thiết 3 Khơng cĩ hiện tượng tự tương quan giữa cc sai số i, nghĩa l
i j
cov , 0, với mọi ij
Giả thiết 4 Khơng cĩ hiện tượng cộng tuyến giữa X v 2 X , nghĩa l3khơng cĩ quan hệ tuyến tính giữa cc biến giải thích
Trang 29Giả thiết 5 Cc sai số i đều cĩ phn phối chuẩn, 2
i N 0;
, i
1.3 Ước lượng tham số.
Để ước lượng tham số của mơ hình
E Y X , X X X ,
người ta dng một mẫu gồm n bộ gi trị X ; X ; Y , i 1,2, ,n2,i 3,i i , để
thnh lập hm hồi quy mẫu, SRF, dạng
l ước lượng điểm của j, với j 1, 2, 3
Khi đĩ, gi trị ước lượng thứ i của SRF sai khc so với gi trị tương ứng của PRF
một đại lượng m ta gọi l phần dư, ký hiệu ei
Y X X e ,nghĩa l
Thế (4) vo (2), (3) v với yi Yi Y, x2,i X2,i X2,
i 2 2,i 3 3,i 3,i 3
Trang 301.4 Phương sai của hệ số hồi quy.
Phương sai v độ lệch chuẩn của ˆ1
2 i
Trang 31ˆvar sẽ lớn v do
8 ˆ2
v 3
ˆ
l cc ước lượng tuyến tính khơng chệch v cĩ phương sai nhỏ
nhất trong lớp cc ước lượng tuyến tính khơng chệch của 2 v 3
Ch ý rằng với cc giả thiết đ nu thì
1.6 Hệ số xc định hồi quy bội.
Trong mơ hình hồi quy hai biến, R đo độ thích hợp của hm hồi quy.2
Nĩ cho ta hình ảnh về tỷ lệ của tồn bộ sự biến đổi của biến phụ thuộc Y dobiến giải thích X gy ra Trong mơ hình hồi quy bội, tỷ lệ của tồn bộ sự khcbiệt của biến Y do tất cả cc biến giải thích X , 2 X gy ra, gọi l hệ số xc3
định hồi quy bội, R , xc định bởi2
n 2 i
n 2 i
i 1
eESS
Ta cĩ 0 R 2 Khi 1 R2 , ta nĩi mơ hình hồi quy giải thích 100% sự1thay đổi của Y Nếu R2 thì mơ hình khơng giải thích sự thay đổi no của0
Y Ngồi ra ta cịn cĩ một tính chất quan trọng của R l nĩ l hm khơng giảm theo2
số biến giải thích cĩ trong mơ hình Dễ thấy rằng ni 1 i y2 ni 1 (Yi Y)2độc lập với số biến nhưng ni 1 i e2 l hm giảm theo số biến ny Do đĩ, nếu tăng
số biến giải thích của mơ hình thì R cũng tăng Vì vậy, khi so snh hai mơ2hình hồi quy cĩ cng biến phụ thuộc nhưng cĩ số biến độc lập khc nhau, ta cầnphải cẩn thận trong việc lựa chọn mơ hình với R cao nhất.2
Để so snh hai số hạng R , ta cần phải tính đến số lượng biến độc lập cĩ2trong mơ hình Cĩ thể thực hiện điều ny dễ dng nếu chng ta xem xt một hệ số
xc định thay thế khc như sau :
n 2 i
n 2 i
trong đĩ k l số cc tham số trong mơ hình bao gồm cả hệ số tự do ( trong mơhình hồi quy ba biến thì k 3 ) R được gọi l 2 R cĩ hiệu chỉnh Thuật2ngữ hiệu chỉnh cĩ nghĩa l hiệu chỉnh theo bậc tự do tương ứng với cc tổng
Trang 32bình phương trong cơng thức định nghĩa của R Số bậc tự do của 2
n 2 i
i 1
y
l n 1 .Giữa R v 2 R cĩ lin quan với nhau Người ta chứng minh được rằng2
i) Khi k 1 thì R2 R2 , nghĩa l số biến cng lớn thì hệ số xc định1
hồi quy đ hiệu chỉnh cng nhỏ hơn hệ số xc định chưa hiệu chỉnh
ii) Mặc d R luơn luơn dương nhưng 2 R cĩ thể m Nếu 2 R m thì khi p2
dụng, ta coi gi trị của nĩ l 0
Trn thực tế, người ta thường dng R hơn cho d rằng chưa cĩ một chứng2
minh chặt chẽ no cho thấy tính ưu việt hơn hẳn của nĩ so với R 2
Người ta dng hệ số xc định hồi quy bội đ hiệu chỉnh để quyết định cĩ nn
đưa thm biến giải thích mới vo mơ hình hay khơng ? Cĩ thể chứng minh
được rằng việc đưa thm biến giải thích l cần thiết chừng no gi trị của R2
cịn tăng ln v hệ số hồi quy của biến được đưa thm vo mơ hình khc 0 l cĩ ý
nghĩa
Để biết được hệ số hồi quy của biến mới đưa thm vo hm hồi quy khc 0 cĩ
ý nghĩa hay khơng, ta cần kiểm định giả thuyết
k k
Cần ch ý rằng, khi dng R để so snh hai mơ hình (d l hệ số cĩ hiệu chỉnh2
hay khơng), cỡ mẫu n v biến phụ thuộc phải giống nhau; cc biến giải thích cĩ
thể cho ở bất cứ dạng no
1.7 Khoảng tin cậy của cc hệ số hồi quy.
Với cc giả thiết về i đ nu thì
j j
j j j
1.9 Kiểm định giả thiết đồng thời
Xt giả thiết đồng thời
H : 0,nghĩa l giả thiết rằng cc hệ số hồi quy 2 v 3 đồng thời bằng 0 Điều ny cĩnghĩa l cả hai biến giải thích đều khơng cĩ ảnh hưởng gì đến biến phụ thuộc
Y Giả thiết ny tương đương với giả thiết
2
H : R 0Nĩi khc đi, cc giả thiết thống k ny tương đương với giả thiết về sự phụthuộc tuyến tính của Y vo hai biến X v 2 X 3
Trang 33Giả thiết ny được kiểm định dựa vo thống k
2 2
Ví dụ 1 Số liệu về doanh thu (Y), chi phí cho quảng co (X ), tiền lương2
của nhn vin tiếp thị (X ) của 12 cơng nhn (đơn vị triệu đồng) cho bởi bảng3
Trang 34Suy ra phương sai, độ lệch chuẩn của ˆ1
được thể hiện trong bảng sau
Hình 1 : Bảng kết quả hồi quy 3 biếnGiải thích kết quả của bảng hồi quy
- Dependent Variable : Biến phụ thuộc l Y
- Method : Phương php ước lượng l phương php OLS
- Date – Time : Ngy giờ thực hiện
- Sample : Số liệu mẫu 1 – 12
- Included observations : Số quan st l 12
- Cột Variable : Cc biến giải thích cĩ trong mơ hình (trong đĩ C l biến số
Trang 35
1 1
- Adjusted R – Squared : Hệ số R điều chỉnh 2
- S.E of regression : Gi trị ước lượng cho : 4.003151
- Sum squared resid : Tổng bình phương cc phần dư ( RSS )
- Log likelihood : Tiu chuẩn ước lượng hợp lý
- Durbin – Watson stat : Gi trị thống k d của Durbin – Watson
- Mean dependent var : Gi trị trung bình của biến phụ thuộc
- S.D dependent var : Độ lệch chuẩn của biến phụ thuộc
- Akaike info criterion : Tiu chuẩn Akaike
- Schwarz info criterion : Tiu chuẩn Schwarz
- F – Statistic : Gi trị của thống k F 1035.543
- Prob( F–Statistic) : Gi trị p-value của thống k F tương ứng
P(F 180.3545) 0.0000 Với F l biến ngẫu nhin cĩ phn phối Fisher
hệ số tự do, j, với j2, 3, , k, l cc hệ số hồi quy ring
Điều ny cĩ nghĩa l tổng thể bao gồm N bộ gi trị
Y , X , X , , Xi 2,i 3,i k,i, với i 1, 2, , N , sao cho
Y X X X ,trong đĩ i l sai số của Y so với kỳ vọng cĩ điều kiệni
2 2,i 3 3,i k k,i
E Y X X , X X , , X X ,
Y X X X ,
với l sai số của Y.
By giờ, từ mẫu quan st, Y , X , X , , Xi 2,i 3,i k,i, với i1, 2, , n,lấy từ tổng thể, ta cĩ
n
YYY
n
n
eee
Trang 36hay ký hiệu dưới dạng ma trận, E ee T 2I.
iii) X , 2 X , , 3 X đ được xc định, nghĩa l ma trận X được hồn tồn xck
định
iv) Khơng cĩ hiện tượng cộng tuyến giữa cc biến giải thích Nĩi khc đi,
hạng của ma trận X bằng k
v) ei N 0; 2, với mọi i
2.3 Ước lượng tham số.
Hm hồi quy mẫu SRF cĩ dạng
k
ˆˆˆ
k
e
ˆe
Trang 37Ví dụ 2 Số liệu quan st của một mẫu cho ở bảng sau Trong đĩ
Y: Lượng hng bn được của một loại hng hĩa (tấn / thng)
2.4 Hệ số xc định hồi quy bội.
Hệ số xc định hồi quy bội R cĩ thể tính bằng một trong hai cơng thức2sau
i) R2 1 RSS ESS
, trong đĩ TSS Y T Y n Y 2; ESS T XTY n Y 2;
r l hệ số tương quan giữa biến Y v biến X j
Trang 382.6 Ma trận hiệp phương sai.
Để kiểm định giả thiết, tìm khoảng tin cậy cũng như thực hiện cc suy
đốn thống k khc, ta cần phải tìm ˆj
var , với j 1, 2, , k v
ˆ ˆi j
cov , Phương php ma trận gip ta cĩ thể thực hiện điều ny
Ma trận hiệp phương sai của ˆ
Trang 39Với số liệu ở ví dụ 2 v sử dụng Eview, ta tìm được cc kết quả sau
Mơ hình hồi quy
Hình 2 : Kết quả hồi quyTrong đĩ
- Dịng Estimation Command : Cho biết lệnh để tìm hm hồi quy (Xem
phụ lục)
- Dịng Estimation Equation : Cho biết dạng phương trình hồi quy, trong
đĩ C(1), C(2), C(3) lần lượt l cc hệ số hồi quy
- Dịng Substituted Coefficients : Cho biết kết quả chi tiết của dạng hm
trn
Ma trận hiệp phương sai
Hình 3 : Ma trận hiệp phương saiKết quả trong bảng trn cho biết gi trị về hiệp phương sai của cc hệ số hồiquy Chẳng hạn như,
Trang 40Do ˆj
cĩ phn phối chuẩn với kỳ vọng j v phương sai j
ˆvar , với
ˆj 2 j, jvar c , j 1, 2, , k ,
Từ đĩ, ta dễ dng suy ra khoảng ước lượng cũng như kiểm định giả thiết
về hệ số hồi quy ring
Đặc biệt, ta cĩ thể kiểm định giả thiết
H : 0.Khi đĩ, nghịch thuyết l H : tồn tại ít nhất một hệ số hồi quy ring khc 0
Dng đại lượng ngẫu nhin
ESS
k 1 RSS
Ta dng
2 2
var Y X X X X v ˆ0 ˆ0
se Y var Y