th phân gi i này cho th y các giá tr trung bình có đi u... thì không tuy n tính... các m u khác nhau chúng có giá tr khác nhau.
Trang 1TR NG I H C TH Y L I
Khoa Kinh t và Qu n lý
(Biên so n l n th nh t cho l p cao h c kinh t TN & MT 17K)
Ti n s Kinh t Nguy n Th Hòa
Hà N i -2009
Trang 2M c l c
Ch ng 1: B n ch t c a phân tích h i qui
1.1 S di n gi i hi n đ i v khái ni m h i qui
Ch ng 2: Mô hình h i qui hai bi n
ph ng sai: Ki m đ nh F
Ch ng 3: Mô hình h i qui nhi u bi n
3.1 Mô hình h i quy ba bi n
3.2 Các gi thi t c a mô hình
Trang 33.5 Các tính ch t c a c l ng bình ph ng bé nh t
R
Trang 4Ch ng 1
B n ch t c a phân tích h i qui
1.1 S di n gi i hi n đ i v khái ni m h i qui
Có nhi u khái ni m nói v kinh t l ng Nh ng có th đ nh ngh a kinh t
l ng nh m t môn khoa h c xã h i trong đó các công c c a lý thuy t kinh t , toán,
Các lý thuy t kinh t th ng đ a ra các m nh đ hay các gi thuy t mà h u h t
ch nói v ch t Ví d , lý thuy t kinh t vi mô kh ng đ nh r ng khi các y u t khác không thay đ i, n u gi m giá c a hàng hoá nào đó thì l ng c u c a hàng hoá đó s
t ng Nh v y, lý thuy t kinh t đ a ra m t m nh đ v m i quan h ngh ch bi n
gi a giá và l ng c u c a m t hàng hoá Nh ng chính lý thuy t này l i không đ a ra
m t s đánh giá l ng hóa nào v m i quan h đó gi a hai bi n; t c là nó không nói
đ c l ng c u m t hàng hóa s t ng ho c gi m bao nhiêu khi giá c a nó thay đ i
d i d ng mà chính chúng có th dùng đ ki m đ nh th c nghi m Và s chuy n đ i mang tính toán h c này thành các ph ng trình kinh t l ng đòi h i r t l n s khéo léo và k n ng th c hành
Th ng k kinh t ch y u quan tâm t i vi c thu th p, x lý, và trình bày s li u
d i d ng s đ và b ng bi u ó là công vi c c a các nhà th ng kê kinh t H ch u
li u đ c thu th p này l i là s li u thô cho nghiên c u kinh t l ng
Các s li u kinh t không ph i đ c t o ra t các cu c thí nghi m có ki m soát Các nhà kinh t l ng gi ng nh các nhà thiên v n h c ph thu c vào s li u mà
Trang 5chúng không th đ c ki m soát tr c ti p S li u này ch a sai s c a phép đo Kinh
t l ng s d ng các công c , ph ng pháp c a th ng kê toán đ tìm ra b n ch t c a các s li u th ng kê
phân tích h i qui nhi u bi n là nghiên c u m i liên h ph thu c có tính th ng kê
c a m t bi n ng u nhiên v i nhi u bi n gi i thích khác
M c tiêu c a phân tích h i qui là đi c l ng và d báo giá tr trung bình c a
bi n ph thu c Y , d a trên các giá tr đã bi t c a bi n gi i thích ; t c là tr c h t đi tìm hàm k v ng có đi u ki n c a bi n ph thu c v i các giá tr đã bi t c a bi n gi i thích d i d ng E (Y/Xi) = f(Xi) T ng giá tr riêng c a bi n ph thu c Yi s bi n
đ ng xung quanh E (Y/Xi) và l ch g i giá tr trung bình có đi u ki n này m t l ng
trai khi bi t chi u cao c a b chúng Trong hình 1.1 là đ th phân r i cho bi t phân
b chi u cao c a nh ng bé trai trong m t t p dân s t ng ng v i các giá tr cho
tr c v chi u cao c a b chúng L u ý r ng ng v i chi u cao cho tr c c a m t
ng i b , có m t kho ng (phân b ) chi u cao c a nh ng bé trai Tuy nhiên, c ng l u
ý chi u cao trung bình c a nh ng bé trai t ng lên khi chi u cao c a b chúng t ng lên th y rõ đi u này, chúng ta v xuyên qua đ th phân r i m t đ ng th ng minh h a chi u cao trung bình c a nh ng bé trai t ng lên nh th nào cùng v i s
Hãy xét đ th phân r i trong hình 1.2, nó cho bi t phân b v chi u cao c a
nh ng bé trai trong m t t p dân s theo nh ng đ tu i c đ nh L u ý r ng, ng v i
Trang 6m i đ tu i cho tr c chúng ta có m t kho ng các chi u cao Rõ ràng không ph i t t
c nh ng bé trai trong cùng m t đ tu i cho tr c thì có cùng chi u cao Nh ng chi u cao trung bình t ng lên theo đ tu i Nh v y, n u bi t đ tu i thì chúng ta có
th đoán đ c chi u cao trung bình t ng ng v i đ tu i đó
Hình 1.1 Phân ph i gi thuy t v chi u cao c a con trai t ng ng v i chi u cao
cho tr c c a b
Hình 1.2 Phân ph i gi thuy t v chi u cao t ng ng v i l a tu i
Trang 7Quay sang ví d v kinh t , m t nhà kinh t có th quan tâm nghiên c u v s
ph thu c c a chi tiêu cá nhân vào thu nh p kh d ng cá nhân sau thu M t phân tích nh v y có th giúp cho vi c c l ng khuynh h ng tiêu dùng biên (MPC),
t c là s thay đ i trung bình v chi tiêu cho tiêu dùng khi thay đ i m t đô la thu
nh p th c
M t nhà đ c quy n có th c đ nh giá hay s n l ng (nh ng không ph i c hai) mu n khám phá xem ph n ng c a c u v m t s n ph m thay đ i theo giá M t thí nghi m nh v y có th t o đi u ki n đ c l ng đ co giãn c a c u theo giá
c a s n ph m đó và giúp xác đ nh m c giá có kh n ng mang l i l i nhu n l n nh t
M t nhà kinh t lao đ ng có th mu n nghiên c u t l thay đ i m c l ng danh ngh a có quan h v i t l th t nghi p S li u l ch s đ c cho đ th phân r i trong hình 1.3 là m t ví d v đ ng cong Philip n i ti ng thi t l p m i quan h gi a
s thay đ i ti n l ng danh ngh a và t l th t nghi p M t đ th phân r i nh v y có
th giúp nhà kinh t lao đ ng d đoán s thay đ i trung bình v m c l ng danh ngh a d a vào m t t l th t nghi p nh t đ nh Nh ng ki n th c nh v y có th giúp
kh ng đ nh m t đi u gì đó v quá trình l m phát trong m t n n kinh t , vì t ng m c
l ng danh ngh a có kh n ng ph n ánh s t ng giá
Hình 1.3 ng cong Philip gi thuy t
m c làm phát càng cao thì t l thu nh p mà m i ng i mu n gi l i d i d ng ti n
Trang 8m t k càng th p, nh minh h a trong hình 1.4 M t phân tích l ng hóa v m i quan
h này s t o kh n ng cho nhà kinh t v ti n t d đoán l ng ti n m t, nh là môt
t l thu nh p c a h , mà m i ng i mu n gi l i t i các m c l m phát khác nhau
Giám đ c marketing c a m t công ty mu n bi t c u v s n ph m c a công ty
có m i quan h nh th nào v i v i chi tiêu cho qu ng cáo M t nghiên c u nh v y
s giúp ích r t nhi u cho vi c tìm ra đ co giãn c a c u theo chi tiêu cho qu ng cáo,
t c là s ph n tr m thay đ i v c u ph n ng l i khi thay đ i m t ph n tr m trong ngân sách qu ng cáo Ki n th c này r t h u ích trong vi c xác đ nh ngân sách chi cho qu ng cáo t i u
Giám đ c marketing c a m t công ty mu n bi t c u v s n ph m c a công ty
có m i quan h nh th nào v i v i chi tiêu cho qu ng cáo M t nghiên c u nh v y
s giúp ích r t nhi u cho vi c tìm ra đ co giãn c a c u theo chi tiêu cho qu ng cáo,
t c là s ph n tr m thay đ i v c u ph n ng l i khi thay đ i m t ph n tr m trong
cho qu ng cáo t i u
Hình 1.4 T l gi ti n m t trong thu nh p có quan h v i t l l m phát
M t nhà kinh t nông nghi p có th quan tâm nhiên c u s ph thu c c a s n
l ng lúa vào nhi t đ , l ng m a, l ng ánh sáng m t tr i, và phân bón Vi c phân tích nh v y có th t o đi u ki n đ d báo v thu ho ch lúa trung bình d a trên thông tin c a các bi n gi i thích
Trang 9B n đ c có th đ a ra nhi u ví d nh v y v s ph thu c c a m t bi n vào
m t hay nhi u bi n Ph ng pháp phân tích h i qui bàn t i đây đ c trình bày c
th nh m nghiên c u s ph thu c nh v y gi a các bi n
1.2 Các m i quan h th ng kê không ph i quan h xác đ nh
T các ví d trích d n trên chúng ta l u ý r ng trong phân tích h i qui
nh ng gì đ c quan tâm là s ph thu c gi a các bi n mang tính th ng kê, ch không mang tính hàm s hay xác đ nh nh nh ng m i quan h trong v t lý c đi n Trong nh ng m i quan h th ng kê chúng ta ch y u x lý v i các bi n ng u nhiên,
t c là các bi n có phân ph i xác su t Ng c l i, trong s ph thu c hàm s hay xác
đ nh chúng ta c ng x lý v i các bi n, nh ng các bi n này không mang tính ng u nhiên
Ví d , s ph thu c c a s n l ng lúa vào nhi t đ , l ng m a, l ng ánh sáng m t tr i, và phân bón v th c ch t là mang tính th ng kê theo ngh a các bi n
gi i thích này m c dù có t m quan tr ng nh t đ nh nh ng không th giúp nhà kinh t nông nghi p d đoán chính xác s n l ng lúa vì nh ng sai s có liên quan trong vi c
đo l ng các bi n này c ng nh hàng lo t các y u t khác (các bi n) tác đ ng đ ng
th i t i s n l ng nh ng có th r t khó đ xác đ nh riêng t ng cái m t Do đó, có s
ch p nh n kh n ng bi n thiên “n i t i” hay ng u nhiên nh t đ nh trong bi n ph thu c s n l ng lúa, nó không th đ c gi i thích hoàn toàn không c n bi t chúng ta xem xét bao nhiêu bi n gi i thích
1.3 H i qui không có tính nhân qu
M c dù phân tích h i qui đ c p đ n s ph thu c c a m t bi n vào nh ng
bi n khác, nh ng nó không nh t thi t hàm ý đ n tính nhân qu Kendall và Stuart đã nói: “M t m i quan h th ng kê dù r t m nh và dù r t nhi u hàm ý không th thi t
l p m i liên h nhân qu : các ý t ng v tính nhân qu c a chúng ta ph i đ n t bên ngoài th ng kê, xét cho cùng ph i đ n t m t lý thuy t nào đó ho c t l nh v c khác.”
Trong ví d v s n l ng lúa trên đây, không có lý do th ng kê nào đ cho
r ng l ng m a không ph thu c vào s n l ng lúa V n đ ch chúng ta xem s n
l ng lúa nh là bi n ph thu c vào l ng m a (trong s nh ng th khác) là do vi c
Trang 10xem xét không có tính th ng kê: ý ngh a chung là m i quan h này không th đ o
ng c đ c, vì chúng ta không th ki m soát l ng m a b ng cách thay đ i s n
l ng lúa
Trong các ví d trên đi m đáng l u ý là m t m i quan h th ng kê v th c
ch t không th ám ch lôgic đ n tính nhân qu qui cho tính nhân qu , ng i ta
ph i yêu c u đ n nh ng xem xét tr c đó ho c lý thuy t Do đó, trong ví d th ba
ng i ta có th vi n d n lý thuy t kinh t đ nói r ng chi tiêu cho tiêu dùng ph thu c vào thu nh p th c t
1.4 H i qui không ph i t ng quan
Phân tích t ng quan tuy có m i quan h r t g n nh ng v m t khái ni m l i
r t khác nhau v i phân tích h i qui, m c tiêu chính c a phân tích t ng quan là đo
l ng m c đ c a m i quan h tuy n tính gi a hai bi n Ví d , chúng ta có th quan tâm tìm ki m (h s ) t ng quan gi a vi c hút thu c và ung th ph i, gi a các đi m thi th ng kê và toán, gi a đi m t t nghi p ph thông và đi m t t nghi p đ i h c, vân vân Trong phân tích h i qui, chúng ta v c b n không quan tâm t i m t s đo nh
v y Thay vào đó, chúng ta c g ng c l ng hay d báo giá tr trung bình c a m t
có m t phân ph i xác su t Ng c l i, các bi n gi i thích đ c cho là nh ng giá tr
c đ nh (trong vi c l y m u l p), chúng đ c đ a ra rõ ràng trong đ nh ngh a v h i qui Ch ng h n, chúng ta gi s r ng bi n l a tu i đ c c đ nh các m c cho tr c
và các s đo chi u cao nh n đ c t i các m c đó Ng c l i trong phân tích t ng quan, chúng ta x lý các (hai) bi n có tính đ i x ng; không có s phân bi t nào gi a
bi n ph thu c và các bi n gi i thích Xét cho cùng, m i t ng quan gi a đi m thi toán và đi m thi th ng kê c ng gi ng nh m i t ng quan gi a đi m thi th ng kê và
đi m thi toán H n n a, c hai bi n đ c cho là ng u nhiên Nh chúng ta s th y,
Trang 11h u h t lý thuy t t ng quan d a trên gi thi t v tính ng u nhiên c a các bi n, trong khi h u h t lý thuy t h i qui đ c gi i thích d a trên gi thi t cho là bi n ph thu c mang tính ng u nhiên nh ng các bi n gi i thích là c đ nh hay không ng u nhiên
1 5 B n ch t và ngu n s li u cho phân tích kinh t l ng
c a s li u phù h p Do đó chúng ta c n dành th i gian bàn v b n ch t, t o ngu n,
và nh ng h n ch c a s li u mà có th g p ph i trong phân tích th c nghi m
th i gian, s li u chéo theo vùng, và s li u h n h p (k t h p s li u chu i th i gian
và s li u chéo theo vùng)
S li u chu i th i gian Chu i th i gian là m t t p h p nh ng quan sát v nh ng giá
tr mà m t bi n có th nh n t i các th i đi m khác nhau S li u nh v y có th đ c thu th p đ u đ n trong nh ng kho ng th i gian nh t đ nh, ch ng h n nh hàng ngày (ví d , giá c phi u), hàng tu n (ví d , m c cung ti n c a nhà n c), hàng tháng (ví
d , t l th t nghi p, ch s giá tiêu dùng), hàng quí (ví d , GNP), hàng n m (ví d , ngân sách c a chính ph ), c n m n m m t l n (ví d đi u tra v s n xu t), c m i
n m m t l n (ví d đi u tra v dân s ) ôi khi các s li u là s n có c theo quí và hàng n m nh trong tr ng h p s li u v GDP hay chi tiêu cho tiêu dùng
Nh v y các s li u đ c thu th p có th là s l ng (ví d , thu nh p, giá c ,
m c cung ti n) ho c ch t l ng (ví d , nam ho c n , có vi c làm ho c không có vi c làm, có hôn nhân ho c ch a có hôn nhân, có trình đ đ i h c ho c không) Nh chúng ta sau này s th y, các bi n ch t l ng đ c g i là các bi n gi và có th quan
Trang 12là không đ i m t cách h th ng theo th i gian Hãy luôn ghi nh m i khi b n x lý
v i s li u chu i th i gian, thì tính d ng c a nó luôn đ c xem xét
S li u chéo theo vùng S li u chéo theo vùng là s li u cho các bi n đ c thu th p
theo không gian vào cùng m t th i đi m, nh s li u đi u tra dân s c 10 n m m t
l n, s liêu đi u tra v chi tiêu cho tiêu dùng hay s li u v ý ki n c tri do r t nhi u
t ch c ti n hành Trong b ng 1.1 minh h a s li u v s n l ng tr ng và giá tr ng cho 50 bang c a M n m 1990 và 1991 V i m i n m, s li u này trên 50 bang là s
li u chéo theo vùng Nh v y, trong b ng 1.1 có hai m u s li u chéo theo vùng
C ng gi ng nh s li u chu i th i gian có v n đ đ c bi t riêng c a chúng v tính d ng, s li u chéo theo vùng c n có v n đ riêng c a chúng, c th là ph ng sai c a sai s không đ ng nh t Chúng ta có m t s bang s n xu t r t nhi u tr ng (ví
d , bang Pennsylvania) và môt s bang s n xu t r t ít Khi đ a các đ n v không
đ ng đ u vào m t phân tích th ng kê, c n ph i tính đ n đ n nh h ng c a đ l n hay qui mô c ng gi ng nh không th tr n l n táo v i cam
S li u h n h p Trong s li u h n h p, có c nh ng phân t s li u chu i th i gian
và c s li u chéo theo vùng S li u trong b ng 1.1 là m t ví d v s li u h n h p
V i m i n m chún ta có 50 quan sát chéo theo vùng và v i m i bang chúng ta có hai quan sát theo th i gian v giá và s n l ng c a tr ng, t ng c ng là 100 quan sát h n
s ng i th t nghi p )
M c dù có r t nhi u s li u s n có trong nghiên c u kinh t , nh ng ch t l ng
c a các s li u thu th p đ c th ng không t t ó là do m t s nguyên nhân H u
Trang 13h t các s li u trong khoa h c xã h i th ng là các s li u phi th c nghi m nên có
th có nhi u sai s do quan sát hay b sót quan sát, hay do c hai Ngay c các s
li u thu th p đ c b ng th c nghi m c ng có sai s c a phép đo Các m u đ c thu
th p trong các cu c đi u tra r t khác nhau v kích c cho nên r t khó kh n trong vi c
so sánh các k t qu gi a các đ t đi u tra Các lo i s li u kinh t th ng có s n
m c t ng h p cao, không đi sâu vào các đ n v nh M t s các s li u thu c bí m t
qu c gia, không ph i ai c ng có th s d ng đ c
B ng 1.1 S n l ng tr ng c a M
Trang 14m c chi tiêu cho tiêu dùng gia đình trung bình hàng tu n n u bi t thu nh p hàng tu n
c a gia đình đó Nh m m c đích đó, ta chia 60 gia đình này thành 10 nhóm có thu
nh p x p x nhau và ki m tra xem chi tiêu tiêu dùng c a các gia đình trong m i nhóm Ta có b ng s li u sau (tính b ng $):
B ng 2-1: Thu nh p và chi tiêu trong 1 tu n c a t ng th
có n m gia đình mà chi tiêu tiêu dùng c a h trong kho ng t 55 $ đ n 75 $ T ng
t , cho X = 240 $ thì có sáu gia đình mà chi tiêu tiêu dùng c a h trong kho ng t
137 $ đ n 189 $ Nói cách khác, m i c t trong b ng 2.1 cho bi t m t phân ph i chi tiêu tiêu dùng Y t ng ng v i m t m c thu nh p c đ nh;t c là nó cho bi t phân
ph i có đi u ki n c a Y v i các giá tr cho tr c c a X Nh v y, ta có b ng phân
d , v i X = 80 $ có n m giá tr c a Y: 55 $, 60 $, 65 $, 70 $ và 75 $ Do đó, cho
tr c X = 80, xác su t c a m i m c trong s các chi tiêu tiêu dùng này b ng 1/5; kí
Trang 15hi u p(Y= 55| X = 80) = 1/5 T ng t , p(Y= 150| X = 260) = 1/7, vân vân Các xác
su t có đi u ki n cho s li u trong b ng 2.1 đ c th hi n trong b ng 2.2
B ng 2-2: Các xác su t có đi u ki n p(Y| X i) cho s li u trong b ng 2.1
i i
i) P(Y| X ).YX
X
|E(Y
E(Y| Xi = 80) = (55 + 60 + 65 + 70 + 75) 1/5 = 65
S li u b ng 2.1 đ c minh h a b ng đ th phân gi i trong hình 2.1
th phân gi i này cho th y phân ph i có đi u ki n c a Y t ng ng v i các giá tr khác nhau c a X M c dù có nh ng bi n thiên v chi tiêu tiêu dùng c a riêng
t ng gia đình, nh ng hình 2.1 cho th y rõ ràng r ng chi tiêu tiêu dùng tính trung bình
t ng lên khi thu nh p t ng lên khía c nh khác, đ th này bi u l giá tr trung bình (có đi u ki n ) c a Y t ng lên khi X t ng Quan sát này có th th y sinh đ ng h n
n u chúng ta t p trung vào nh ng đi m in đ m th hi n các giá tr trung bình có đi u
ki n khác nhau c a Y th phân gi i này cho th y các giá tr trung bình có đi u
Trang 16ki n này n m trên m t đ ng th ng v i đ d c d ng ng th ng này đ c g i là
đ ng h i qui t ng th ó chính là h i qui c a Y theo X
Hình 2.1 Phân ph i có đi u ki n v chi tiêu v i các m c thu nh p khác nhau
Khi đó, v m t hình h c m t đ ng h i qui t ng th đ n gi n là qu tích các
đi m giá tr trung bình có đi u ki n hay k v ng có đi u ki n c a bi n ph thu c v i
nh ng giá tr c đ nh c a các bi n gi i thích Nh minh h a trong hình 2.2 cho th y
trung bình có đi u ki n này
cho bi t giá tr trung bình c a Y thay đ i theo X nh th nào
trong nh ng tình hu ng th c t chúng ta không s n có toàn b t ng th đ ki m tra
Do đó d ng hàm PRF là m t v n đ th c nghi m, m c dù trong các tr ng h p c
th lý thuy t có th có đi u gì đó đ nói Ví d , các nhà kinh t có th th a nh n r ng
Trang 17chi tiêu tiêu dùng có m i quan h tuy n tính v i thu nh p Vì v y, nh là m t s x p
x đ u tiên hay gi thuy t đ ti n hành nghiên c u, ta có th gi s r ng PRF E(Y|
Thu t ng tuy n tính đây đ c di n gi i theo hai cách:
1 Tuy n tính theo các bi n i u đ u tiên có l r t “ t nhiên” c a ý ngh a
(2.2) Trong tr ng h p này đ ng tuy n tính là m t đ ng th ng Theo s di n gi i này, thì m t hàm h i qui nh E(Y | Xi) = β1 + β2 Xi2 không ph i là m t hàm tuy n tính vì bi n X xu t hi n v i s m 2
2 Tuy n tính theo tham s Cách di n gi i v tuy n tính th hai là k v ng có
E(Y|Xi)= β1 + β2Xi2 là m t mô hình h i qui tuy n tính nh ng E(Y | X i ) = 1+ 2 X i
Trang 18thì không tuy n tính Mô hình th hai là m t ví d v mô hình h i qui phi tuy n (theo các tham s ) mà chúng ta không x lý v i nh ng mô hình nh v y trong tài
li u này
2.3 Ch đ nh ng u nhiên v hàm PRF
Rõ ràng trong hình 2.1 khi thu nh p gia đình t ng lên thì chi tiêu tiêu dùng gia đình tính trung bình c ng t ng lên Nh ng còn chi tiêu tiêu dùng c a m t gia đình c
th có m i quan h nh th nào v i m c thu nh p (c đ nh) c a gia đình đó? Ta th y
t b ng 2.1 và hình 2.1 chi tiêu tiêu dùng c a m t gia đình c th không nh t thi t
t ng lên khi m c thu nh p t ng lên Ví d , ng v i m c thu nh p 100$ có m t gia đình mà chi tiêu tiêu dùng b ng 65$ th p h n chi tiêu tiêu dùng c a hai gia đình có thu nh p hàng tu n ch 80$ Nh ng l u ý r ng, m c chi tiêu tiêu dùng trung bình c a các gia đình có thu nh p hàng tu n 100$ là l n h n m c chi tiêu tiêu dùng trung bình
c a các gia đình có thu nh p hàng tu n 80$ (77$ l n h n 65$)
V y thì chúng ta có th nói gì v m i quan h gi a chi tiêu tiêu dùng c a m t gia đình c th và m t m c thu nh p cho tr c? T hình 2.1 ta th y, v i m c thu
nh p Xi cho tr c thì chi tiêu tiêu dùng c a m t gia đình c th dao đ ng xung
quanh k v ng có đi u ki n c a nó Do đó, chúng ta có th bi u di n bi n thiên này
c a m t gia đình c th xung quanh k v ng c a nó nh sau:
ui = Yi – E(Y Xi) hay Yi = E(Y Xi) + ui (2.3)
Nh v y, chúng ta có th nói chi tiêu dùng c a m t gia đình c th v i m c thu nh p c a nó cho tr c có th đ c bi u di n thành t ng c a hai ph n: (1) E(Y |
m c thu nh p đó Thành ph n này có tính h th ng và xác đ nh đ c (2) thành ph n
thi t là tuy n tính theo Xi, thì ph ng trình (2.3) có th vi t là:
Yi = E(Y Xi) + ui
Trang 19E(Yi|Xi) = E[E(Y|Xi)] + E(ui|Xi) = E(Y| Xi) + E(ui|Xi) (2.5)
Do E(Yi|Xi) c ng chính là E(Y|Xi), nên ph ng trình (2.4) hàm ý r ng
E(ui|Xi) = 0 (2.6)
Nh v y, gi thi t cho r ng đ ng th ng h i qui đi qua các giá tr trung
2.4 T m quan tr ng c a sai s ng u nhiên
Nh đã l u ý trên, bi u th c sai s ng u nhiên uilà đ i di n cho t t
c các bi n b b qua không đ a vào mô hình nh ng có tác đ ng đ ng th i t i
nhi u bi n t i đa có th đ c? Chúng ta có th xây d ng đ c mô hình h i quy
b i nh ng dù có đ a thêm vào bao nhiêu bi n đ c l p thì sai s ng u nhiên v n
t n t i v i nhi u lý do C th :
th ho c th ng là không hoàn thi n Chúng ta có th bi t ch c ch n thu nh p hàng tu n X có nh h ng t i chi tiêu dùng Y, nh ng có th b qua ho c
d ng đ thay th cho t t c các bi n b b qua không đ a vào mô hình
Trang 202 Không đ y đ s li u: ngay c khi bi t rõ các bi n b b qua không đ a vào
không có đ y đ thông tin v các bi n này Kinh nghi m nói chung trong phân tích th c nghi m là s li u chúng ta thích nh lý t ng th ng không
s n có Ví d , chúng ta có th đ a s giàu có c a gia đình nh là m t bi n gi i thích thêm vào bi n thu nh p đ gi i thích chi tiêu dùng gia đình Nh ng th t không may, thông tin v s giàu có gia đình là không s n có Do đó chúng ta
bu c ph i b qua bi n v s giàu có này không đ a vào mô hình dù cho s liên quan c a nó v m t lý thuy t là r t l n đ gi thích chi tiêu tiêu dùng
chúng ta bên c nh thu nh p X1, còn có s con trong gia đình X2, gi i tính X3, tôn giáo X4, trình đ v n hóa X5, và vùng đ a lý X6 c ng tác đ ng t i chi tiêu tiêu tiêu dùng Nh ng r t có th là nh h ng chung c a t t c hay m t s
bi n này là r t nh đ n m c mà không nh h ng đáng k khi đ a chúng vào
mô hình Ng i ta hy v ng r ng nh h ng k t h p c a chúng có th đ c xem nh là bi n ng u nhiên ui
ta thành công trong vi c đ a t t c các bi n có liên quan vào mô hình, thì v n
có gi i h n v s ng u nhiên mang tính n i tâm nào đó trong t ng cá nhân mà
ph n ánh r t t t s ng u nhiên mang tính n i tâm này
các bi n Y và X đ c đo chính xác, nh ng trong th c t s li u có th b sai
Trang 217 D ng hàm sai Chúng ta th ng không bi t chính xác d ng hàm v m i quan
h gi a các bi n gi i thích và ph thu c, đó là m i quan h tuy n tính hay, phi tuy n
2.5 Hàm h i quy m u SRF
Cho đ n gi chúng ta m i h n ch th o lu n t p t ng th các giá tr c a Y
t ng ng v i các giá tr X c đ nh đ th n tr ng tránh vi c l y m u các quan sát (l u ý s li u c a b ng 2.1 minh h a t p t ng th , ch không ph i m t m u) Nh ng
đã đ n lúc ph i đ i m t v i các v n đ l y m u, vì h u h t trong các tình hu ng th c
t mà chúng ta có là m t m u các giá tr c a Y t ng ng v i các giá r X c đ nh nào đó Do đó nhi m v c a chúng ta bây gi là đi c l ng hàm h i qui t ng th PRF trên c s thông tin m u
minh h a, gi s r ng t p t ng th c a b ng 2.1 chúng ta không bi t mà ch
có thông tin là m t m u đ c ch n ng u nhiên v các giá tr c a Y v i các giá tr X
Trang 22PRF t s li u m u hay không? B n đ c ch c ch n khi ng , chúng ta không th c
l ng “chính xác” PRF vì các dao đ ng trong vi c l y m u th y đi u này, ta l y
m t m u ng u nhiên khác t t p t ng th trong b ng 2.1, nh trong b ng 2.4
V s li u trong các b ng 2.3 và 2.4, ta đ c đ th phân gi i nh trong hình
hai đ ng này th hi n đ ng h i qui t ng th “th t s ”? Chúng ta không th ch c
ch n tuy t đ i là đ ng nào Các đ ng trong hình 2.3 đ c g i là các đ ng h i
qui m u Do có nh ng dao đ ng trong vi c l y m u nên chúng là x p x c a h i qui
v i N m u khác nhau, và các hàm h i qui m u không trùng nhau
Trang 23Yi = β∧1 +β∧2Xi + u∧i (2.8)
Hình 2.3 Các đ ng h i qui d a trên hai m u khác nhau
trong đó ký hi u thêm vào u∧i nh đã đ c đ c đ nh ngh a, g i là ph n d (c a
hàm h i qui t ng th PRF
Tóm l i, chúng ta tìm th y m c tiêu ban đ u trong phân tích h i qui là c hàm PRF (2.4) đ c d a trên hàm h i qui m u (2.8), vì th ng th ng phân tích c a chúng ta đ c a trên vi c l y m t m u t t p t ng th Nh ng do các dao đ ng l y
m u nên c l ng hàm h i qui t ng th PRF d a trên hàm h i qui ch là m t x p x
X p x này đ c minh h a trong hình 2.4
Yi = Y∧i + u∧i (2.9)
và theo hàm h i qui t ng th PRF, nó có th đ c bi u di n là
Yi = E(Y Xi) + ui (2.10)
Trang 242.6 Ph ng pháp bình ph ng nh nh t (OLS)
Gauss đ a ra là m t trong nh ng ph ng pháp phân tích h i qui n i ti ng và có hi u
Trang 25= Y∧i + u∧i (2.9)
trong đó Y∧i là giá tr (trung bình có đi u ki n) đ c c l ng c a Yi
Nh ng hàm SRF đ c c l ng nh th nào? th y đ c đi u này chúng
ta ti p t c nh sau
Tr c h t, ta bi u di n (2.9) l i nh sau
u∧i = Yi - Y∧i
= Yi -β∧1-β∧2Xi (2.11)
nó cho bieeys (ph n d ) đ n gi n là m c chênh l ch gi a giá tr nó cho bi t (ph n
d ) đ n gi n là m c chênh l ch gi a giá t c th và giá tr Y đ c c l ng
Bây gi cho tr c n c p quan sát v Y và X, chúng ta mu n xác đ nh hàm
chúng ta có th tuân theo tiêu chu n sau: Ch n SRF b ng m t cách sao cho t ng các
ph n d ∑u∧i = ∑(Y i − )Y∧i nh t i đa có th đ c Nh ng yêu c u này b ng tr c giác, thì đây ch a ph i là m t tiêu chu n th t t t nh chúng ta th y trong đ th th phân gi i hình 2.5
Hình 2.5 Tiêu chu n bình ph ng nh nh t
N u chúng ta tuân theo tiêu chu n c c ti u hóa ∑u∧i , thì hình 2.5 cho th y
Trang 26các ph n d u∧2và u∧3 c ng nh các ph n d u∧1và u∧4có cùng trong s trong t ng (u∧1+u∧2 +u∧3+u∧4 ), nh ng hai ph n d đ u tiên l i g n v i SRF h n so v i hai ph n
d sau Nói cách khác, các ph n d này có t m quan tr ng nh nhau không không liên quan t i vi c t ng quan sát riêng là g n hay xa v i SRF nh th nào H u qu
nh ng có u∧i b r i ra r t xa SRF th y đi u này, gi s cho u∧1,u∧2,u∧3, và u∧4các
∧
4
u l i r i ra xa h n r t nhi u so v i u∧2và u∧3 tránh đ c đi u này n u chúng ta
Ti p theo, chúng ta l y đ o hàm (2.12) theoβ∧1vàβ∧2 và cho chúng b ng 0 đ
Trang 27các m u khác nhau chúng có giá tr khác nhau
1 SRF đi qua trung bình m u (X, Y), ngh a là Y = β∧1+β∧2 X , nh minh h a trong hình 2.6
Hình 2.6: ng th ng h i qui m u đi qua các giá tr trung bình m u c a Y và
X
Trang 282 Giá tr trung bình c a Y∧ib ng giá tr trung bình c a các giá tr (quan sát) c th
Ví d : B ng sau đây cho s li u v lãi su t (Y) và t l l m phát (X) trong n m 1988
chín n c, gi s r ng s ph thu c E(Y|X) có d ng tuy n tính Hãy xây d n hàm
Trang 29C n c vào b ng ta có:
∧ 2
n i i i
x
y x
1 2
8489,1973
14,2466
C n c vào ph ng pháp bình ph ng t i thi u (OLS), ta đã tính đ c các
c l ng c a mô hình d a vào m u đã cho M t câu h i đ t ra là li u các c l ng tìm đ c có đáng tin c y hay không? Và ch t l ng các c l ng ph thu c vào:
- Các giá tr quan sát (Xi, Yi)
- Các gi thi t v sai s ng u nhiên (nhi u) ui
• Gi thi t 1: Mô hình h i qui là tuy n tính theo các tham s
• Gi thi t 2: Các giá tr c a X đ c xác đ nh khi l y m u
• Gi thi t 3: K v ng c a nhi u ng u nhiên ui ph i b ng 0, t c (E(ui|Xi) =0),
nh minh h a trong hình 2.7
Hình 2.7 Phân ph i xác su t có đi u ki n c a các nhi u u i
• Gi thi t 4: Ph ng sai c a ui là b ng nhau:
Trang 30var(ui Xi) = E[ui-E(ui) Xi]2 = 2
Tr ng h p ng c l i: var(ui) ≠ var(uj) g i là ph ng sai không thu n nh t
• Gi thi t 5: không có s t ng quan gi a các nhi u ui, t c
cov (ui, uj Xi, Xj) = 0 ∀i ≠ j
• Gi thi t 6: không có s t ng quan gi a ui và Xi, t c cov(ui, Xj) = 0
• Gi thi t 7: Có s bi n đ ng gi a các giá tr X, t c var(X) ph i là m t s
d ng h u h n
• Gi thi t 8: Mô hình h i qui đ c ch đ nh đúng
• Gi thi t 9: Không có đa c ng tuy n ch t ch , t c là gi a các bi n gi i thích
không có m i quan h tuy n tính ch t ch
2.9 chính xác hay sai s chu n c a các c l ng OLS
T các ph ng trình (2.14) và (2.15) ta th y các c l ng β∧1vàβ∧2 là hàm
s c a các s li u m u Nh ng do các s li u có kh n ng thay đ i t m u này sang
m u khác, nên các c l ng này t thân chúng c ng thay đ i theo Do đó, c n có cái gì đó là th c đo đ tin c y hay đ chính xác c a các c l ng này Trong
th ng kê, đ chính xác c a m t c l ng đ c đo b ng đ l ch chu n (se), nó đ c tính nh sau:
, và n-2 đ c g i là s
b c t do (df), ∑ei2 là t ng bình ph ng các ph n d (RSS)
Trang 31∑ei2 có th đ c tính t công th c (2.12) (l u ý trong tài li u này ei và u∧i là
m t) hay tính theo công th c:
th bi n đ i đ có công th c tính ∑ei2 thu n l i h n n a Do
nên
∧
1
n a, qua m i m u chúng còn ph thu c l n nhau S ph thu c này đ c đo b ng công th c:
Tính ch t c a các c l ng OLS: nh lý Gauss-Markov
1 Nó là tuy n tính, t c là có m t hàm tuy n tính c a m t bi n ng u nhiên nh bi n
ph thu c Y trong mô hình h i qui
2 Nó là không ch ch, t c là E(β∧2) = 2
3 Nó có ph ng sai nh nh t trong l p t t c các c l ng tuy n tính không
l ng hi u qu
nh lý Gauss- Markov: D a vào các gi thi t đã cho c a mô hình h i qui tuy n
Trang 32i Y Y
1
2
) ( = ∑
=
n i i
y
1
2
= TSS (total sum of squares) là t ng bình
ph ng c a t t c các sai l ch gi a các giá tr quan sát c th Yiv i giá tr trung bình c a chúng
i Y Y
1
2
)( = ∑
=
∧
−
n i
i Y Y
1
2
) ( = ∑
=
∧
n i i
β ∑
=
n i i
x
1
2
= ESS (2.22) (explained sum of squares) là t ng bình ph ng t t c các sai l ch gi a các giá tr
c l ng c a bi n ph thu c Y nh n đ c t hàm h i quy m u và giá tr trung bình
c a chúng Ph n này đo đ chính xác c a hàm h i quy m u SRF theo s li u đã cho
=
n i i
i
i Y Y
1
2
)
đ c t hàm h i quy (t ng bình ph ng c a các ph n d ) Khi đó, (2.21) là:
TSS = ESS + RSS (2.23)
và cho bi t TSS đ c chia thành hai ph n: m t ph n do đ ng h i qui m u gây ra và
m t ph n do các y u t ng u nhiên gây ra
Chia c hai v c a (2.23) cho TSS , ta có:
n i i
Y Y
Y Y
1
2 1
2
)(
)(
n i i
Y Y e
1
2 1 2
)(
là:
Trang 33n i i
Y Y
Y Y
1
2 1
2
)(
)(
=
TSS ESS
n i i
Y Y e
1
2 1 2
)(
v i giá tr trung bình c a chúng đ c gi i thích b ng mô hình h i qui Nó là
s do y u ng u nhiên nh
r2 có th tính nhanh chóng t công th c:
(2.25)
Trang 34N u chia c t s và m u s c a (2.25) cho c m u n (ho c n-1 n u c m u
nh ), thì ta có:
(2.26) trong đó S2
y
1
2
(2.28) RSS = TSS – ESS
= TSS(1- ESS/TSS)
= ∑
=
n i i
Trang 35B ng 2.8: Tính SRF t s li u v chi tiêu dùng Y và thu nh p hàng tu n X
Trang 362.11 Các tín h ch t c a các c l ng d i gi thi t chu n c a mô hình
2 m x
x
e2
1f(x)
V i gi thi t trên thì khi đó chính Yic ng có phân ph i chu n có:
E(Yi) = β1 +β2 Xivar(Yi) = 2
Trang 372 i
2 2
2 n
1 i
2 i
1 i
2 i 2
x
x n X
2
1
β β
∧
2.12 Kho ng tin c y và ki m đ nh các h s h i qui
1 Kho ng tin c y choβ 1 , β2 và 2
Các c l ng β∧1,β∧2, và
2
∧
và 2 ch a bi t ây là nh ng c c đi m tin c y c a nh ng c l ng này
nh th nào? Do m u thay đ i nên các c l ng này khác v i giá tr th c c a tham
s mà chúng c l ng m c dù giá tr trung bình c a chúng đ c k v ng là b ng
v i giá tr th c (E(β∧i) = βi và E(
2
∧
l ng đ c xác đ nh theo đ l ch tiêu chu n c a chúng Chúng ta không ch d a vào các c l ng đi m, mà còn xây d ng m t kho ng xung quanh c l ng đi m v i
đ r ng nh t đ nh t ng ng v i xác su t tin c y nào đó cho tr c
c y hay xác xu t (1- α) v i 0 < α < 1 thì ta c n xác đ nh s d ng δ sao cho xác
su t đ cho kho ng ng u nhiên (β∧2 - δ, β∧2 + δ) ch a giá tr th t β2 đúng b ng 1-α:
P[β∧2 - δ ≤ β2 ≤ β∧2+ δ] = 1 - α
Trang 38-(nte
S
2)(nP[-t
2 i
i i 2
Trang 39V i kho ng tin c y c a ph ng sai σ2
ta có đ i l ng th ng kê
(2.30)
thi t l p kho ng tin c y cho σ2 nh sau:
đ nh là m t th t c trong đó các k t qu c a m u đ c s d ng đ th m tra l i s đúng đ n ho c sai l m c a c a gi thuy t H0
* 2 2
ββ
∼ T(n-2), hay
Trang 40bác b gi thuy t H0 cho r ng giá tr đúng c a β2 = 0,3
Trong th c t ta không n tính (2.33) t ng minh mà ch c n tính
t =
0357,0
3,05091,
0 −
giá tr t này rõ ràng n m trong mi n bác b nh trong hình 2.12