Mục Lục Câu 1: Thực hiện các yêu cầu phân tích hồi quy bội Hồi quy bội còn gọi là phương pháp hồi quy đa biến, dùng phân tích mối quan hệ giữa nhiều biến số độc lập tức biến giải thích
Trang 1Mục Lục
Câu 1: Thực hiện các yêu cầu phân tích hồi quy bội
Hồi quy bội còn gọi là phương pháp hồi quy đa biến, dùng phân tích mối quan hệ giữa nhiều biến số độc lập (tức biến giải thích hay biến nguyên nhân) ảnh hưởng đến 1 biến phụ thuộc (tức biến phân tích hay biến kết quả)
Trong thực tế, có rất nhiều bài toán kinh tế - cả lĩnh vực kinh doanh và kinh tế học, phải cần đến phương pháp hồi quy đa biến Chẳng hạn như phân tích những nhân tố ảnh hưởng đến thu nhập quốc dân, sự biến động của tỷ giá ngoại hối; xét doanh thu trong trường hợp có nhiều mặt hàng; phân tích tổng chi phí với nhiều nhân tố tác động; phân tích giá thành chi tiết; những nguyên nhân ảnh hưởng đến khối lượng tiêu thụ…
Một chỉ tiêu kinh tế chịu sự tác động cùng lúc của rất nhiều nhân tố thuận chiều hoặc trái chiều nhau Chẳng hạn như doanh thu lệ thuộc và giá cả, thu nhập bình quân xã hội, lãi suất tiền gửi, mùa vụ, thời tiết, quảng cáo tiếp thị… Mặt khác, giữa những nhân
tố lại cũng có sự tương quan tuyến tính nội tại với nhau Phân tích hồi quy giúp ta vừa kiểm định lại giả thiết về những nhân tố tác động và mức độ ảnh hưởng, vừa định lượng được các quan hệ kinh tế giữa chúng Từ đó, làm nền tảng cho phân tích dự báo và có những quyết sách phù hợp, hiệu quả, thúc đẩy tăng trưởng
Mô hình hồi quy tuyến tính k biến (PRF):
E(Y/X2i,…,Xki) = β1+ β2X2i +…+ βkXki
Yi = β1+ β2X2i + …+ βkXki + Ui Trong đó :
Y - biến phụ thuộc
X2,…,Xk - các biến độc lập
Ui: Sai số ngẫu nhiên
β1 là hệ số tự do
Trang 2βj cho biết khi Xj tăng 1 đơn vị thì trung bình của Y sẽ thay đổi βj đơn vị trong trường hợp các yếu tố khác không đổi (j=2,…,k)
Khi k=3 ta sẽ có mô hình hồi quy tuyến tính 3 biến
E(Y/X2, X3) = β1+ β2X2 + β3X3 (PRF)
Yi = β1+ β2X2i + β3X3i + Ui (PRM)
1.1 Mối Liên hệ giữ mô hình hồi quy đơn biến va hồi quy bội
Báng so sánh về dạng hàm của mô hình hồi quy đa biến so với trường hợp đơn biến
Hồi quy đơn biến Hồi quy đa biến
Ví Dụ CONS =β1+β2INC+ε INV =β1 +β2T +β3G+β4INT+ε
Dạng mô Hình Y =β1+β2X +ε Y =β1+β2X2 +β3X3 +β4X4 +ε
Với mỗi quan sat Y n =β1+β2X n +εn Y n =β1 +β2X n2 +β3X n3 +β4X n4 +εn
Như vậy hồi quy đa biến là sự mở rộng tự nhiên của trường hợp đơn biến ,khi số biến giải thích lớn hơn 2, kể cả hằng sô
1.2 Thực hiện mô hình hồi quy 3 biến
a Ứớc lượng các tham số cho mô hình hồi quy ba biến E(Y/X2, X3) = β1+ β2X2 + β3X3 (PRF)
Yi = β1+ β2X2i + β3X3i + Ui (PRM)
Hồi quy mẫuGiả sử có một mẫu gồm n quan sát các giá trị (Yi, X2i, X3i) Theo phương pháp OLS,
Tìm (j= 1,2,3) phải thoả mãn :
Q= ( ˆ ˆ ˆ )2 min
3 3 2 2 1
i i
i Y e X X e
j
βˆ
Trang 3Giải hệ ta có:
x i = X i −X
y i =Y i −Y
=> yˆi =βˆ2x2 +βˆ3x3 →Hàm hồi quy mẫu đi qua gốc tọa độ
b Phương sai của các ước lượng là:
Trong đó : Trong đó : σ2 = Var(Ui) (σ2 là phương sai của Ui )
σ2 chưa biết nên trong thực tế người ta dùng ước lượng không chệch của nó
1 2 1 2
Mô hình hồi quy 3 biến
3 3 2 2 1
3 2
ˆˆ
ˆˆˆ
X X
βββ
2 3i
2 2i
i 2i 3i 2i
2 2i i 3i
2 3i 2i
2 3i
2 2i
i 3i 3i 2i
2 3i i 2i
) x x ( x x
y x x x x
y x
) x x ( x x
y x x x x
y x
2 3
2 2
2
2 3 2
1
)ˆ(
)ˆ(
1)ˆ(
σβ
σβ
σβ
2 3i
2 2i
2 2i
2 3i 2i
2 3i
2 2i
2 3i
2 3i 2i
2 3i
2 2i
2i 3i
) x x ( x x
x
) x x ( x x
x
) x x ( x x
x x
Var Var
X X
n Var
3
)1(3ˆ
2 2 2
σ
∑ Yi−Y 2 = Y i−Yˆi 2 + Yˆi−Y 2
Trang 4R2= ˆ2 2 2ˆ3 3
i
i i i
i
y
x y x
)(
2
2 2
n y
k n
e R
i i
Với k là tham số của môi hình kể cả hệ số tự do
Mối quan hệ giữa R và R
k n
n R R
d Khoảng tin cậy của tham số
Khoảng tin cậy của tham sô βi với mức ý nghĩa α hay độ tin cậy 1-α
)ˆ
;ˆ
2()ˆ(
ˆ
2 / 2
)2(ˆ)
2(
)2(ˆ
2 2 / 1
2 2
2 /
n
a
σσ
χσ
2( 2) 2
2( 2)ˆ
σχ
−
n a
n
2( 2)
2 / 1
f Kiểm định giả thiết
Kiểm định giả thiết H0 β =i βi*
)ˆ(
i
i i i
Trang 52
2
R
n R
445791214202124
-17-13-11-9-513111723
-12-8-6-4-2046814
-8-8-7-5-3028912
Trang 614464361640163664196
646449259046481144956
1 −
∑x y ∑x2y−900 ∑x1x2 −524 ∑x12 −576 ∑x22 −504Thực hiện trên ta được
445791214202124
40.3242.9245.3348.8552.3757.0061.8269.7872.1979.42
-0.321.080.67-0.85-0.371.00-1.82-1.781.810.58
0.10241.16640.44890.72250.13691.00003.31243.16843.27610.3364
289169121802519121289529
∑e=0 ∑e2 =13.6740 ∑y2 =1634
và với α =0.05 ta tính Fα
1.3 Mô hình hồi quy k biến
a Mô hình :Mô hình hồi quy trog đó biến phụ thuộc Y phụ thuộc vào k-1 biến giải thích
,098,31
%)1,99(991
,
0
2 =
Trang 7(i = 1,…, n)Hàm hồi quy mẫu
Với i=1 n ta có dạng ma trận sau
1 1 21
2 1
ˆ
ˆˆ
ˆ
3 3 2 2 1 1
X Y
i n
i i
n
e
β β
β β β
1 2
i n
i i
n i i
X X X
X Y
e
β β
β β β
…
1 1
i n
i i k
n i
i
X X X
X Y
e
β β
β β β
c Các tham số dưới dạng ước lượng
Kỳ vọng :E(β =) β
Phương sai
i ki k i
i i
i Y e X X e
Trang 8
Với σ2 được ước lượng bởi
k n
e e
−
ˆ2σ
d Hàm số xác định bội và bội hiệu chỉnh
Tính chất này dùng đẻ đánh giá mức độ thích hợp của hàm hồi quy
+ Giá trị của R2 đồng biến với số biến giải thích của mô hình Tuy nhiên không thể lấy điều đó xem xét việc đã thêm biến giải thischvaof mô hình
Hệ số xác định bội hiệu chỉnh
hay
R2 có các tính chất sau :
- R2có thể âm, trong trường hợp âm, ta coi giá trị của nó bằng 0
- Khi số biến giải thích của mô hình tăng lên thì R2 tăng chậm hơnR2
1
2
2 ≤R ≤
R
Tính chất này được dùng làm căn cứ xem sét việc đã thêm biến giải thích vào mô hình
Các sử dụng R2 để quyết định đưa thêm biến vào mô hình
ESS R
y
)/(
i
2 2
n
k n e
k n
n R R
Trang 9Nếu thì chọn mô hình (1) tức là không cần thêm biến X3 vào ngược lại hì chọn
mô hình (2)
e Khoảng tin cậu của tham số kiểm định các giả thiết hồi quy
Khoảng tin cậy của tham số
βi∈(βˆi −εi;βˆi +ε)
Khoảng tin cậy của tham sô βi với mức ý nghĩa α hay độ tin cậy 1-α
)ˆ
;ˆ
2()ˆ(
ˆ
2 / 2
)2(ˆ)
2(
)2(ˆ
2 2 / 1
2 2
2 /
n
a
σσ
χσ
2 ( 2 ) 2
2( 2)ˆ
σχ
−
n a
n
2 ( 2 )
2 / 1
εi =SE(βˆi)t(n−k,α/ 2 )
g Kiểm định giả tiết
Kiểm định giả thiết H0 : *
i
i β
β =
)ˆ(
i
i i i
2 2
i X
2 1
R
2 1
R
) 2 ( ˆ
ˆ ˆ
ˆ
3 3 2 2
Y = β + β + β
2 2
R
2 2
R
2 2
2
R >
Trang 10Nếu t i >t(n−k, α / 2 ) hoặc t i <t(n−k,α/2): bác bỏ H0
Nếu −t(n−k, α / 2 ) ≤t i ≤t(n−k, α / 2 ) : chấp nhận H0
h Xác định sự phù hợp của mô hình
2 3 3
2
i
ki i k i
i i
i
y
X Y X
Y X
Y R
∑
∑++
∑+
∑
k n
n R R
1(
)(
k n R F
Nguyên tắc quyết định
Nếu F > Fα(k−1,n−k) :Bác bỏ H0 mô hình phù hợp
Nếu F ≤Fα(k−1,n−k) : Chấp nhận H0 : mô hình không phù hợp
1.4 Hướng dẫn phân tích hồi quy 3 biến băng phần mềm SPSS
Giả sử ta có tập dữ liệu như sau :
Y:tổng doanh thu
X2:doanh thu bình quân
Trang 12Tổng bình phương hồi quy :0.918
Tổng bình phương phần dư là:13.544
Trung bình bình phương hồi qui: 1.836/ 2 (bậc tự do)=0.918
Trung bình bình phương phần dư: 13.544/ 7(bậc tự do=n-2)=1.935
F=0.474
Bảng 4 :Đánh giá ý nghĩa của các hệ số hồi quy
phương trình hồi quy: Yˆi=6.046-0.518X2+0.252X3
Câu 2: Phân tích xu thế chuỗi thời gian.
Từ xu hướng phát triển của hiện tượng nghiên cứu ta xác định được phương trình hồi quy lý thuyết , đó là phương trình phù hợp với xu hướng và đặc điểm biến động của hiện tượng nghiên cứu , từ đó có thể ngoại suy hàm su thế để xác định mức độ phát triển trong tương lai
2.1 Mô hình phân tích chuỗi thời gian
Phân tích chuỗi thời gian được chia làm hai phương pháp
Trang 13Phân tích xu thế : Đây là một phân tích liên quan đến chuỗi nhiều năm, do đó ta sẽ sử dụng số liệu hàng năm để phân tích một cách tổng quát ta cần phải một chuỗi dài ít là 10->15 năm
Để đánh giá yếu tố xu thế, phương pháp sử dụng phổ biến là phương pháp bình phương tối thiểu (BPTT)
Đấy là phương pháp cho phép xác định được đường cong (thẳng) hoặc mặt phẳng biểu thị xu thế số liệu ,giới thiệu tốt nhất số liệu trong quá khứ
Trong trường hợp cá biệt khi nhận thấy xu thế của biến khảo sát trong thời gian dài là tuyến tính ,.Phương trình sẽ được xác định bởi
Y=a+bt
t: biểu thị thời gian
a,b:là những tham số quy định vị trí của đường hồi quy
Từ phương trình này,bằng phương pháp bình phương nhỏ nhất hoặc thông qua việc đặt thứ tự thời gian (t) trong dãy số để tính tham số a,b
Yi: Quan sát a: Xu thế
Đây là một hàm hai biến a và b, để cho D cực trị (với ý nghĩa vật lý của bài toán ta biết đó là cực tiểu) ta phải có
=0
∂
∂
a D
Trang 14Từ đó :
[1] ∑2[ −( + i)].i =0
i i
t bt a
t N t
y t N y t
.)(
a= y i −b t i
N
t N
t
N i
i
+ +
1
Chú ý trong trường hợp xu thế không phải tuyến tính ta có thể xét đến dạng đường cong hàm
mũ y=abt hoặc dạng parabol y=a+bt+ct2 Các tham số a,b,c vẫn xác định dựa vào khái niệm bình phương tối thiểu mà ta vừa nghiên cứu trên
b Đánh giá sự biến đổi theo mùa
Để nhận biết ảnh hưởng của thành phần mùa lên chuỗi thời gian khảo sát ta dùng thông số gọi
là chỉ số mùa
- Nếu số liệu theo tháng, ta có 12 tháng giá trị is
- Nếu số liệu theo quý ,ta có 12 giá trị is.
- Nếu giá trị tính theo 6 tháng ,ta có 2 giá trị is
Tính chỉ số mùa
Từ số liệu quan trắc chỉ số mùa được tính từ is,t như sau:
is,t=[giá trị quan trắc]/[giá trị cho bởi y=[a+bt]t
Chú ý: Có bao nhiêu số liệu quan trắc → có bấy nhiêu is,t và giá trị is,t thay đổi quanh giá trị 1
Từ các giá trị đại biểu is,t , các giá trị đại biểu is được tính bằng giá trị trung bình của các tháng (quý) tương ứng :
Theo tháng
is,k=
12,1
;
k N
i
n k t s
Theo quý
0)]
([
Trang 15is,k=∑1 ,= ; =1,4
k N
i
n k t s
Với N (số tháng ,quý,…) có trong chuỗi số liệu phân tích
Giá trị chỉ số mùa hiệu chỉnh
Ta phải có :
)(12
12
1 ,
tháng i
1 ,
i
i i s
k s
1 ,
i
i i s
k s
∑
=
=
Chuỗi CVS(loại bỏ ảnh hưởng mùa trong chuỗi giá trị quan sát)
Sự hiệu chỉnh mùa này cho phép chúng ta muốn so sánh kết quả của các tháng khác nhau trog một mùa nhằm để biết nếu có sự tăng hay giảm đã xảy ra so với giá trị bình thường Giá trị hiệu chỉnh mùa sẽ được tính như sau
= → * →
, ,
*
k s
t k
i
y
k=1,12 (số liệu tháng) hay 1,4( số liệu quý)
Dự báo với mô hình phân rã
Giá trị dự báo tại thời điểm t của biến nghiên cứu *
t
y được xác định như sau:
y t* =[a+bt]*i s,k
][a+bt : giá trị cho bởi đường xu thế
k:ứng với tháng (mùa) tại thời điểm t
Trang 16a Xác định xu thế biểu diễn bởi đường thảng bằng phương pháp bình phương tối thiểu Từ đó xác định hệ số biến đổi mùa đại biểu cho 4 quý.
b Xác định doanh thu tính từ mô hình (quý 1/năm 1 đến quý 2/ năm 6)
c Hãy dự báo doanh thu cho quý 3 và 4 của năm cuối cùng và quý 1,2 của năm kế tiếpBài làm :
Trang 17Áp dụng phương pháp bình phương tối thiểu :
ta thu được kết quả :
a= 33.49 , b=1.347 và mô hình dự báo
2.2.Thực hiện phân tích chuỗi thời gian trong phần mềm SPSS
Giả sử ta có bảng dữ liệu như sau:
Trang 18Ban đầu bạn chọn chế độ hiển thị cho biểu đồ chuỗi thời gian
Bạn chon Graphs-Legacy Dialogs –Line (chọn kiểu khung hiển thị ví dụ :Line(đường dây) Bar (hình cột ) hoặc 3-D Bar …) tiếp đó cửa sổ Line Chart hiện ra bạn chọn (Simple cho thể hiện 1 đường ,Multiple cho 2 đường hoặc Drop-Line): Simple và trong
ô Data in Are là Values of individual cases để hiển thị giá trị
Bấm Define cửa cổ mới xuất hiện bạn điền thông tin trong ô Line Represents (đường dây thuộc tính muốn thể hiện ):CA và Variable (sự biến thiên theo giá trị ví dụ: thời gian) chọn :DATE_ thì ta đã có biêu đồ dạng như sau:
Trang 19Bây giờ tiến hành phân tích chuỗi thời gian
Bắt đầu chon :Analyze –Forecasting-Create model
Trong hộp thoại Time series Modeler:
Tab Valiables đưa biến cần dự báo (biến CA) ,và chọn Exponential smoothing ở
khung Methord,chọn Criteria để khai báo là mô hình nhân tính hay công tính
Tab Statistics ,đánh dấu Root mean square để tính RMSE của mô hình.Đánh dấu Display forecasts để thể hiện kết quả dự báo trên mà hình Viewer
Chọn Tab Plots,và đánh dấu Forecasts,Fit Values để vẽ đường biểu diễn cả giá trị
dự báo và giá trị thực tế lên cùng một đồ thị để nhằm đánh giá độ chính xác
Tab Options, Nhấp chọn First case after end of estimation period through a special date , và nhập vào ô Year ,và ô Qarter, gồm thông tin dự báo tháng nào ?
năm bao nhiêu…?.Nếu bạn muốn lưu các giá trị dự báo về File dữ liệu thì bấm vào Tab Save
Click Ok ta có kết quả dự báo như sau
Trang 21Câu 3 : Thực hiện tập dữ liệu trên SPSS
Tìm tập dữ liệu (trong các tạp chí quốc tế hoặc Việt Nam) áp dụng phương pháp phân tích
dữ liệu thích hợp cho tập dữ liệu đó
Bài làm :Tập dữ liệuTrong các loại cây lương thực lấy hạt ở Việt Nam thì lúa và ngô và khoai là ba loại cây lương thực chính, song so với tổng sản lượng của ba loại cây này thì sản lượng ngô chỉ vào khoảng trên dưới 10% Sản lượng ba loại cây này tăng liên tục trong những năm qua Nguyên nhân tăng năng suất và sản lượng lúa, ngô ,khoai là do những thay đổi về cơ chế chính sách đầu tư vốn và sự kết hợp đẩy mạnh ứng dụng các tiến bộ kỹ thuật mới vào sản xuất như giống mới,
Đây là kết quả mối quan hệ về sản lượng nông nghiệp với sản lượng thóc ,sản lượng khoai lang và sản lượng ngô năm 2001
Nguồn dữ liệu trang Wed : http://www.gso.gov.vn
Trang 22X4:Sản lượng ngô
Bài làm
3.1 Hàm hồi quy bội
Ta có tập dữ liệu 4 biến nên dùng phương pháp hồi quy bội có hàm như sau:
3.2.Ước lượng hồi
Ước lượng hồi quy tổng khối lượng hàng hóa vận chuyển theo khối lượng hàng hóa vận
chuyển bằng đường sắt và đường biển
Bằng việc sử dụng phần mềm SPSS ta thực hiện tập dữ liệu sau:
Thực hiện phân tích hồi quy đa biến Click Analyze –Regression – Linear
Trang 23Với Y:là biến phụ thuộc và X2, X3 là biến độc lập ta thu được kết quả như sau
Trang 24Bảng có các thông tin cho ta: β∧1=50.245 β∧2= 1.058 β∧3= 0.497 βˆ4=0.944
Từ kết quả ước lượng nêu trên ta thu được hàm hồi quy mẫu như sau:
Yˆi =50.245 + 1.058*X2 +0.497 *X3 + 0.944*X4
Và kết quả ước lượng:
R2=0.997 (tương ứng 99.7% sự thay đổi vốn đầu tư là sự thay đổi của các sản lượng)
∧
1
β βˆ2,βˆ3,βˆ4> 0 ⇒phù hợp với lý thuyết thống kê
Ý nghĩa của các hệ số trong mô hình :
Trang 25Tiêu chuẩn kiểm định
Kiểm định giả thiết H0 β =i βi*
T =
)ˆ(
0ˆ
2
2β
β
Se
−
∼ T(n-3).Miền bác bỏ :: Wα = {T/ T > Tα(n/−23)}
Theo kết quả báo cáo mức 1(mức ý nghĩa α = 0 05 ta có:
0ˆ
3
3β
0ˆ
4
4β
β
Se
−
∼ T(n-3) Miền bác bỏ : Wα = {T/ T > Tα(n/−23)}
Theo kết quả báo cáo mức 1(mức ý nghĩa α = 0 05 ta có:
Tqs =2.073< T0.025(8) = 2.306
Tqs∉ Wα=> Chưa đủ cơ sở để bác bỏ H0
Vậy biến X4 của mô hinh phù hợp
Trang 263.3.Kiểm định sự phù hợp của mô hình hồi quy
Ramsey RESET Test:
F-statistic 0.940047 Prob F(1,6) 0.369710
Log likelihood ratio 1.601040 Prob Chi-Square(1) 0.205756
Kiểm định cặp giả thuyết :
H0 : mô hình (1) không phù hợp
H1 : mô hình (1) phù hợp
+) Sử dụng tiêu chuẩn kiểm định F = ~ F ( k-1, n-k )
Trong đó k là số biến có mặt trong (1) , R12 là hệ số xác định bội của (1) , n là số quan sát Miền bác bỏ : Wα = { Fq/s / Fq/s > Fα ( k-1 , n-k ) }
Với α = 0,05, n = 11 thì F0,05(1,6) =5,99
Theo báo cáo : Fqs = 0,940047
Ta có Fqs< F0,05(1,6) nên chưa đủ cơ sở để bác bỏ H0
Vậy mô hình đã cho phù hợp
3.4.Phân tích dựa vào kết quả ước lượng (Khoảng tin cậy )
3.4.1.Với biến độc lập X 2
Khi một biến độc lập thay đổi một đơn vị thì biến phụ thuộc thay đổi như thế nào?
Khi sản lượng thóc thay đổi 1 nghìn tấn với điều kiện sản lượng khoai lang và sản lượng ngô không thay đổi thì tổng sản lượng nông nghiệp thay đổi trong khoảng:
) 1 (
) 1 /(
2 1
2 1
k n R
k R
−
−
−