Giới thiệu khái quát về đề tài nghiên cứu Nghiên cứu các nhân tố tác động đến tổng chi tiêu hàng tháng của sinh viên Đại học Thương Mại.. Mục tiêu nghiên cứu Chỉ ra các yếu tố tác độn
Trang 1MỤC LỤC
CHƯƠNG 1: LỜI NÓI ĐẦU 2
1.1 Giới thiệu khái quát về đề tài nghiên cứu 2
1.2 Mục tiêu nghiên cứu 2
1.3 Đối tượng và phạm vi nghiên cứu 2
CHƯƠNG 2: CƠ SỞ LÝ THUYẾT 3
2.1 Lý thuyết về phân tích hồi quy 3
2.1.1 Mô hình hồi quy nhiều biến: 3
2.1.1 Ước lượng bằng phương pháp bình phương nhỏ nhất 4
2.1.2 Khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy 5
2.1.3 Kiểm định giả thuyết đồng thời 6
2.1.4 Phân tích hồi quy và dự báo 7
2.2 Các khuyết tật của mô hình 7
2.2.1 Hiện tượng phương sai sai số thay đổi 7
2.2.2 Tự tương quan 13
2.2.3 Đa cộng tuyến 16
2.2.4 Tính phân phối chuẩn của sai số ngẫu nhiên 19
CHƯƠNG 3: VẬN DỤNG 20
3.1 Xây dựng mô hình hồi quy: 20
3.1.1 Bảng số liệu: 20
3.1.2 Mô hình hồi quy mẫu: 22
3.2 Phát hiện và khắc phục khuyết tật của mô hình: 22
3.2.1 Phương sai sai số thay đổi: 22
3.2.2 Đa cộng tuyến: 25
3.3 Mô hình hồi quy mẫu sau khi khắc phục hiện tượng: 27
3.4 Ước lượng các hệ số hồi quy: 28
3.5 Kiểm định các hệ số hồi quy: 29
3.6 Kiểm định giả thuyết đồng thời: 30
3.7 Dự báo mô hình: 31
CHƯƠNG 4: KẾT LUẬN 33
LỜI CẢM ƠN 34
Trang 2CHƯƠNG 1: LỜI NÓI ĐẦU 1.1 Giới thiệu khái quát về đề tài nghiên cứu
Nghiên cứu các nhân tố tác động đến tổng chi tiêu hàng tháng của sinh viên Đại học Thương Mại.
Xuất phát từ thực tế hiện nay, khi nhu cầu và mức chi tiêu cho đời sống của sinh viên ngày một tăng Bài toán cân đối chi tiêu đối với mỗi sinh viên luôn là vấn đề được quan tâm Do đó, nhóm thực hiện đề tài nghiên cứu với mong muốn giúp sinh viên có cái nhìn toàn diện nhất để đảm bảo chi tiêu một cách hợp lý và khoa học.
1.2 Mục tiêu nghiên cứu
Chỉ ra các yếu tố tác động đến tổng chi tiêu hàng tháng của sinh viên
Giải thích mối quan hệ giữa các yếu tố tác động đến tổng chi tiêu hàng tháng của sinh viên
Đo lường mức độ tác động của các yếu tố, thể hiện yếu tố nào là yếu tố tác động nhất tới tổng chi tiêu hàng tháng của sinh viên
Đưa ra mô hình hồi quy, từ đó kết luận và đưa ra giải pháp giúp sinh viên
có kế hoạch chi tiêu hợp lý.
1.3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu: Các nhân tố tác động đến tổng chi tiêu trung bình hàng tháng của sinh viên Đại học Thương Mại.
Trang 3CHƯƠNG 2: CƠ SỞ LÝ THUYẾT
2.1 Lý thuyết về phân tích hồi quy
2.1.1 Mô hình hồi quy nhiều biến:
Mô hình hồi quy tổng thể (PRF) Hàm hồi quy mẫu (SRF)
Yi=β1+β2X 2 i+β3X 3i+…+ β k X ki+Ui
Yi: là giá trị của biến phụ thuộc Y.
β1: hệ số chặn.
β j: hệ số của biến giải thích (j= ´ 2 , k).
U i : sai số ngẫu nhiên.
Các giả tiết cơ bản của mô hình hồi quy nhiều biến
Các biến giải thích ^X j (j= ´ 2 , k) không phải là biến ngẫu nhiên, giá trị của chúng làxác định
Kỳ vọng toán của các sai số ngẫu nhiên Uj bằng không
Trong đó, ^β1 và ^β2là các ước lượng không chệch của các hệ số hồi quy β1 và β2 và u¿i là
hệ số không chệch của sai số ui
Các tính chất của ước lượng OLS
Trang 4 Đường hồi quy đi qua điểm trung bình ( Y, X2,…, Xk), tức là
Y = ^β1+ ^β2X 2 i+…+ ^ β k X ki
Giá trị trung bình của các giá trị Yi được xác định theo hàm hồi quy mẫu bằng giá trị trung bình của biến phụ thuộc, tức là Y^= 1n ∑ Ŷi = Y
Tổng các phần dư của hàm hồi quy mẫu bằng 0: ∑ei = 0
Các phần dư ei không tương quan với Ŷi tức là ∑eiŶi = 0
Các phần dư ei không tương quan với Xji tức là ∑eiXji = 0 (j = )
Với giả thiết của MHHQ tuyến tính cổ điển thì các ước lượng bình phương nhỏ nhất ^β j
là các ước lượng hiệu quả của βj ( với j = )
2.1.1 Ước lượng bằng phương pháp bình phương nhỏ nhất
Trang 62.1.2 Khoảng tin cậy và kiểm định giả thuyết về các hệ số hồi quy
2.1.2.1 Khoảng tin cậy của các hệ số hồi quy
2.1.2.2 Kiểm định giả thuyết về các hệ số của hồi quy tổng thể
Bài toán: Với mức ý nghĩa α Kiểm định giả thuyết về β j theo một trong 3 bài toán sau:
Trang 7Bài toán 1 Bài toán 2 Bài toán 3 Xác định
Kiểm định theo p-value:
P-value < α bác bỏ giả thuyết H0, tức là hệ số hồi quy không có ý nghĩa thống
kê Ngược lại, nếu P-value > α thì ta không có cơ sở bác bỏ giả thuyết H0, tức là các hệ
số hồi quy có ý nghĩa thống kê
2.1.3 Kiểm định giả thuyết đồng thời
2.1.3.1 Hệ số xác định bội
- Định nghĩa 1: Hệ số xác định bội được định nghĩa: R2=ESS
RSS TSS
Trang 82.1.3.2 Kiểm định giả thuyết đồng thời
2.1.4 Phân tích hồi quy và dự báo
2.1.4.1 Dự báo giá trị trung bình
Với độ tin cậy γ cho trước, dự báo được giá trị trung bình của Y:
Ước lượng điểm của E (Y / X0) là: Y^0=X0T ^β=^ β1+ ^β2X20+ +^β k X k 0
2.1.4.2 Dự báo giá trị cá biệt
Với độ tin cậy γ cho trước, ta cần dự báo giá trị cá biệt Y0 của Y khi các biến độc lập
2.2 Các khuyết tật của mô hình
2.2.1 Hiện tượng phương sai sai số thay đổi
2.2.1.1 Bản chất
- Vi phạm giả thiết : Var(U i)=σ2 (∀ i)
Trang 9- Tức là Var(U i)=σ i2
(∀ i)2.2.1.2 Nguyên nhân
- Do bản chất mối quan hệ giữa các biến kinh tế
- Do kỹ thuật thu nhập xử lí số liệu
- Do con người học được hành vi trong quá khứ
- Một nguyên nhân khác là mô hình định dạng sai, mô hình hồi quy không
- Đúng (dạng hàm sai, thiếu biến quan trọng, chuyển đổi dữ liệu không đúng).2.2.1.3 Hậu quả
- Các ước lượng bình phương nhỏ nhất (OLS) vẫn là các ước lượng tuyến tính không chệch nhưng không còn là hiệu quả
- Kết quả của bài toán ước lượng và kiểm định giả thuyết về các hệ số hồi quy không còn đáng tin cậy (các khoảng tin cậy và kiểm định giả thuyết thông thườngdựa trên phân phối t và F sẽ không còn đáng tin cậy nữa Do vậy, nếu chúng ta áp dụng các kỹ thuật kiểm định giả thuyết thông thường sẽ cho ra kết quả sai)
- Kết quả dự báo không còn hiệu quả nữa khi sử dụng các ước lượng OLS có phương sai không nhỏ nhất
2.2.1.4 Phát hiện hiện tượng phương sai sai số thay đổi
Phương pháp đồ thị phần dư
Ước lượng mô hình hồi quy gốc thu được e i → e i2
Vẽ đồ thị e i2 theo chiều tăng của Xij nào đó (hoặc Y^i )
Nhận xét: Nếu Xij biến động mà e i2 cũng biến động tăng, giảm theo các dạng hình b, c, d, e thì mô hình có phương sai sai số thay đổi, còn mô hình a thi phương sai sai số là thuần nhất
Trang 10 Bước 1: Ước lượng hồi quy gốc để thu được các phần dư e i
Bước 2: Ước lượng hồi quy
Nếu H0bị bác bỏ thì kết luận có phương sai của sai số thay đổi
Tiêu chuẩn kiểm định:
Trang 11Dựa vào W α hoặc P – giá trị để kiểm định giả thiết:
+ Nếu P – giá trị < α => Bác bỏ H0, chấp nhận H1 và kết luận phương sai của sai số thay đổi
+ Nếu P – giá trị > α => Bác bỏ H1, chấp nhận H0 và kết luận không có phương sai của sai số thay đổi
Dựa vào W α hoặc P – giá trị để kiểm định giả thiết:
+ Nếu P – giá trị < α => Bác bỏ H0, chấp nhận H1 và kết luận phương sai của sai số thay đổi
+ Nếu P – giá trị > α => Bác bỏ H1, chấp nhận H0 và kết luận không có phương sai của sai số thay đổi
Kiểm định White
Ước lượng mô hình gốc bằng phương pháp OLS được phần dư e i
Trang 12 Ước lượng mô hình phụ e i2=α1+α2X 2 i+…+α k X ki+γ1X 2 i2
+…+γ ki X ki2
i → j
λ j X i X j+vi
bằng phương pháp OLS tìn được hệ số xác định bội R¿2
BTKĐ:{H0: Phương sai sai số không đổi
H1: Phương sai sai số thay đổi {H0: R¿2=0
H1: R¿2>0
Với TCKĐ: χ = n.R¿2
H0đúng
χ 2 (df )
Dựa vào W_α hoặc P – giá trị để kiểm định giả thiết:α hoặc P – giá trị để kiểm định giả thiết:
+ Nếu P – giá trị < α => Bác bỏ H0, chấp nhận H1 và kết luận phương sai củasai số thay đổi
+ Nếu P – giá trị > α => Bác bỏ H1, chấp nhận H0 và kết luận không cóphương sai của sai số thay đổi
Kiểm định dựa trên biến phụ thuộc
Giả thuyết: σ i2=α1+α2[E(Y i)]2+U i
Thay E(Y¿ ¿i)= ^ Y i¿=> σ i2=α1+α2¿ thu được R¿2
Bài toán kiểm định: {H0: α2=0
H1:α2≠ 0{H0:Phương sai sai số đồng đều
H1: Phương sai sai số thay đổi
Tiêu chuẩn kiểm định: χ2
=n R¿2 Nếu H0đúng thì χ2~ χ2 (1)
Dựa vào W_α hoặc P – giá trị để kiểm định giả thiết:α hoặc P – giá trị để kiểm định giả thiết:
+ Nếu P – giá trị < α => Bác bỏ H0, chấp nhận H1 và kết luận phương sai củasai số thay đổi
+ Nếu P – giá trị > α => Bác bỏ H1, chấp nhận H0 và kết luận không cóphương sai của sai số thay đổi
Trang 13 Mô hình (2) có phương sai sai số không đổi: Var(U i
GLS là phương pháp sử dụng OLS trong mô hình sau khi thay đổi biến để các giả thiết được thỏa mãn WLS là kỹ thuật đặc biệt của GLS
TH2: Khi σ2 chưa biết:
Xét mô hình ban đầu: Y i=β1+β2X i+U i (1)
Mô hình có hiện tượng PSSS ngẫu nhiên thay đổi và giá trị của nó chưa biết:
Var (U i¿ = σ i2, ∀ i
- Giả thiết 1: PSSS ngẫu nhiên tỷ lệ với biến giải thích:
Var (U i¿=σ i2=σ2X i
Trang 14Chia cả 2 vế của mô hình (1) cho √X i ta có:
Ước lượng mô hình (4) bằng phương pháp WLS với trọng số w i= 1
X i thu được các ước lượng BLUE
- Giả thiết 2: PSSS ngẫu nhiên tỷ lệ với bình phương của biến giải thích:
- Giả thuyết 4: Dạng hàm sai
Thay đổi sang dạng hàm khác
2.2.2 Tự tương quan
2.2.2.1 Bản chất
Trang 15+ Tính “trễ” của các địa lượng kinh tế.
- Chủ quan: Kỹ thuật thi thập số liệu hay sai lầm khi thiết lập mô hình (bỏ biến, dạng hàm sai )
- Các kiểm định t và F nói chung không đáng tin cậy
- σ2=(n−k ) ^σ2
σ2 cho ước lượng lệch của σ2thực, và trong một số trường hợp nó dường như ước lượng thấp σ2
- R2 có thể là độ đo không đáng tin cậy cho R2 thực
- Các phương sai và sai số tiêu chuẩn của dự đoán đã tính được cũng có thểkhông hiệu quả
=> Khoảng tin cậy và kết quả kiểm định không còn ý nghĩa
Trang 162.2.2.4 Phát hiện hiện tượng tự tương quan
Kiểm định d (Durbin – Waston)
Ước lượng mô hình hồi quy gốc thu được e t
BTKĐ: {H0: MH không có tự tương quan
H1: Môhình có tự tương quan
Không có tựtương quan
Không có kếtluận
Tự tương quanâm
0 dL dU 4 – dU 4 – dL 4
Kiểm định B-G (Breush-Godfrey)
Mô hình:Y t=β1+β2X 2 t+…+β k X kt+Ut
Giả sử:U t=ρ1U t−1+…+ ρp U t− p+εt
Bằng phương pháp OLS, ước lượng mô hình ban đầu để nhận được các phần dư
e t, và ước lượng mô hình e t=β1+β2X 2 t+…+ βk X kt+ρ1e t−1+ρ2e t −2+…+ ρ p e t− p+vt đểthu được hệ số xác định bội R2
BTKĐ:{H0: ρ1=ρ2=…=ρp=0
H1:∃ ρj=0
<=> {H0: mhkhông có tươngquan bậc p (AR ( p))
H1:môhình có tương quan bậc p( AR ( p ))
Trang 17Có xảy ra hiện tượng TTQ bậc 1 Khắc phục hiện tượng trên:
TH1: Khi cấu trúc tự tương quan đã biết:
Xét MH: Y i=β1+β2X i+Ui
Với cấu trúc TTQ: U i=ρ1U i−1+εi
Phương pháp sai phân tổng quát
Y i=β1+β2X i+Ui (1)
Y i−1=β1+β2X i−1+Ui−1
Y i−ρY i−1=β1(1−ρ)+ β2(X i−ρ X i−1)+(U i−ρ U i−1) (2)
TH2: Khi cấu trúc tự tương quan chưa biết:
Dựa vào thống kê d:
Trang 18- Đa cộng tuyến không hoàn hảo:
λ2X 2 i+λ3X 3 i+…+λ k X ki+Vi=0∀ i( ∑λ i2>0)2.2.3.2 Nguyên nhân
- Do bản chất của các mối quan hệ giữa các biến độc lập
+Dấu của ^β j khác so với thực tế
+Kết quả ước lượng khá nhạy khi có sự thay đổi nhỏ trong mẫu
2.2.3.4 Phát hiện hiện tượng đa cộng tuyến
Kết luận: Có xảy ra đa cộng tuyến
Ngược lại, nếu không thỏa mãn 1 trong hai điều kiện trên thì không xảy ra hiện tượng
Phương pháp nhân tử phóng đại phương sai (VIF)
VIF = 1
1−R i2 , Nếu VIF >10 thì xảy ra đa cộng tuyến
Trang 19 Phương pháp hồi quy phụ.
Chọn một biến X j để hồi quy theo các biến giải thích còn lại để thu được R2
{H0: môhình không có đa cộng tuyến
H1:mô hìnhcó xảy ra đa cộng tuyến{H0: R2j=0
Suy ra: W α hoặc P giátrị
Dựa vào W α hoặc P – giá trị để kiểm định giả thiết:
+ Nếu P – giá trị < α => Bác bỏ H0 , chấp nhận H1 và kết luận mô hình có đa cộng
Suy ra: Có cơ sở để khẳng định: mô hình có đa cộng tuyến giữa X i và X j
2.2.3.5 Khắc phục đa cộng tuyến
- Thu thập thêm số liệu mới:
+ Nếu có hiện tượng đa cộng tuyến thì có thể chọn lại mẫu Phương án này có thể
sử dụng chi phí cho việc lấy mẫu khác ở mức độ chấp nhận được
+ Đôi khi chỉ cần thu nhập thêm số liệu, tăng cỡ mẫu có thể làm giảm tính nghiêm trọng trong đa cộng tuyến
- Bỏ biến:
+ Khi mô hình có hiện tượng đa cộng tuyến nghiêm trọng thì cách “đơn giản nhất”
là bỏ biến ra khỏi mô hình
Trang 20+ Có 2 cách để chọn biến loại khỏi mô hình:
C1: Loại khỏi mô hình biến có tỷ số t thấp nhất
C2: Lần lượt bỏ từng biến, hồi quy mô hình và chọn mô hình có hệ số R2 cao nhất
Mô hình này là mô hình sai phân cấp 1
Thực tế cho thấy mô hình sai phân cấp 1 đã giảm được đáng kể mức độ đa cộng tuyếncủa mô hình gốc
2.2.4 Tính phân phối chuẩn của sai số ngẫu nhiên
Để kiểm định e t có phân phối chuẩn hay không ta có thể dùng χ2 bằng cách sử dụng
kiểm định Jarque-Bera (JB)
Trong đó S là hệ số bất đối xứng, K là độ nhọn Trong trường hợp tổng quát K và S
được tính như sau:
Với n khá lớn JB có phân bố xấp xỉ χ2(2) Xét cặp giả thiết
{H0: Sai số U i có phânbố chuẩn
Trang 21 H0 sẽ bị bác bỏ nếu JB >χ α2, trường hợp ngược lại không có cơ sở bác bỏ H0
Hoặc dựa vào P_α hoặc P – giá trị để kiểm định giả thiết: giá trị:
+ P_α hoặc P – giá trị để kiểm định giả thiết: giá trị >α, Chấp nhận H0, đồng thời bác bỏ H1
+ P_α hoặc P – giá trị để kiểm định giả thiết: giá trị <α, chấp nhận H1, đồng thời bác bỏ H0
CHƯƠNG 3: VẬN DỤNG 3.1 Xây dựng mô hình hồi quy:
3.1.1 Bảng số liệu:
Trang 23T là tổng chi cho tiền ăn uống (triệu đồng/tháng)
Từ bảng trên ta thấy tổng chi tiêu hàng tháng của sinh viên cao nhất là 6 triệu đồng, thấp nhất là 1 triệu đồng và trung bình chi tiêu hàng tháng là 2,754762 triệu đồng Tổng thu nhập hàng tháng của sinh viên cao nhất là 7 triệu và thấp nhất là 1,2 triệu đồng, trung bình thu nhập hàng tháng là 3,764286 triệu đồng Tổng chi tiêu cho tiền trọ hàng tháng của sinh viên cao nhất là 2 triệu đồng, thấp nhất là 0 triệu đồng, đây
là những bạn có nhà ở gần trường hoặc ở nhà người thân Tổng chi cho ăn uống lớn nhất là 2.5 triệu đồng, nhỏ nhất là 0,3 triệu đồng, trung bình là 1,161905 triệu đồng Như vậy nhìn vào con số lớn nhất và số liệu trung bình có thể thấy, mức chi tiêu hàng tháng của sinh viên là khá cao Các nhân tố đưa ra có khả năng tác động đến biến giải thích
3.1.2 Mô hình hồi quy mẫu:
Dependent Variable: Y
Method: Least Squares
Trang 24Adjusted R-squared 0.827651 S.D dependent var 1.023433 S.E of regression 0.424877 Akaike info criterion 1.216361
Bảng 3.3: Kết quả phân tích hồi quy
Mô hình hồi quy mẫu:
^
Y i=0,82013+0,24777 X i−0,43125 Zi+1,17429 Ti
3.2 Phát hiện và khắc phục khuyết tật của mô hình:
3.2.1 Phương sai sai số thay đổi:
a Phát hiện hiện tượng phương sai sai số thay đổi
Sử dụng Kiểm định White
Với mức ý nghĩa α=0.05
BTKĐ {H0: M ô h ìn h k h ô ng có h i ệ n t ượ ng phương sai sai số t h ay đổ i
H1: M ô h ìn h c ó h i ệ n t ượ ng phương sai sai số t h ay đổ i
Trang 25Kết quả eview:
Heteroskedasticity Test: White
Obs*R-squared 17.01412 Prob Chi-Square(9) 0.0485
Scaled explained SS 9.140642 Prob Chi-Square(9) 0.4244
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
R-squared 0.405098 Mean dependent var 0.163328
Adjusted R-squared 0.237782 S.D dependent var 0.189391
S.E of regression 0.165348 Akaike info criterion -0.557276
Sum squared resid 0.874876 Schwarz criterion -0.143545
Log likelihood 21.70279 Hannan-Quinn criter -0.405627
F-statistic 2.421154 Durbin-Watson stat 2.205911
Kết luận: Mô hình có hiện tượng phương sai sai số thay đổi
b Khắc phục hiện tượng PSSS thay đổi
Xét mô hình Y i=0 82012+0 24777 Xi−0 43125 Zi+1 17429 Ti+U i
KĐGT : {H0: M ô h ìn h k h ô ng có h i ệ n t ượ ng phương sai sai số t h ay đổ i
H1: M ô h ìn h c ó h i ệ n t ượ ng phương sai sai số t h ay đổ i
Xét trường hợp σ2 chưa biết
Giả thiết : σ2=σ2X i ( σ2 là hằng số dương)