Giống nhau: Hàm hồi nghiên cứu sự phụ thuộc giữa một biến biến phụ thuộc, biến được giải thích và một hay nhiều biến khác biến độc lập hay biến giảithích với mục đích là ước lượng hay dự
Trang 2K204020959 K204020069
Trang 4Nhóm 3_Bài tập chương 2
I THEORY
T.1 Phát hiểu mô hình, hàm hồi quy đa biến Giải thích ý nghĩa các hệ số đứng trước các biến giải thích.
● Mô hình hồi quy tổng thể đa biến
Mô hình hồi quy tổng thể đa biến là mô hình mô tả sự phụ thuộc giữa một biến phụ thuộc (Y) vào nhiều biến giải thích cộng với một sai số ngẫu nhiên (ε)
Y =f ( X2 , X3 , , X k )+ ε=β1 +β2 X 2+ β3 X3 + +β k X k +ε
Trong đó:
- β1 là hệ số tự do
- β2, β3,…, β k là các hệ số hồi quy riêng ứng với các biến giải thích
- ε (i=1,2,…,n) là sai số ngẫu nhiên
-Y là giá trị của biến phụ thuộc
- X là giá trị của biến độc lập (biến giải thích) thứ i
● Hàm hồi quy tổng thể đa biến
Hàm hồi quy tổng thể đa biến là hàm hồi quy ước tính chính xác mức độ phụthuộc của biến phụ thuộc (Y) dựa trên các giá trị cho trước của các biến giảithích thông qua giá trị đại diện (giá trị trung bình) của biến phụ thuộc được sựủng hộ về mặt lý thuyết bới các học thuyết kinh tế hoặc các nghiên cứu thựcnghiệm khác
f (X2 , X3 , , X k )=E (Y / X2 , X3 , , X k )=β1+ β2 X2 +β3 X3 + + β k X k
Trong đó:
- β1 là hệ số tự do
- β2, β3,…, β k là các hệ số hồi quy riêng ứng với các biến giải thích
● Ý nghĩa của các hệ số đứng trước các biến giải thích
β 1 là hệ số tự do (hệ số chặn) cho biết giá trị trung bình Y khi X2 =X3= =X k =0
β 2 được gọi là hệ số góc, cho biết khi X2 tăng 1 đơn vị (trong điều kiện các X khác không đổi) thì giá trị trung bình Y tăng β2 đơn vị
β 3 được gọi là hệ số góc, cho biết khi X3 tăng 1 đơn vị (trong điều kiện các X khác không đổi) thì giá trị trung bình Y tăng β3 đơn vị
β k được gọi là hệ số góc, cho biết khi X k tăng 1 đơn vị (trong điều kiện các X khác không đổi) thì giá trị trung bình Y tăng β k đơn vị
Trang 5● Mô hình hồi quy mẫu đa biến
- ^β2, ^β3,…, ^β k là các hệ số hồi quy riêng ứng với các biến giải thích
- e (i=1,2,…,n) là sai số ngẫu nhiên
-Y là giá trị của biến phụ thuộc
- X là giá trị của biến độc lập (biến giải thích) thứ i
● Hàm hồi quy mẫu đa biến
- ^β2, ^β3,…, ^β k là các hệ số hồi quy riêng ứng với các biến giải thích
● Ý nghĩa của các hệ số đứng trước các biến giải thích
^β1 là hệ số tự do (hệ số chặn) cho biết giá trị trung bình Y khi X2 =X3= =Xk =0
^β2 được gọi là hệ số góc, cho biết khi X 2 tăng 1 đơn vị (trong điều kiện các X khác không đổi) thì giá trị trung bình Y tăng ^β2 đơn vị.
^β3 được gọi là hệ số góc, cho biết khi X3 tăng 1 đơn vị (trong điều kiện các X khác không đổi) thì giá trị trung bình Y tăng ^β3 đơn vị.
^β k được gọi là hệ số góc, cho biết khi X k tăng 1 đơn vị (trong điều kiện các X khác không đổi) thì giá trị trung bình Y tăng ^βk đơn vị
T.2 So sánh hàm hồi quy đơn biến và đa biến trên cùng một chủ đề Hãy cho biết sự khác biệt là gì? Giải thích.
Giống nhau: Hàm hồi nghiên cứu sự phụ thuộc giữa một biến (biến phụ thuộc,
biến được giải thích) và một hay nhiều biến khác (biến độc lập hay biến giảithích) với mục đích là ước lượng hay dự đoán giá trị đại diện của biến phụthuộc (giá trị trung bình) theo các giá trị xác định của một (hay các) biến độclập
Khác nhau:
- Đối với hàm hồi quy đơn biến f (X )=E (Y / X )=β1+ β2 X =β1 +β2 X2 ta chỉ nghiêncứu sự phụ thuộc giữa một biến (biến phụ thuộc, biến được giải thích) Y và một
Trang 6Nhóm 3_Bài tập chương 2
không sử dụng hàm hồi quy đơn biến nhiều vì các vấn đề, chủ đề nghiên cứuđều phụ thuộc vào nhiều yếu tố khác nhau chứ không chỉ dựa vào một yếu tốxác định Khi ước tính mức độ phụ thuộc của biến phụ thuộc (Y) dựa trên cácgiá trị cho trước của biến giải thích (X) ta sẽ bỏ qua rất nhiều các biến giải thíchkhác không được xét tới dẫn đến kết quả nghiên cứu được không sát với thực tế
- Đối với hàm hồi quy đa biến f (X )=E (Y / X )=β1+ β2 X2 + β3 X3+ + β k X k tanghiên cứu sự phụ thuộc giữa một biến (biến phụ thuộc, biến được giải thích) Y
và các biến khác (biến độc lập hay biến giải thích) X2 , X3 , , X k Trong thực tế,người ta thường sử dụng hàm hồi quy đa biến vì nó phù hợp với thực tế các vấn
đề, chủ đề nghiên cứu khi các vấn đề, chủ đề này đều phụ thuộc vào nhiều yếu
tố khác nhau Khi ước tính mức độ phụ thuộc của biến phụ thuộc (Y) dựa trêncác giá trị cho trước của các biến giải thích (X2 , X3 , , X k) ta sẽ xét được nhiềunguyên nhân cụ thể ảnh hưởng đến biến giải thích, đưa ra được kết quả chínhxác và sát với thực tế nhất cho nghiên cứu Tuy nhiên, không nên lạm dụng, đưanhiều biến không phù hợp vào mô hình
Ví dụ 1: Với chủ đề chi tiêu của một hộ gia đình, đối với hàm hồi quy đơn biến,
ta chỉ nghiên cứu sự phụ thuộc của chi tiêu (Y) vào thu nhập (X) Trong thực tế,chi tiêu của một hộ gia đình không chỉ phụ thuộc vào thu nhập mà còn vàonhiều yếu tố khác như số con trong gia đình, tiền thuê nhà, tiền điện nước,…Trong mô hình hồi quy đơn biến các yếu tố khác này được coi là sai số ngẫunhiên (ε) chứa những yếu tố không được đưa vào trong mô hình
Đối với hàm hồi quy đa biến, ta nghiên cứu sự phụ thuộc của chi tiêu (Y) vàocác biến thu nhập (X2), số con trong gia đình (X3 ¿, tiền thuê nhà (X 4 ¿ , tiền điện
nước (X5 ¿ , Hàm hồi quy đa biến này phù hợp hơn so với hàm hồi đơn biến
trong thực tế, mang đến giá trị trung bình của biến chi tiêu (Y) chính xác và cụthể hơn
Ví dụ 2: Với chủ đề điểm trung bình cuối năm nhất của một sinh viên đại học,
tương tự như ví dụ 1, đối với hàm hồi quy đơn biến, ta chỉ nghiên cứu sự phụthuộc của điểm trung bình cuối năm nhất (Y) vào thời gian lên lớp của sinh viên(X) Trong thực tế, điểm trung bình cuối năm nhất của một sinh viên không chỉphụ thuộc vào thời gian lên lớp của sinh viên mà còn vào nhiều yếu tố khác nhưthời gian tự học tại nhà, thời gian làm bài tập, thời gian học nhóm cùng bạn bè,
… Trong mô hình hồi quy đơn biến các yếu tố khác này được coi là sai số ngẫu nhiên (ε) chứa những yếu tố không được đưa vào trong mô hình
Đối với hàm hồi quy đa biến, ta nghiên cứu sự phụ thuộc của điểm trung bìnhcuối năm nhất (Y) vào các biến thời gian lên lớp của sinh viên ( X 2), thời gian tựhọc tại nhà (X3 ¿, thời gian làm bài tập (X 4 ¿ , thời gian học nhóm cùng bạn bè (
X5 ¿ , Hàm hồi quy đa biến này phù hợp hơn so với hàm hồi đơn biến trong
thực tế, mang đến giá trị trung bình của biến điểm trung bình cuối năm nhất (Y)chính xác và cụ thể hơn
Trang 7T.3 Phân biệt sự khác nhau và giống nhau giữa mô hình hồi quy đơn
biến và đa biến.
Mô hình hồi quy đơn biến
Chứa 1 biến giải thích Chứa nhiều biến giải thích
T.4 Trong mô hình hồi quy đa biến để đo lường sự phù hợp của mô hình ta nên sử dụng R2 hay R 2 ? Tại sao?
Trong mô hình hồi quy đa biến để đo lường sự phù hợp của mô hình ta nên sửdụng R 2 thay vì R2 Vì khi thêm biến vào mô hình thì ESS tăng nhưng TSS khôngđổi dẫn đến R2 tăng (theo công thức: R2= ESS
TSS ) Vậy nên cứ thêm biến vào
mô hình thì R2tăng, do đó không thể dùng R2 để đo lường mức độ phù hợp của môhình Thêm vào đó, ta sử dụng đại lượng R 2 , đây là đại lượng đo lường mức độ phùhợp của mô hình hồi quy đa biến tốt hơn R2 vì nó ngăn chặn được việc thêm cácbiến giải thích không tốt vào trong mô hình Trong thực tế khi thêm biến giải thíchvào mô hình thì R2 dùng hệ số luôn tăng dẫn đến việc thêm quá nhiều biến giảithích vào mô hình (kể cả biến không cần thiết) Để tránh hiện tượng này người tadùng hệ số R 2 vì khi thêm biến vào mô hình R 2 có thể tăng
hoặc không tăng Khi thêm biến vào mô hình, nếu biến này có ý nghĩa thìtăng, ngược lại, R 2 không tăng Do đó, ta chỉ thêm biến vào mô hình khi nàocòn tăng (biến được đưa vào mô hình có ý nghĩa, mô hình phù hợp)
T.5 Để kiểm định một mô hình hồi quy đa biến có hay không phù hợp, bạn
sẽ kiểm định giả thuyết gì ? Trình bày chi tiết các bước thực hiện.
Để kiểm định một mô hình hồi quy đa biến có hay không phù hợp, ta sẽ sử dụnggiả thuyết kiểm định sự phù hợp của mô hình (R2 ¿
Trang 8Nhóm 3_Bài tập chương 2
T.6 Hãy viết tất cả các cách mà bạn nghĩ có thể sử dụng để phân tích mối liên hệ giữa biến phụ thuộc (Y) và 5 biến giải thích (X 2 , X 3 , X 4 , X 5 ,
X 6 ), cụ thể:
a) Các cách viết có thể sử dụng cho mô hình và hàm hồi quy tổng thể.
● Mô hình hồi quy tổng thể
b) Các cách viết có thể sử dụng cho mô hình và hàm hồi quy mẫu.
● Mô hình hồi quy mẫu
Trang 9II MULTIPLE CHOICE
Câu M.1 Khi phân tích hồi quy đa biến người ta đưa ra 03 dạng biểu diễn như
Theo bạn có các dạng biểu diễn nào là ĐÚNG
A Chỉ có (i) đúng B Chỉ có (ii) đúng C Chỉ có (iii) D Cả (i), (ii) và
Trang 10Nhóm 3_Bài tập chương 2
Nếu ta có một mẫu gồm n quan sát có (k + 1) giá trị (Y i , X1 i , X 2i , X3 i ,… ,X ki ),i=1
,n thì ta có hệ n phương trình như sau:
Khi đó với mẫu gồm n quan sát có k giá trị (X 1i , X2 i , X 3i , … , X ki ),i=1 , n thì ta có
hệ n phương trình như sau:
{Y^1 =^β1 +β^2 X21 + ^β3 X31 +…+ ^β k X k1 Y^2 =^β1+ β^2 X22 + ^β3 X32 +…+ β^k X k1 …Y^n=^β1 + ^β2 X2n + ^β3 X3n +…+^β k X kn
Khi đó dạng ma trận của hàm hồi quy mẫu sẽ là: Y^ = X ^β→ (ii) đúng
Từ (i) và (ii) thì ta cũng suy ra được: e=Y −Y^ → (iii) đúng
Vậy: Cả (i), (ii) và (iii) đều đúng → Chọn D
Câu M.2 Hồi quy đa biến bao hàm việc giải bài toán:
Trang 12với giá trị thực Y i nhất, tức là tổng phần dư (sai số): ∑ e i= ∑ (Y i −Y i )
càng tốt Vì vậy ta mới có bài toán:
Trang 13B Chỉ có (ii) đúng
Trang 14Nhóm 3_Bài tập chương 2
C Cả hai mệnh đề (i) và (ii) đều đúng
D Cả hai mệnh đề (i) và (ii) đều sai
động của các nguyên nhân khác ngoài các biến X được đề cập
Vì vậy quan hệ trên cũng có nghĩa là: TSS = ESS + RSS (*) → (i) đúng
Từ (*) ta cũng suy ra được: 1= ESS TSS + RSS
TSS
Điều này có nghĩa là 100% sự biến động của Y = …% sự biến động của các biến
X + …% sự biến động của các nguyên nhân khác
(i) ^βk là một biến (đại lượng) ngẫu nhiên
(ii) Nếu các sai số ngẫu nhiên (ε i) bằng 0, thì việc hồi quy trở thành tầm thường, vì ta luôn có ^β k =β k
A Chỉ có (i) đúng
B Chỉ có (ii) đúng
C Cả hai mệnh đề (i) và (ii) đều đúng
D Cả hai mệnh đề (i) và (ii) đều sai
Đáp án: A
Có thể thấy tại mỗi quan sát thứ i, hay tương đương với mỗi bộ giá trị đã xác định
(x1i , x2i , x 3i , … , x ki ),ta nhận được một giá trị xác định f ( x1i , x2i ,x3i ,… , x ki ) và một giá trị ngẫu nhiên y i.
Khi đó: εi = y i −f ( x1 i ,x2 i ,x3 i ,… ,x ki ) là yếu tố (sai số) ngẫu nhiên
Trang 15Tuy nhiên khả năng cao là chúng ta đã vô tình chọn 1 bộ mẫu n quan sát quá
“đẹp”, vô tình khiến cho các sai số εi bằng 0 (lý do có thể đơn giản là vì các yếu
tố giải thích khác bù trừ cho nhau) Vì vậy khi ta chọn mẫu khác, có thể các sai số
ε i này không còn bằng 0 nữa và ^β k ≠ β k Vì vậy việc tìm hàm hồi quy mẫu vẫn có
ý nghĩa của nó
Câu M.5 Để kiểm định biến giải thích X k có hay không ý nghĩa khi đưa vào
mô hình người ta kiểm định giả thiết: Trong các phát biểu sau phát biểu nào đúng?
A Nếu giá trị kiểm định thì ta nói biến Xk có ýnghĩa ở mức α
B Nếu p_value > α thì biến Xk đưa vào mô hình là phù hợp
C Nếu p_value < α thì biến Xk đưa vào mô hình là không phù hợp
Trang 17Phương án C: Sai Nếu p_value > thì ta bác bỏ , biến có ý nghĩavới mức ý nghĩa Vì thế biến đưa vào mô hình là phù hợp.
=> Chọn phương án D: Cả A, B, C đều sai.
Câu M.6 Để kiểm định biến giải thích X k có hay không ý nghĩa khi đưa vào
mô hình người ta kiểm định giả thiết: Trong các phát biểu sau phát biểu nào ĐÚNG?
A Dùng và p_value là 2 phương pháp khác nhau để kiểm định cặpgiả thiết trên
B Hai phương pháp dùng và p_value là như nhau trong việc kiểm định cặp giả thiết trên
C Khi p_value = 0 thì ta chấp nhận giả thiết H0 mà không quan tâm đến mức ý nghĩa α
D Khi = 0 thì ta kết luận rằng việc đưa biến Xk vào mô hình là phù hợp
Phương án B: Sai
Phương án C: Sai Khi p_value > thì ta mới chấp nhận giả thuyết H0
Phương án D: Sai Khi thì ta mới kết luận rằng việc đưa vào mô hình là phù hợp
=> Chọn phương án A.
Trang 18Nhóm 3_Bài tập chương 2
Câu M.7 Giả sử ta đưa thêm biến giải thích có ý nghĩa vào mô hình
Trong các mệnh đề sau, đâu là mệnh đề ĐÚNG?
A.Đưa thêm biến giải thích vào mô hình làm giảm mức độ giải thích của mô
=> Chọn phương án B: ESS luôn tăng.
Câu M.8 Với hệ số , ta có các phát biểu sau:
(i) n là sample size
(ii) k là số lượng các tham số đứng trước các biến giải thích
(iii) RSS là Error sum square
(i) n là sample size => đúng
(ii) k là số lượng các tham số đứng trước biến giải thích => đúng
(iii) RSS là Error sum square => đúng
(iv) R2 > => đúng
Trang 19(v) được sử dụng để loại các biến giải thích không có ý nghĩa ra khỏi
mô hình => đúng vì khi ta thêm các biến giải thích không có ý nghĩa vào mô
hình, sẽ không tăng, từ đó giúp ta xác định và loại bỏ được các biến giảithích không có ý nghĩa
(vi) được sử dụng để ủng hộ việc thêm các biến giải thích có ý nghĩa
vào mô hình => đúng vì khi ta thêm các biến giải thích vào mô hình,
chỉ có các biến giải thích có ý nghĩa mới làm tăng, từ đó giúp ta xác định được biến giải thích nào là có ý nghĩa
=> Số phát biểu đúng là 6.
Người ta cần loại 2 biến , ra khỏi mô hình Trong các mệnh đều sau, mệnh đề nào ĐÚNG?
A Giả thuyết là hoàn toàn tương đương với việc kiểm định 2 giảthuyết or
B Cặp giả thuyết cần kiểm định là
C Kiểm định Wald test không phù hợp để kiểm định việc loại cùng lúc 2 biến, ra khỏi mô hình
D Khi kiểm định các giả thuyết or nếu chấp nhận mộttrong 2 giả thuyết này thì việc loại cả 2 biến giải thích là thích hợp trong môhình
Chọn B
Vì theo đề bài người ta cần loại 2 biến ra khỏi mô hình tức là cần kiểmđịnh có ý nghĩa đối với mô hình hay không Từ đó sẽ có cặp giả thuyết
cần kiểm định:
Trang 20Nhóm 3_Bài tập chương 2
A và D sai vì giả thuyết nghĩa là 2 biến giải thích đồng thời không
có ý nghĩa với mô hình, hai giả thuyết or nghĩa là có ít nhất
1 trong 2 biến giải thích không có ý nghĩa với mô hình nên hai giả thuyết không tương đương nhau
C sai vì kiểm định Wald test xét đến sự đồng thời không có ý nghĩa của 2 biếngiải thích đối với mô hình với cặp giả thuyết cần kiểm định:
Do đó, phù hợp để kiểm định việc loại cùng lúc 2 biến , ra khỏi mô hình hay không
Câu M.10 Xét hai mô hình hồi quy đa biến sau:
Người ta đưa ra các phát biểu sau:
(i) Mô hình (1) là mô hình (2) khi ta chấp nhận giả thuyết
(ii) Ta luôn có <
(iii) Nếu càng lớn thì ta càng có xu hướng chấp nhận giả thuyết (iv) Nếu càng lớn thì giá trị kiểm định trong kiểm định Wald càng gần 0
Trang 21(ii) Ta luôn có < Sai
Mô hình (1) có thêm nhiều biến giải thích cho mô hình (2) nên mức độ giảithích mô hình (1) lớn hơn mô hình (2) tức là Từ đó, làm giảm tổng bình phương sai số RSS Vì vậy ta luôn có
(iii) Nếu càng lớn thì ta càng có xu hướng chấp nhận giả thuyết Sai
Ta có giá trị kiểm định trong kiểm định Wald
Nếu càng lớn thì càng lớn Điều đó dẫn đến tăng đến mộtmức độ nào đó rồi lớn hơn giá trị (giá trị tra bảng Fisher) Khi đó, sẽcàng có xu hướng bác bỏ giả thuyết và việc thêm các biến giải thích là cần thiết
Hoặc là ta có thể giải thích: Nếu càng lớn thì việc thêm các biến vào mô hình sẽ càng cải thiện đáng kể mức độ giải thích của mô hình Từ
đó sẽ càng có xu hướng bác bỏ giả thuyết
(iv) Nếu càng lớn thì giá trị kiểm định trong kiểm định Wald càng gần 0 Sai
Ta có giá trị kiểm định trong kiểm định Wald
Theo giải thích của câu (ii) thì => không âm Ta có
=> luôn không âm, 0 < m < k < n
Tương tự giải thích của (iii): càng lớn thì càng lớn
Vì vậy, nếu càng lớn giá trị kiểm định không âm và càng tăng nên không thể càng gần 0
Trang 22Nhóm 3_Bài tập chương 2
Câu M.11 Xét hai mô hình hồi quy đa biến sau:
Wald Trong các mệnh đều sau, có bao nhiêu mệnh đề SAI
(i) Khi giá trị kiểm định càng lớn thì việc đưa thêm các biến giải thích ,vào mô hình là không nên –> Sai
Khi giá trị kiểm định càng lớn thì việc thêm các biến vào mô hình sẽ càng cải thiện đáng kể mức độ giải thích của mô hình Từ đó sẽ càng có xuhướng bác bỏ giả thuyết tức là việc đưa thêm các biến giải thích , vào
mô hình là phù hợp
(ii) Khi p_value của càng gần 0 thì việc loại các biến giải thích , là nênlàm
–> Sai
Nhìn vào đồ thị phân phối Fisher ta thấy được mối liên hệ giữa và p_value
Do đó khi p_value của càng gần 0 thì càng lớn và tiến dần đến + , cũngnhư theo giải thích của câu (i) nên việc loại các biến giải thích , là không phù hợp
(iii) p_value của lớn thì đồng nghĩa với có giá trị lớn -> Sai
Trang 23Nhìn vào đồ thị thì ta thấy khi p_value của lớn thì có giá trị càng nhỏ(iv) Khi giá trị kiểm định thì nên đưa thêm các biến giải thích ,vào mô hình -> Sai
Khi giá trị kiểm định thì ta chấp nhận tức là chấp nhận giả thuyết
Khi đó, các biến giải thích không phù hợp với mô hình và không nên đưa vào mô hình
A.0 B.1 C.2 D.3 E.4
Chọn E
Câu M.12 Xét hai mô hình hồi quy đa biến sau:
Để loại 02 biến , ra khỏi model 1 thì giá trị kiểm định nào sau đây ĐÚNG
Trang 24Chúng ta biết là các tổng của những bình phương độc lập có phân phối chi bìnhphương là phân phối chi bình phương với n – k bậc tự do (n quan sáttrừ k thông số trong Mô hình 1), cũng là phân phối chi bìnhphương với bậc tự do bằng m=2 là số biến số loại bỏ trong (2) Ta có tỷ số củahai phân bố chi bình phương độc lập có phân phối F có hai thông số: bậc tự docho tử số của tỷ số, bậc tự do cho mẫu số Trị thống kê sẽ căn cứ trên tỷ số F,chúng ta đã định nghĩa phân phối F là tỷ số của hai biến ngẫu nhiên phân phốichi bình phương độc lập Điều này cho ta trị thống kê:
Do đó đáp án đúng là C
Trang 25III PRACTICE
Bài 2.1
Theo 1 chủ đề nghiên cứu người ta thấy giá căn nhà (Price) trên cùng 1 khu
vực phụ thuộc vào: SQFT (Diện tích); BEDRMS (Số phòng ngủ); BATHS
(Số phòng tắm) (file Eview Baitap_Chapter2_2021_2022.wf1, sheet:
Bai_2_1) Người ta thu thập được một mẫu gồm 14 căn nhà có số liệu như
sau:
1 Tính hệ số tương quan tuyến tính (r XY ) giữa các cặp: PRICE & SQFT;
PRICE & BEDRMS; PRICE& BATHS Hãy giải thích các giá trị thu được
- Hệ số tương quan tuyến tính của Price & SQFT = 0.9058 Hệ số này cho biết
mức độ phụ thuộc giữa giá một căn nhà và diên tích của ngôi nhà đó Có
khoảng 90.58% sự tăng lên (hoặc giảm đi) của giá của một ngôi nhà (PRICE)
được giải thích qua sự tăng lên (hoặc giảm đi) về diện tích của ngôi nhà đó
(SQFT)), và 9.42% được giải thích bởi yếu tố khác
- Hệ số tương quan tuyến tính của Price & BEDRMS = 0.3156 Hệ số này cho
biết mức độ phụ thuộc giữa giá một căn nhà và số phòng ngủ của ngôi nhà đó
Có khoảng 31.56% sự tăng lên (hoặc giảm đi) của giá của một ngôi nhà
(PRICE) được giải thích qua sự tăng lên (hoặc giảm đi) về diện tích của ngôi
nhà đó (BEDRMS), và 68.44% được giải thích bởi yếu tố khác
- Hệ số tương quan tuyến tính của Price & BATHS = 0.6696 Hệ số này cho biết
mức độ phụ thuộc giữa giá một căn nhà và diên tích của ngôi nhà đó Có
khoảng 66.96% sự tăng lên (hoặc giảm đi) của giá của một ngôi nhà (PRICE)
Trang 26Hàm hồi quy 1: PRICE = f(SQFT)
Hàm hồi quy 2: PRICE = g(BEDRMS)
Hàm hồi quy 3: PRICE = h(BATHS)
Hàm hồi quy 4: PRICE = k (SQFT, BEDRMS)
Hàm hồi quy 5: PRICE = h (SQFT, BATHS)
Hàm hồi quy 6: PRICE = f (SQFT, BEDRMS, BATHS)
(a) Dựa trên kết quả của phần mềm Eviews hãy cho biết hàm hồi quy mẫu nào là tốt nhất? Tại sao.
Kết quả phân tích Eviews:
Hàm hồi quy 1: PRICE = f(SQFT) = 52.35 + 0.139SQFT
Trang 27Hàm hồi quy 2: PRICE = g(BEDRMS) = 112.85 + 56.175BEDRMS
Trang 28Nhóm 3_Bài tập chương 2
Hàm hồi quy 3: PRICE = h(BATHS) = 4.5+ 132.78BATHS
Hàm hồi quy 4: PRICE = k (SQFT, BEDRMS) = 0.148SQFT –
23.91BEDRMS +121.18
Hàm hồi quy 5: PRICE = h (SQFT, BATHS)= 0.15SQFT-22.72BATHS +
79.5
Trang 29Hàm hồi quy 6: PRICE = f (SQFT, BEDRMS, BATHS)= 0.15SQFT
- Đối với hàm thứ 2 và 3, R 2 lại khá thấp, R 2 lần lượt ở từng hàm là 0.0245
và 0.4024 Có nghĩa là ở hàm hồi quy mẫu thứ 2, biến số phòng ngủ của ngôinhà giải thích 2,45% được sự biến thiên của biến giá căn nhà, còn 97,55% là docác yếu tố khác Còn ở hàm hồi quy mẫu thứ 3, biến số phòng tắm của ngôi nhàgiải thích 40.24% được sự biến thiên của biến giá căn nhà, còn 59.76% là docác yếu tố khác
Vậy trong các hàm đơn biến trên, Hàm hồi quy mẫu thứ nhất tốt nhất
- Đối với các hàm đa biến (hàm 4, 5, 6) Có thể thấy tại hàm hồi quy mẫuthứ nhất, khi chỉ xét sự phụ thuộc của giá căn nhà vào diện tích của căn nhà đó,hàm có giá trị R 2 0.8056 còn khi ở hàm 4,5,6 (ta có thêm các biến số phòngtắm, số phòng ngủ vào hàm mới) thì R 2 của từng hàm này đều giảm xuống (giátrị R 2 của các hàm 4, 5, 6 lần lượt là 0.8046; 0.7937; 0.7867
- Qua đó, ta có thể thấy, với cùng một bộ số liệu, ở các hàm khi thêm cácbiến mới vào như các biến số phòng ngủ, số phòng tắm vào hàm hồi quy thì
Trang 30Nhóm 3_Bài tập chương 2
Vì thế hàm hồi quy mẫu tốt nhất là hàm số 1
(b) Dựa trên hàm hồi quy mẫu tốt nhất được chọn, hãy giải thích các hệ số đứng trước các biến giải thích.
PRICE = f(SQFT) = 52.35 + 0.139SQFT
Ý nghĩa hệ số đứng trước biến giải thích: Diện tích của ngôi nhà tăng lên 1 đơn
vị thì giá ngôi nhà trung bình sẽ tăng thêm 0.139 đơn vị
(c) Hãy dự báo giá nhà trung bình trong hàm hồi quy 5 nếu diện tích là 300
m 2 và số phòng tắm là 2
Hàm hồi quy 5: PRICE = h(SQFT, BATHS)= 0.15SQFT-22.72BATHS + 79.5Với diện tích 300 m2 , số phòng tắm là 2 thì giá nhà trung bình trong hàm hồi quy sẽ có giá trị là 0.15*300 - 22.72*2 + 79.5 = 79.06
(d) Hãy dự báo giá nhà trung bình trong hàm hồi quy 1 nếu diện tích là 300
m 2 và so sánh giá trị tìm được này với giá trị ở câu e) Bạn có rút ra nhận xét gì?
Hàm hồi quy 1: PRICE = f(SQFT) = 52.35 + 0.139SQFT
Với diện tích căn nhà là 300 m2, giá nhà trung bình là:
PRICE= 129.0616 + 0.1548SQFT - 21.5875BEDRMS - 12.1928BATHS
Ta sẽ sử dụng kiểm định Wald để xem hệ số đứng trước BEDRMS và BATHS (
β3và β4) có ý nghĩa hay không
Khi loại đi hai biến BEDRMS và BATHS, hàm hồi quy sẽ có dạng như sau:PRICE = f(SQFT) = 52.35 + 0.139SQFT (Tương đương với hàm hồi quy 1 ởcâu a) Ta có giả thiết kiểm định: (với i = 3, 4)
Lúc này, dựa vào kết quả chạy eviews từ câu a Ta có:
Trang 31Hàm Hồi quy Mẫu 6 Hàm hồi quy mẫu 1
R2 (6) = 0.8360
R2 (1) = 0.8205
Giá trị kiểm định
Ta có (0.4726 < 4.1029) Chấp nhận H0 Vì vậy, β3= β4= 0 Điều này
đồng nghĩa với Hàm hồi quy 1 tốt hơn hàm hồi quy 6
(f) Theo 1 số chuyên gia về bất động sản nhận định rằng giá căn nhà sẽ tăng khi giá trị của các biến giải thích tăng nhưng tuân theo quy luật cận biên giảm dần (bạn tự tìm hiểu thêm về quy luật này), nên họ đề xuất mô hình sau:
PRICE = f (SQFT, SQFT 2 ) + ԑ Giả định ta không quan tâm đến việc các hệ số đứng trước các biến giải thích này có hay không ý nghĩa.
Hãy trả lời các câu hỏi sau:
1 Bạn kỳ vọng các hệ số đứng trước các biến giải thích này sẽ có giá trị âm hay dương ? Giải thích?
Mô hình hồi quy tuyến tính đa biến:
Trang 32Nhóm 3_Bài tập chương 2
Nội dung của Quy luật lợi ích cận biên giảm dần:
- Trong kinh tế học, chúng ta có thể thấy quy luật lợi ích cận biên giảm dần chorằng, lợi ích cận biên của hàng hóa hoặc dịch vụ giảm khi nguồn cung sẵn cócủa nó tăng lên Theo đó mà các tác nhân kinh tế sẽ khiến lần lượt các đơn vịcủa hàng hóa hoặc dịch vụ ngày càng giảm đi, cho đến khi nó hết giá trị
- Bất cứ khi nào một cá nhân tương tác với một hàng hóa kinh tế, thì cá nhân đóhành động theo cách thể hiện thứ tự mà họ coi trọng việc sử dụng hàng hóa đó
Do đó, đơn vị đầu tiên được tiêu thụ, là dành cho mục đích có giá trị nhất của cánhân đó Đơn vị thứ hai được dành cho mục đích có giá trị thứ hai, và cứ nhưvậy Nói cách khác, qui luật lợi ích cận biên giảm dần qui định rằng, khi ngườitiêu dùng đi chợ để mua hàng hóa, họ không coi trọng tất cả các mặt hàng họmua như nhau Họ sẽ trả nhiều tiền hơn cho một số mặt hàng và ít hơn chonhững mặt hàng khác
Như vậy, hệ số β 2 được kỳ vọng là mang giá trị dương (β2 > 0) và hệ số β3 được
kỳ vọng là mang giá trị âm (β3< 0) vì theo lý thuyết của quy luật lợi ích cận biêngiảm dần, với trường hợp này ta có thể giải thích như sau: khi giá trị của cácbiến giải thích tăng thì giá trị của biến phụ thuộc sẽ tăng đến một điểm nhấtđịnh (hay còn được gọi là đỉnh của đồ thị Parabol) sau đó giảm dần, điều nàyđược biểu diễn một cách rõ ràng hơn qua đồ thị Parabol với β2 > 0 và β3< 0trong hình dưới đây:
Nghĩa là khi tăng giá trị của biến giải thích SQFT thì giá bán của căn nhà sẽtăng nhưng chỉ tăng đến một điểm nhất định rồi sau đó giảm dần
Trang 332 Bạn hãy sử dụng phần mềm Eviews để chạy mô hình hồi quy tuyến tính trên và cho biết các hệ số chạy trên phần mềm Eviews có dấu như bạn kỳ vọng không?
Sau khi chạy mô hình hồi quy tuyến tính trên phần mềm Eviews, ta được các hệ
số β 2= 0.2246 và β3= -2.1*10-5, như vậy ta có thể kết luận rằng các hệ số chạytrên phần mềm Eviews có dấu như kỳ vọng ban đầu
3* Hãy giải thích ý nghĩa của các hệ số đứng trước các biến giải thích trong mô hình trên?
Khi Diện tích của căn nhà tăng thêm 1m2 thì giá căn nhà sẽ tăng thêm trung bình0.22455 đơn vị
Với Δ PRICE ≈ PRICE’(X).ΔSQFT = β2+ 2β3SQFT = 0.2246 - 2*2.1*10-5 =0.22455
Khi diện tích căn nhà tăng và đạt đến giá trị khoảng 5348m2 thì giá căn nhà sẽđạt được giá trị cao nhất là khoảng 572 đơn vị Nhưng khi diện tích căn nhà lớnhơn 5348m2 thì giá căn nhà sẽ không tiếp tục tăng nữa mà giảm dần, phù hợpvới quy luật Lợi ích cận biên giảm dần