Xây d[ng mô h\nh Xác định dạng mô hình Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của xe nhóm em đã chọn sử d/ng phân tích hồi quy với mô hình hồi quy tuyến
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÍ
-o0o -TIỂU LUẬN MÔN : THỐNG KÊ ỨNG DỤNG CASE 4: FINDING THE BEST CAR VALUE
Giáo viên hướng dẫn: Hà Thị Thư Trang
Nhóm 12:
Hà Nô D i, tháng 1 năm 2022
Trang 2LỜI CẢM ƠN
Bản tiu luâ n được hoàn thành trên cơ sở đóng góp của các thành viên với vốn kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng D/ng Đây cũng là một cơ hội thực hành khiến chúng em có th hiu rõ hơn về các phân tích và kim định đặc trưng có liên quan, áp d/ng kiến thức trên giảng đường đ làm quen và rút ra được nhưng kết luận bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các nhân tố Chúng em xin gửi lời cảm ơn sâu sắc tới cô Hà Thị Thư Trang, Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn cô đã tận tình giảng dạy và truyền th/ kiến thức, kinh nghiệm cũng như phong cách trình bày, đ chúng em có thêm những bài học quý báu
Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bài tiu luâ n này không th tránh khỏi sai sót, chúng em rất mong nhận được sự góp ý động viên của cô đ chúng em có th hoàn thiện hơn, áp d/ng tốt hơn trong các công việc sau này
Chúng em xin chân thành cảm ơn Cô
H Nô i, ngày 13/01/2022
Nhóm thực hiê n
Trang 3MỤC LỤC
L^I C`M ƠN 2
ĐcNG GcP CfA ChC THiNH VIÊN 3
I ĐĂT VlN ĐÊ 5
1 Đề bài 5
2 Xây dựng mô hình 6
II PHÂN TrCH 8
1 Thống kê mô tả các biến 8
1.1 Tóm tắt dữ liê u 8
1.2 Bảng tần số và đồ thị của dữ liệu 8
2 Phân tích theo các câu hỏi được gợi ý trong Case-Problems 13
2.1 Giá ( Price) 13
2.2 Chi Phí Năm Năm Của Chủ Sở Hữu ( Cost/Mile ) 14
2.3 Đim Kim Tra Đương Bô ( Road-Test Score ) 14
2.4 Dự Đoán Đô Tin Câ y ( Predicted Reliability ) 16
3 Kết luâ n dựa trên các phân tích trên 16
4 Ước lượng mô hình hồi quy bô i 17
4.1 Giải thích hàm hồi quy mẫu nhận được : 17
4.2 Kim định sự phù hợp của mô hình 18
III K~T LUÂN 21
Trang 4I ĐĂDT VJN ĐÊ
1 ĐL bài
Khi quyết định mua mô t chiếc xe nào đó, giá trị thực không nhất thiết được xác định bởi số tiền bạn chi cho lần mua ban đầu Thay vào đó, những chiếc xe đáng tin câ y và không tốn nhiều chi phí đ sở hữu thường đại diê n cho những giá trị tốt nhất Tuy nhiên cho dù sở hữu mô t chiếc ô tô đáng tin câ y hay r€ tiền đến đâu nó cũng phải hoạt đô ng tốt
Đ đo lường giá trị, Consumer Reports đã phát trin mô t hê thống gọi là đim giá trị ( Value Score ) Đim giá trị dựa trên chi phí năm năm của chủ sở hữu
( Cost/Mile ), đim kim tra đường bô tổng th ( Road-Test Score ) và xếp hạng đô tin câ y được dự đoán ( Predicted Reliability ) Chi phí chủ sở hữu trong năm năm đầu tiên sở hữu, bao gồm khấu hao, nhiên liê u, bảo trì và sửa chữa,v.v Sử d/ng mức trung bình quốc gia là 12.000 dă m mô t năm, chi phí trung bình cho m•i dă m lái xe được sử d/ng làm thước đo chi phí của chủ sở hữu trong năm năm Đim kim tra đường bô là kết quả của hơn 50 bài kim tra và đánh giá dựa trên thang đim 100, với đim số cao hơn cho thấy hiê u suất tốt hơn, sự thoải mái, tiê n lợi và tiêt kiê m nhiên liê u Đim số kim tra đường bô cao nhất đạt được trong các bài kim tra do Consumer Reports thực hiê n được là 99 đối với Lexus LS 460L Xếp hạng dự đoán
về đô tin câ y (1 = K„m, 2 = Khá, 3 = Tốt, 4 = Rất tốt, 5 = Xuất sắc) dựa trên dữ liê u
từ Khảo sát tự đô ng hàng năm của Consumer Reports
Mô t chiếc xe có đim giá trị là 1,0 được coi là “giá trị trung bình” Mô t chiếc
xe có đim giá trị là 2,0 được coi là co giá trị tốt gấp đôi mô t chiếc xe có đim giá trị
là 1,0; mô t chiếc xe có đim giá trị 0,5 được coi là tốt bˆng mô t nửa so với mức trung bình; và như thế Dữ liê u về 20 chiếc sedans gia đình, bao gồm cả giá ($) của m•i chiếc được kim tra ở bảng dưới đây:
Car Price ($) Cost/Mile Road- Test Reliability Predicted Value Score
Trang 5Nissan Altima 2.5 S (4-cyl.) 23,970.00 0.59 91 4 1.75 Kia Optima LX (2.4) 21,885.00 0.58 81 4 1.73 Subaru Legacy 2.5i Premium 23,830.00 0.59 83 4 1.73 Ford Fusion Hybrid 32,360.00 0.63 84 5 1.70 Honda Accord LX-P (4-cyl.) 23,730.00 0.56 80 4 1.62 Mazda6 i Sport (4-cyl.) 22,035.00 0.58 73 4 1.60 Hyundai Sonata GLS (2.4) 21,800.00 0.56 89 3 1.58 Ford Fusion SE (4-cyl.) 23,625.00 0.57 76 4 1.55 Chevrolet Malibu LT (4-cyl.) 24,115.00 0.57 74 3 1.48 Kia Optima SX (2.0T) 29,050.00 0.72 84 4 1.43 Ford Fusion SEL (V6) 28,400.00 0.67 80 4 1.42 Nissan Altima 3.5 SR (V6) 30,335.00 0.69 93 4 1.42 Hyundai Sonata Limited (2.0T) 28,090.00 0.66 89 3 1.39 Honda Accord EX-L (V6) 28,695.00 0.67 90 3 1.36 Mazda6 s Grand Touring (V6) 30,790.00 0.74 81 4 1.34 Ford Fusion SEL (V6, AWD) 30,055.00 0.71 75 4 1.32 Subaru Legacy 3.6R Limited 30,094.00 0.71 88 3 1.29 Chevrolet Malibu LTZ (V6) 28,045.00 0.67 83 3 1.20 Chrysler 200 Limited (V6) 27,825.00 0.70 52 5 1.20 Chevrolet Impala LT (3.6) 28,995.00 0.67 63 3 1.05
2 Xây d[ng mô h\nh
Xác định dạng mô hình
Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của
xe nhóm em đã chọn sử d/ng phân tích hồi quy với mô hình hồi quy tuyến tính đ đưa ra những ước lượng và kết luận về biến ph/ thuộc của mô hình
Các biến được sử d/ng đ đưa vào trong bài là:
Đơn vị
Bi^n đô D c lâ D p Xi Price
Cost/Mile Road-Test Score Predicted Reliability
Đô la cost/mile Đim Mức
• Mô hình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộc Y và các biến
Trang 6độc lập có dạng :
Value Score = β1 + β2 * Price + β3 * Cost/Mile + β4 * Road-Test Score + β5 * Predicted Reliability + µi
Trong đó :
- β1: là hệ số chặn
- β2, β3, β4, β5: là các hệ số góc tương ứng với các biến độc lập
- µi : là sai số ngẫu nhiên
• Kỳ vọng về dấu của các biến độc lập :
- Theo đề bài đim giá trị không ph/ thuô c vào giá, nhưng theo mong muốn
của khách hàng nói chung kì vọng giá mua xe s— đồng biến với đim giá trị – dấu (+)
- Chi phí năm năm của chủ sở hữu càng nhiều thì đim giá trị s— càng nhỏ –
dấu (-)
- Đim đường bô càng cao chứng tỏ chiếc xe càng nhiều giá trị – dấu (+)
- Mức xếp hạng về đô tin câ y càng cao xe càng giá trị – dấu (+)
II PHÂN TÍCH
Trang 71 Thdng kê mô tf các bi^n
1.1 Tóm tgt dh liê D u
1.2 Bfng tần sd và đồ thị của dh liệu
1.2.1 Đimm Giá Trị ( Value Score )
Value
score Frequency tần số(%)
tần số tích lũy(%)
Trang 8Nhâ n x!t: số đim chủ yếu là 1.4; 1.6; 1.8 những xe được đánh giá hầu hết là có
đi€m trên giá trị trung bình từ khá đến tốt
1.2.2 Giá ( Price )
Price($)
Frequenc
y T(n s) (%)
T(n s) t+ch l,y %
21000-23300 3 15% 15.00%
23300-25600 5 25% 40.00%
25600-27900 1 5% 45.00%
27900-30200 8 40% 85.00%
30200-32500 3 15% 100.00%
21000 23300 25600 27900 30200 32500
0
1
2
3
4
5
6
7
8
9
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
3
5
1
8
3
0.00%
15.00%
40.00% 45.00%
85.00%
100.00%
Histogram
Price Frequency
Price($)
Nhâ n x!t: dữ liê u về giá xe tâ p trung ở giữa, giá xe được khảo sát quá cao và quá
thấp không nhiều
1.2.3 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )
Cost/Mile Frequency tần số(%) tần số tích lũy(%)
Trang 90,75 4 20% 100%
Nhâ n x!t: chi phí năm năm của chủ sở hữu có 0.6 và 0.7 chiếm phần lớn lần lượt là
40% và 35% trong tổng dữ liê u
1.2.4 Đimm Kimm Tra Đương Bô D ( Road-Test Score )
Road-test Score Frequency tần số(%) tần số tích lũy(%)
Trang 10Nhâ n x!t: Đim kim tra đường bô của các xe trong dữ liê u mẫu tâ p trung chủ yếu
trên 80 đim là mức đim cao
1.2.5 Đô D tin câ D y đưrc d[ đoán ( Predicted Reliability )
Predicte
d
reliabilit
y Frequenc y tần số(%) tần số tích lũy(%)
0
2
4
6
8
10
12
0%
20%
40%
60%
80%
100%
120%
7
11
2
0 35%
Histogra m
Frequency Cumulative %
Predicted reliability
Nhâ n x!t: Đô tin câ y được dự đoán chủ yếu là Tốt và Rất Tốt.
Trang 112 Phân toch theo các câu hsi đưrc gri t trong Case-Problems
Sử d/ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng phương pháp OLS, ta có kết quả về sự ph/ thuô c của biến Value Score với các biến khác như sau:
2.1 Giá ( Price)
- Có R = 0.3277 có nghĩa là biến Price giải thích được 32.77% sự biến động2
của biến Value Score
Hàm hồi quy mẫu nhâ n được là:
= 2.3587 - 0.0000334 * Price
- Giải thích : β = -0.0000334 cho biết khi giá xe tăng 1$ thì trung bình đim giá trị 1
giảm 0.0000334 đim
- Kim định giả thiết với tham số :
H0 : β = 0 1
H1 : β ≠ 01
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.0083 < α = 0,05 Ta bác bỏ giả thiếtH0 Vây biến Price có tác đô ng đến biến Value Score
Trang 122.2 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )
- Có R = 0.5132 có nghĩa là biến Cost/Mile giải thích được 51.32% sự biến động2
của biến Value Score
Hàm hồi quy mẫu nhâ n được là:
= 2.9422 – 2.3119 * (Cost/Mile)
- Giải thích : β = -2.3119 cho biết khi Chi Phí Năm Năm Của Chủ Sở Hữu tăng 1$ 1
thì trung bình Dim Giá Trị giảm 2.3119 đim
- Kim định giả thiết với tham số :
H0 : β = 0 1
H1 : β ≠ 01
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.000381 < α = 0,05 Ta bác bỏ giả thiếtH0 Vâ y biến Cost/Mile có tác
đô ng đến biến Value Score
Trang 13- Có R = 0.1694 có nghĩa là biến Road-Test Score giải thích được 16.94% sự biến 2
động của biến Value Score
Hàm hồi quy mẫu nhâ n được là:
= 0.7978 + 0.0082 * Road-Test Score
- Giải thích : β = 0.0082 cho biết khi Đim Kim Tra Đương Bô1 tăng 1 đim thì trung bình Dim Giá Trị tăng 0.0082 đim
- Kim định giả thiết với tham số :
H0 : β = 0 1
H1 : β ≠ 01
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.0715 > α = 0,05 Ta chấp nhâ n giả thuyết H Vâ0 y biến Road-Test Score không có tác đô ng đến biến Value Score
Trang 142.4 D[ Đoán Đô D Tin Câ D y ( Predicted Reliability )
- Có R = 0.1229 có nghĩa là biến Predicted Reliability giải thích được 12.29% sự 2
biến động của biến Value Score
Hàm hồi quy mẫu nhâ n được là:
= 1.0515 + 0.1084 * Predicted Reliability
- Giải thích : β = 0.1084 cho biết khi Dự Đoán Đô1 Tin Câ y tăng 1 mức thì trung bình Đim Giá Trị tăng 0.1084 đim
- Kim định giả thiết với tham số :
H0 : β = 0 1
H1 : β ≠ 01
Với mức ý nghĩa 5% ta thấy :
P – Value = 0.1294 > α = 0,05 Ta chấp nhâ n giả thuyết H Vâ0 y biến Predicted Reliability không có tác đô ng đến biến Value Score
3 K^t luâ D n d[a trên các phân toch trên
Sau khi thực hiê n phân tích hồi quy đơn biến Value Score theo các biến còn lại ta có th tổng hợp lại như sau:
Biến Price, Cost/Mile có tác đô ng tiêu cực đến biến ph/ thuô c, trong đó biến Cost/Mile giải thích được 51.32% sự biến động của biến Value Score là khá cao
Trang 15Biến Road-Test Score, Predicted Reliability có quan hê cùng chiều nhưng không có tác đô ng đến biến ph/ thuô c
=> Viê c thực hiê n phân tích hồi quy đơn các biến cho kết quả về kì vọng dấu của các biến là chính xác, nhưng theo đề bài đã cho là không chính xác Nhóm s— tiếp t/c thực hiê n hồi quy bô i đ đánh giá toàn diê n hơn về sự tác đô ng của các biến đô c
lâ p đến biến ph/ thuô c
4 Ước lưrng mô h\nh hồi quy bô D i
Sử d/ng phần mềm excel ta ước lượng mô hình trên bˆng phương pháp OLS,
ta có kết quả thu được ở bảng sau :
B5ng 1
Qua kết quả chạy từ ứng d/ng excel, chúng ta thấy rˆng R hiê2 u chžnh là 0.9126, có nghĩa là mô hình giải thích được 91.26% sự thay đổi của Value Score có ph/ thuộc vào các biến trong mô hình
Hàm hồi quy mẫu nhâ n được là:
Value Score^ = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test Score + 0.1791 * Predicted Reliability
4.1 Gifi thoch hàm hồi quy mẫu nhận đưrc :
- β = -0.000014 cho biết khi giá tăng 1 đô la thì đim giá trị trung bình giảm
Trang 160.000014 đim với điều kiê n các yếu tố khác không đổi
- β3 = 1.5815 cho biết khi chi phí năm năm của chủ sở hữu tăng 1 cost/mile thì đim giá trị trung bình giảm 1.5815 đim với điều kiê n các yếu tố khác
không đổi
- β4 = 0.0114 cho biết khi đim kim tra đường bô tăng 1 đim thì đim giá trị trung bình tăng 0.0114 đim với điều kiê n các yếu tố khác không đổi
- β5 = 0.1791 cho biết khi mức đô tin câ y dự đoán tăng 1 mức thì trung bình đim giá trị tăng 0.1719 đim với điều kiê n các yếu tố khác không đổi
4.2 Kimm định s[ phw hrp của mô h\nh
Kiểm định ý nghĩa mô hình
Kim định các cặp giả thiết :
H : β = β = β = β = 0 0 2 3 4 5
H : Có ít nhất 1 trong các giá trị β không bˆng 1
Từ bảng 4 ta có :
F = 50.6046 và mức ý nghĩa của F, P = 0,000000016< < 0,05 do đó ta có th kết F
luật mô hình trên là có ý nghĩa
Kiểm định gi5 thiết với các tham s).
H0 : β = 0 2
H1 : β ≠ 02
Với mức ý nghĩa 5% ở bảng 2 ta thấy :
P – Value = 0.1002 > α = 0,05
→ Biến Price không ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%
Tương tự lần lượt kim định với các cặp giả thiết khác :
H : β = 0 0 j
H : β ≠ 0 (3 ÷ 5 ) 1 j
Trang 17→ Các biến Cost/Mile, Road-Test Score, Predicted Reliability có ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%
Loại b? biến không cA ý nghĩa ( Price)
Thực hiê n hồi quy với dữ liê u cũ đã loại bỏ biến Price, thu được kết quả sau :
B5ng 2
Nhâ n x!t : Hê số R2 hiê u chžnh mới là 0.9013 < 0.9126 – hê số R2 hiê u chžnh cũ (Bảng 1) Nên viê c bỏ bớt biến Price trong mô hình là không phù hợp
Kiểm định hiê n tưFng đa cô ng tuyến
Sử d/ng phần mềm SPSS đ tính thừa số phóng đại phương sai VIF, ta thu được kết quả sau :
Trang 18Nhâ n x!t : các giá trị VIF nˆm trong khoảng từ 1 đến 5 cho thấy rˆng có mô t
mối tương quan vừa phải giữa các biến nhưng không quá nghiêm trọng nên
có th bỏ qua
Kiểm định gi5 định không cA tG tương quan giIa các ph(n dư.
Dùng kim định Durbin Waston trên SPSS thu được kết quả :
Nhâ n x!t : 1 < D = 1.710 <3 Vâ y mô hình không có hiê n tượng tự tương quan
giữa các phần dư
Kim định phần dư tuân theo phân phối chu£n
Thực hiê n kim định phân phối chu£n cho phần dư trong SPSS có kết quả sau :
Nhâ n x!t :
- Với kim định Kolmogorow-Smirnov, p-value = 0.200 > 0.05
- Với kim định Shapiro-Wilk, p-value = 0.283 > 0.05
Vâ y cả hai kim định đều cho kết quả phần dư tuân theo phân phối chu£n
Kiểm định phương sai sai s) thay đLi
Dùng Eviews đ thực hiê n kim định White thu được bảng kết quả dưới đây :
Trang 19Nhâ n x!t : Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 > 0.05 Vâ y mô hình không có phương sai sai số thay đổi
Trang 20III KẾT LUÂDN
Vấn đề biến Price không có tác đô ng tới biến ph/ thuô c có th do c¥ mẫu
không đủ lớn Do viê c bỏ biến Price không làm tăng mức đô giải thích của mô hình nên nhóm em vẫn dữ nguyên mô hình ban đầu
Sau khi tiến hành kim định các giả thuyết của mô hình, không phát hiê n mô hình đã ước lượng vi phạm các giả định và kì vọng về dấu so với ban đầu Có th nói rˆng mô hình:
Value Score = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test Score + 0.1791 * Predicted Reliability
là mô t mô hình tốt