1. Trang chủ
  2. » Giáo Dục - Đào Tạo

TIỂU LUẬN môn THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE

20 18 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 20
Dung lượng 1,22 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Xây d[ng mô h\nh  Xác định dạng mô hình Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của xe nhóm em đã chọn sử d/ng phân tích hồi quy với mô hình hồi quy tuyến

Trang 1

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI

VIỆN KINH TẾ VÀ QUẢN LÍ

-o0o -TIỂU LUẬN MÔN : THỐNG KÊ ỨNG DỤNG CASE 4: FINDING THE BEST CAR VALUE

Giáo viên hướng dẫn: Hà Thị Thư Trang

Nhóm 12:

Hà Nô D i, tháng 1 năm 2022

Trang 2

LỜI CẢM ƠN

Bản tiu luâ n được hoàn thành trên cơ sở đóng góp của các thành viên với vốn kiến thức được đúc kết ra từ quá trình học và nghiên cứu môn Thống Kê -ng D/ng Đây cũng là một cơ hội thực hành khiến chúng em có th hiu rõ hơn về các phân tích và kim định đặc trưng có liên quan, áp d/ng kiến thức trên giảng đường đ làm quen và rút ra được nhưng kết luận bổ ích về những hiện tượng trong những mối tương quan khác nhau và sự ảnh hưởng lẫn nhau giữa các nhân tố Chúng em xin gửi lời cảm ơn sâu sắc tới cô Hà Thị Thư Trang, Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn cô đã tận tình giảng dạy và truyền th/ kiến thức, kinh nghiệm cũng như phong cách trình bày, đ chúng em có thêm những bài học quý báu

Do vốn kiến thức và kĩ năng còn hạn chế nên chắc hẳn bài tiu luâ n này không th tránh khỏi sai sót, chúng em rất mong nhận được sự góp ý động viên của cô đ chúng em có th hoàn thiện hơn, áp d/ng tốt hơn trong các công việc sau này

Chúng em xin chân thành cảm ơn Cô

H Nô i, ngày 13/01/2022

Nhóm thực hiê n

Trang 3

MỤC LỤC

L^I C`M ƠN 2

ĐcNG GcP CfA ChC THiNH VIÊN 3

I ĐĂT VlN ĐÊ 5

1 Đề bài 5

2 Xây dựng mô hình 6

II PHÂN TrCH 8

1 Thống kê mô tả các biến 8

1.1 Tóm tắt dữ liê u 8

1.2 Bảng tần số và đồ thị của dữ liệu 8

2 Phân tích theo các câu hỏi được gợi ý trong Case-Problems 13

2.1 Giá ( Price) 13

2.2 Chi Phí Năm Năm Của Chủ Sở Hữu ( Cost/Mile ) 14

2.3 Đim Kim Tra Đương Bô  ( Road-Test Score ) 14

2.4 Dự Đoán Đô  Tin Câ y ( Predicted Reliability ) 16

3 Kết luâ n dựa trên các phân tích trên 16

4 Ước lượng mô hình hồi quy bô i 17

4.1 Giải thích hàm hồi quy mẫu nhận được : 17

4.2 Kim định sự phù hợp của mô hình 18

III K~T LUÂN 21

Trang 4

I ĐĂDT VJN ĐÊ

1 ĐL bài

Khi quyết định mua mô t chiếc xe nào đó, giá trị thực không nhất thiết được xác định bởi số tiền bạn chi cho lần mua ban đầu Thay vào đó, những chiếc xe đáng tin câ y và không tốn nhiều chi phí đ sở hữu thường đại diê n cho những giá trị tốt nhất Tuy nhiên cho dù sở hữu mô t chiếc ô tô đáng tin câ y hay r€ tiền đến đâu nó cũng phải hoạt đô ng tốt

Đ đo lường giá trị, Consumer Reports đã phát trin mô t hê  thống gọi là đim giá trị ( Value Score ) Đim giá trị dựa trên chi phí năm năm của chủ sở hữu

( Cost/Mile ), đim kim tra đường bô  tổng th ( Road-Test Score ) và xếp hạng đô  tin câ y được dự đoán ( Predicted Reliability ) Chi phí chủ sở hữu trong năm năm đầu tiên sở hữu, bao gồm khấu hao, nhiên liê u, bảo trì và sửa chữa,v.v Sử d/ng mức trung bình quốc gia là 12.000 dă m mô t năm, chi phí trung bình cho m•i dă m lái xe được sử d/ng làm thước đo chi phí của chủ sở hữu trong năm năm Đim kim tra đường bô  là kết quả của hơn 50 bài kim tra và đánh giá dựa trên thang đim 100, với đim số cao hơn cho thấy hiê u suất tốt hơn, sự thoải mái, tiê n lợi và tiêt kiê m nhiên liê u Đim số kim tra đường bô  cao nhất đạt được trong các bài kim tra do Consumer Reports thực hiê n được là 99 đối với Lexus LS 460L Xếp hạng dự đoán

về đô  tin câ y (1 = K„m, 2 = Khá, 3 = Tốt, 4 = Rất tốt, 5 = Xuất sắc) dựa trên dữ liê u

từ Khảo sát tự đô ng hàng năm của Consumer Reports

Mô t chiếc xe có đim giá trị là 1,0 được coi là “giá trị trung bình” Mô t chiếc

xe có đim giá trị là 2,0 được coi là co giá trị tốt gấp đôi mô t chiếc xe có đim giá trị

là 1,0; mô t chiếc xe có đim giá trị 0,5 được coi là tốt bˆng mô t nửa so với mức trung bình; và như thế Dữ liê u về 20 chiếc sedans gia đình, bao gồm cả giá ($) của m•i chiếc được kim tra ở bảng dưới đây:

Car Price ($) Cost/Mile Road- Test Reliability Predicted Value Score

Trang 5

Nissan Altima 2.5 S (4-cyl.) 23,970.00 0.59 91 4 1.75 Kia Optima LX (2.4) 21,885.00 0.58 81 4 1.73 Subaru Legacy 2.5i Premium 23,830.00 0.59 83 4 1.73 Ford Fusion Hybrid 32,360.00 0.63 84 5 1.70 Honda Accord LX-P (4-cyl.) 23,730.00 0.56 80 4 1.62 Mazda6 i Sport (4-cyl.) 22,035.00 0.58 73 4 1.60 Hyundai Sonata GLS (2.4) 21,800.00 0.56 89 3 1.58 Ford Fusion SE (4-cyl.) 23,625.00 0.57 76 4 1.55 Chevrolet Malibu LT (4-cyl.) 24,115.00 0.57 74 3 1.48 Kia Optima SX (2.0T) 29,050.00 0.72 84 4 1.43 Ford Fusion SEL (V6) 28,400.00 0.67 80 4 1.42 Nissan Altima 3.5 SR (V6) 30,335.00 0.69 93 4 1.42 Hyundai Sonata Limited (2.0T) 28,090.00 0.66 89 3 1.39 Honda Accord EX-L (V6) 28,695.00 0.67 90 3 1.36 Mazda6 s Grand Touring (V6) 30,790.00 0.74 81 4 1.34 Ford Fusion SEL (V6, AWD) 30,055.00 0.71 75 4 1.32 Subaru Legacy 3.6R Limited 30,094.00 0.71 88 3 1.29 Chevrolet Malibu LTZ (V6) 28,045.00 0.67 83 3 1.20 Chrysler 200 Limited (V6) 27,825.00 0.70 52 5 1.20 Chevrolet Impala LT (3.6) 28,995.00 0.67 63 3 1.05

2 Xây d[ng mô h\nh

Xác định dạng mô hình

Đ phân tích những tác động của các nhân tố ảnh hưởng đến đim giá trị của

xe nhóm em đã chọn sử d/ng phân tích hồi quy với mô hình hồi quy tuyến tính đ đưa ra những ước lượng và kết luận về biến ph/ thuộc của mô hình

Các biến được sử d/ng đ đưa vào trong bài là:

Đơn vị

Bi^n đô D c lâ D p Xi Price

Cost/Mile Road-Test Score Predicted Reliability

Đô la cost/mile Đim Mức

• Mô hình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộc Y và các biến

Trang 6

độc lập có dạng :

Value Score = β1 + β2 * Price + β3 * Cost/Mile + β4 * Road-Test Score + β5 * Predicted Reliability + µi

Trong đó :

- β1: là hệ số chặn

- β2, β3, β4, β5: là các hệ số góc tương ứng với các biến độc lập

- µi : là sai số ngẫu nhiên

• Kỳ vọng về dấu của các biến độc lập :

- Theo đề bài đim giá trị không ph/ thuô c vào giá, nhưng theo mong muốn

của khách hàng nói chung kì vọng giá mua xe s— đồng biến với đim giá trị – dấu (+)

- Chi phí năm năm của chủ sở hữu càng nhiều thì đim giá trị s— càng nhỏ –

dấu (-)

- Đim đường bô  càng cao chứng tỏ chiếc xe càng nhiều giá trị – dấu (+)

- Mức xếp hạng về đô  tin câ y càng cao xe càng giá trị – dấu (+)

II PHÂN TÍCH

Trang 7

1 Thdng kê mô tf các bi^n

1.1 Tóm tgt dh liê D u

1.2 Bfng tần sd và đồ thị của dh liệu

1.2.1 Đimm Giá Trị ( Value Score )

Value

score Frequency tần số(%)

tần số tích lũy(%)

Trang 8

Nhâ n x!t: số đim chủ yếu là 1.4; 1.6; 1.8 những xe được đánh giá hầu hết là có

đi€m trên giá trị trung bình từ khá đến tốt

1.2.2 Giá ( Price )

Price($)

Frequenc

y T(n s) (%)

T(n s) t+ch l,y %

21000-23300 3 15% 15.00%

23300-25600 5 25% 40.00%

25600-27900 1 5% 45.00%

27900-30200 8 40% 85.00%

30200-32500 3 15% 100.00%

21000 23300 25600 27900 30200 32500

0

1

2

3

4

5

6

7

8

9

0.00%

20.00%

40.00%

60.00%

80.00%

100.00%

120.00%

0

3

5

1

8

3

0.00%

15.00%

40.00% 45.00%

85.00%

100.00%

Histogram

Price Frequency

Price($)

Nhâ n x!t: dữ liê u về giá xe tâ p trung ở giữa, giá xe được khảo sát quá cao và quá

thấp không nhiều

1.2.3 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )

Cost/Mile Frequency tần số(%) tần số tích lũy(%)

Trang 9

0,75 4 20% 100%

Nhâ n x!t: chi phí năm năm của chủ sở hữu có 0.6 và 0.7 chiếm phần lớn lần lượt là

40% và 35% trong tổng dữ liê u

1.2.4 Đimm Kimm Tra Đương Bô D ( Road-Test Score )

Road-test Score Frequency tần số(%) tần số tích lũy(%)

Trang 10

Nhâ n x!t: Đim kim tra đường bô  của các xe trong dữ liê u mẫu tâ p trung chủ yếu

trên 80 đim là mức đim cao

1.2.5 Đô D tin câ D y đưrc d[ đoán ( Predicted Reliability )

Predicte

d

reliabilit

y Frequenc y tần số(%) tần số tích lũy(%)

0

2

4

6

8

10

12

0%

20%

40%

60%

80%

100%

120%

7

11

2

0 35%

Histogra m

Frequency Cumulative %

Predicted reliability

Nhâ n x!t: Đô  tin câ y được dự đoán chủ yếu là Tốt và Rất Tốt.

Trang 11

2 Phân toch theo các câu hsi đưrc gri t trong Case-Problems

Sử d/ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng phương pháp OLS, ta có kết quả về sự ph/ thuô c của biến Value Score với các biến khác như sau:

2.1 Giá ( Price)

- Có R = 0.3277 có nghĩa là biến Price giải thích được 32.77% sự biến động2

của biến Value Score

 Hàm hồi quy mẫu nhâ n được là:

= 2.3587 - 0.0000334 * Price

- Giải thích : β = -0.0000334 cho biết khi giá xe tăng 1$ thì trung bình đim giá trị 1

giảm 0.0000334 đim

- Kim định giả thiết với tham số :

 H0 : β = 0 1

H1 : β ≠ 01

Với mức ý nghĩa 5% ta thấy :

P – Value = 0.0083 < α = 0,05 Ta bác bỏ giả thiếtH0 Vây biến Price có tác đô ng đến biến Value Score

Trang 12

2.2 Chi Pho Năm Năm Của Chủ Sp Hhu ( Cost/Mile )

- Có R = 0.5132 có nghĩa là biến Cost/Mile giải thích được 51.32% sự biến động2

của biến Value Score

 Hàm hồi quy mẫu nhâ n được là:

= 2.9422 – 2.3119 * (Cost/Mile)

- Giải thích : β = -2.3119 cho biết khi Chi Phí Năm Năm Của Chủ Sở Hữu tăng 1$ 1

thì trung bình Dim Giá Trị giảm 2.3119 đim

- Kim định giả thiết với tham số :

 H0 : β = 0 1

H1 : β ≠ 01

Với mức ý nghĩa 5% ta thấy :

P – Value = 0.000381 < α = 0,05 Ta bác bỏ giả thiếtH0 Vâ y biến Cost/Mile có tác

đô ng đến biến Value Score

Trang 13

- Có R = 0.1694 có nghĩa là biến Road-Test Score giải thích được 16.94% sự biến 2

động của biến Value Score

 Hàm hồi quy mẫu nhâ n được là:

= 0.7978 + 0.0082 * Road-Test Score

- Giải thích : β = 0.0082 cho biết khi Đim Kim Tra Đương Bô1  tăng 1 đim thì trung bình Dim Giá Trị tăng 0.0082 đim

- Kim định giả thiết với tham số :

 H0 : β = 0 1

H1 : β ≠ 01

Với mức ý nghĩa 5% ta thấy :

P – Value = 0.0715 > α = 0,05 Ta chấp nhâ n giả thuyết H Vâ0 y biến Road-Test Score không có tác đô ng đến biến Value Score

Trang 14

2.4 D[ Đoán Đô D Tin Câ D y ( Predicted Reliability )

- Có R = 0.1229 có nghĩa là biến Predicted Reliability giải thích được 12.29% sự 2

biến động của biến Value Score

 Hàm hồi quy mẫu nhâ n được là:

= 1.0515 + 0.1084 * Predicted Reliability

- Giải thích : β = 0.1084 cho biết khi Dự Đoán Đô1 Tin Câ y tăng 1 mức thì trung  bình Đim Giá Trị tăng 0.1084 đim

- Kim định giả thiết với tham số :

 H0 : β = 0 1

H1 : β ≠ 01

Với mức ý nghĩa 5% ta thấy :

P – Value = 0.1294 > α = 0,05 Ta chấp nhâ n giả thuyết H Vâ0 y biến Predicted Reliability không có tác đô ng đến biến Value Score

3 K^t luâ D n d[a trên các phân toch trên

Sau khi thực hiê n phân tích hồi quy đơn biến Value Score theo các biến còn lại ta có th tổng hợp lại như sau:

Biến Price, Cost/Mile có tác đô ng tiêu cực đến biến ph/ thuô c, trong đó biến Cost/Mile giải thích được 51.32% sự biến động của biến Value Score là khá cao

Trang 15

Biến Road-Test Score, Predicted Reliability có quan hê  cùng chiều nhưng không có tác đô ng đến biến ph/ thuô c

=> Viê c thực hiê n phân tích hồi quy đơn các biến cho kết quả về kì vọng dấu của các biến là chính xác, nhưng theo đề bài đã cho là không chính xác Nhóm s— tiếp t/c thực hiê n hồi quy bô i đ đánh giá toàn diê n hơn về sự tác đô ng của các biến đô c

lâ p đến biến ph/ thuô c

4 Ước lưrng mô h\nh hồi quy bô D i

Sử d/ng phần mềm excel ta ước lượng mô hình trên bˆng phương pháp OLS,

ta có kết quả thu được ở bảng sau :

B5ng 1

Qua kết quả chạy từ ứng d/ng excel, chúng ta thấy rˆng R hiê2 u chžnh là 0.9126, có nghĩa là mô hình giải thích được 91.26% sự thay đổi của Value Score có ph/ thuộc vào các biến trong mô hình

 Hàm hồi quy mẫu nhâ n được là:

Value Score^ = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test Score + 0.1791 * Predicted Reliability

4.1 Gifi thoch hàm hồi quy mẫu nhận đưrc :

- β = -0.000014 cho biết khi giá tăng 1 đô la thì đim giá trị trung bình giảm

Trang 16

0.000014 đim với điều kiê n các yếu tố khác không đổi

- β3 = 1.5815 cho biết khi chi phí năm năm của chủ sở hữu tăng 1 cost/mile thì đim giá trị trung bình giảm 1.5815 đim với điều kiê n các yếu tố khác

không đổi

- β4 = 0.0114 cho biết khi đim kim tra đường bô  tăng 1 đim thì đim giá trị trung bình tăng 0.0114 đim với điều kiê n các yếu tố khác không đổi

- β5 = 0.1791 cho biết khi mức đô  tin câ y dự đoán tăng 1 mức thì trung bình đim giá trị tăng 0.1719 đim với điều kiê n các yếu tố khác không đổi

4.2 Kimm định s[ phw hrp của mô h\nh

 Kiểm định ý nghĩa mô hình

Kim định các cặp giả thiết :

H : β = β = β = β = 0 0 2 3 4 5

H : Có ít nhất 1 trong các giá trị β không bˆng 1

Từ bảng 4 ta có :

F = 50.6046 và mức ý nghĩa của F, P = 0,000000016< < 0,05 do đó ta có th kết F

luật mô hình trên là có ý nghĩa

 Kiểm định gi5 thiết với các tham s).

H0 : β = 0 2

H1 : β ≠ 02

Với mức ý nghĩa 5% ở bảng 2 ta thấy :

P – Value = 0.1002 > α = 0,05

→ Biến Price không ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%

Tương tự lần lượt kim định với các cặp giả thiết khác :

H : β = 0 0 j

H : β ≠ 0 (3 ÷ 5 ) 1 j

Trang 17

→ Các biến Cost/Mile, Road-Test Score, Predicted Reliability có ảnh hưởng đến biến Value Score ở mức ý nghĩa 5%

Loại b? biến không cA ý nghĩa ( Price)

Thực hiê n hồi quy với dữ liê u cũ đã loại bỏ biến Price, thu được kết quả sau :

B5ng 2

Nhâ n x!t : Hê  số R2 hiê u chžnh mới là 0.9013 < 0.9126 – hê  số R2 hiê u chžnh cũ (Bảng 1) Nên viê c bỏ bớt biến Price trong mô hình là không phù hợp

Kiểm định hiê n tưFng đa cô ng tuyến

Sử d/ng phần mềm SPSS đ tính thừa số phóng đại phương sai VIF, ta thu được kết quả sau :

Trang 18

Nhâ n x!t : các giá trị VIF nˆm trong khoảng từ 1 đến 5 cho thấy rˆng có mô t

mối tương quan vừa phải giữa các biến nhưng không quá nghiêm trọng nên

có th bỏ qua

Kiểm định gi5 định không cA tG tương quan giIa các ph(n dư.

Dùng kim định Durbin Waston trên SPSS thu được kết quả :

Nhâ n x!t : 1 < D = 1.710 <3 Vâ y mô hình không có hiê n tượng tự tương quan

giữa các phần dư

 Kim định phần dư tuân theo phân phối chu£n

Thực hiê n kim định phân phối chu£n cho phần dư trong SPSS có kết quả sau :

Nhâ n x!t :

- Với kim định Kolmogorow-Smirnov, p-value = 0.200 > 0.05

- Với kim định Shapiro-Wilk, p-value = 0.283 > 0.05

Vâ y cả hai kim định đều cho kết quả phần dư tuân theo phân phối chu£n

Kiểm định phương sai sai s) thay đLi

Dùng Eviews đ thực hiê n kim định White thu được bảng kết quả dưới đây :

Trang 19

Nhâ n x!t : Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 > 0.05 Vâ y mô hình không có phương sai sai số thay đổi

Trang 20

III KẾT LUÂDN

Vấn đề biến Price không có tác đô ng tới biến ph/ thuô c có th do c¥ mẫu

không đủ lớn Do viê c bỏ biến Price không làm tăng mức đô  giải thích của mô hình nên nhóm em vẫn dữ nguyên mô hình ban đầu

Sau khi tiến hành kim định các giả thuyết của mô hình, không phát hiê n mô hình đã ước lượng vi phạm các giả định và kì vọng về dấu so với ban đầu Có th nói rˆng mô hình:

Value Score = 1.2695 - 0.000014 * Price – 1.5815 * Cost/Mile + 0.0114 * Road-Test Score + 0.1791 * Predicted Reliability

là mô t mô hình tốt

Ngày đăng: 24/04/2022, 22:03

HÌNH ẢNH LIÊN QUAN

 Xác định dạng mô hình - TIỂU LUẬN môn  THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE
c định dạng mô hình (Trang 5)
• Mô hình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộ cY và các biến - TIỂU LUẬN môn  THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE
h ình hồi quy tổng th mô tả mối quan hệ biến ph/ thuộ cY và các biến (Trang 5)
Sử d/ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng phương pháp OLS, ta có kết quả về sự ph/ thuô c của biến Value Score với các biến  khác như sau: - TIỂU LUẬN môn  THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE
d ng phần mềm excel đ ước lượng mô hình hồi quy tuyến tính đơn bˆng phương pháp OLS, ta có kết quả về sự ph/ thuô c của biến Value Score với các biến khác như sau: (Trang 11)
Sử d/ng phần mềm excel ta ước lượng mô hình trên bˆng phương pháp OLS, ta có kết quả thu được ở bảng sau : - TIỂU LUẬN môn  THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE
d ng phần mềm excel ta ước lượng mô hình trên bˆng phương pháp OLS, ta có kết quả thu được ở bảng sau : (Trang 15)
Nhâ n x!t: Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 &gt; 0.05. Vâ y mô hình không có phương sai sai số thay đổi. - TIỂU LUẬN môn  THỐNG kê ỨNG DỤNG CASE 4 FINDING THE BEST CAR VALUE
h â n x!t: Nhìn vào bảng trên ta thấy giá trị p-value = 0.1337 &gt; 0.05. Vâ y mô hình không có phương sai sai số thay đổi (Trang 19)

TỪ KHÓA LIÊN QUAN

w