CHƯƠNG 4: PHÂN TÍCH KẾT QUẢ NGHIÊN CỨU
4.4 Phân tích hồi quy tuyến tính
4.4.2 Xây dựng phương trình hồi quy tuyến tính
Phân tích hồi quy tuyến tính sẽ giúp chúng ta biết được cường độ tác động của các biến độc lập lên biến phụ thuộc. Phương pháp hồi quy được sử dụng ở đây là phương pháp bình phương nhỏ nhất OLS với biến phụ thuộc là quyết định mua sắm của khách hàng còn biến độc lập là các biến giá trị nhân sự giá trị xã hội, giá trị tính theo giá cả, giá trị chất lượng, không gian cửa hiệu của đại lý phân phối. Phương trình hồi quy tính bội biểu diễn mối liên hệ giữa các nhân tố có dạng:
QDM =βo+β1NS +β2CL +β3KG +β4XH +β5CX+β6GIA
Trong đó:
NS: yếu tố giá trị nhân sự CL: yếu tố giá trị chất lượng
KG: yếu tố không gian cửa hiệu của đại lý phân phối XH: yếu tố giá trị xã hội
CX: yếu tố giá trị cảm xúc
GIA: yếu tố giá trị tính theo giá cả
Vớiβo: hằng số tự do;βi, i: 1÷6, là hệ số hồi quy riêng phần
Kết quả phân tích hồi quy được thực hiện bằng phương pháp pháp Enter được thể hiện qua bảng tóm tắt kết quả hồi quy 4.7 và 4.8 như sau:
Bảng 4.7: Bảng mô tả kết quả phân tích hồi quy lần 1
Mô
hình R
R2 R2hiệu chỉnh Std. Error ước tính Hệ số Durbin-Watson
1 .729(a) .531 .516 .41179 2.133
a Biến độc lập: (Hằng số), GIA, CX, XH, KG, CL, NS b Biến phụ thuộc: QDM
Bảng 4.8: Hệ số hồi quy lần 1
Mô hình
Hệ số chưa chuẩn hóa
Hệ số chuẩn hóa
t Sig.
Đa cộng tuyến
B
Sai số
chuẩn Beta Tolerance VIF
1 Hằng số .734 .249 2.954 .003
NS .007 .048 .008 .147 .883 .737 1.357
CL .066 .062 .072 2.898 .043 .491 2.038
KG .017 .045 .023 .381 .704 .641 1.560
XH .305 .051 .374 6.034 .000 .620 1.612
CX .218 .063 .241 3.463 .001 .491 2.036
GIA .218 .049 .233 4.421 .000 .858 1.166
Thông qua kiểm định F cho mô hình hồi qui, với mức ý nghĩa 5% cho thấy bốn yếu tố CL (Sig. = 0.040), XH (Sig. = 0.000), CX (Sig. = 0.001), GIA (Sig.
=0.000) là có giá trị sig. 0.000< 0.05; và yếu tố còn lại là NS (Sig. =0.883) và KG (Sig. =0.704) là có giá trị sig.> 0.05. Bên cạnh đó yếu tố NS cóβ1=0.008 và yếu tố KG cóβ3=0.023, ta có thể nói rằng xét về mặt thống kê thì các hệ sốβ1và β3không lớn hơn 0 với mức ý nghĩa 5%. Vì thế ta loại biến NS và KG ra khỏi mô hình hồi quy 1 vì trọng số của hai biến này không có ý nghĩa thống kê. Tuy nhiên nếu xem xét tương quan trong mẫu giữa biến NS với các biến CL, XH, CX ta thấy như sau:
cor(NS,XH) =0.405; cor(NS,CL)=0.402; cor(NS,CX)=0.310 là khá mạnh. Tương tự, tương quan trong mẫu giữa biến KG với các biến CL, XH, CX: cor(KG, CL)=
0.554; cor(KG, XH)= 0.365; cor(KG, CX)= 0.384 là khá cao. Vì vậy, trong trường hợp này hai biến NS và KG đã được thể hiện trong biến CL, XH, CX. Điều này có nghĩa là các biến CL, XH, CX đã giải thích luôn phần NS và KG trong mô hình hồi quy bội. Trên thực tế, khi khách hàng có ý định mua một chiếc xe tay ga tại một đại lý phân phối có chất lượng phục vụ của nhân viên tốt, nhiệt tình thân thiện làm họ hài lòng (giá trị cảm xúc cao) thì họ sẽ mua xe tại đại lý đó, ngược lại khách hàng sẽ đi qua đại lý khác mua; bên cạnh đó giá trị chất lượng giải thích luôn phần của giá trị nhân sự thông qua cung cách phục vụ, thái độ của nhân viên cũng như không gian cửa hiệu khang trang, thiết bị hiện đại tạo cho khách hàng cảm giác đại lý phân phối kinh doanh chuyên nghiệp, đáng tin cậy. Không gian cửa hiệu của đại lý phân phối được giải thích bởi giá trị xã hội thông qua cách bài trí sang trọng, vị trí đại lý tọa lạc tại khu trung tâm mua sắm cao cấp, sầm uất làm cho khách hàng vào mua xe máy tay ga ở những nơi này được gia tăng giá trị xã hội của bản thân, được khẳng định đẳng cấp của họ và ngược lại.
Sau khi loại 2 biến NS và KG ra khỏi mô hình hồi quy 1 ta phân tích hồi quy lần 2 bằng phương pháp enter, kết quả được thể hiện qua bảng sau:
Bảng 4.9: Bảng tóm tắt kết quả phân tích hồi quy lần 2
Mô hình R R2 R2hiệu chỉnh Std. Error ước tính Hệ số Durbin-Watson
1 .728(a) .530 .521 .41005 2.138
a Biến độc lập: (Hằng số), GIA, CX, XH, CL
Bảng 4.10: ANOVA(b)
Mô hình Tổng độ lệch
bình phương Bậc tự do
Bình phương
trung bình F Sig.
1 Hồi quy 35.178 4 8.794 52.304 .000(a)
Phần dư 36.150 215 .168
Tổng cộng 71.328 219
a Biến độc lập: (Hằng số), GIA, CX, XH, CL b Biến phụ thuộc: QDM
Bảng 4.11: Hệ số hồi quy (a)
Mô hình
Hệ số chưa chuẩn hóa
Hệ số chuẩn
hóa t Sig. Đa cộng tuyến
B
Sai số
chuẩn Beta T VIF
1 Hằng số .764 .234 3.262 .001
CL .078 .055 .086 1.241 .036 .622 1.608
XH .310 .049 .380 6.381 .000 .666 1.502
CX .219 .062 .242 3.513 .001 .496 2.018
GIA .215 .049 .230 4.422 .000 .875 1.143
aBiến phụ thuộc: QDM
4.4.2.1 Đánh giá và kiểm định độ phù hợp của mô hình
Giá trị Sig. F change bằng 0.000< 0.05 cho thấy các biến đưa vào đều có ý nghĩa về mặt thống kê với mức ý nghĩa 5%. Như vậy các biến độc lập trong mô hình có mối quan hệ đối với biến phụ thuộc QDM (quyết định mua sắm của khách hàng).
Để đánh giá mức độ phù hợp của mô hình hồi quy đối với tập dữ liệu, ta sử dụng hệ số R2 hiệu chỉnh (Adjusted R Square). Căn cứ vào kết quả của bảng 4.9, hệ số R2 hiệu chỉnh là 0.521 nhỏ hơn R2 là 0.530 chứng tỏ mô hình hồi quy phù hợp với dữ liệu ở mức 0.521, có nghĩa là có 52.1% sự biến thiên của quyết định mua xe máy của người dân TP.HCM được giải thích bởi các biến có trong mô hình. Với giá trị này thì độ phù hợp của mô hình là chấp nhận được.
Để kiểm định độ phù hợp của mô hình hồi quy tuyến tính tổng thể, ta sử dụng kiểm định F trong bảng 4.10 phân tích phương sai ANOVA. Kết quả cho thấy giá trị Sig. của kiểm định F bằng 0.000 < 0.05 nên ta có thể bác bỏ giả thuyết H0
(các hệ số hồi quy bằng 0). Như vậy, mô hình hồi quy tuyến tính đã xây dựng phù hợp với tập dữ liệu thu được ( Hoàng trọng & Chu Nguyễn Mộng ngọc, 2008).
Đồng thời, ta cũng xem xét ý nghĩa của các hệ số hồi quy riêng phần trong mô hình thông qua kiểm định t với giả thiết H0là hệ số hồi quy của các biến độc lập βk = 0. Giả thiết H0 đồng nghĩa với giả thuyết các biến độc lập và phụ thuộc không có liên hệ tuyến tính. Kết quả bảng 4.10 cho thấy kiểm định t của 4 biến độc lập CX (giá trị cảm xúc), XH (giá trị xã hội), GIA (giá trị tính theo giá cả), CL (giá trị chất lượng) đều có hệ số Sig. <0.05. Điều này có nghĩa là an toàn khi bác bỏ giả thiết H0 (hệ số hồi quy riêng phần của tổng thể bằng 0 với độ tin cậy 95%). Như vậy các hệ số hồi quy riêng phần của các biến độc lập đều có ý nghĩa trong mô hình phân tích hồi quy lần 2.
4.4.2.2 Xác định tầm quan trọng của các biến trong mô hình
Căn cứ vào kết quả phân tích hệ số hồi quy ở bảng 4.11, phương trình hồi quy (theo hệ số đã chuẩn hóa) biểu thị ảnh hưởng của các nhân tố giá trị xã hội, giá trị tính theo giá cả và giá trị chất lượng đến quyết định mua sắm của khách hàng được thể hiện như sau:
QDM = 0.086×CL + 0.380×XH + 0.242×CX + 0.230×GIA
Hay là quyết định mua sắm bằng = 0.086× Giá trị chất lượng + 0.380× Giá trị xã hội + 0.242× Giá trị cảm xúc + 0.230×Giá trị tính theo giá cả.
Nghĩa là, giá trị xã hội (0.380) có tác động mạnh nhất đến quyết định mua xe tay ga của khách hàng, tiếp đến là giá trị cảm xúc (0.242), giá trị tính theo giá cả (0.230) và giá trị chất lượng (0.086) tác động đến quyết định mua sắm của khách hàng ở mức độ thấp nhất.
Điều đó cũng có ý nghĩa là trong điều kiện 3 nhân tố còn lại không thay đổi, nếu giá trị xã hội tăng lên 1 đơn vị thì làm cho quyết định mua sắm của khách hàng tăng lên 0.38 đơn vị. Tương tự, sự tăng lên một bậc của giá trị cảm xúc, giá trị tính
theo giá cả, giá trị chất lượng sẽ làm gia tăng quyết định mua sắm của khách hàng lên 0.242; 0.230; 0.086 đơn vị.
Mặt khác, kết quả phân tích hệ số hồi quy cho thấy các hệ số hồi quy đều dương chứng tỏ các có tác động cùng chiều đến quyết định mua sắm của khách hàng. Do đó, ta có thể kết luận: các giả thuyết trong mô hình nghiên cứu đã điều chỉnh H3, H4, H5, H6 được chấp nhận.
4.4.2.3 Dò tìm sự vi phạm các giả định cần thiết trong hồi quy tuyến tính
Giả định thứ nhất cần kiểm tra là giả định liên hệ tuyến tính. Phương pháp được sử dụng là biểu đồ phân tán Scatterplot với giá trị phần dư chuẩn hóa (Standarized residual) trên trục tung và giá trị dự đoán chuẩn hóa (Standarized predicted value) trên trục hoành.
Nhìn vào đồ thị hình 4.2, ta thấy các phần dư phân tán ngẫu nhiên trong 1 vùng quanh đường đi qua tung độ 0 chứ không tạo thành một hình dạng nào. Điều này có nghĩa là giả thuyết về quan hệ tuyến tính không bị vi phạm.
Scatterplot
Dependent Variable: QDM
3 2 1 0 -1 -2 -3
-4 -3
-2 -1 0 1 2 3
Regression Standardized Predicted Value
Hình 4.2: Đồ thị phân tán Scatterplot
Giả định thứ hai là giả định phương sai của sai số không đổi. Để thực hiện kiểm định này, chúng ta sẽ dùng kiểm định tương quan hạng Spearman của giá trị tuyệt đối phần dư và các biến độc lập.
Bảng 4.12: Bảng kiểm định hệ số tương quan hạng Spearman
Hệ số tương quan
hạng Spearman's
rho
CL XH CX GIA ABSCUARE
ABSCUARE
Hệ số tương
quan 0.051 0.031 0.027 -0.019 1.000 Sig. (2-tailed) 0.456 0.648 0.686 0.778 .
N 220 220 220 220 220
Kết quả kiểm định cho thấy giá trị Sig. của giá trị xã hội, giá trị tính theo giá cả, giá trị chất lượng, giá trị cảm xúc, đều lớn hơn 0.05 cho nên chúng ta không thể bác bỏ giả thuyết H0: hệ số tương quan của tổng thể bằng 0. Như vậy, giả thuyết phương sai của sai số thay đổi bị bác bỏ, tức là giả định phương sai của sai số không đổi không bị vi phạm.
Giả định thứ 3 là giả định về phân phối chuẩn và phần dư. Chúng ta sẽ sử dụng các biểu đồ tần số (Histogram, P-P plot) của các phần dư (đã được chuẩn hóa) để kiểm tra giả định này.
Kết quả từ biểu đồ tần số Histogram của phần dư từ hình 4.3 cho thấy phân phối của phần dư xấp xỉ chuẩn (trung bình Mean = 0, độ lệch chuẩn Std. Dev = 0.99 gần bằng 1). Điều này có nghĩa là giả thuyết phân phối chuẩn của phần dư không bị vi phạm.
Histogram
Dependent Variable: QDM
40
30
20
10 Std. Dev = ,99
Mean = 0,00
0 N = 220,00
Regression Standardized Residual
Hình 4.3: Đồ thị tần số Histogram
Kết quả từ biểu đồ tần số P-P Plot từ hình 4.4 cho thấy các điểm quan sát không phân tán quá xa đường thẳng kỳ vọng, nên ta có thể kết luận là giả định về phân phối chuẩn không bị vi phạm.
Normal P-P Plot of Regres io Dependent Variable: QDM
1,0
,8
,5
,3
0,0
0,0 ,3
,5
,8 1,0
Observed Cum Prob
Hình 4.4: Đồ thị tần số P-P plot
Giả định thứ tư là giả định về tính độc lập của sai số (không có tương quan giữa các phần dư). Ta dùng đại lượng thống kê Durbin-Watson (d) để kiểm định.
Theo kết quả từ bảng 4.10 cho thấy giá trị d= 2.138, thuộc khoản 1.5 – 2.5. Có nghĩa là d rơi vào miền chấp nhận giả thiết không có tương quan chuỗi bậc nhất với nhau. Do đó, giả định không có mối tương quan giữa các phần dư trong mô hình hồi qui đa biến không bị vi phạm.
Giả định thứ năm là giả định không có mối tương quan giữa các biến độc lập, đo lường đa cộng tuyến (Collinearity Diagnostics). Theo kết quả từ bảng 4.10 cho thấy hệ số phóng đại VIF (Variance Inflation Factor) không lớn hơn 5. Do đó, giả định không có mối tương quan giữa các biến độc lập trong mô hình hồi qui đa biến không bị vi phạm.
Như vậy, từ kết quả kiểm tra trên cho thấy mô hình hồi quy được xây dựng không vi phạm các giả định cần thiết trong hồi quy tuyến tính.