Dữ liệu đầu vào Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.. 2 Mục tiêu của bài toán T
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA: HTTT KINH TẾ VÀ THƯƠNG MAI ĐIỆN TỬ
ĐỀ TÀ̀I THẢO LUẬN
MÔN: KHAI PHÁ DỮ LIỆ$U TRONG KINH DOANH
Đề tài: Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm
Trang 2Người thực hiện: 9
BẢNG PHÂN CÔNG NHIỆ$M VỤ VÀ̀ DANH SÁCH THÀ̀NH VIÊN NHÓM 7
-Phân tích mô hình hồi quy-Tổng hợp word(nhóm trưởng)
- Phân tích nhân tố khám phá EFA
- Tương quan Pearson
Lời mở đầu, kết luận, Xử lý số
liệu
Trang 32
Trang 4Mục lục
CHƯƠNG I: KHẢO SÁT DỰ ÁN 5
CHƯƠNG II: KẾ́T QUẢ NGHIÊN CÚU 8
1 Mô tả thống kê 8
2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha 8
3 Kết quả phân tích nhân tố khám phá EFA 11
4 Tương quan pearson 16
5 Phân tích hồi quy đa biến 16
CHƯƠNG III: XÂY DỰNG CÂY QUYẾ́T ĐỊNH 18
CHƯƠNG IV: GIẢI PHÁP 28
Trang 5LỜI MỞ ĐẦU
Những năm gần đây, khi nền kinh tế đất nước phát triển, chất lượng đời sống củangười dân Việt Nam đặc biệt là ở khu vực thành thị ngày càng nâng cao Cùng với nhucầu “ăn ngon mặc đẹp” là nhu cầu có được một sức khỏe tốt, thân hình dẻo dai, cân đối
Để thỏa mãn các nhu cầu trên thì việc có được đôi giày thể thao đẹp, phù hợp với các loạihình thể thao là một điều cần thiết
Hàng loạt các thương hiệu giày thể thao quốc tế lớn như Nike, Adidas vàReebok… có nhà sản xuất gia công phần mềm của giày dép tại Việt Nam, đồng thời cácsản phẩm chính hãng cũng tham gia vào thị trường giày dép của Việt Nam Nổi bật trong
đó là Adidas Là thương hiệu nổi tiếng toàn cầu, Adidas tham gia thị trường dụng cụ thểthao Việt Nam từ rất lâu Năm 1993, Adidas đã có mặt tại Việt Nam nhưng phải đến năm
2009 Adidas mới chính thức thành lập Công ty Adidas Việt Nam, được sở hữu 100% vốnbởi Adidas International B.V (Amsterdam, Hà Lan)
Adidas phát triển nhanh và mạnh tại thị trường Việt Nam Chỉ sau 2 năm hoạtđộng chính thức, Adidas đã mở tổng cộng 50 cửa hàng tại các thành phố lớn, trải dài từBắc vào Nam Adidas hiện đang có khoảng 80.000 lao động tại Việt Nam
Để gia tăng khả năng khai thác thị trường sản phẩm giày thể thao, Adidas đã thựchiện các chiến dịch marketing với quy mô lớn nhằm tác động đến hành vi mua của ngườitiêu dùng Thông qua việc chứng minh những ưu thế về tính năng sản phẩm, chất lượngdịch vụ, làm gia tăng lợi ích về mặt tâm lí, xã hội cho người sử dụng,… Công ty kì vọngnhững giá trị vượt trội đó sẽ gia tăng lượng khách hàng về cho công ty Đây chính lànguyên nhân chúng tôi chọn đề tài nghiên cứu: “Nghien cuu yeu to anh huong đen vieclua chon san pham tai adidas”
4
Trang 6CHƯƠNG I: KHẢO SÁT DỰ ÁN
1 Dữ liệu đầu vào
Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về
các nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.
2 Mục tiêu của bài toán
Từ những lựa chọn của khách hàng, xác định sự tương quan của các yếu tố ảnh hưởng tới quyết định lựa chọn sản phẩm của Adidas Từ đó thấy được mức độ ảnh
hưởng của các yếu tố và sự đưa ra quyết định mua các sản phẩm của Adidas
3 Mẫu phiếu điều tra
Bảng câu hỏi khảo sát về các nhân tố ảnh hưởng đến quyết định mua sản phẩm của Adidas.
BẢNG CÂU HỎI KHẢO SÁT VỀ CÁC YẾ́U TỐ ẢNH HƯỞNG ĐẾ́N VIỆ$C
LỰA CHỌN SẢN PHẨM TẠI ADIDAS
Xin chào các bạn! Chúng tôi là nhóm nghiên cứu của trường đại học Thương Mạiđang thực hiện việc khảo sát về "các yếu tố ảnh hưởng đến quyết định lựa chọn sảnphẩm tại Adidas" Rất mong các bạn dành thời gian để trả lời một số câu hỏi khảo sátcủa chúng tôi dưới đây
Xin chân thành cảm ơn!
Giới thiệu đôi nét về bản thân bạn
Trang 84 Bạn biết Adidas qua đâu ?
o Được bạn bè, người thân giới thiệuNgười bán hàng trên FB
o Thường xuyên xuất hiện trên tivi, mạng xã hội
o Được thấy từ nhiều người sử dụng
1 Giày có nhiều màu sắc, mẫu
mã đa dang để lựa chọn
1 Thái độ nhân viên vui vẻ,
thân thiện và An ninh trật tự
tốt
2 Các cửa hàng phân phối giày
rộng rãi, mạng lưới đại lý
Trang 9C Thương hiệu
1 Adidas là một thương hiệu lớn
2 Adidas là một thương hiệu uy tín
3 Mọi người xung quanh đều sử dụng
D Giá cả
1 Giày có giá cả cạnh tranh trên thị trường
2 Giá có tương xứng với chất lượng
3 Có nhiều mức giá để lựa chọn
4 Có giá cả hợp lý với mỗi người tiêu dùng
Bạn sẽ giới thiệu cho mọi người xung quanh mua hàng tại Adidas?
Trong 147 phiếu khảo sát thu được có: 88 người thuộc giới tính nữ
chiếm 59.86%, còn lại 59 người là thuộc giới tính nữ chiếm 40.14%
Thu nhập dưới 1 triệu có 27 người chiếm 18,36%, từ 1 đến 2 triệu có 72 người chiếm 48,97% , trên 2 triệu có 43 chiếm 29,25% , khác có 5 người chiếm 3,4%
8
Trang 10Số người chi dưới 1 triệu cho 1 đôi giày adidas có 52 người chiếm 35,37%, từ
1 đến 2 triệu có 65 người chiếm 44,2% , trên 2 triệu có 22 người chiếm 15%, mục khác có 8 người chiếm 5,44%
Số người mua giày từ website có 30 người chiếm , số người mua gìay từ cửa hàng có 50 người chiếm, số người mua giày từ các sàn thương mại điện tử có
19 người chiếm 12,92%, số người mua giày từ người bán hàng trên facebook
có 43 người chiếm 29,25%, mục khác có người mua giày từ các đơn vị bán hàng khác hoặc chưa mua bao giờ có 5 người chiếm 3,4%
2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha - Ta quy ước như sau:
HTCLSP1: Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn
HTCLSP2: Giày có đầy đủ kích cỡ phù hợp vs người mua
HTCLSP3: Giày êm ái khi di chuyển
HTCLSP4: Giày có độ bền cao
CLDV1: Thái độ nhân viên vui vẻ, thân thiện và an ninh trật tự tốt
CLDV2: Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắpCLDV3: Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiềuđợt sale
CLDV4: Khách hàng được cung cấp nhiều thông tin về sản phẩm
TH1: Adidas là một thương hiệu lớn
TH2: Adidas là một thương hiệu uy tín
TH3: Mọi người xung quanh đều sử dụng
GC1: Giày có giá cả cạnh tranh trên thị trường
GC2: Giá có tương xứng với chất lượng
GC3: Có nhiều mức giá để lựa chọn
GC4: Có giá cả hợp lý với mỗi người tiêu dùng
- Hình thức chất lượng sản phẩm: Reliability Statistics
Trang 11Scale Mean Scale Corrected Cronbach's
Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.789 > 0.6, hệ số
tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ
số Cronbach's Alpha if Item Deleted của biến “Giày có nhiều màu sắc, mẫu mã
đa dang để lựa chọn” (= 0.796) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại
bỏ biến quan sát “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”
- Chất lượng dịch vụ: Reliability Statistics
Item-Total Statistics
Trang 1210
Trang 13Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.757 > 0.6, hệ
số tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)
- Thương hiệu: Reliability Statistics
Item-Total Statistics
Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.719 > 0.6, hệ số
tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ
số Cronbach's Alpha if Item Deleted của biến “Mọi người xung quanh đều sử
dụng” (= 0.736) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ biến quan sát
“Mọi người xung quanh đều sử dụng”
- Giá cả: Reliability Statistics
Item-Total Statistics
11GC2
GC3
GC4
11.6611.6711.86
4.5684.2904.214
.603.614.584
.746.741.759
Trang 14Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.795 > 0.6, hệ
số tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)
Kết luận: Sau khi tiến hành phân tích độ tin cậy bằng phương pháp
Cronbach’s Alpha, 15 biến quan sát rút lại còn 13 biến quan sát, loại bỏ các biến quan sátlà: “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”, “Mọi người xung quanh đều
sử dụng”
3 Kết quả phân tích nhân tố khám phá EFA
3.1 Kiểm định KMO và Bartlett’s Test
- Yêu cầu
+ Hệ số KMO ≥ 0.5
+ Sig < 0.005
KMO and Bartlett's Test
Bartlett's Test of Sphericity Approx Chi-Square 866.753
Bảng giải thích tổng phương sai
Extraction Method: Principal Component Analysis
Total Variance Explained
Nhận xét: Tiêu chuẩn của phương pháp phân tích nhân tố là chỉ số KMO phải lớn
hơn 0.5 (Garson, 2003) và kiểm định Barlett’s có mức ý nghĩa sig < 0.05 để chứng
tỏ dữ liệu dùng phân tích nhân tố là thích hợp và giữa các biến có tương quan với
nhau Giá trị Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO)=0.858
Kết quả phân tích nhân tố cho thấy chỉ số KMO là 0.858> 0.5, điều này chứng tỏ
dữ liệu dùng để phân tích nhân tố là hoàn toàn thích hợp
Kết quả kiểm định Barlett’s là 866.753 với mức ý nghĩa Sig = 0.000< 0.05,lúc này bác
bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể
12
Trang 15Như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị
bác bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố
3.2 Eigenvalues và phương sai trích
Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay
Varimax
Kết quả cho thấy 13 biến quan sát ban đầu được nhóm thành 3 nhóm
Giá trị tổng phương sai trích = 62.401% > 50%: đạt yêu cầu; khi đó có thể nói rằng
3 nhân tố này giải thích 62.401% biến thiên của dữ liệu
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvaluesthấp nhất là 1.015> 1
Total Variance Explained
Rotation Sums of Squared
13
Trang 16Có 3 loại biến xấu:
+ Biến xấu 1 : Hệ số tải Factor Loading nhỏ hơn hệ số tải tiêu chuẩn
+ Biển xấu 2 : Tải lên 2 hay nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.5
+ Biến xấu 3 : Nằm tách biệt duy nhất ở một nhân tố
Từ bảng trên ta thấy loại 2 biến xấu: CLDV3, GC1
Rotated Component Matrix a
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
a Rotation converged in 7 iterations.
Ta bỏ các biến trên và thực hiện lại ta được:
14
Trang 17KMO and Bartlett's Test
Ta thấy hệ số KMO của bài là 0.842 > 0.5 đủ để phân tích nhân tố là phù hợp
Kiểm định Bartlett có ý nghĩa thống kê Sig < 0.05, chứng tỏ các biến quan sát có
tương quan với nhau trong nhân tố
Total Variance Explained
Extraction Method: Principal Component Analysis.
Rotation Sums of Squared Loadings
Total % of Cumulative
Variance %
3.558 32.346 32.346 2.648 24.074 56.419
Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay
Varimax
15
Trang 18Kết quả cho thấy 11 biến quan sát ban đầu được nhóm thành 2 nhóm.
Giá trị tổng phương sai trích = 56.419% > 50%: đạt yêu cầu; khi đó có thể nói rằng
3 nhân tố này giải thích 56.419% biến thiên của dữ liệu
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvaluesthấp nhất là 1.167> 1
a Rotation converged in 3 iterations.
Qua bảng trên ta không còn thấy biến xấu nào để loại bỏ nữa Kết thúc phân tích EFA
Vậy sau khi phân tích nhân tố khám phá EFA ta loại 2 biến xấu: CLDV3,
Trang 19F_CLDV Pearson Correlation 620 ** 1
** Correlation is significant at the 0.01 level (2-tailed).
Nhận xét: Sig kiểm định tương quan Pearson các giữa 2 biến độc lập F_GC,
F_CLDV đều nhỏ hơn 0.05 Như vậy, có mối liên hệ tuyến tính giữa 2 biến F_GC và
F_CLDV
5 Phân tích hồi quy đa biến
Model Summary b
Adjusted R Std Error of the
Trang 20B Std Error Beta Tolerance VIF
Hệ số VIF của các biến độc lập có 1 biến lớn lơn 2 nên có hiện tượng đa cộng biến xảy ra
Các hệ số hồi quy đều lớn hơn 0 Như vậy tất cả các biến độc lập đưa vào phân tích hồi quy đều tác động cùng chiều tới biến phụ thuộc Dựa vào độ lớn của hệ số hồi quy chuẩn hoá Beta, thứ
tự mức độ tác động từ mạnh nhất tớ yếu nhất của cá biến độc lập tới biến phụ thuộc HL là
GCTH(0.030),CLDVTH(0.030) > GC(0.011) Tương ứng với;
- Biến Chất lượng dịch vụ và thương hiệu tác động mạnh nhất tới sự hài lòng của khách hàng
- Biến Giá cả tác động mạnh thứ 2 tới sự hài lòng của khách hàng
-18
Trang 21 Giá cả trung bình Mean = -4.43E -16 gần bằng 0, độ lệch chuẩn là 0.990 gần bằng 1, như vậy
có thể nói, phân phối phần dư xấp xỉ chuẩ Do đó, có thể kết luận rằng: Giả thiết phân phối chuẩncủa phần dư không bị vi phạm
Phương trình hồi quy chuẩn hoá là
HL = 0.109 * GCTH + 0.102*CLDVTH+0.49*GC
ĐỊNH 1 Tìm nút gốc
Trang 22Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5
Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều là YES
1.2 Xét thuộc tính Chất lượng dịch vụ Thuộc
tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là C2, C3, C4, C5
Child node ứng với Chất lượng dịch vụ = 2 và = 3 có Entropy = 0 do tất cả các giá trị đều
1.3 Xét thuộc tính Thương hiệu
Thuộc tính này nhận 1 trong 5 giá trị là 1,3,4,5
Gọi tập hợp điểm trong mỗi child node này là A1, A3, A4, A5
Child node ứng với Thương hiệu = 1 và = 3 có Entropy = 0 do tất cả các giá trị đều làYES
Trang 23Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là G2, G3, G4, G5
Child node ứng với Thương hiệu = 2 và = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5
Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều bằng YES
21
Trang 242.2 Xét thuộc tính Thương hiệu
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là A3, A4, A5
Child node ứng với Thương hiệu = 3 có Entropy = 0 do tất cả các giá trị đều là YES Entropy(A3) = 0
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5
Child node ứng với Thương hiệu = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều làYES
Trang 252.4 Với Thương hiệu = 4
a Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 4,5
Gọi tập hợp điểm trong mỗi child node này là T4, T5
Child node ứng với Hình thức chất lượng = 4 có Entropy = 0 do tất cả các giá trị đều làYES
Thuộc tính này nhận 1 trong 5 giá trị là 5
Gọi tập hợp điểm trong mỗi child node này là G5
Trang 262.5 Với Thương hiệu = 5
a Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là T3, T4, T5
Child node ứng với Hình thức chất lượng = 3 và = 5 có Entropy = 0 do tất cả các giá trịđều là YES
Entropy(T3) = 0
Entropy(T5) = 0
Trang 27Thuộc tính này nhận 1 trong 5 giá trị là 3, 4, 5
Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5
Child node ứng với Hình thức chất lượng = 3 và = 4 có Entropy = 0 do tất cả các giá trịđều là YES
Trang 28Làm tương tự với các nhánh còn lại Ta có cây quyết định cuối cùng sau:
3 Kiểm tra độ chính xác của cây quyết định vừa vẽ
Lấy 30% dữ liệu phần cuối trong file kết quả thu được từ phiếu khảo sát ta áp dụng vào cây quyết định để tính độ chính xác của cây ta thu được bảng kết quả như sau:
Sự hài lòng STT Hình thức chất lượng Chất lượng dịch Thương hiệu Giá cả của khách
Trang 29128 Rất đồng ý Phân vân Đồng ý Rất đồng ý Yes (TP)
129 Không đồng ý Không đồng ý Rất không Không đồng ý Yes (FN)
Trang 3027
Trang 31CHƯƠNG IV: GIẢI PHÁP
Thứ nhất, trong bảng cập nhật trên ta có thể thấy tỉ lệ người bình chọn phân vân
ở cột Thương Hiệu nhiều hơn cả Điều này chứng minh Adidass chưa thật sự xây dựng được thương hiệu mang niềm tin cho người tiêu dùng Giải pháp ở đây cần phải tập trung cho việc PR thương hiệu Adidass trở nên gần gũi với người tiêu dùng thong qua các chiến dịch tập trung vào khách hàng: Chương trình giảm giá, khuyến mãi, Ưu đãi, Từ thiện,…
Thứ hai, vấn đề còn nằm ở phần giá cả Vì định vị bản thân là một thương hiệu lớn nên phân khúc giá của adidass luôn nằm ở mức khá, cao Chính vì thế đối tượng khách hàng của thương hiệu này cũng là tầm khá và cao Điều này khá bất cập trong việc những khách hàng tầm trung có thể tiếp cận được với sản phẩm Do đó, đề xuất tới việc xây dựng, tạo ra các sản phẩm phù hợp với nhu cầu của khách hàng tầm trung để đáp ứngnhu cầu tốt hơn của người tiêu dung
28