Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại adidas Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại adidas Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại adidas Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại adidas
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA: HTTT KINH T V THƯƠNG MẠI ĐIÊN TƯ
ĐỀ TI THẢO LUẬN
MÔN: KHAI PHÁ DỮ LIỆU TRONG KINH DOANH
Đề tài: Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại
Trang 2Mục lục
CHƯƠNG I: KHẢO SÁT DỰ ÁN 5
CHƯƠNG II: KT QUẢ NGHIÊN CÚU 8
1 Mô tả thống kê 8
2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha 8
3 Kết quả phân tích nhân tố khám phá EFA 11
4 Tương quan pearson 16
5 Phân tích hồi quy đa biến 16
CHƯƠNG III: XÂY DỰNG CÂY QUYT ĐỊNH 18
CHƯƠNG IV: GIẢI PHÁP 28
Trang 3LỜI MỞ ĐẦU
Những năm gần đây, khi nền kinh tế đất nước phát triển, chất lượng đời sống củangười dân Việt Nam đặc biệt là ở khu vực thành thị ngày càng nâng cao Cùng với nhucầu “ăn ngon mặc đẹp” là nhu cầu có được một sức khỏe tốt, thân hình dẻo dai, cân đối
Để thỏa mãn các nhu cầu trên thì việc có được đôi giày thể thao đẹp, phù hợp với các loạihình thể thao là một điều cần thiết
Hàng loạt các thương hiệu giày thể thao quốc tế lớn như Nike, Adidas vàReebok… có nhà sản xuất gia công phần mềm của giày dép tại Việt Nam, đồng thời cácsản phẩm chính hãng cũng tham gia vào thị trường giày dép của Việt Nam Nổi bật trong
đó là Adidas Là thương hiệu nổi tiếng toàn cầu, Adidas tham gia thị trường dụng cụ thểthao Việt Nam từ rất lâu Năm 1993, Adidas đã có mặt tại Việt Nam nhưng phải đến năm
2009 Adidas mới chính thức thành lập Công ty Adidas Việt Nam, được sở hữu 100% vốnbởi Adidas International B.V (Amsterdam, Hà Lan)
Adidas phát triển nhanh và mạnh tại thị trường Việt Nam Chỉ sau 2 năm hoạtđộng chính thức, Adidas đã mở tổng cộng 50 cửa hàng tại các thành phố lớn, trải dài từBắc vào Nam Adidas hiện đang có khoảng 80.000 lao động tại Việt Nam
Để gia tăng khả năng khai thác thị trường sản phẩm giày thể thao, Adidas đã thựchiện các chiến dịch marketing với quy mô lớn nhằm tác động đến hành vi mua của ngườitiêu dùng Thông qua việc chứng minh những ưu thế về tính năng sản phẩm, chất lượngdịch vụ, làm gia tăng lợi ích về mặt tâm lí, xã hội cho người sử dụng,… Công ty kì vọngnhững giá trị vượt trội đó sẽ gia tăng lượng khách hàng về cho công ty Đây chính lànguyên nhân chúng tôi chọn đề tài nghiên cứu: “Nghiên cứu yếu tố ảnh hưởng đến việclựa chọn sản phẩm tại adidas”
Trang 4
1 Dữ liệu đầu vào
Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các
nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas
2 Mục tiêu của bài toán
Từ những lựa chọn của khách hàng, xác định sự tương quan của các yếu tố ảnh hưởng tới quyết định lựa chọn sản phẩm của Adidas Từ đó thấy được mức độ ảnh hưởng của các yếu tố và sự đưa ra quyết định mua các sản phẩm của Adidas
3 Mẫu phiếu điều tra
Bảng câu hỏi khảo sát về các nhân tố ảnh hưởng đến quyết định mua sản phẩm của Adidas
BẢNG CÂU HỎI KHẢO SÁT VỀ CÁC YU TỐ ẢNH HƯỞNG ĐN VIỆC
LỰA CHỌN SẢN PHẨM TẠI ADIDAS
Xin chào các bạn! Chúng tôi là nhóm nghiên cứu của trường đại học Thương Mạiđang thực hiện việc khảo sát về "các yếu tố ảnh hưởng đến quyết định lựa chọn sảnphẩm tại Adidas" Rất mong các bạn dành thời gian để trả lời một số câu hỏi khảo sátcủa chúng tôi dưới đây
Xin chân thành cảm ơn!
A Giới thiệu chung
Giới thiệu đôi nét về bản thân bạn
1 Họ và ………
Trang 5B Các yếu tố ảnh hưởng đến việc lựa chọn Adidas
1 Bạn thường chọn giày theo tiêu chí gì?
Trang 64 Bạn biết Adidas qua đâu ?
o Được bạn bè, người thân giới thiệuNgười bán hàng trên FB
o Thường xuyên xuất hiện trên tivi, mạng xã hội
o Được thấy từ nhiều người sử dụng
1 Giày có nhiều màu sắc, mẫu
mã đa dang để lựa chọn
1 Thái độ nhân viên vui vẻ,
thân thiện và An ninh trật tự
Trang 72 Các cửa hàng phân phối giày
rộng rãi, mạng lưới đại lý
3 Có nhiều mức giá để lựa chọn
4 Có giá cả hợp lý với mỗi
Trang 8CHƯƠNG II: KT QUẢ NGHIÊN CÚU
Số người chi dưới 1 triệu cho 1 đôi giày adidas có 52 người chiếm 35,37%, từ
1 đến 2 triệu có 65 người chiếm 44,2% , trên 2 triệu có 22 người chiếm 15%, mục khác có 8 người chiếm 5,44%
Số người mua giày từ website có 30 người chiếm , số người mua gìay từ cửa hàng có 50 người chiếm, số người mua giày từ các sàn thương mại điện tử có
19 người chiếm 12,92%, số người mua giày từ người bán hàng trên facebook
có 43 người chiếm 29,25%, mục khác có người mua giày từ các đơn vị bán hàng khác hoặc chưa mua bao giờ có 5 người chiếm 3,4%
2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha
- Ta quy ước như sau:
HTCLSP1: Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn
HTCLSP2: Giày có đầy đủ kích cỡ phù hợp vs người mua
HTCLSP3: Giày êm ái khi di chuyển
HTCLSP4: Giày có độ bền cao
CLDV1: Thái độ nhân viên vui vẻ, thân thiện và an ninh trật tự tốt
CLDV2: Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắp
CLDV3: Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiều đợt sale
CLDV4: Khách hàng được cung cấp nhiều thông tin về sản phẩm
TH1: Adidas là một thương hiệu lớn
Trang 9 TH2: Adidas là một thương hiệu uy tín
TH3: Mọi người xung quanh đều sử dụng
GC1: Giày có giá cả cạnh tranh trên thị trường
GC2: Giá có tương xứng với chất lượng
GC3: Có nhiều mức giá để lựa chọn
GC4: Có giá cả hợp lý với mỗi người tiêu dùng
CorrectedItem-TotalCorrelation
Cronbach'sAlpha ifItemDeletedHTCLSP
- Chất lượng dịch vụ:
Reliability Statistics
Trang 10Cronbach'sAlpha ifItemDeletedCLDV
CorrectedItem-TotalCorrelation
Cronbach'sAlpha ifItemDeleted
Trang 11số Cronbach's Alpha if Item Deleted của biến “Mọi người xung quanh đều sử dụng” (= 0.736) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ biến quan sát
“Mọi người xung quanh đều sử dụng”
CorrectedItem-TotalCorrelation
Cronbach'sAlpha ifItemDeleted
Kết luận: Sau khi tiến hành phân tích độ tin cậy bằng phương pháp
Cronbach’s Alpha, 15 biến quan sát rút lại còn 13 biến quan sát, loại bỏ các biến quan sát là: “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”,
“Mọi người xung quanh đều sử dụng”
3 Kết quả phân tích nhân tố khám phá EFA
3.1 Kiểm định KMO và Bartlett’s Test
- Yêu cầu
+ Hệ số KMO ≥ 0.5
+ Sig < 0.005
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .858
Trang 12df 78
Bảng giải thích tổng phương sai
Extraction Method: Principal Component Analysis
Total Variance Explained
Nhận xét: Tiêu chuẩn của phương pháp phân tích nhân tố là chỉ số KMO phải lớn
hơn 0.5 (Garson, 2003) và kiểm định Barlett’s có mức ý nghĩa sig < 0.05 để chứng tỏ
dữ liệu dùng phân tích nhân tố là thích hợp và giữa các biến có tương quan với nhau.Giá trị Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO)=0.858
Kết quả phân tích nhân tố cho thấy chỉ số KMO là 0.858> 0.5, điều này chứng tỏ dữ liệu dùng để phân tích nhân tố là hoàn toàn thích hợp
Kết quả kiểm định Barlett’s là 866.753 với mức ý nghĩa Sig = 0.000< 0.05,lúc này bác bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể Như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị bác
bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố
3.2 Eigenvalues và phương sai trích
Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay
Varimax
Kết quả cho thấy 13 biến quan sát ban đầu được nhóm thành 3 nhóm
Giá trị tổng phương sai trích = 62.401% > 50%: đạt yêu cầu; khi đó có thể nói rằng 3 nhân tố này giải thích 62.401% biến thiên của dữ liệu
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvalues thấp nhất là 1.015> 1
Total Variance Explained
Trang 13Có 3 loại biến xấu:
+ Biến xấu 1 : Hệ số tải Factor Loading nhỏ hơn hệ số tải tiêu chuẩn
+ Biển xấu 2 : Tải lên 2 hay nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.5.+ Biến xấu 3 : Nằm tách biệt duy nhất ở một nhân tố
Từ bảng trên ta thấy loại 2 biến xấu: CLDV3, GC1
Rotated Component Matrix a
Component
HTCLSP3 819
Trang 14Extraction Method: Principal Component Analysis
Rotation Method: Varimax with Kaiser
Normalization.
a Rotation converged in 7 iterations.
Ta bỏ các biến trên và thực hiện lại ta được:
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy .842
Bartlett's Test of Sphericity Approx Chi-Square 671.126
Ta thấy hệ số KMO của bài là 0.842 > 0.5 đủ để phân tích nhân tố là phù hợp
Kiểm định Bartlett có ý nghĩa thống kê Sig < 0.05, chứng tỏ các biến quan sát cótương quan với nhau trong nhân tố
Total Variance Explained
Component Initial Eigenvalues Extraction Sums of Squared
Cumulative
% Total % of Variance
Cumulative
%
1 5.039 45.813 45.813 5.039 45.813 45.813 3.558 32.346 32.346
Trang 15Extraction Method: Principal Component Analysis.
Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay
Varimax
Kết quả cho thấy 11 biến quan sát ban đầu được nhóm thành 2 nhóm
Giá trị tổng phương sai trích = 56.419% > 50%: đạt yêu cầu; khi đó có thể nói rằng 3 nhân tố này giải thích 56.419% biến thiên của dữ liệu
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvalues thấp nhất là 1.167> 1
Trang 16a Rotation converged in 3 iterations.
Qua bảng trên ta không còn thấy biến xấu nào để loại bỏ nữa Kết thúc phân tích EFA
Vậy sau khi phân tích nhân tố khám phá EFA ta loại 2 biến xấu: CLDV3,
GC1
4 Tương quan pearson
Correlations
F_GC F_CLDV F_GC Pearson Correlation 1 620 **
** Correlation is significant at the 0.01 level (2-tailed).
Nhận xét: Sig kiểm định tương quan Pearson các giữa 2 biến độc lập F_GC,
F_CLDV đều nhỏ hơn 0.05 Như vậy, có mối liên hệ tuyến tính giữa 2 biến F_GC và F_CLDV
5 Phân tích hồi quy đa biến
Model Summary b
Adjusted R Square
Std Error of the Estimate Durbin-Watson
a Predictors: (Constant), GC, CLDVTH, GCTH
b Dependent Variable: HL
Trang 17Giá trị hiệu chỉnh bằng 0.008 cho thấy biến độc lập đưa vào chạy hồi quy ảnh hưởng 0.8% sự
thay đổi của biến phụ thuộc, còn lại là 99.2% là do các biến ngoài mô hình và sai số ngẫu nhiên.
Hệ số Durbin- Watson nằm trong khoảng 1.5 đến 2.5 nên không có hiện tượng tự tương quan
Các hệ số hồi quy đều lớn hơn 0 Như vậy tất cả các biến độc lập đưa vào phân
tích hồi quy đều tác động cùng chiều tới biến phụ thuộc Dựa vào độ lớn của hệ số
hồi quy chuẩn hoá Beta, thứ tự mức độ tác động từ mạnh nhất tớ yếu nhất của cá
biến độc lập tới biến phụ thuộc HL là GCTH(0.030),CLDVTH(0.030) >
Trang 18- Giá cả trung bình Mean = -4.43E -16 gần bằng 0, độ lệch chuẩn là 0.990 gần bằng
1, như vậy có thể nói, phân phối phần dư xấp xỉ chuẩ Do đó, có thể kết luận rằng:
Giả thiết phân phối chuẩn của phần dư không bị vi phạm
Phương trình hồi quy chuẩn hoá là
Trang 19Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5
Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trị đều là YES
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là C2, C3, C4, C5
Child node ứng với Chất lượng dịch vụ = 2 và = 3 có Entropy = 0 do tất cả các giá trị đều
là YES
Entropy(C2) = 0
Entropy(C3) = 0
Trang 20Entropy(C4) =
Entropy(C5) =
Entropy(CLDV,S) =
1.3 Xét thuộc tính Thương hiệu
Thuộc tính này nhận 1 trong 5 giá trị là 1,3,4,5
Gọi tập hợp điểm trong mỗi child node này là A1, A3, A4, A5
Child node ứng với Thương hiệu = 1 và = 3 có Entropy = 0 do tất cả các giá trị đều là YES
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là G2, G3, G4, G5
Child node ứng với Thương hiệu = 2 và = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều
Trang 212 Tìm các nút tiếp theo
Ta tiếp tục tính Entropy cho nhánh Chất lượng dịch vụ =5 và =4
*Với Chất lượng dịch vụ = 4
2.1 Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5
Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều bằng YES
2.2 Xét thuộc tính Thương hiệu
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là A3, A4, A5
Child node ứng với Thương hiệu = 3 có Entropy = 0 do tất cả các giá trị đều là YESEntropy(A3) = 0
Entropy(A4) =
Entropy(A5) =
=> Entropy(TH,S) =
2.3 Xét thuộc tính Giá cả
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5
Trang 22Child node ứng với Thương hiệu = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều là YES
Entropy(G3) = 0
Entropy(G4) = 0
Entropy(G5) =
Entropy(GC,S) =
Ta thấy, Entropy (TH, S) = 0,2814 là nhỏ nhất Ta chọn Node tiếp theo là Thương hiệu
2.4 Với Thương hiệu = 4
a Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 4,5
Gọi tập hợp điểm trong mỗi child node này là T4, T5
Child node ứng với Hình thức chất lượng = 4 có Entropy = 0 do tất cả các giá trị đều là YES
Entropy(T4) = 0
Entropy(T5) =
Entropy(HTCL,S) =
b Xét thuộc tính Giá cả
Thuộc tính này nhận 1 trong 5 giá trị là 5
Gọi tập hợp điểm trong mỗi child node này là G5
Entropy(G5) =
Entropy(GC,S) =
Trang 23Ta thấy, Entropy (HTCL, S) = 0,4702 là nhỏ nhất Ta chọn Node tiếp theo là Hình thức chất lượng
2.5 Với Thương hiệu = 5
a Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là T3, T4, T5
Child node ứng với Hình thức chất lượng = 3 và = 5 có Entropy = 0 do tất cả các giá trị đều là YES
Entropy(T3) = 0
Trang 24Entropy(T5) = 0
Entropy(T4) =
Entropy(HTCL,S) =
b Xét thuộc tính Giá cả
Thuộc tính này nhận 1 trong 5 giá trị là 3, 4, 5
Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5
Child node ứng với Hình thức chất lượng = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều là YES
Trang 253 Kiểm tra độ chính xác của cây quyết định vừa vẽ
Lấy 30% dữ liệu phần cuối trong file kết quả thu được từ phiếu khảo sát ta áp dụng vàocây quyết định để tính độ chính xác của cây ta thu được bảng kết quả như sau:
Trang 27 Thứ nhất, trong bảng cập nhật trên ta có thể thấy tỉ lệ người bình chọn phân vân
ở cột Thương Hiệu nhiều hơn cả Điều này chứng minh Adidass chưa thật sự xâydựng được thương hiệu mang niềm tin cho người tiêu dùng Giải pháp ở đây cầnphải tập trung cho việc PR thương hiệu Adidass trở nên gần gũi với người tiêu dùng thong qua các chiến dịch tập trung vào khách hàng: Chương trình giảm giá, khuyến mãi, Ưu đãi, Từ thiện,…
Thứ hai, vấn đề còn nằm ở phần giá cả Vì định vị bản thân là một thương hiệu lớn nên phân khúc giá của adidass luôn nằm ở mức khá, cao Chính vì thế đối tượng khách hàng của thương hiệu này cũng là tầm khá và cao Điều này khá bấtcập trong việc những khách hàng tầm trung có thể tiếp cận được với sản phẩm
Do đó, đề xuất tới việc xây dựng, tạo ra các sản phẩm phù hợp với nhu cầu của khách hàng tầm trung để đáp ứng nhu cầu tốt hơn của người tiêu dung
KT LUẬN
Trang 28Qua đề tài nghiên cứu trên, nhóm 7 đã nhận thấy việc khách hàng lựa chọn sảnphẩm tại Adidas phụ thuộc nhiều vào Chất lượng dịch vụ của cửa hàng Tiêu chí hàngđầu để khách hàng quyết định mua hàng của Adidas là Chất lượng dịch vụ Bởi ai cũngmuốn trả tiền cho những dịch vụ tương xứng với giá tiền Điều này sẽ giúp khách hàng
cảm thấy hài lòng, đáp ứng được kì vọng của họ Ngoài yếu tố về Chất lượng dịch vụ
thì các yếu tố về Thương hiệu, Hình thức chất lượng và giá cả của sản phẩm cũng gópphần ảnh hưởng đến khách hàng quyết định lựa chọn sản phẩm của Adidas
Trong quá trình nghiên cứu, bài thảo luận của nhóm 7 có thể vẫn còn có nhiều sai xót Nhóm rất mong cô và các bạn đóng góp ý kiến để bài thảo luận của nhóm được hoàn thiện hơn nữa Nhóm xin chân thành cảm ơn!