Dữ liệu đầu vào Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.. 2 Mục tiêu của bài toán T
Trang 1TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA: HTTT KINH T V THƯƠNG MẠI ĐIÊ N TƯ
ĐỀ T I THẢO LUẬN
MÔN: KHAI PHÁ DỮ LIỆU TRONG KINH DOANH
Đề tài: Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại
Trang 2Người thực hiện: 9
BẢNG PHÂN CÔNG NHIỆM VỤ V DANH SÁCH TH NH VIÊN NHÓM 7
- Cây quyết định tổng quát
- Kiểm định độ tin cậy thang đo Cronbach’s Alpha
- Phân tích nhân tố khám phá EFA
- Tương quan Pearson
Lời mở đầu, kết luận, Xử lý số
liệu
Trang 3Mục lục
CHƯƠNG I: KHẢO SÁT DỰ ÁN 5
CHƯƠNG II: K T QUẢ NGHIÊN CÚU 8
1 Mô tả thống kê 8
2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha 8
3 Kết quả phân tích nhân tố khám phá EFA 11
4 Tương quan pearson 16
5 Phân tích hồi quy đa biến 16
CHƯƠNG III: XÂY DỰNG CÂY QUY T ĐỊNH 18
CHƯƠNG IV: GIẢI PHÁP 28
3
TIEU LUAN MOI download : skknchat123@gmail.com
Trang 4Hàng loạt các thương hiệu giày thể thao quốc tế lớn như Nike, Adidas và Reebok…
có nhà sản xuất gia công phần mềm của giày dép tại Việt Nam, đồng thời các sản phẩmchính hãng cũng tham gia vào thị trường giày dép của Việt Nam Nổi bật trong đó làAdidas Là thương hiệu nổi tiếng toàn cầu, Adidas tham gia thị trường dụng cụ thể thaoViệt Nam từ rất lâu Năm 1993, Adidas đã có mặt tại Việt Nam nhưng phải đến năm 2009Adidas mới chính thức thành lập Công ty Adidas Việt Nam, được sở hữu 100% vốn bởiAdidas International B.V (Amsterdam, Hà Lan)
Adidas phát triển nhanh và mạnh tại thị trường Việt Nam Chỉ sau 2 năm hoạt độngchính thức, Adidas đã mở tổng cộng 50 cửa hàng tại các thành phố lớn, trải dài từ Bắc vàoNam Adidas hiện đang có khoảng 80.000 lao động tại Việt Nam
Để gia tăng khả năng khai thác thị trường sản phẩm giày thể thao, Adidas đã thựchiện các chiến dịch marketing với quy mô lớn nhằm tác động đến hành vi mua của ngườitiêu dùng Thông qua việc chứng minh những ưu thế về tính năng sản phẩm, chất lượngdịch vụ, làm gia tăng lợi ích về mặt tâm lí, xã hội cho người sử dụng,… Công ty kì vọngnhững giá trị vượt trội đó sẽ gia tăng lượng khách hàng về cho công ty Đây chính lànguyên nhân chúng tôi chọn đề tài nghiên cứu: “Nghiên cứu yếu tố ảnh hưởng đến việclựa chọn sản phẩm tại adidas”
Trang 5CHƯƠNG I: KHẢO SÁT DỰ ÁN
1 Dữ liệu đầu vào
Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các
nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.
2 Mục tiêu của bài toán
Từ những lựa chọn của khách hàng, xác định sự tương quan của các yếu tố ảnh hưởng tới quyết định lựa chọn sản phẩm của Adidas Từ đó thấy được mức độ ảnh hưởng của các yếu tố và sự đưa ra quyết định mua các sản phẩm của Adidas
3 Mẫu phiếu điều tra
Bảng câu hỏi khảo sát về các nhân tố ảnh hưởng đến quyết định mua sản phẩm của Adidas.
BẢNG CÂU HỎI KHẢO SÁT VỀ CÁC Y U TỐ ẢNH HƯỞNG Đ N VIỆC
LỰA CHỌN SẢN PHẨM TẠI ADIDAS
Xin chào các bạn! Chúng tôi là nhóm nghiên cứu của trường đại học Thương Mạiđang thực hiện việc khảo sát về "các yếu tố ảnh hưởng đến quyết định lựa chọn sảnphẩm tại Adidas" Rất mong các bạn dành thời gian để trả lời một số câu hỏi khảo sátcủa chúng tôi dưới đây
Xin chân thành cảm ơn!
Giới thiệu đôi nét về bản thân bạn
1 Họ và ………
5
TIEU LUAN MOI download : skknchat123@gmail.com
Trang 74 Bạn biết Adidas qua đâu ?
o Được bạn bè, người thân giới thiệuNgười bán hàng trên FB
o Thường xuyên xuất hiện trên tivi, mạng xã hội
1 Giày có nhiều màu sắc, mẫu
mã đa dang để lựa chọn
Trang 82 Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắp nên dễ dàng tìm muasản phẩm
3 Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiều đợt sale
4 Khách hàng được cung cấp nhiều thông tin về sản phẩm
C Thương hiệu
1 Adidas là một thương hiệu lớn
2 Adidas là một thương hiệu uy tín
3 Mọi người xung quanh đều sử dụng
D Giá cả
1 Giày có giá cả cạnh tranh trên thị trường
2 Giá có tương xứng với chất lượng
3 Có nhiều mức giá để lựa chọn
4 Có giá cả hợp lý với mỗi người tiêu dùng
Bạn sẽ giới thiệu cho mọi người xung quanh mua hàng tại Adidas?
Cảm ơn bạn đã giúp nhóm mình!
Trang 9CHƯƠNG II: K T QUẢ NGHIÊN CÚU
Số người chi dưới 1 triệu cho 1 đôi giày adidas có 52 người chiếm 35,37%, từ
1 đến 2 triệu có 65 người chiếm 44,2% , trên 2 triệu có 22 người chiếm 15%, mục khác có 8 người chiếm 5,44%
Số người mua giày từ website có 30 người chiếm , số người mua gìay từ cửa hàng có 50 người chiếm, số người mua giày từ các sàn thương mại điện tử có
19 người chiếm 12,92%, số người mua giày từ người bán hàng trên facebook
có 43 người chiếm 29,25%, mục khác có người mua giày từ các đơn vị bán hàng khác hoặc chưa mua bao giờ có 5 người chiếm 3,4%
2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha
- Ta quy ước như sau:
HTCLSP1: Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọnHTCLSP2: Giày có đầy đủ kích cỡ phù hợp vs người muaHTCLSP3: Giày êm ái khi di chuyển
HTCLSP4: Giày có độ bền caoCLDV1: Thái độ nhân viên vui vẻ, thân thiện và an ninh trật tự tốtCLDV2: Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắpCLDV3: Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiều đợt sale
CLDV4: Khách hàng được cung cấp nhiều thông tin về sản phẩmTH1: Adidas là một thương hiệu lớn
9
TIEU LUAN MOI download : skknchat123@gmail.com
Trang 10TH2: Adidas là một thương hiệu uy tínTH3: Mọi người xung quanh đều sử dụngGC1: Giày có giá cả cạnh tranh trên thị trườngGC2: Giá có tương xứng với chất lượngGC3: Có nhiều mức giá để lựa chọnGC4: Có giá cả hợp lý với mỗi người tiêu dùng
- Hình thức chất lượng sản phẩm: Reliability Statistics
Item-Total Statistics
Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.789 > 0.6, hệ số
tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ
số Cronbach's Alpha if Item Deleted của biến “Giày có nhiều màu sắc, mẫu mã đa
dang để lựa chọn” (= 0.796) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ
biến quan sát “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”
- Chất lượng dịch vụ: Reliability Statistics
Trang 11Cronbach's N of
Item-Total Statistics
Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.757 > 0.6, hệ số
tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)
- Thương hiệu: Reliability Statistics
Cronbach's N of
Item-Total Statistics
Scale Mean Scale Corrected Cronbach's
if Item Variance if Item-Total Alpha if
Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.719 > 0.6, hệ số
tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ
11
Trang 12TIEU LUAN MOI download : skknchat123@gmail.com
Trang 13số Cronbach's Alpha if Item Deleted của biến “Mọi người xung quanh đều sử
dụng” (= 0.736) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ biến quan sát
“Mọi người xung quanh đều sử dụng”
- Giá cả: Reliability Statistics
Cronbach's N of
Item-Total Statistics
Scale Mean Scale Corrected Cronbach's
if Item Variance if Item-Total Alpha if
Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.795 > 0.6, hệ số
tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)
Kết luận: Sau khi tiến hành phân tích độ tin cậy bằng phương pháp
Cronbach’s Alpha, 15 biến quan sát rút lại còn 13 biến quan sát, loại bỏ các biến quan sát là: “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”,
“Mọi người xung quanh đều sử dụng”
3 Kết quả phân tích nhân tố khám phá EFA
3.1 Kiểm định KMO và Bartlett’s Test
KMO and Bartlett's Test
12
TIEU LUAN MOI download : skknchat123@gmail.com
Trang 14Bartlett's Test of Sphericity Approx Chi-Square 866.753
Bảng giải thích tổng phương sai
Extraction Method: Principal Component Analysis
Total Variance Explained
Nhận xét: Tiêu chuẩn của phương pháp phân tích nhân tố là chỉ số KMO phải lớn
hơn 0.5 (Garson, 2003) và kiểm định Barlett’s có mức ý nghĩa sig < 0.05 để chứng tỏ
dữ liệu dùng phân tích nhân tố là thích hợp và giữa các biến có tương quan với nhau
Giá trị Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO)=0.858
Kết quả phân tích nhân tố cho thấy chỉ số KMO là 0.858> 0.5, điều này chứng tỏ dữ
liệu dùng để phân tích nhân tố là hoàn toàn thích hợp
Kết quả kiểm định Barlett’s là 866.753 với mức ý nghĩa Sig = 0.000< 0.05,lúc này
bác bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể
Như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị bác
bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố
3.2 Eigenvalues và phương sai trích
Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay
Varimax
Kết quả cho thấy 13 biến quan sát ban đầu được nhóm thành 3 nhóm
Giá trị tổng phương sai trích = 62.401% > 50%: đạt yêu cầu; khi đó có thể nói rằng 3
nhân tố này giải thích 62.401% biến thiên của dữ liệu
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvalues
thấp nhất là 1.015> 1
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared
Trang 15al Comp onent Analys is.
Trang 163.3 Ma trận xoay nhân số
Theo Hair & công sự (1998), Factor loading (hệ số tải nhân tố hay trọng số nhân tố) là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA
Có 3 loại biến xấu:
+ Biến xấu 1 : Hệ số tải Factor Loading nhỏ hơn hệ số tải tiêu chuẩn
+ Biển xấu 2 : Tải lên 2 hay nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.5.+ Biến xấu 3 : Nằm tách biệt duy nhất ở một nhân tố
Từ bảng trên ta thấy loại 2 biến xấu: CLDV3, GC1
Rotated Component Matrix a
Component
Trang 17Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser
Normalization.
a Rotation converged in 7 iterations.
Ta bỏ các biến trên và thực hiện lại ta được:
KMO and Bartlett's Test
Ta thấy hệ số KMO của bài là 0.842 > 0.5 đủ để phân tích nhân tố là phù hợp
Kiểm định Bartlett có ý nghĩa thống kê Sig < 0.05, chứng tỏ các biến quan sát có
tương quan với nhau trong nhân tố
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared Loadings
Loadings Total % of Cumulative Total % of Cumulative Total % of Cumulative
5.039 45.813 45.813 5.039 45.813 45.813 3.558 32.346 32.346
15
TIEU LUAN MOI download : skknchat123@gmail.com
Trang 18Extraction Method: Principal Component Analysis.
Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay
Varimax
Kết quả cho thấy 11 biến quan sát ban đầu được nhóm thành 2 nhóm
Giá trị tổng phương sai trích = 56.419% > 50%: đạt yêu cầu; khi đó có thể nói rằng 3 nhân tố này giải thích 56.419% biến thiên của dữ liệu
Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvalues thấp nhất là 1.167> 1
Trang 19a Rotation converged in 3 iterations.
Qua bảng trên ta không còn thấy biến xấu nào để loại bỏ nữa Kết thúc phân tích EFA
Vậy sau khi phân tích nhân tố khám phá EFA ta loại 2 biến xấu: CLDV3,
** Correlation is significant at the 0.01 level (2-tailed).
Nhận xét: Sig kiểm định tương quan Pearson các giữa 2 biến độc lập F_GC,
F_CLDV đều nhỏ hơn 0.05 Như vậy, có mối liên hệ tuyến tính giữa 2 biến F_GC và
Trang 20Giá trị hiệu chỉnh bằng 0.008 cho thấy biến độc lập đưa vào chạy hồi quy ảnh hưởng 0.8% sự thay
đổi của biến phụ thuộc, còn lại là 99.2% là do các biến ngoài mô hình và sai số ngẫu nhiên.
Hệ số Durbin- Watson nằm trong khoảng 1.5 đến 2.5 nên không có hiện tượng tự tương
quan chuỗi bậc xảy ra
Các hệ số hồi quy đều lớn hơn 0 Như vậy tất cả các biến độc lập đưa vào phân
tích hồi quy đều tác động cùng chiều tới biến phụ thuộc Dựa vào độ lớn của hệ số
hồi quy chuẩn hoá Beta, thứ tự mức độ tác động từ mạnh nhất tớ yếu nhất của cá
biến độc lập tới biến phụ thuộc HL là GCTH(0.030),CLDVTH(0.030) >
GC(0.011) Tương ứng với;
- Biến Chất lượng dịch vụ và thương hiệu tác động mạnh nhất tới sự hài lòng của khách hàng
- Biến Giá cả tác động mạnh thứ 2 tới sự hài lòng của khách hàng
Trang 21-Giá cả trung bình Mean = -4.43E -16 gần bằng 0, độ lệch chuẩn là 0.990 gần bằng
1, như vậy có thể nói, phân phối phần dư xấp xỉ chuẩ Do đó, có thể kết luận rằng:
Giả thiết phân phối chuẩn của phần dư không bị vi phạm
Phương trình hồi quy chuẩn hoá là
Trung lập -> YesKhông đồng ý->Yes
Hoàn toàn đồng ý -> YesĐồng ý -> Yes
4/951/46
0/32/96
19
TIEU LUAN MOI download : skknchat123@gmail.com
Trang 221.1 Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5
Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trị
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là C2, C3, C4, C5
Child node ứng với Chất lượng dịch vụ = 2 và = 3 có Entropy = 0 do tất cả các giá trị đều
là YES
Entropy(C2) = 0
Trang 23Entropy(C4) =
Entropy(C5) =
Entropy(CLDV,S) =
1.3 Xét thuộc tính Thương hiệu
Thuộc tính này nhận 1 trong 5 giá trị là 1,3,4,5
Gọi tập hợp điểm trong mỗi child node này là A1, A3, A4, A5
Child node ứng với Thương hiệu = 1 và = 3 có Entropy = 0 do tất cả các giá trị đều làYES
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là G2, G3, G4, G5
Child node ứng với Thương hiệu = 2 và = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều
Trang 242 Tìm các nút tiếp theo
Ta tiếp tục tính Entropy cho nhánh Chất lượng dịch vụ =5 và =4
*Với Chất lượng dịch vụ = 4
2.1 Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5
Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5
Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều bằng YES
2.2 Xét thuộc tính Thương hiệu
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là A3, A4, A5
Child node ứng với Thương hiệu = 3 có Entropy = 0 do tất cả các giá trị đều là YESEntropy(A3) = 0
Entropy(A4) =
Entropy(A5) =
=> Entropy(TH,S) =
2.3 Xét thuộc tính Giá cả
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5
Trang 25Child node ứng với Thương hiệu = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều làYES
Entropy(G3) = 0
Entropy(G4) = 0
Entropy(G5) =
Entropy(GC,S) =
Ta thấy, Entropy (TH, S) = 0,2814 là nhỏ nhất Ta chọn Node tiếp theo là Thương hiệu
2.4 Với Thương hiệu = 4
a Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 4,5
Gọi tập hợp điểm trong mỗi child node này là T4, T5
Child node ứng với Hình thức chất lượng = 4 có Entropy = 0 do tất cả các giá trị đều làYES
Entropy(T4) = 0
Entropy(T5) =
Entropy(HTCL,S) =
b Xét thuộc tính Giá cả
Thuộc tính này nhận 1 trong 5 giá trị là 5
Gọi tập hợp điểm trong mỗi child node này là G5
Trang 26Ta thấy, Entropy (HTCL, S) = 0,4702 là nhỏ nhất Ta chọn Node tiếp theo là Hình thức chất lượng.
2.5 Với Thương hiệu = 5
a Xét thuộc tính Hình thức chất lượng
Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5
Gọi tập hợp điểm trong mỗi child node này là T3, T4, T5
Child node ứng với Hình thức chất lượng = 3 và = 5 có Entropy = 0 do tất cả các giá trị đều là YES
Trang 27Entropy(T5) = 0
Entropy(T4) =
Entropy(HTCL,S) =
b Xét thuộc tính Giá cả
Thuộc tính này nhận 1 trong 5 giá trị là 3, 4, 5
Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5
Child node ứng với Hình thức chất lượng = 3 và = 4 có Entropy = 0 do tất cả các giá trịđều là YES