1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(TIỂU LUẬN) THẢO LUẬN môn KHAI PHÁ dữ LIỆU TRONG KINH DOANH đề tài khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại adidas

32 13 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại Adidas
Người hướng dẫn PGS. TS. Nguyễn Thị Thu Thủy
Trường học Trường Đại Học Thương Mại
Chuyên ngành Khai phá dữ liệu trong kinh doanh
Thể loại Tiểu luận
Năm xuất bản 2021
Thành phố Hà Nội
Định dạng
Số trang 32
Dung lượng 737,67 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Dữ liệu đầu vào Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.. 2 Mục tiêu của bài toán T

Trang 1

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA: HTTT KINH TẾ VÀ THƯƠNG MAI ĐIỆN TỬ

ĐỀ TÀ̀I THẢO LUẬN

MÔN: KHAI PHÁ DỮ LIỆ$U TRONG KINH DOANH

Đề tài: Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm

Trang 2

Người thực hiện: 9

BẢNG PHÂN CÔNG NHIỆ$M VỤ VÀ̀ DANH SÁCH THÀ̀NH VIÊN NHÓM 7

-Phân tích mô hình hồi quy-Tổng hợp word(nhóm trưởng)

- Phân tích nhân tố khám phá EFA

- Tương quan Pearson

Lời mở đầu, kết luận, Xử lý số

liệu

Trang 3

2

Trang 4

Mục lục

CHƯƠNG I: KHẢO SÁT DỰ ÁN 5

CHƯƠNG II: KẾ́T QUẢ NGHIÊN CÚU 8

1 Mô tả thống kê 8

2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha 8

3 Kết quả phân tích nhân tố khám phá EFA 11

4 Tương quan pearson 16

5 Phân tích hồi quy đa biến 16

CHƯƠNG III: XÂY DỰNG CÂY QUYẾ́T ĐỊNH 18

CHƯƠNG IV: GIẢI PHÁP 28

Trang 5

LỜI MỞ ĐẦU

Những năm gần đây, khi nền kinh tế đất nước phát triển, chất lượng đời sống củangười dân Việt Nam đặc biệt là ở khu vực thành thị ngày càng nâng cao Cùng với nhucầu “ăn ngon mặc đẹp” là nhu cầu có được một sức khỏe tốt, thân hình dẻo dai, cân đối

Để thỏa mãn các nhu cầu trên thì việc có được đôi giày thể thao đẹp, phù hợp với các loạihình thể thao là một điều cần thiết

Hàng loạt các thương hiệu giày thể thao quốc tế lớn như Nike, Adidas vàReebok… có nhà sản xuất gia công phần mềm của giày dép tại Việt Nam, đồng thời cácsản phẩm chính hãng cũng tham gia vào thị trường giày dép của Việt Nam Nổi bật trong

đó là Adidas Là thương hiệu nổi tiếng toàn cầu, Adidas tham gia thị trường dụng cụ thểthao Việt Nam từ rất lâu Năm 1993, Adidas đã có mặt tại Việt Nam nhưng phải đến năm

2009 Adidas mới chính thức thành lập Công ty Adidas Việt Nam, được sở hữu 100% vốnbởi Adidas International B.V (Amsterdam, Hà Lan)

Adidas phát triển nhanh và mạnh tại thị trường Việt Nam Chỉ sau 2 năm hoạtđộng chính thức, Adidas đã mở tổng cộng 50 cửa hàng tại các thành phố lớn, trải dài từBắc vào Nam Adidas hiện đang có khoảng 80.000 lao động tại Việt Nam

Để gia tăng khả năng khai thác thị trường sản phẩm giày thể thao, Adidas đã thựchiện các chiến dịch marketing với quy mô lớn nhằm tác động đến hành vi mua của ngườitiêu dùng Thông qua việc chứng minh những ưu thế về tính năng sản phẩm, chất lượngdịch vụ, làm gia tăng lợi ích về mặt tâm lí, xã hội cho người sử dụng,… Công ty kì vọngnhững giá trị vượt trội đó sẽ gia tăng lượng khách hàng về cho công ty Đây chính lànguyên nhân chúng tôi chọn đề tài nghiên cứu: “Nghien cuu yeu to anh huong đen vieclua chon san pham tai adidas”

4

Trang 6

CHƯƠNG I: KHẢO SÁT DỰ ÁN

1 Dữ liệu đầu vào

Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về

các nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.

2 Mục tiêu của bài toán

Từ những lựa chọn của khách hàng, xác định sự tương quan của các yếu tố ảnh hưởng tới quyết định lựa chọn sản phẩm của Adidas Từ đó thấy được mức độ ảnh

hưởng của các yếu tố và sự đưa ra quyết định mua các sản phẩm của Adidas

3 Mẫu phiếu điều tra

Bảng câu hỏi khảo sát về các nhân tố ảnh hưởng đến quyết định mua sản phẩm của Adidas.

BẢNG CÂU HỎI KHẢO SÁT VỀ CÁC YẾ́U TỐ ẢNH HƯỞNG ĐẾ́N VIỆ$C

LỰA CHỌN SẢN PHẨM TẠI ADIDAS

Xin chào các bạn! Chúng tôi là nhóm nghiên cứu của trường đại học Thương Mạiđang thực hiện việc khảo sát về "các yếu tố ảnh hưởng đến quyết định lựa chọn sảnphẩm tại Adidas" Rất mong các bạn dành thời gian để trả lời một số câu hỏi khảo sátcủa chúng tôi dưới đây

Xin chân thành cảm ơn!

Giới thiệu đôi nét về bản thân bạn

Trang 8

4 Bạn biết Adidas qua đâu ?

o Được bạn bè, người thân giới thiệuNgười bán hàng trên FB

o Thường xuyên xuất hiện trên tivi, mạng xã hội

o Được thấy từ nhiều người sử dụng

1 Giày có nhiều màu sắc, mẫu

mã đa dang để lựa chọn

1 Thái độ nhân viên vui vẻ,

thân thiện và An ninh trật tự

tốt

2 Các cửa hàng phân phối giày

rộng rãi, mạng lưới đại lý

Trang 9

C Thương hiệu

1 Adidas là một thương hiệu lớn

2 Adidas là một thương hiệu uy tín

3 Mọi người xung quanh đều sử dụng

D Giá cả

1 Giày có giá cả cạnh tranh trên thị trường

2 Giá có tương xứng với chất lượng

3 Có nhiều mức giá để lựa chọn

4 Có giá cả hợp lý với mỗi người tiêu dùng

Bạn sẽ giới thiệu cho mọi người xung quanh mua hàng tại Adidas?

Trong 147 phiếu khảo sát thu được có: 88 người thuộc giới tính nữ

chiếm 59.86%, còn lại 59 người là thuộc giới tính nữ chiếm 40.14%

Thu nhập dưới 1 triệu có 27 người chiếm 18,36%, từ 1 đến 2 triệu có 72 người chiếm 48,97% , trên 2 triệu có 43 chiếm 29,25% , khác có 5 người chiếm 3,4%

8

Trang 10

Số người chi dưới 1 triệu cho 1 đôi giày adidas có 52 người chiếm 35,37%, từ

1 đến 2 triệu có 65 người chiếm 44,2% , trên 2 triệu có 22 người chiếm 15%, mục khác có 8 người chiếm 5,44%

Số người mua giày từ website có 30 người chiếm , số người mua gìay từ cửa hàng có 50 người chiếm, số người mua giày từ các sàn thương mại điện tử có

19 người chiếm 12,92%, số người mua giày từ người bán hàng trên facebook

có 43 người chiếm 29,25%, mục khác có người mua giày từ các đơn vị bán hàng khác hoặc chưa mua bao giờ có 5 người chiếm 3,4%

2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha - Ta quy ước như sau:

HTCLSP1: Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn

HTCLSP2: Giày có đầy đủ kích cỡ phù hợp vs người mua

HTCLSP3: Giày êm ái khi di chuyển

HTCLSP4: Giày có độ bền cao

CLDV1: Thái độ nhân viên vui vẻ, thân thiện và an ninh trật tự tốt

CLDV2: Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắpCLDV3: Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiềuđợt sale

CLDV4: Khách hàng được cung cấp nhiều thông tin về sản phẩm

TH1: Adidas là một thương hiệu lớn

TH2: Adidas là một thương hiệu uy tín

TH3: Mọi người xung quanh đều sử dụng

GC1: Giày có giá cả cạnh tranh trên thị trường

GC2: Giá có tương xứng với chất lượng

GC3: Có nhiều mức giá để lựa chọn

GC4: Có giá cả hợp lý với mỗi người tiêu dùng

- Hình thức chất lượng sản phẩm: Reliability Statistics

Trang 11

Scale Mean Scale Corrected Cronbach's

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.789 > 0.6, hệ số

tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ

số Cronbach's Alpha if Item Deleted của biến “Giày có nhiều màu sắc, mẫu mã

đa dang để lựa chọn” (= 0.796) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại

bỏ biến quan sát “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”

- Chất lượng dịch vụ: Reliability Statistics

Item-Total Statistics

Trang 12

10

Trang 13

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.757 > 0.6, hệ

số tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)

- Thương hiệu: Reliability Statistics

Item-Total Statistics

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.719 > 0.6, hệ số

tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ

số Cronbach's Alpha if Item Deleted của biến “Mọi người xung quanh đều sử

dụng” (= 0.736) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ biến quan sát

“Mọi người xung quanh đều sử dụng”

- Giá cả: Reliability Statistics

Item-Total Statistics

11GC2

GC3

GC4

11.6611.6711.86

4.5684.2904.214

.603.614.584

.746.741.759

Trang 14

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.795 > 0.6, hệ

số tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)

Kết luận: Sau khi tiến hành phân tích độ tin cậy bằng phương pháp

Cronbach’s Alpha, 15 biến quan sát rút lại còn 13 biến quan sát, loại bỏ các biến quan sátlà: “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”, “Mọi người xung quanh đều

sử dụng”

3 Kết quả phân tích nhân tố khám phá EFA

3.1 Kiểm định KMO và Bartlett’s Test

- Yêu cầu

+ Hệ số KMO ≥ 0.5

+ Sig < 0.005

KMO and Bartlett's Test

Bartlett's Test of Sphericity Approx Chi-Square 866.753

Bảng giải thích tổng phương sai

Extraction Method: Principal Component Analysis

Total Variance Explained

Nhận xét: Tiêu chuẩn của phương pháp phân tích nhân tố là chỉ số KMO phải lớn

hơn 0.5 (Garson, 2003) và kiểm định Barlett’s có mức ý nghĩa sig < 0.05 để chứng

tỏ dữ liệu dùng phân tích nhân tố là thích hợp và giữa các biến có tương quan với

nhau Giá trị Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO)=0.858

Kết quả phân tích nhân tố cho thấy chỉ số KMO là 0.858> 0.5, điều này chứng tỏ

dữ liệu dùng để phân tích nhân tố là hoàn toàn thích hợp

Kết quả kiểm định Barlett’s là 866.753 với mức ý nghĩa Sig = 0.000< 0.05,lúc này bác

bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể

12

Trang 15

Như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị

bác bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố

3.2 Eigenvalues và phương sai trích

Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay

Varimax

Kết quả cho thấy 13 biến quan sát ban đầu được nhóm thành 3 nhóm

Giá trị tổng phương sai trích = 62.401% > 50%: đạt yêu cầu; khi đó có thể nói rằng

3 nhân tố này giải thích 62.401% biến thiên của dữ liệu

Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvaluesthấp nhất là 1.015> 1

Total Variance Explained

Rotation Sums of Squared

13

Trang 16

Có 3 loại biến xấu:

+ Biến xấu 1 : Hệ số tải Factor Loading nhỏ hơn hệ số tải tiêu chuẩn

+ Biển xấu 2 : Tải lên 2 hay nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.5

+ Biến xấu 3 : Nằm tách biệt duy nhất ở một nhân tố

 Từ bảng trên ta thấy loại 2 biến xấu: CLDV3, GC1

Rotated Component Matrix a

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser

Normalization.

a Rotation converged in 7 iterations.

 Ta bỏ các biến trên và thực hiện lại ta được:

14

Trang 17

KMO and Bartlett's Test

Ta thấy hệ số KMO của bài là 0.842 > 0.5 đủ để phân tích nhân tố là phù hợp

Kiểm định Bartlett có ý nghĩa thống kê Sig < 0.05, chứng tỏ các biến quan sát có

tương quan với nhau trong nhân tố

Total Variance Explained

Extraction Method: Principal Component Analysis.

Rotation Sums of Squared Loadings

Total % of Cumulative

Variance %

3.558 32.346 32.346 2.648 24.074 56.419

Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay

Varimax

15

Trang 18

Kết quả cho thấy 11 biến quan sát ban đầu được nhóm thành 2 nhóm.

Giá trị tổng phương sai trích = 56.419% > 50%: đạt yêu cầu; khi đó có thể nói rằng

3 nhân tố này giải thích 56.419% biến thiên của dữ liệu

Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvaluesthấp nhất là 1.167> 1

a Rotation converged in 3 iterations.

Qua bảng trên ta không còn thấy biến xấu nào để loại bỏ nữa Kết thúc phân tích EFA

Vậy sau khi phân tích nhân tố khám phá EFA ta loại 2 biến xấu: CLDV3,

Trang 19

F_CLDV Pearson Correlation 620 ** 1

** Correlation is significant at the 0.01 level (2-tailed).

Nhận xét: Sig kiểm định tương quan Pearson các giữa 2 biến độc lập F_GC,

F_CLDV đều nhỏ hơn 0.05 Như vậy, có mối liên hệ tuyến tính giữa 2 biến F_GC và

F_CLDV

5 Phân tích hồi quy đa biến

Model Summary b

Adjusted R Std Error of the

Trang 20

B Std Error Beta Tolerance VIF

 Hệ số VIF của các biến độc lập có 1 biến lớn lơn 2 nên có hiện tượng đa cộng biến xảy ra

 Các hệ số hồi quy đều lớn hơn 0 Như vậy tất cả các biến độc lập đưa vào phân tích hồi quy đều tác động cùng chiều tới biến phụ thuộc Dựa vào độ lớn của hệ số hồi quy chuẩn hoá Beta, thứ

tự mức độ tác động từ mạnh nhất tớ yếu nhất của cá biến độc lập tới biến phụ thuộc HL là

GCTH(0.030),CLDVTH(0.030) > GC(0.011) Tương ứng với;

- Biến Chất lượng dịch vụ và thương hiệu tác động mạnh nhất tới sự hài lòng của khách hàng

- Biến Giá cả tác động mạnh thứ 2 tới sự hài lòng của khách hàng

-18

Trang 21

 Giá cả trung bình Mean = -4.43E -16 gần bằng 0, độ lệch chuẩn là 0.990 gần bằng 1, như vậy

có thể nói, phân phối phần dư xấp xỉ chuẩ Do đó, có thể kết luận rằng: Giả thiết phân phối chuẩncủa phần dư không bị vi phạm

Phương trình hồi quy chuẩn hoá là

HL = 0.109 * GCTH + 0.102*CLDVTH+0.49*GC

ĐỊNH 1 Tìm nút gốc

Trang 22

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5

Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều là YES

1.2 Xét thuộc tính Chất lượng dịch vụ Thuộc

tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là C2, C3, C4, C5

Child node ứng với Chất lượng dịch vụ = 2 và = 3 có Entropy = 0 do tất cả các giá trị đều

1.3 Xét thuộc tính Thương hiệu

Thuộc tính này nhận 1 trong 5 giá trị là 1,3,4,5

Gọi tập hợp điểm trong mỗi child node này là A1, A3, A4, A5

Child node ứng với Thương hiệu = 1 và = 3 có Entropy = 0 do tất cả các giá trị đều làYES

Trang 23

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là G2, G3, G4, G5

Child node ứng với Thương hiệu = 2 và = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5

Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều bằng YES

21

Trang 24

2.2 Xét thuộc tính Thương hiệu

Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5

Gọi tập hợp điểm trong mỗi child node này là A3, A4, A5

Child node ứng với Thương hiệu = 3 có Entropy = 0 do tất cả các giá trị đều là YES Entropy(A3) = 0

Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5

Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5

Child node ứng với Thương hiệu = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều làYES

Trang 25

2.4 Với Thương hiệu = 4

a Xét thuộc tính Hình thức chất lượng

Thuộc tính này nhận 1 trong 5 giá trị là 4,5

Gọi tập hợp điểm trong mỗi child node này là T4, T5

Child node ứng với Hình thức chất lượng = 4 có Entropy = 0 do tất cả các giá trị đều làYES

Thuộc tính này nhận 1 trong 5 giá trị là 5

Gọi tập hợp điểm trong mỗi child node này là G5

Trang 26

2.5 Với Thương hiệu = 5

a Xét thuộc tính Hình thức chất lượng

Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5

Gọi tập hợp điểm trong mỗi child node này là T3, T4, T5

Child node ứng với Hình thức chất lượng = 3 và = 5 có Entropy = 0 do tất cả các giá trịđều là YES

Entropy(T3) = 0

Entropy(T5) = 0

Trang 27

Thuộc tính này nhận 1 trong 5 giá trị là 3, 4, 5

Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5

Child node ứng với Hình thức chất lượng = 3 và = 4 có Entropy = 0 do tất cả các giá trịđều là YES

Trang 28

Làm tương tự với các nhánh còn lại Ta có cây quyết định cuối cùng sau:

3 Kiểm tra độ chính xác của cây quyết định vừa vẽ

Lấy 30% dữ liệu phần cuối trong file kết quả thu được từ phiếu khảo sát ta áp dụng vào cây quyết định để tính độ chính xác của cây ta thu được bảng kết quả như sau:

Sự hài lòng STT Hình thức chất lượng Chất lượng dịch Thương hiệu Giá cả của khách

Trang 29

128 Rất đồng ý Phân vân Đồng ý Rất đồng ý Yes (TP)

129 Không đồng ý Không đồng ý Rất không Không đồng ý Yes (FN)

Trang 30

27

Trang 31

CHƯƠNG IV: GIẢI PHÁP

 Thứ nhất, trong bảng cập nhật trên ta có thể thấy tỉ lệ người bình chọn phân vân

ở cột Thương Hiệu nhiều hơn cả Điều này chứng minh Adidass chưa thật sự xây dựng được thương hiệu mang niềm tin cho người tiêu dùng Giải pháp ở đây cần phải tập trung cho việc PR thương hiệu Adidass trở nên gần gũi với người tiêu dùng thong qua các chiến dịch tập trung vào khách hàng: Chương trình giảm giá, khuyến mãi, Ưu đãi, Từ thiện,…

 Thứ hai, vấn đề còn nằm ở phần giá cả Vì định vị bản thân là một thương hiệu lớn nên phân khúc giá của adidass luôn nằm ở mức khá, cao Chính vì thế đối tượng khách hàng của thương hiệu này cũng là tầm khá và cao Điều này khá bất cập trong việc những khách hàng tầm trung có thể tiếp cận được với sản phẩm Do đó, đề xuất tới việc xây dựng, tạo ra các sản phẩm phù hợp với nhu cầu của khách hàng tầm trung để đáp ứngnhu cầu tốt hơn của người tiêu dung

28

Ngày đăng: 13/12/2022, 06:47

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w