1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Thảo luận nhóm TMU môn KHAI PHÁ dữ LIỆU TRONG KINH DOANH đề tài khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại adidas

32 81 1

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 32
Dung lượng 458,12 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Dữ liệu đầu vào Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.. 2 Mục tiêu của bài toán T

Trang 1

TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA: HTTT KINH T V THƯƠNG MẠI ĐIÊ N TƯ

ĐỀ T I THẢO LUẬN

MÔN: KHAI PHÁ DỮ LIỆU TRONG KINH DOANH

Đề tài: Khai phá dữ liệu cho cơ sở dữ liệu khách hàng quyết định lựa chọn sản phẩm tại

Trang 2

Người thực hiện: 9

BẢNG PHÂN CÔNG NHIỆM VỤ V DANH SÁCH TH NH VIÊN NHÓM 7

- Cây quyết định tổng quát

- Kiểm định độ tin cậy thang đo Cronbach’s Alpha

- Phân tích nhân tố khám phá EFA

- Tương quan Pearson

Lời mở đầu, kết luận, Xử lý số

liệu

Trang 3

Mục lục

CHƯƠNG I: KHẢO SÁT DỰ ÁN 5

CHƯƠNG II: K T QUẢ NGHIÊN CÚU 8

1 Mô tả thống kê 8

2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha 8

3 Kết quả phân tích nhân tố khám phá EFA 11

4 Tương quan pearson 16

5 Phân tích hồi quy đa biến 16

CHƯƠNG III: XÂY DỰNG CÂY QUY T ĐỊNH 18

CHƯƠNG IV: GIẢI PHÁP 28

3

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 4

Hàng loạt các thương hiệu giày thể thao quốc tế lớn như Nike, Adidas và Reebok…

có nhà sản xuất gia công phần mềm của giày dép tại Việt Nam, đồng thời các sản phẩmchính hãng cũng tham gia vào thị trường giày dép của Việt Nam Nổi bật trong đó làAdidas Là thương hiệu nổi tiếng toàn cầu, Adidas tham gia thị trường dụng cụ thể thaoViệt Nam từ rất lâu Năm 1993, Adidas đã có mặt tại Việt Nam nhưng phải đến năm 2009Adidas mới chính thức thành lập Công ty Adidas Việt Nam, được sở hữu 100% vốn bởiAdidas International B.V (Amsterdam, Hà Lan)

Adidas phát triển nhanh và mạnh tại thị trường Việt Nam Chỉ sau 2 năm hoạt độngchính thức, Adidas đã mở tổng cộng 50 cửa hàng tại các thành phố lớn, trải dài từ Bắc vàoNam Adidas hiện đang có khoảng 80.000 lao động tại Việt Nam

Để gia tăng khả năng khai thác thị trường sản phẩm giày thể thao, Adidas đã thựchiện các chiến dịch marketing với quy mô lớn nhằm tác động đến hành vi mua của ngườitiêu dùng Thông qua việc chứng minh những ưu thế về tính năng sản phẩm, chất lượngdịch vụ, làm gia tăng lợi ích về mặt tâm lí, xã hội cho người sử dụng,… Công ty kì vọngnhững giá trị vượt trội đó sẽ gia tăng lượng khách hàng về cho công ty Đây chính lànguyên nhân chúng tôi chọn đề tài nghiên cứu: “Nghiên cứu yếu tố ảnh hưởng đến việclựa chọn sản phẩm tại adidas”

Trang 5

CHƯƠNG I: KHẢO SÁT DỰ ÁN

1 Dữ liệu đầu vào

Dữ liệu đầu vào là bảng dữ liệu thông tin và mức độ đồng ý của khách hàng về các

nhân tố ảnh hưởng đến quyết định lựa chọn sản phẩm tại Adidas.

2 Mục tiêu của bài toán

Từ những lựa chọn của khách hàng, xác định sự tương quan của các yếu tố ảnh hưởng tới quyết định lựa chọn sản phẩm của Adidas Từ đó thấy được mức độ ảnh hưởng của các yếu tố và sự đưa ra quyết định mua các sản phẩm của Adidas

3 Mẫu phiếu điều tra

Bảng câu hỏi khảo sát về các nhân tố ảnh hưởng đến quyết định mua sản phẩm của Adidas.

BẢNG CÂU HỎI KHẢO SÁT VỀ CÁC Y U TỐ ẢNH HƯỞNG Đ N VIỆC

LỰA CHỌN SẢN PHẨM TẠI ADIDAS

Xin chào các bạn! Chúng tôi là nhóm nghiên cứu của trường đại học Thương Mạiđang thực hiện việc khảo sát về "các yếu tố ảnh hưởng đến quyết định lựa chọn sảnphẩm tại Adidas" Rất mong các bạn dành thời gian để trả lời một số câu hỏi khảo sátcủa chúng tôi dưới đây

Xin chân thành cảm ơn!

Giới thiệu đôi nét về bản thân bạn

1 Họ và ………

5

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 7

4 Bạn biết Adidas qua đâu ?

o Được bạn bè, người thân giới thiệuNgười bán hàng trên FB

o Thường xuyên xuất hiện trên tivi, mạng xã hội

1 Giày có nhiều màu sắc, mẫu

mã đa dang để lựa chọn

Trang 8

2 Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắp nên dễ dàng tìm muasản phẩm

3 Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiều đợt sale

4 Khách hàng được cung cấp nhiều thông tin về sản phẩm

C Thương hiệu

1 Adidas là một thương hiệu lớn

2 Adidas là một thương hiệu uy tín

3 Mọi người xung quanh đều sử dụng

D Giá cả

1 Giày có giá cả cạnh tranh trên thị trường

2 Giá có tương xứng với chất lượng

3 Có nhiều mức giá để lựa chọn

4 Có giá cả hợp lý với mỗi người tiêu dùng

Bạn sẽ giới thiệu cho mọi người xung quanh mua hàng tại Adidas?

Cảm ơn bạn đã giúp nhóm mình!

Trang 9

CHƯƠNG II: K T QUẢ NGHIÊN CÚU

Số người chi dưới 1 triệu cho 1 đôi giày adidas có 52 người chiếm 35,37%, từ

1 đến 2 triệu có 65 người chiếm 44,2% , trên 2 triệu có 22 người chiếm 15%, mục khác có 8 người chiếm 5,44%

Số người mua giày từ website có 30 người chiếm , số người mua gìay từ cửa hàng có 50 người chiếm, số người mua giày từ các sàn thương mại điện tử có

19 người chiếm 12,92%, số người mua giày từ người bán hàng trên facebook

có 43 người chiếm 29,25%, mục khác có người mua giày từ các đơn vị bán hàng khác hoặc chưa mua bao giờ có 5 người chiếm 3,4%

2 Phân tích độ tin cậy qua hệ số Cronbach’s Alpha

- Ta quy ước như sau:

HTCLSP1: Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọnHTCLSP2: Giày có đầy đủ kích cỡ phù hợp vs người muaHTCLSP3: Giày êm ái khi di chuyển

HTCLSP4: Giày có độ bền caoCLDV1: Thái độ nhân viên vui vẻ, thân thiện và an ninh trật tự tốtCLDV2: Các cửa hàng phân phối giày rộng rãi, mạng lưới đại lý rộng khắpCLDV3: Dịch vụ hậu mãi ở cửa hàng tốt, chế độ bảo hành tốt và có nhiều đợt sale

CLDV4: Khách hàng được cung cấp nhiều thông tin về sản phẩmTH1: Adidas là một thương hiệu lớn

9

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 10

TH2: Adidas là một thương hiệu uy tínTH3: Mọi người xung quanh đều sử dụngGC1: Giày có giá cả cạnh tranh trên thị trườngGC2: Giá có tương xứng với chất lượngGC3: Có nhiều mức giá để lựa chọnGC4: Có giá cả hợp lý với mỗi người tiêu dùng

- Hình thức chất lượng sản phẩm: Reliability Statistics

Item-Total Statistics

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.789 > 0.6, hệ số

tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ

số Cronbach's Alpha if Item Deleted của biến “Giày có nhiều màu sắc, mẫu mã đa

dang để lựa chọn” (= 0.796) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ

biến quan sát “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”

- Chất lượng dịch vụ: Reliability Statistics

Trang 11

Cronbach's N of

Item-Total Statistics

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.757 > 0.6, hệ số

tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)

- Thương hiệu: Reliability Statistics

Cronbach's N of

Item-Total Statistics

Scale Mean Scale Corrected Cronbach's

if Item Variance if Item-Total Alpha if

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.719 > 0.6, hệ số

tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3) Tuy nhiên hệ

11

Trang 12

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 13

số Cronbach's Alpha if Item Deleted của biến “Mọi người xung quanh đều sử

dụng” (= 0.736) lớn hơn hệ số Cronbach’ Alpha chung nên ta loại bỏ biến quan sát

“Mọi người xung quanh đều sử dụng”

- Giá cả: Reliability Statistics

Cronbach's N of

Item-Total Statistics

Scale Mean Scale Corrected Cronbach's

if Item Variance if Item-Total Alpha if

Kết quả kiểm định cho thấy hệ số Cronbach’ Alpha chung = 0.795 > 0.6, hệ số

tương quan biến-tổng của các biến quan sát đều đạt yêu cầu (> 0.3)

Kết luận: Sau khi tiến hành phân tích độ tin cậy bằng phương pháp

Cronbach’s Alpha, 15 biến quan sát rút lại còn 13 biến quan sát, loại bỏ các biến quan sát là: “Giày có nhiều màu sắc, mẫu mã đa dang để lựa chọn”,

“Mọi người xung quanh đều sử dụng”

3 Kết quả phân tích nhân tố khám phá EFA

3.1 Kiểm định KMO và Bartlett’s Test

KMO and Bartlett's Test

12

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 14

Bartlett's Test of Sphericity Approx Chi-Square 866.753

Bảng giải thích tổng phương sai

Extraction Method: Principal Component Analysis

Total Variance Explained

Nhận xét: Tiêu chuẩn của phương pháp phân tích nhân tố là chỉ số KMO phải lớn

hơn 0.5 (Garson, 2003) và kiểm định Barlett’s có mức ý nghĩa sig < 0.05 để chứng tỏ

dữ liệu dùng phân tích nhân tố là thích hợp và giữa các biến có tương quan với nhau

Giá trị Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO)=0.858

Kết quả phân tích nhân tố cho thấy chỉ số KMO là 0.858> 0.5, điều này chứng tỏ dữ

liệu dùng để phân tích nhân tố là hoàn toàn thích hợp

Kết quả kiểm định Barlett’s là 866.753 với mức ý nghĩa Sig = 0.000< 0.05,lúc này

bác bỏ giả thuyết H0: các biến quan sát không có tương quan với nhau trong tổng thể

Như vậy giả thuyết về ma trận tương quan giữa các biến là ma trận đồng nhất bị bác

bỏ, tức là các biến có tương quan với nhau và thỏa điều kiện phân tích nhân tố

3.2 Eigenvalues và phương sai trích

Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay

Varimax

Kết quả cho thấy 13 biến quan sát ban đầu được nhóm thành 3 nhóm

Giá trị tổng phương sai trích = 62.401% > 50%: đạt yêu cầu; khi đó có thể nói rằng 3

nhân tố này giải thích 62.401% biến thiên của dữ liệu

Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvalues

thấp nhất là 1.015> 1

Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared

Trang 15

al Comp onent Analys is.

Trang 16

3.3 Ma trận xoay nhân số

Theo Hair & công sự (1998), Factor loading (hệ số tải nhân tố hay trọng số nhân tố) là chỉ tiêu để đảm bảo mức ý nghĩa thiết thực của EFA

Có 3 loại biến xấu:

+ Biến xấu 1 : Hệ số tải Factor Loading nhỏ hơn hệ số tải tiêu chuẩn

+ Biển xấu 2 : Tải lên 2 hay nhiều nhóm nhân tố và chênh lệch hệ số tải nhỏ hơn 0.5.+ Biến xấu 3 : Nằm tách biệt duy nhất ở một nhân tố

Từ bảng trên ta thấy loại 2 biến xấu: CLDV3, GC1

Rotated Component Matrix a

Component

Trang 17

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser

Normalization.

a Rotation converged in 7 iterations.

Ta bỏ các biến trên và thực hiện lại ta được:

KMO and Bartlett's Test

Ta thấy hệ số KMO của bài là 0.842 > 0.5 đủ để phân tích nhân tố là phù hợp

Kiểm định Bartlett có ý nghĩa thống kê Sig < 0.05, chứng tỏ các biến quan sát có

tương quan với nhau trong nhân tố

Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Rotation Sums of Squared Loadings

Loadings Total % of Cumulative Total % of Cumulative Total % of Cumulative

5.039 45.813 45.813 5.039 45.813 45.813 3.558 32.346 32.346

15

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 18

Extraction Method: Principal Component Analysis.

Nhận xét: Thực hiện phân tích nhân tố theo Principal components với phép quay

Varimax

Kết quả cho thấy 11 biến quan sát ban đầu được nhóm thành 2 nhóm

Giá trị tổng phương sai trích = 56.419% > 50%: đạt yêu cầu; khi đó có thể nói rằng 3 nhân tố này giải thích 56.419% biến thiên của dữ liệu

Giá trị hệ số Eigenvalues của các nhân tố đều cao (>1), nhân tố thứ 3 có Eigenvalues thấp nhất là 1.167> 1

Trang 19

a Rotation converged in 3 iterations.

Qua bảng trên ta không còn thấy biến xấu nào để loại bỏ nữa Kết thúc phân tích EFA

Vậy sau khi phân tích nhân tố khám phá EFA ta loại 2 biến xấu: CLDV3,

** Correlation is significant at the 0.01 level (2-tailed).

Nhận xét: Sig kiểm định tương quan Pearson các giữa 2 biến độc lập F_GC,

F_CLDV đều nhỏ hơn 0.05 Như vậy, có mối liên hệ tuyến tính giữa 2 biến F_GC và

Trang 20

Giá trị hiệu chỉnh bằng 0.008 cho thấy biến độc lập đưa vào chạy hồi quy ảnh hưởng 0.8% sự thay

đổi của biến phụ thuộc, còn lại là 99.2% là do các biến ngoài mô hình và sai số ngẫu nhiên.

Hệ số Durbin- Watson nằm trong khoảng 1.5 đến 2.5 nên không có hiện tượng tự tương

quan chuỗi bậc xảy ra

Các hệ số hồi quy đều lớn hơn 0 Như vậy tất cả các biến độc lập đưa vào phân

tích hồi quy đều tác động cùng chiều tới biến phụ thuộc Dựa vào độ lớn của hệ số

hồi quy chuẩn hoá Beta, thứ tự mức độ tác động từ mạnh nhất tớ yếu nhất của cá

biến độc lập tới biến phụ thuộc HL là GCTH(0.030),CLDVTH(0.030) >

GC(0.011) Tương ứng với;

- Biến Chất lượng dịch vụ và thương hiệu tác động mạnh nhất tới sự hài lòng của khách hàng

- Biến Giá cả tác động mạnh thứ 2 tới sự hài lòng của khách hàng

Trang 21

-Giá cả trung bình Mean = -4.43E -16 gần bằng 0, độ lệch chuẩn là 0.990 gần bằng

1, như vậy có thể nói, phân phối phần dư xấp xỉ chuẩ Do đó, có thể kết luận rằng:

Giả thiết phân phối chuẩn của phần dư không bị vi phạm

Phương trình hồi quy chuẩn hoá là

Trung lập -> YesKhông đồng ý->Yes

Hoàn toàn đồng ý -> YesĐồng ý -> Yes

4/951/46

0/32/96

19

TIEU LUAN MOI download : skknchat123@gmail.com

Trang 22

1.1 Xét thuộc tính Hình thức chất lượng

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5

Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trị

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là C2, C3, C4, C5

Child node ứng với Chất lượng dịch vụ = 2 và = 3 có Entropy = 0 do tất cả các giá trị đều

là YES

Entropy(C2) = 0

Trang 23

Entropy(C4) =

Entropy(C5) =

Entropy(CLDV,S) =

1.3 Xét thuộc tính Thương hiệu

Thuộc tính này nhận 1 trong 5 giá trị là 1,3,4,5

Gọi tập hợp điểm trong mỗi child node này là A1, A3, A4, A5

Child node ứng với Thương hiệu = 1 và = 3 có Entropy = 0 do tất cả các giá trị đều làYES

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là G2, G3, G4, G5

Child node ứng với Thương hiệu = 2 và = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều

Trang 24

2 Tìm các nút tiếp theo

Ta tiếp tục tính Entropy cho nhánh Chất lượng dịch vụ =5 và =4

*Với Chất lượng dịch vụ = 4

2.1 Xét thuộc tính Hình thức chất lượng

Thuộc tính này nhận 1 trong 5 giá trị là 2,3,4,5

Gọi tập hợp điểm trong mỗi child node này là T2, T3, T4, T5

Child node ứng với Hình thức chất lượng = 2 và = 3 có Entropy = 0 do tất cả các giá trịđều bằng YES

2.2 Xét thuộc tính Thương hiệu

Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5

Gọi tập hợp điểm trong mỗi child node này là A3, A4, A5

Child node ứng với Thương hiệu = 3 có Entropy = 0 do tất cả các giá trị đều là YESEntropy(A3) = 0

Entropy(A4) =

Entropy(A5) =

=> Entropy(TH,S) =

2.3 Xét thuộc tính Giá cả

Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5

Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5

Trang 25

Child node ứng với Thương hiệu = 3 và = 4 có Entropy = 0 do tất cả các giá trị đều làYES

Entropy(G3) = 0

Entropy(G4) = 0

Entropy(G5) =

Entropy(GC,S) =

Ta thấy, Entropy (TH, S) = 0,2814 là nhỏ nhất Ta chọn Node tiếp theo là Thương hiệu

2.4 Với Thương hiệu = 4

a Xét thuộc tính Hình thức chất lượng

Thuộc tính này nhận 1 trong 5 giá trị là 4,5

Gọi tập hợp điểm trong mỗi child node này là T4, T5

Child node ứng với Hình thức chất lượng = 4 có Entropy = 0 do tất cả các giá trị đều làYES

Entropy(T4) = 0

Entropy(T5) =

Entropy(HTCL,S) =

b Xét thuộc tính Giá cả

Thuộc tính này nhận 1 trong 5 giá trị là 5

Gọi tập hợp điểm trong mỗi child node này là G5

Trang 26

Ta thấy, Entropy (HTCL, S) = 0,4702 là nhỏ nhất Ta chọn Node tiếp theo là Hình thức chất lượng.

2.5 Với Thương hiệu = 5

a Xét thuộc tính Hình thức chất lượng

Thuộc tính này nhận 1 trong 5 giá trị là 3,4,5

Gọi tập hợp điểm trong mỗi child node này là T3, T4, T5

Child node ứng với Hình thức chất lượng = 3 và = 5 có Entropy = 0 do tất cả các giá trị đều là YES

Trang 27

Entropy(T5) = 0

Entropy(T4) =

Entropy(HTCL,S) =

b Xét thuộc tính Giá cả

Thuộc tính này nhận 1 trong 5 giá trị là 3, 4, 5

Gọi tập hợp điểm trong mỗi child node này là G3, G4, G5

Child node ứng với Hình thức chất lượng = 3 và = 4 có Entropy = 0 do tất cả các giá trịđều là YES

Ngày đăng: 05/08/2022, 10:24

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w