ĐỀ TÀI:Ý KIẾN CỦA KHÁCH HÀNG VỀ NHỮNG YẾU TỐ ĐƯỢC CHO LÀ QUAN TRỌNG ĐỐI VỚI MỘT SIÊU THỊ TRÊN ĐỊA BÀN THÀNH PHỐ HÀ NỘI I.. Giới thiệu chung dữ liệu và mục tiêu phân tích Bộ dữ liệu là ý
Trang 1MỤC LỤC
I Giới thiệu dữ liệu và mục tiêu 2
1 Giới thiệu chung dữ liệu và mục tiêu phân tích 2
2 Các biến của dữ liệu 2
II Cách thực hành phân tích 4
1 Một số phân tích sơ bộ về bộ dữ liệu 4
1.1 Đăc điểm giới tính 4
1.2 Đặc điểm về tình trạng con cái 4
1.3 Đặc điểm phân bố tuổi 4
1.4 Đặc điểm tình trạng học vấn 4
1.5 Đặc điểmTình trạng công việc 4
1.6 Chi phí trung bình của một lần đi mua 4
2 Kiểm tra dữ liệu trống 5
3 Phân tích thành phần chính PCA 5
3.1 Chọn biến 5
3.2 Xác định thành phần chính 6
3.3 Xác định các biến tương ứng với từng thành phần chính được rút trích 10
4 Tính các nhân tố 13
5 Một số đồ thị 15
5.1 Đồ thị của tất cả các quan sát theo giới tính 15
5.2 Đồ thị của tất cả các quan sát theo nhóm tuổi 16
5.3 Đồ thị của tất cả các quan sát theo tình trạng con cái 17
5.4 Đồ thị của tất cả các quan sát theo học vấn 18
5.5 Đồ thị của tất cả các quan sát theo công việc 19
5.6 Đồ thị của tất cả các quan sát theo chi phí 20
5.7.Một số đồ thị khác 21
III Kiến nghị: 22
Trang 2ĐỀ TÀI:
Ý KIẾN CỦA KHÁCH HÀNG VỀ NHỮNG YẾU TỐ ĐƯỢC CHO LÀ QUAN TRỌNG ĐỐI VỚI MỘT SIÊU THỊ TRÊN
ĐỊA BÀN THÀNH PHỐ HÀ NỘI
I Giới thiệu dữ liệu và mục tiêu
1 Giới thiệu chung dữ liệu và mục tiêu phân tích
Bộ dữ liệu là ý kiến từ 400 khách hàng trên địa bàn thành phố Hà Nội nhằmkhảo sát nhu cầu, kỳ vọng của người dân về những yếu tố được cho là cần thiết đốivới một siêu thị
Mục đích phân tích bộ dữ liệu là từ ý kiến đánh giá của khách hàng về nhữngyếu tố quan trọng của siêu thị cần có, tìm ra được những nhân tố có tác động, từcác nhân tố đó, xác định nhóm các nhân tố nào có ảnh hưởng mạnh mẽ nhất Qua
đó đưa ra được hướng đi hiệu quả nhằm nâng cao chất lượng, hạn chế xảy ra saisót không đáng có khi bắt đầu mở một siêu thị
2 Các biến của dữ liệu
Trang 3+ Đầy đủ: Siêu thị cung cấp đầy đủ các loại mă ̣t hàng mà khách hàng cần.+ Đa dạng: Nhiều loại hàng hóa đa dạng, phong phú.
+ Bố cục: Cách bày trí ngăn nắp, có khoa học và dễ dàng tìm kiếm sản phẩm.+ Tiện lợi: nhiều loại hình thanh toán tiện lợi (tiền mặt, thanh toán chuyểnkhoản, thanh toán qua thẻ, ) cho khách hàng lựa chọn
+ Thân thiện: Nhân viên luôn thân thiện phục vụ, giải đáp tận tình và đầy đủthắc mắc của khách hàng
+ Giao hàng: Dịch vụ giao hàng tâ ̣n nơi nhanh chóng, đúng hẹn
+ Sạch sẽ: Khu vực mua sắm bên trong siêu thị sạch sẽ, thoáng mát
+ An toàn: Hàng hóa bày bán tại siêu thị đảm bảo chất lượng, có nhãn hiệu,xuất xứ rõ ràng
+ Giá cả: Giá cả hàng hóa phù hợp với chất lượng sản phẩm, luôn được niêmyết rõ ràng
+ Vị trí: Siêu thị nằm ở vị trí trung dễ tìm, thuận tiện ra vào
+ Bãi đậu xe: Bãi đậu xe rộng rãi, thoáng mát, dễ dàng trong việc di chuyển
Trang 4+ Giảm giá: Các chương trình giảm giá, khuyến mãi hấp dẫn được diễn rathường xuyên.
II Cách thực hành phân tích
1 Một số phân tích sơ bộ về bộ dữ liệu
1.1 Đăc điểm giới tính
Câu lệnh: table(Nhom5$Gioitinh)
- Có 164 nam và 236 nữ tham gia vào cuộc khảo sát
1.2 Đặc điểm về tình trạng con cái
Câu lệnh: table(Nhom5$Tinhtrang)
- Trong đó 215 người có con và 185 người chưa có con
1.3 Đặc điểm phân bố tuổi
Trang 5- 183 người có chi phí nằm trong khoảng 100-300k, 121 người có chi phí nằmtrong khoảng 300-500k, 48 người có chi phí nằm trong khoảng 500-700k, 48 người
có chi phí nằm trong khoảng >700k
2 Kiểm tra dữ liệu trống
Câu lệnh : sum(is.na(Nhom5))
Kết quả : Bộ dữ liệu không có dữ liệu trống
3 Phân tích thành phần chính PCA
pca5 <- select(Nhom5, Daydu:Giamgia )
pca6 <- select(Nhom5, Gioitinh:Giamgia )
3.1 Chọn biến
a Phân tích tương quan giữa các biến (Hệ số tương quan)
- Mục đích: đo mức độ mạnh yếu của mối quan hệ giữa hai biến số
Câu lệnh: cor_matrix <- cor(pca5, use = 'complete.obs')
Trang 6Hai biến Baidauxe và Giaca có hệ số tương quan rất thấp (0.008) Hai biếnBaidauxe và Giaca hầu như không có mối liên hệ nào.
b Kiểm định Bartlett's: Kiểm định tương quan giữa các biến
Ho: Ma trận hệ số tương quan của tổng thể là ma trận đơn vị (không rút bớtđược biến)
H1: Ma trận hệ số tương quan của tổng thể không phải là ma trận đơn vị
Do đó dữ liệu phù hợp để sử dụng cho phân tích thành phần chính
Hệ số KMO test = 0,76 > 0.6 đảm bảo sử dụng được phương pháp phân tíchthành phần chính cho bộ dữ liệu, KMO tại các biến đều >0.6 (chỉ có 1 biếnGiamgia là 0.59 xấp xỉ 0.6) do đó các biến đều phù hợp để phần tích thành phầnchính
3.2 Xác định thành phần chính
a) Xác định và loại giá trị ngoại biên
Đồ thị các quan sát
Trang 7Câu lệnh : res.pca5 <- PCA(pca5, graph = FALSE)
summary(res.pca5)
fviz_pca_ind(res.pca5)
Nhận xét : Các quan sát tập trung vào một chỗ thì không có vấn đề gì bởi vì đóng
góp của các quan sát là như nhau Tuy nhiên có những quan sát nằm xa (54, 93,
199, 394) - ảnh hưởng của quan sát này sẽ làm kết quả bị sai lệnh và những quansát đó có thể được coi là giá trị ngoại biên
Đồ thị của 10 quan sát có đóng góp lớn nhất
Trang 8Câu lệnh : fviz_pca_ind(res.pca5, select.ind= list(cos2 = 10))
Có 6 quan sát ngoại biên (37, 58, 132, 190, 194, 260)
Sau khi phân tích hai đồ thị ta xác định được 10 giá trị ngoại biên => tiến hànhloại bỏ quan sát này ra trước khi phân tích thành phần chính
Câu lệnh: pca5 <- pca5[-c(54, 93, 199, 394, 37, 58, 132, 190, 194, 260),]
Trang 9Trong phân tích thành phần chính căn cứ để xác định thành phần chính theo matrận hệ số tương quan là sử dụng eigenvalues >1, hoặc từ đồ thị ta xác định được 4thành phần chính => 12 biến ban đầu có thể biểu diễn tuyến tính qua 4 thành phầnchính và ta giảm chiều dữ liệu từ 12 xuống còn 4 chiều.
Scree plot:
fviz_eig(res.pca5, addlabels = TRUE, ylim = c(0, 50))
Trang 103.3 Xác định các biến tương ứng với từng thành phần chính được rút trích
Câu lệnh : fviz_contrib(res.pca5,choice ="var",axes = 1 )
Trang 11Câu lệnh : fviz_contrib(res.pca5,choice ="var",axes = 2 )
Câu lệnh : fviz_contrib(res.pca5,choice ="var",axes = 3 )
Trang 12Câu lệnh : fviz_contrib(res.pca5,choice ="var",axes = 4 )
Nhận xét : Dựa vào từng đồ thị ta xác định được rõ ràng những biến nào có thể
nằm trong thành phần chính nào, nhưng có 1 số biến thuộc 2 đến 3 thành phầnchính như: Daydu (1,2), Dadang (1,2), An Toàn (1,3), Giamgia (2, 3, 4), Thanthien(2,4) cần phải xem xét (dựa vào Cos2, Ctr xem biến đó giải thích cho thành phầnchính nào nhiều hơn thì sẽ xếp vào thuộc thành phần chính đó)
Trang 13Kết luận :
Thành phần chính thứ nhất gồm các biến: Tienloi, Giaohang, Vitri
Thành phần chính thứ 2 gồm: Giamgia, Dadang, Daydu, Thanthien
Thành phần chính thứ 3 gồm: Sachse, Giaca, Antoan
Trang 14tpc <- mutate(tpc,
pc2=Daydu*-0.562+Dadang*-0.573+Bocuc*0.194+Tienloi*-0.142+Thathien*0.554+Giaohang*0.239+Sachse*0.289+Antoan*0.195+Giaca*0.228+Vitri*-0.273+Baidauxe*0.09+Giamgia*0.584)
pc4=Daydu*0.116+Dadang*-0.087+Bocuc*-0.501+Tienloi*-0.223+Thathien*-0.043+Antoan*0.250+Giaca*0.26+Vitri*0.246+Baidauxe*0.451+Giamgia*0.447)
Trang 16geom.ind = "point",
col.ind = pca6$Gioitinh,
addEllipses = TRUE,
legend.title = "Groups")
Nhận xét : Vòng tròn màu xanh là câu trả lời về những điều quan trọng nên có tại
một siêu thị của nữ giới, vòng tròn màu đỏ là câu trả lời của nam giới Hai vòngtròn tập trung tại một chỗ, có thể thấy các dạng trả lời của nam và nữ giới không cónhiều sự khác biệt (dạng trả lời của nam giới tập trung hơn so với nữ giới, có thểnói nữ giới có nhiều quan điểm khác nhau hơn đối với tiêu chuẩn của 1 siêu thị)
5.2 Đồ thị của tất cả các quan sát theo nhóm tuổi
Câu lệnh: fviz_pca_ind(res.pca6,
geom.ind = "point",
col.ind = pca6$Nhomtuoi,
Trang 18Nhận xét : Quan sát từ đồ thị cũng có thể thấy là câu trả lời của những người có
con và không có con là gần như không khác biệt Như vậy tình trạng con cái không
có ảnh hưởng lớn đến câu trả lời về tiêu chuẩn của siêu thị
5.4 Đồ thị của tất cả các quan sát theo học vấn
Trang 19Nhận xét : Các vòng tròn đại diện cho học vấn rất tập trung, do đó các câu trả lời
về những điều quan trọng nên có tại một siêu thị theo trình độ học vấn khá tươngđồng
5.5 Đồ thị của tất cả các quan sát theo công việc
Trang 20Nhận xét : Tại đồ thị này có thể thấy câu trả lời chia theo công việc đã có sự thay
đổi, trong đó các công việc đều có những câu trả lời khá giống nhau trừ nhóm côngviệc khác.Có thể lí giải do tập hợp nhiều công việc khác nhau nên dẫn tới câu trảlời cũng có nhiều thay đổi
5.6 Đồ thị của tất cả các quan sát theo chi phí
Trang 21Nhận xét : Có thể thấy mực độ tập trung của câu trả lời ngày càng tăng theo độ
tăng của chi phí trung bình khi đi mua sắm, nhóm >700k cũng là nhóm có mức độtập trung cao nhất trong đồ thị này
5.7.Một số đồ thị khác
Câu lệnh: fviz_pca_biplot(res.pca6,
col.ind = pca6$Gioitinh, palette = "jco",
addEllipses = TRUE, label = "var",
col.var = "black", repel = TRUE,
legend.title = "gioitinh")
Trang 22Nhận xét : Từ đồ thị có thể thấy các vecto Tienloi, Thanthien, Baidauxe khá tiệm
cận vòng tròn của nam giới nên có thể cho rằng nam giới quan tâm khá nhiều đếncác yêu tố đó Trong khi nữ giới có vẻ như quan tâm hơn đến các yếu tố như: giaohàng, đa dạng, an toàn, giá cả
III Kiến nghị:
Nghiên cứu nhằm chỉ ra được các yếu tố dịch vụ quan trọng trong việc mởsiêu thị trên đại bàn thành phố Hà Nội Bằng phương pháp phân tích thành phầnchính dữ liệu thu thập được từ nhóm khách hàng, nhóm nghiên cứu đã xác địnhđược các thành phần chính bao gồm có:
Thành phần chính thứ nhất, gồm: Tiện lợi, Giao hàng, Vị trí -> Thuận Tiện
Thành phần chính thứ hai, gồm: Giảm giá, đa dạng, đầy đủ -> Thiện cảm
Trang 23 Thành phần chính thứ ba, gồm: Sạch sẽ, Giá cả, An toàn -> Tin Cậy
Thành phần chính thứ tư, gồm: Bố cục, bãi đậu xe -> Cấu trúc
Trong đó thành phần chính quan trọng nhất mà doanh nghiệp cần cân nhắctrong việc xây dựng dịch vụ siêu thị chính là các yếu tố quyết định trực tiếp đến sựthuận tiện, nhanh chóng cho khách hàng trong việc mua sắm, bao gồm có: Tiện lợi,giao hàng, vị trí Sở dĩ đây là những yếu tố quan trọng nhất bởi vì Hà Nội là mộtthành phố lớn, nhịp sống rất nhanh, cuộc sống người dân tương đối bận rộn do đókhi tìm đến các siêu thị thì khách hàng sẽ ưu tiên không gian mua sắm tiện lợi và
vị trí địa lý hợp lý Chuỗi siêu thị tiêu dùng vẫn luôn được đánh giá cao bởi việclựa chọn các vị trí địa lý “đắc địa” ở các khu dân cư đông đúc, nhu cầu tiêu dùngcao, có vị trí giao thông thuận lợi, đảm bảo không bị ách tắc khi khách mua hàngquá đông gây cản trở giao thông đi lại Bên cạnh đó việc lựa chọn mặt bằng cửahàng lớn, (1000-10000m2 tùy vào khu vực) đảm bảo sức chứa các mặt hàng vàlượng khách lớn cũng sẽ là một điểm cộng lớn cho siêu thị Đây đều là những yếu
tố mà chủ doanh nghiệp có thể cân nhắc tiếp tục phát huy khi mở siêu thị Ngoài
ra, trong thời kỳ đại dịch phức tạp, việc di chuyển đến các cửa hàng siêu thị trở nênkhó khăn hơn bao giờ hết, thì việc giao hàng nghiễm nhiên trở thành một trongnhững yếu tố được quan tâm hàng đầu của khách hàng khi chọn lựa siêu thị Vì thếnếu doanh nghiệp muốn mở siêu thị thì cần tập trung chú trọng vào dịch vụ giaohàng và chăm sóc khách hàng trực tuyến
Bên cạnh ưu tiên sự tiện lợi trong việc mua sắm thì khách hàng còn đặc biệtquan tâm đến sự đa dạng và ưu đãi của các sản phẩm Mặt bằng chung sản phẩmcàng phong phú thì sẽ càng thu hút được lượng khách hàng nhiều Bên cạnh đó,việc giảm giá hay ưu đãi cho một số mặt hàng vào một số khung thời gian cố địnhtrong năm sẽ góp phần kích cầu mua sắm của khách hàng trong năm
Các yếu tố còn lại liên quan đến chất lượng sản phẩm như: sạch sẽ, giá cả, antoàn cũng là yếu tố quan trọng tuy nhiên chưa được coi là yếu tố tiên quyết nhấttrong việc đưa ra quyết định lựa chọn cửa hàng siêu thị của khách hàng