1. Trang chủ
  2. » Luận Văn - Báo Cáo

Chuyên ngành kinh tế dữ liệu ứng dụng ngôn ngữ r trong phân tích hành vi khách hàng starbucks

68 2 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Ứng dụng Ngôn Ngữ R Trong Phân Tích Hành Vi Khách Hàng Starbucks
Tác giả Uông Ngọc Anh
Người hướng dẫn TS. Nguyễn Hữu Xuân Trường
Trường học Học viện Chính sách và Phát triển
Chuyên ngành Kinh tế dữ liệu ứng dụng ngôn ngữ R trong phân tích hành vi khách hàng Starbucks
Thể loại Khóa luận tốt nghiệp
Năm xuất bản 2023
Thành phố Hà Nội
Định dạng
Số trang 68
Dung lượng 1,74 MB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Nhờ đó, các doanh nghiệp có thể áp dụng các kỹ thuật phân tích dữ liệu để tìm ra những thông tin cần thiết về hành vi khách hàng, từ đó tối ưu hóa chiến lược kinh doanh và tăng cường cạn

Trang 1

BỘ KẾ HOẠCH VÀ ĐẦU TƯ HỌC VIỆN CHÍNH SÁCH VÀ PHÁT TRIỂN

Hà Nội – 2023

Trang 2

LỜI CAM ĐOAN Tôi xin cam đoan Khóa luận với đề tài “Ứng dụng ngôn ngữ R trong phân tích hành vi khách hàng Starbucks” là do tự bản thân thực hiện, có sự hỗ trợ của

giáo viên hướng dẫn và không sao chép các công trình nghiên cứu của người khác

Các số liệu trong Khóa luận được sử dụng trung thực và trích dẫn rõ ràng

Nếu sai tôi xin hoàn toàn chịu trách nhiệm

Giảng viên hướng dẫn

Hà Nội, ngày 26 tháng 4 năm 2023

Sinh viên Uông Ngọc Anh

Trang 3

Trong quá trình thu thập thông tin và các số liệu liên quan, tôi đã nhận được

sự chỉ dẫn giúp đỡ, hỗ trợ tận tình giảng viên được sự giúp đỡ của TS Nguyễn Hữu Xuân Trường và những giảng viên khác trong khoa Kinh Tế Số - Học viện Chính sách và Phát triển

V ới điều kiện thời gian cũng như kinh nghiệm còn hạn chế, trong quá trình hoàn thiện bài Khóa luận, tôi không thể tránh khỏi những sai sót, rất mong nhận được sự chỉ bảo, đóng góp ý kiến từ quý ngân hàng và quý thầy cô, để đề tài này có thể hoàn thiện hơn

Tôi xin chân thành cảm ơn!

Hà Nội, tháng 4 năm 2023

Sinh viên Uông Ngọc Anh

Trang 4

MỤC LỤC

LỜI CAM ĐOAN ii

LỜI CẢM ƠN iii

MỤC LỤC iv

DANH MỤC CÁC VIẾT TẮT vi

DANH MỤC HÌNH - BIỂU ĐỒ vii

DANH MỤC BẢNG SỬ DỤNG viii

MỞ ĐẦU 1

1 Tính cấp thiết của đề tài 1

2 Mục đích nghiên cứu 1

3 Đối tượng và phạm vi nghiên cứu 2

4 Phương pháp nghiên cứu 2

5 Kết cấu khóa luận 2

CHƯƠNG 1: CƠ SỞ LÝ THUYẾT BÀI TOÁN PHÂN TÍCH HÀNH VI KHÁCH HÀNG 3

1.1 Phân tích dữ liệu 3

1.1.1 Định nghĩa Phân tích dữ liệu 3

1.1.2 Vai trò phân tích dữ liệu 3

1.1.3 Phân loại các loại phân tích dữ liệu 4

1.1.4 Quy trình phân tích dữ liệu 4

1.1.5 Khám phá dữ liệu 5

1.1.6 Trực quan hóa dữ liệu 6

1.2 Phân tích hành vi khách hàng và vai trò trong kinh doanh 8

1.2.1 Phân tích hành vi khách hàng 8

1.2.2 Vai trò của phân tích hành vi khách hàng trong kinh doanh 9

1.3 Các phương pháp phân tích hành vi khách hàng 13

1.3.1 Phân tích đối tượng khách hàng 13

1.3.2 Phân tích chuỗi giá trị khách hàng 13

Trang 5

1.3.3 Phân tích phản hồi của khách hàng 14

1.4 Phương pháp dự đoán khách hàng sử dụng dịch vụ tương lai 15

1.4.1 Mô hình hồi quy Logistics 15

1.4.2 Đánh giá phân loại 17

1.5 Phương pháp phân nhóm khách hàng 18

1.5.1 Mô hình phân khúc khác hàng Kmeans 19

1.5.2 Phương pháp chọn K tối ưu với phương pháp Eblow 20

1.6 Giới thiệu ngôn ngữ R và thư viện sử dụng 21

1.6.1 Giới thiệu ngôn ngữ R 21

1.6.2 Tính năng của ngôn ngữ R 22

1.6.3 Cài đặt và sử dụng R 23

1.6.4 Thư viện R sử dụng 23

KẾT LUẬN CHƯƠNG 1 26

CHƯƠNG 2: KHÁM PHÁ DỮ LIỆU 27

2.1 Dữ liệu nghiên cứu 27

2.2 Khám phá dữ liệu 29

2.2.1 Giới tính 29

2.2.2 Thành phần khách hàng được khảo sát 30

2.2.3 Phản hồi khách hàng chọn quay trở lại 31

2.2.4 Phân phối mức thu nhập hàng năm của khách hàng 32

2.2.5 Thời gian ghé quán của khách hàng 34

2.2.6 Số tiền tiêu trung bình của khách hàng 37

KẾT LUẬN CHƯƠNG 2 41

CHƯƠNG 3: XÂY DỰNG MÔ HÌNH PHÂN TÍCH HÀNH VI KHÁCH HÀNG 42

3.1 Tiền xử lý dữ liệu 42

3.2 Xây dựng mô hình dự đoán khách hàng sử dụng dịch vụ tương lai 43

3.3 Xây dựng mô hình phân nhóm khách hàng 48

KẾT LUẬN CHƯƠNG 3 58

KẾT LUẬN 59

TÀI LIỆU THAM KHẢO 60

Trang 6

DANH MỤC CÁC VIẾT TẮT

STT Chữ cái viết tắt Tên đầy đủ tiếng anh Tên đầy đủ tiếng

việt

1 GMM Gaussian Mixture Model

2 BIC Bayesian Information Criterion

3 RFM Recency - Frequency - Monetary

Trang 7

Hình 2.3 Biểu đồ Tỷ lệ khách hàng chọn quay lại

Hình 2.4 Biểu đồ phân phối mức thu nhập hàng năm

Hình 2.5 Biểu đồ thời gian ghé quán của khách hàng

Hình 2.6 Biểu đồ thời gian ghé quán của khách hàng

Hình 2.7 Biểu đồ Số tiền tiêu trung bình của khách hàng

Hình 2.8 Biểu đồ số tiền tiêu trung bình và thành phần khách hàng Hình 3.1 Kết quả ma trận nhầm lẫn

Hình 3.2 Chọn k cụm tối ưu với phương pháp Eblow

Trang 8

Hình 3.3 Kết quả phân khúc dữ liệu với Mô hình Kmeans

DANH MỤC BẢNG SỬ DỤNG

Bảng 1.1 Ma trận nhầm lẫn

Bảng 2.1 Mô tả câu hỏi khảo sát “Starbucks Customer Survey.csv” Bảng 2.2 Bảng thống kê Tỷ lệ khách hàng chọn quay lại

Bảng 2.3 Bảng thống kê phân phối mức thu nhập hàng năm

Bảng 2.4 Bảng thống kê thời gian ghé quán khách hàng

Bảng 2.5 Bảng thống kê thời gian ghé quán của thành phần khách hàng Bảng 2.6 Số tiền tiêu trung bình của khách hàng

Bảng 2.7 Bảng thống kê số tiền tiêu trung bình - thành phần khách hàng Bảng 3.1 Bảng hệ số hiển thị các hệ số ước tính

Bảng 3.2 Kết quả ma trận nhầm lẫn

Bảng 3.3 Thống kê giá trị WSS với từng giá trị K

Bảng 3.4 Thống kê phân khúc khách hàng

Trang 9

MỞ ĐẦU

1 Tính cấp thiết của đề tài

Trong thời đại kinh tế số hiện nay, việc phân tích hành vi khách hàng là một trong những vấn đề cấp thiết và quan trọng nhất đối với các doanh nghiệp Với sự phát triển không ngừng của công nghệ, việc thu thập và xử lý dữ liệu từ khách hàng trở nên dễ dàng hơn bao giờ hết Nhờ đó, các doanh nghiệp có thể áp dụng các kỹ thuật phân tích dữ liệu để tìm ra những thông tin cần thiết về hành vi khách hàng, từ

đó tối ưu hóa chiến lược kinh doanh và tăng cường cạnh tranh trên thị trường

Trong bối cảnh đó, phân tích hành vi khách hàng với ngôn ngữ R đóng vai trò

vô cùng quan trọng Ngôn ngữ R là một trong những ngôn ngữ phổ biến nhất để phân tích dữ liệu, cho phép người dùng thực hiện các phân tích phức tạp và tạo ra các biểu đồ và báo cáo trực quan Sử dụng R để phân tích hành vi khách hàng giúp cho các doanh nghiệp có thể nắm bắt được những thông tin quan trọng về hành vi của khách hàng, từ đó tạo ra các chiến lược kinh doanh hiệu quả và cải thiện chất lượng dịch vụ

Trang 10

3 Đối tượng và phạm vi nghiên cứu

 Đối tượng và phạm vi nghiên cứu : hồi quy logistic, phân cụm kmeans

4 Phương pháp nghiên cứu

 Phương pháp luận nghiên cứu khoa học

 Phương pháp thu thập dữ liệu: Thông tin được thu nhập từ giáo trình, bài giảng

 Phương pháp phân loại, phân cụm

5 Kết cấu khóa luận

Ngoài phần mở đầu, kết luận và danh mục tài liệu tham khảo, nội dung khóa

luận còn bao gồm ba chương:

Trang 11

CHƯƠNG 1: CƠ SỞ LÝ THUYẾT BÀI TOÁN PHÂN TÍCH HÀNH VI

KHÁCH HÀNG 1.1 Phân tích dữ liệu

1.1.1 Định nghĩa Phân tích dữ liệu

Phân tích dữ liệu (Tiếng anh: data analysis) là quá trình sử dụng các công cụ,

kỹ thuật và phương pháp để tìm ra thông tin, kiến thức và hệ thống hóa dữ liệu Phân tích dữ liệu giúp người sử dụng hiểu rõ hơn về dữ liệu và giải quyết các vấn đề có liên quan đến dữ liệu

Quá trình phân tích dữ liệu bao gồm việc sử dụng các công cụ thống kê, khai thác dữ liệu, học máy và các phương pháp khác để phân tích và tìm kiếm thông tin

từ dữ liệu Quá trình này giúp đưa ra các kết luận, dự đoán và giải thích về dữ liệu

Phân tích dữ liệu có thể được sử dụng để giải quyết nhiều vấn đề khác nhau, bao gồm phân tích thị trường, phân tích đối thủ cạnh tranh, phát hiện gian lận, phân tích chuỗi cung ứng và nhiều lĩnh vực khác Từ việc phân tích dữ liệu, người sử dụng

có thể tìm ra những cơ hội kinh doanh mới, tối ưu hóa quy trình hoạt động và nâng cao hiệu suất kinh doanh

1.1.2 Vai trò phân tích dữ liệu

Nhắm mục tiêu khách hàng tốt hơn: Doanh nghiệp không muốn lãng phí

thời gian quý báu, tài nguyên và tiền bạc của doanh nghiệp để thực hiện các chiến dịch quảng cáo nhắm mục tiêu đến các nhóm nhân khẩu học có ít hoặc không quan tâm đến hàng hóa và dịch vụ bạn cung cấp

Vận dụng dữ liệu sẵn có tìm ra Insight khách hàng: Thông qua phân tích

dữ liệu doanh nghiệp có thể hiểu rõ hơn về thói quen chi tiêu, thu nhập khả dụng và các lĩnh vực có khả năng quan tâm nhất của đối tượng khách hàng

Trang 12

mục tiêu Nhà quản lý doanh nghiệp dễ dàng hơn trong việc định giá, xác định

độ dài của chiến dịch kinh doanh và thậm chí dự đoán số lượng hàng hóa cần sản xuất

Giảm chi phí hoạt động: Phân tích dữ liệu cho biết lĩnh vực nào trong doanh

nghiệp cần nhiều tài nguyên hơn, và lĩnh vực nào đang làm việc không hiệu quả cần xem xét thu nhỏ hoặc loại bỏ hoàn toàn

1.1.3 Phân loại các loại phân tích dữ liệu

Phân tích chuẩn đoán - Diagnostic analytics: là phân tích chuyên sâu Đưa

ra các giả thuyết có thể xảy ra Chẳng hạn như thời tiết có ảnh hưởng đến doanh số bán trà sữa hay không?

Phân tích mô tả - Descriptive analytics: dựa trên một khoảng thời gian nhất

định Chẳng hạn như dựa trên số lượng người truy cập trang, doanh thu tháng,

Phân tích dự đoán - Predictive analytics: dự đoán điều sẽ xảy ra trong tương

lai Những ảnh hưởng mà có thể ảnh hưởng đến doanh số, tình hình kinh doanh,…

Phân tích đề xuất - Prescriptive analytics: giúp doanh nghiệp đưa ra kết luận

cho quá trình hoạt động Đề xuất giải pháp tối ưu hơn

1.1.4 Quy trình phân tích dữ liệu

Quy trình phân tích dữ liệu là quá trình phân tích dữ liệu từ khi thu thập đến khi đưa ra kết luận Các bước cơ bản trong quy trình phân tích dữ liệu gồm:

1 Thu thập dữ liệu: Thu thập các dữ liệu liên quan đến vấn đề cần phân tích từ nhiều nguồn khác nhau, bao gồm các nguồn nội bộ và ngoại vi

Trang 13

2 Chuẩn bị dữ liệu: Tiến hành xử lý dữ liệu để đưa chúng về dạng phù hợp cho việc phân tích, bao gồm các bước như loại bỏ các giá trị nhiễu, chuẩn hóa dữ liệu và xử lý các giá trị thiếu

3 Khám phá dữ liệu: Thực hiện khám phá dữ liệu để tìm hiểu các đặc trưng của

dữ liệu, đồng thời phát hiện và loại bỏ các ngoại lệ và giá trị nhiễu

4 Áp dụng phương pháp phân tích dữ liệu: Sử dụng các công cụ và phương pháp phân tích dữ liệu phù hợp để tìm kiếm thông tin và tạo ra các mô hình phân tích

5 Đánh giá và đưa ra kết luận: Đánh giá kết quả phân tích dữ liệu để đưa ra kết luận và giải thích các kết quả

6 Trình bày kết quả: Trình bày kết quả phân tích dữ liệu theo cách trực quan và

dễ hiểu cho người sử dụng, đồng thời cung cấp các giải pháp và khuyến nghị phù hợp để giúp người sử dụng đưa ra quyết định

Quy trình phân tích dữ liệu không phải là một quy trình tuyến tính và có thể

có sự thay đổi tùy thuộc vào từng trường hợp cụ thể Tuy nhiên, việc thực hiện các bước trên sẽ giúp cho quá trình phân tích dữ liệu được thực hiện một cách chính xác

và hiệu quả

1.1.5 Khám phá dữ liệu

Khám phá dữ liệu (EDA) là quá trình khám phá dữ liệu để tìm ra thông tin cần thiết và hiểu rõ hơn về dữ liệu và phân tích dữ liệu một cách rõ ràng hơn Quá trình này giúp người sử dụng có cái nhìn tổng quan về dữ liệu, đồng thời phát hiện các đặc trưng, xu hướng và quan hệ giữa các biến trong dữ liệu

Mục đích của khám phá dữ liệu là giúp người sử dụng hiểu rõ hơn về dữ liệu trước khi tiến hành phân tích và xử lý Khám phá dữ liệu giúp đưa ra các giải pháp cho các vấn đề liên quan đến dữ liệu, đồng thời giúp cho quá trình phân tích và xử

Trang 14

lý dữ liệu được thực hiện chính xác và hiệu quả hơn Quá trình khám phá dữ liệu bao gồm các bước như sau:

1 Xem xét dữ liệu: Kiểm tra dữ liệu để đảm bảo tính toàn vẹn và đầy đủ của dữ liệu

2 Xác định đặc trưng: Xác định các đặc trưng của dữ liệu, bao gồm các giá trị

cụ thể của các biến, tần số xuất hiện và phân bố của các giá trị trong dữ liệu

3 Trực quan hóa dữ liệu: Sử dụng các biểu đồ và đồ thị để hiển thị dữ liệu và giúp người sử dụng dễ dàng hình dung được các đặc trưng của dữ liệu

4 Phân tích mối liên hệ: Tìm kiếm các mối liên hệ giữa các biến trong dữ liệu

để hiểu rõ hơn về sự phụ thuộc và tương quan giữa chúng

1.1.6 Trực quan hóa dữ liệu

a Khái niệm trực quan hóa dữ liệu

Trực quan hóa dữ liệu (Tiếng anh: Data Visualization) là kỹ thuật biểu diễn

dữ liệu bằng đồ họa, có sử dụng các yếu tố trực quan như biểu đồ và đồ thị để phát hiện xu hướng, mẫu hình và các giá trị ngoại lệ, từ đó đúc kết nhanh thông tin chuyên sâu và hỗ trợ trong việc ra quyết định tức thời Trực quan hóa nghiên cứu trình bày một cách trực quan khối dữ liệu trừu tượng để tăng cường nhận thức của con người

b Mục tiêu của trực quan hóa dữ liệu

Trong môi trường kinh doanh, tốc độ đưa ra quyết định là yếu tố then chốt Những câu hỏi và chỉ dấu đã biết sẽ không đòi hỏi quá nhiều thời gian để tìm câu trả lời Tuy nhiên, khi xử lý những tình huống chưa biết, bạn cần có giải pháp phù hợp

để khám phá những dữ liệu có sẵn theo cách ít tốn thời gian hơn Do đó, mọi công

cụ trực quan hóa dữ liệu đều có hai mục tiêu chính, đó là:

Trang 15

Giải thích: Hình ảnh biểu diễn trực quan cung cấp cho người dùng thông tin liên quan để đáp ứng các nhu cầu thông thường hàng ngày (ví dụ: doanh số trong một ngày ở các khu vực)

Khám phá: Cung cấp chế độ xem đa chiều về tập dữ liệu để người dùng khám phá, đặt câu hỏi trong khi suy ngẫm và tìm ra thông tin chuyên sâu (ví dụ: Thành tích của doanh nghiệp được đánh giá qua các thông số khác nhau trong một khoảng thời gian nhất định)

c Quy trình của trực quan hóa dữ liệu

Quá trình tạo trực quan hóa dữ liệu bao gồm 4 bước chính sau:

Xác định yêu cầu: Bước đầu tiên là xác định yêu cầu cần giải quyết Nó có

thể là bất cứ thứ gì có thể rất rộng và sâu về chuyên môn như thể hiện tại sao những báo cáo lỗi trả về không có xu hướng giảm xuống, hoặc là thể hiện khoảng thời gian ước tính phù hợp cho một sản phẩm bất kỳ trong dây chuyền sản xuất

Phân tích dữ liệu: Khi đã có dữ liệu cần phải phân tích để hiểu ý nghĩa của

dữ liệu Do đó, phân tích là bước chủ yếu nhất trong tạo trực quan hóa dữ liệu Chỉ có thông qua phân tích dữ liệu mới hiểu được dữ liệu, từ đó truyền đạt thông tin của dữ liệu

Trực quan hóa dữ liệu: Khi đã phân tích và hiểu dữ liệu (theo phân tích chi

tiết) và hiểu thông tin cần truyền đạt cho người khác Và trực quan hóa dữ liệu

là thực hiện việc truyền đạt thông tin đó

d Trực quan hóa dữ liệu với ngôn R

R là một trong những ngôn ngữ lập trình phổ biến được sử dụng cho phân tích

dữ liệu và trực quan hóa dữ liệu Nó cung cấp cho người dùng nhiều thư viện và gói phần mềm để tạo các biểu đồ và đồ thị đẹp mắt và dễ hiểu.Trong khóa luận sẽ tiến

Trang 16

hành sử dụng thư viện ggplot trong trực quan hóa dữ liệu với R, các bước trực quan hóa dữ liệu với R bao gồm:

1 import dữ liệu: Đầu tiên, import dữ liệu vào R Chúng ta có thể sử dụng các

gói phần mềm như read.csv hoặc read_excel để import dữ liệu

2 Khởi tạo ggplot: Sử dụng hàm ggplot để khởi tạo ggplot Chúng ta sẽ cần

truyền vào dữ liệu và xác định các yếu tố mà chúng ta muốn trực quan hóa trên trục x và y

3 Thêm các lớp (layers): Các lớp là các yếu tố bổ sung trên biểu đồ, chẳng hạn

như các dòng, cột, điểm dữ liệu, vùng màu, v.v Để thêm các lớp, chúng ta có thể sử dụng các hàm như geom_point, geom_line, geom_bar, v.v

4 Tùy chỉnh biểu đồ: Chúng ta có thể tùy chỉnh biểu đồ bằng cách thêm tiêu đề,

chú thích, định dạng trục, màu sắc, v.v

5 Lưu và chia sẻ biểu đồ: Cuối cùng, chúng ta có thể lưu biểu đồ bằng cách sử

dụng các hàm như ggsave hoặc xuất nó dưới dạng các tệp hình ảnh như PNG hoặc PDF để chia sẻ với người khác

1.2 Phân tích hành vi khách hàng và vai trò trong kinh doanh

1.2.1 Phân tích hành vi khách hàng

a Định nghĩa khách hàng

Khách hàng (tiếng anh: Customer) là người sử dụng hoặc tiêu dùng sản phẩm, dịch vụ hoặc hàng hóa mà doanh nghiệp cung cấp Khách hàng là thành phần cốt yếu, thành phần cực kỳ quan trọng trong kinh doanh của tất cả các doanh nghiệp, vì

họ chính là nguồn thu nhập và doanh số bán hàng, dịch vụ của doanh nghiệp

b Định nghĩa hành vi khách hàng

Trang 17

Hành vi khách hàng (tiếng anh: Customer Behavior) hiểu đơn giản là cách mà khách hàng tương tác với sản phẩm hoặc dịch vụ của doanh nghiệp Hành vi khách hàng là tập hợp các hoạt động, quyết định và phản hồi của khách hàng đối với sản phẩm hoặc dịch vụ của một doanh nghiệp Hành vi khách hàng được ảnh hưởng bởi nhiều yếu tố như nhu cầu, sở thích, tài chính, Có thể được phân loại theo nhiều cách khác nhau, bao gồm chuỗi giá trị khách hàng, quá trình quyết định mua sắm, tần suất mua hàng, sự trung thành và phản hồi của khách hàng

c Phân tích hành vi khách hàng

Phân tích hành vi khách hàng là quá trình sử dụng các phương pháp và công

cụ phân tích dữ liệu để hiểu rõ hơn về hành vi và các quyết định mua sắm của khách hàng Phân tích hành vi khách hàng bao gồm việc thu thập, phân tích và đánh giá các thông tin về hành vi của khách hàng, từ đó giúp các doanh nghiệp hiểu rõ hơn

về nhu cầu và sở thích của khách hàng và đưa ra các chiến lược kinh doanh phù hợp

1.2.2 Vai trò của phân tích hành vi khách hàng trong kinh doanh

Phân tích hành vi khách hàng đóng vai trò vô cùng quan trọng trong kinh doanh của các doanh nghiệp, bởi khi phân tích hành vi khách hàng sẽ giúp các doanh nghiệp hiểu rõ hơn về khách hàng của mình, từ đó đưa ra các quyết định kinh doanh phù hợp và tối ưu hóa trải nghiệm khách hàng Các vai trò của phân tích hành vi khách hàng trong kinh doanh bao gồm:

a Điều chỉnh chiến lược kinh doanh

Phân tích hành vi khách hàng giúp các doanh nghiệp hiểu rõ hơn về sở thích

và nhu cầu của khách hàng, từ đó điều chỉnh chiến lược kinh doanh để đáp ứng được nhu cầu và tạo ra giá trị cho khách hàng Việc điều chỉnh chiến lược kinh doanh bởi

nó giúp các doanh nghiệp hiểu rõ hơn về nhu cầu và sở thích của khách hàng, từ đó đưa ra các quyết định kinh doanh phù hợp và tối ưu hóa trải nghiệm khách hàng

Trang 18

Phân tích hành vi mua sắm và phân tích phản hồi của khách hàng giúp các doanh nghiệp hiểu rõ hơn về các yếu tố ảnh hưởng đến hành vi mua sắm của khách hàng

Từ đó doanh nghiệp có thể hiểu rõ hơn về các khía cạnh sau:

các doanh nghiệp hiểu rõ hơn về điểm mạnh và điểm yếu của sản phẩm, từ đó điều chỉnh chiến lược kinh doanh để tối ưu hóa sản phẩm và giảm thiểu các điểm yếu

Chiến lược giá cả: Các doanh nghiệp có thể áp dụng chiến lược giá cả phù

hợp với sở thích và nhu cầu của khách hàng thông qua phân tích hành vi khách hàng

Kênh tiếp thị và phân phối sản phẩm: Phân tích hành vi khách hàng giúp các

doanh nghiệp hiểu rõ hơn về kênh tiếp thị và phân phối sản phẩm phù hợp với khách hàng, từ đó điều chỉnh chiến lược kinh doanh và tăng cường tương tác với khách hàng

b Tăng cường tương tác với khách hàng

Phân tích hành vi khách hàng giúp các doanh nghiệp hiểu rõ hơn về quá trình quyết định mua sắm và sự trung thành của khách hàng Từ đó, các doanh nghiệp có thể tăng cường tương tác với khách hàng, tạo ra trải nghiệm tích cực và giữ chân khách hàng lâu dài Phân tích hành vi mua sắm và phân tích đối tượng khách hàng giúp các doanh nghiệp hiểu rõ hơn về các yếu tố ảnh hưởng đến sự hài lòng và tương tác của khách hàng

Phản hồi của khách hàng: Phân tích phản hồi của khách hàng giúp các doanh

nghiệp hiểu rõ hơn về sự hài lòng của khách hàng, từ đó đưa ra các chiến lược tương tác và giải quyết các thắc mắc của khách hàng

Trang 19

Kênh tương tác: Phân tích hành vi khách hàng giúp các doanh nghiệp hiểu rõ

hơn về các kênh tương tác mà khách hàng thường sử dụng và ưa chuộng, từ

đó tăng cường tương tác với khách hàng trên các kênh tương tác này

c Tăng doanh số bán hàng

Phân tích hành vi khách hàng giúp các doanh nghiệp tìm hiểu rõ hơn về nhu cầu của khách hàng và đưa ra các chiến lược tiếp thị và bán hàng phù hợp, từ đó tăng doanh số bán hàng Phân tích hành vi khách hàng đóng vai trò quan trọng trong việc tăng doanh số bán hàng bởi nó giúp các doanh nghiệp hiểu rõ hơn về nhu cầu và sở thích của khách hàng, từ đó đưa ra các chiến lược tiếp thị và bán hàng phù hợp Từ

đó các doanh nghiệp có thể tìm hiểu rõ hơn về:

Sở thích và nhu cầu của khách hàng: Các doanh nghiệp có thể nắm bắt được

sở thích và nhu cầu của khách hàng thông qua phân tích hành vi khách hàng,

từ đó đưa ra các sản phẩm và dịch vụ phù hợp với khách hàng

Chiến lược giá cả: Các doanh nghiệp có thể áp dụng chiến lược giá cả phù

hợp với sở thích và nhu cầu của khách hàng thông qua phân tích hành vi khách hàng

Kênh tiếp thị và phân phối sản phẩm: Phân tích hành vi khách hàng giúp các

doanh nghiệp hiểu rõ hơn về kênh tiếp thị và phân phối sản phẩm phù hợp với khách hàng, từ đó tối ưu hóa quy trình bán hàng và tăng doanh số bán hàng

d Nâng cao chất lượng dịch vụ

Phân tích hành vi khách hàng giúp các doanh nghiệp hiểu rõ hơn về sở thích

và nhu cầu của khách hàng, từ đó nâng cao chất lượng dịch vụ và đáp ứng tốt nhu cầu của khách hàng Phân tích phản hồi của khách hàng và phân tích hành vi mua sắm giúp các doanh nghiệp hiểu rõ hơn về các yếu tố ảnh hưởng đến sự hài lòng của khách hàng

Trang 20

Sự trung thành của khách hàng: Các doanh nghiệp có thể phân tích sự trung

thành của khách hàng để nâng cao chất lượng dịch vụ và tạo trải nghiệm tích cực cho khách hàng

Phản hồi của khách hàng: Phân tích phản hồi của khách hàng giúp các doanh

nghiệp hiểu rõ hơn về những điểm mạnh và điểm yếu của dịch vụ, từ đó nâng cao chất lượng dịch vụ và đáp ứng được nhu cầu của khách hàng

e Giữ chân khách hàng

Phân tích hành vi khách hàng đóng vai trò quan trọng trong việc giữ chân khách hàng bởi nó giúp các doanh nghiệp hiểu rõ hơn về sự trung thành và nhu cầu của khách hàng, từ đó đưa ra các chiến lược tương tác với khách hàng và tạo trải nghiệm tích cực cho khách hàng

Các phương pháp phân tích hành vi khách hàng như phân tích sự trung thành, phân tích phản hồi của khách hàng, phân tích hành vi mua sắm và phân tích đối tượng khách hàng giúp các doanh nghiệp hiểu rõ hơn về các yếu tố ảnh hưởng đến

sự trung thành của khách hàng Thông qua phân tích hành vi khách hàng, các doanh nghiệp có thể tìm hiểu rõ hơn về:

Sự trung thành của khách hàng: Các doanh nghiệp có thể phân tích sự trung

thành của khách hàng để đưa ra các chính sách khuyến mãi và tương tác với khách hàng, từ đó giữ chân khách hàng lâu dài

Phản hồi của khách hàng: Phân tích phản hồi của khách hàng giúp các doanh

nghiệp hiểu rõ hơn về nhu cầu và sở thích của khách hàng, từ đó tạo ra trải nghiệm tích cực và tăng cường sự trung thành của khách hàng

Hành vi mua sắm của khách hàng: Các doanh nghiệp có thể phân tích hành

vi mua sắm của khách hàng để đưa ra các sản phẩm và dịch vụ phù hợp với khách hàng, từ đó giữ chân khách hàng lâu dài

Trang 21

Điểm mạnh và điểm yếu của sản phẩm: Phân tích hành vi khách hàng giúp

các doanh nghiệp hiểu rõ hơn về điểm mạnh và điểm yếu của sản phẩm, từ đó tối ưu hóa sản phẩm và tăng sự trung thành của khách hàng

1.3 Các phương pháp phân tích hành vi khách hàng

1.3.1 Phân tích đối tượng khách hàng

Phân tích đối tượng khách hàng (tiếng anh: Customer Segmentation Analysis)

là một phương pháp phân tích hành vi khách hàng giúp tách khách hàng thành các nhóm có tính chất tương đồng về nhu cầu, sở thích, hành vi mua sắm và đặc điểm khác nhau Phương pháp này được sử dụng để hiểu rõ hơn về khách hàng và đưa ra các chiến lược kinh doanh phù hợp với từng nhóm khách hàng Quy trình phân tích đối tượng khách hàng bao gồm:

1 Phân tích dữ liệu: Dữ liệu thu thập được phải được phân tích và chia nhóm

dựa trên các đặc điểm tương đồng của khách hàng Các công cụ phân tích dữ

liệu như Phân tích cụm, Phân tích nhân tố hoặc Phân tích hồi quy có thể được

sử dụng để giúp tìm ra những đặc điểm khách hàng chung

2 Xác định các nhóm khách hàng: Sau khi phân tích dữ liệu, các nhóm khách

hàng sẽ được xác định dựa trên các đặc điểm tương đồng của họ Các doanh nghiệp sẽ phân loại khách hàng vào từng nhóm có tính chất tương đồng

3 Đưa ra chiến lược phù hợp: Sau khi tách các nhóm khách hàng, các doanh

nghiệp có thể đưa ra chiến lược phù hợp với từng nhóm, tối ưu hóa trải nghiệm khách hàng và tăng cường tương tác với khách hàng

1.3.2 Phân tích chuỗi giá trị khách hàng

Phân tích chuỗi giá trị khách hàng (tiếng anh: Customer Value Chain Analysis) là một phương pháp phân tích hành vi khách hàng giúp các doanh nghiệp hiểu rõ hơn về cách thức khách hàng tạo ra giá trị cho doanh nghiệp Phân tích này

Trang 22

tập trung vào quá trình mua sắm và tiêu dùng sản phẩm/dịch vụ, đồng thời phân tích các quan hệ giữa khách hàng và doanh nghiệp trong quá trình tạo ra giá trị Quy trình phân tích chuỗi giá trị khách hàng bao gồm:

1 Xác định các bước trong chuỗi giá trị: Các doanh nghiệp cần xác định các

bước trong quá trình mua sắm và tiêu dùng sản phẩm/dịch vụ của khách hàng Các bước này có thể bao gồm tìm hiểu sản phẩm/dịch vụ, tìm kiếm thông tin, đặt hàng, thanh toán, sử dụng sản phẩm/dịch vụ và đánh giá sản phẩm/dịch

vụ

2 Xác định giá trị của từng bước trong chuỗi giá trị: Các doanh nghiệp cần

xác định giá trị của từng bước trong chuỗi giá trị để hiểu rõ hơn về cách khách hàng tạo ra giá trị cho doanh nghiệp Giá trị này có thể bao gồm sự hiểu biết

về sản phẩm/dịch vụ, sự hài lòng về chất lượng sản phẩm/dịch vụ và dịch vụ hậu mãi

3 Xác định các yếu tố ảnh hưởng đến giá trị: Các doanh nghiệp cần xác định

các yếu tố ảnh hưởng đến giá trị của từng bước trong chuỗi giá trị Các yếu tố này có thể bao gồm chất lượng sản phẩm/dịch vụ, giá cả, thương hiệu, dịch

vụ hậu mãi và độ tin cậy

4 Đưa ra chiến lược phù hợp: Sau khi phân tích chuỗi giá trị khách hàng, các

doanh nghiệp có thể đưa ra các chiến lược phù hợp để tối ưu hóa giá trị của từng bước trong chuỗi giá trị Các chiến lược này có thể bao gồm tăng cường chất lượng sản phẩm/dịch vụ, giảm giá cả, nâng cao dịch vụ hậu mãi và tạo thương hiệu mạnh mẽ

1.3.3 Phân tích phản hồi của khách hàng

Phân tích phản hồi của khách hàng (tiếng anh: Customer Feedback Analysis)

là một phương pháp phân tích hành vi khách hàng giúp các doanh nghiệp hiểu rõ hơn về ý kiến, đánh giá, phản hồi của khách hàng đối với sản phẩm/dịch vụ của

Trang 23

mình Phân tích phản hồi của khách hàng giúp các doanh nghiệp nhanh chóng phát hiện các vấn đề và cải thiện sản phẩm/dịch vụ của mình Quy trình phân tích phản hồi của khách hàng bao gồm:

1 Phân tích dữ liệu: Các doanh nghiệp cần phân tích dữ liệu thu thập được để

hiểu rõ hơn về ý kiến, đánh giá, phản hồi của khách hàng Các công cụ phân tích dữ liệu như sentiment analysis, text mining và topic modeling có thể được

sử dụng để phân tích dữ liệu phản hồi của khách hàng

2 Đưa ra các giải pháp: Dựa trên các kết quả phân tích, các doanh nghiệp có

thể đưa ra các giải pháp để cải thiện sản phẩm/dịch vụ của mình và nâng cao trải nghiệm của khách hàng Các giải pháp này có thể bao gồm cải thiện chất lượng sản phẩm/dịch vụ, cải thiện dịch vụ hậu mãi, tăng cường tiếp thị và quảng bá thương hiệu

1.4 Phương pháp dự đoán khách hàng sử dụng dịch vụ tương lai

Phương pháp dự đoán khách hàng sử dụng dịch vụ tương lai là một phần quan trọng trong phân tích hành vi khách hàng, bằng cách sử dụng các mô hình phân loại trong học máy để xác định trước các khách hàng sẽ hoặc không sử dụng dịch vụ, sản phẩm của doanh nghiệp Điều này có thể giúp cho các doanh nghiệp đưa ra các chính sách kịp thời để giữ chân được khách hàng

1.4.1 Mô hình hồi quy Logistics

Hồi quy logistic là một kỹ thuật quan trọng trong lĩnh vực trí tuệ nhân tạo và máy học (ML), mô hình là kỹ thuật phân tích dữ liệu sử dụng toán học để tìm ra mối quan hệ giữa hai yếu tố dữ liệu Sau đó, kỹ thuật này sử dụng mối quan hệ đã tìm được để dự đoán giá trị của những yếu tố đó dựa trên yếu tố còn lại Dự đoán thường cho ra một số kết quả hữu hạn, như có hoặc không Mô hình hồi quy logistics hoạt động bằng cách tính toán giá trị xác suất của biến phụ thuộc, dựa trên các giá trị của

Trang 24

biến độc lập Giá trị xác suất này được chuyển đổi thành các giá trị dự đoán, thông thường là 0 hoặc 1, bằng cách áp dụng một ngưỡng xác định trước đó

Hình 1.1: Ví dụ về Phân loại với mô hình hồi quy logistics

Nguồn: Tác giả biên tập từ [1]

Mô hình hồi qui Logistic là sự tiếp nối ý tưởng của hồi qui tuyến tính vào các bài toán phân loại Từ đầu ra của hàm tuyến tính chúng ta đưa vào hàm Sigmoid để tìm ra phân phối xác suất của dữ liệu

Lưu ý rằng hàm Sigmoid chỉ được sử dụng trong bài toán phân loại nhị phân Đối với bài toán phân loại nhiều hơn hai nhãn, hàm Softmax (sẽ được tìm hiểu ở những chương sau) là một dạng hàm tổng quát của Sigmoid sẽ được sử dụng Hàm Sigmoid thực chất là một hàm biến đổi phi tuyến dựa trên công thức:

𝜎(𝑥) = 1

1 + 𝑒−𝑥

Trang 25

Hình 1.2: Hàm Sigmoid

Nguồn: Tác giả biên tập từ [2]

Hàm Sigmoid có hình dạng là một đường cong chữ S và đơn điệu tăng Chính

vì thế nên nó còn có tên một tên gọi khác là hàm chữ S Một vài tài liệu còn gọi nó

là hàm Logistic đại diện cho hồi qui Logistic Ngoài ra ta dễ dàng chứng minh giá trị của hàm Sigmoid nằm trong khoảng [0,1], với giới hạn tới ∞ và −∞ của hàm Sigmoid lần lượt là:

Trang 26

Phương pháp đánh giá trong bài toán phân loại dựa trên ma trận nhầm lẫn Confusion Matrix bằng chỉ số đánh giá độ chính xác accuracy, và ma trận nhầm lẫn

 TP (True Positive) là tổng số trường hợp dự báo khớp mẫu đúng,

 TN (True Negative) là tổng số trường hợp dự báo khớp với mẫu sai

 FP (False Positive) là tổng số trường hợp dự báo các quan sát thuộc mẫu đúng tính thành sai và

 FN (False Negative) là tổng số trường hợp dự báo các quan sát thuộc mẫu sai tính thành đúng

Với accuracy là độ chính xác của mô hình, nó là tỷ lệ giữa số lượng mẫu được phân loại chính xác trên cho tổng số mẫu của tập dữ liệu thử nghiệm Accuracy được xác định như sau:

Trang 27

sử dụng sản phẩm, dịch vụ của công ty Phân nhóm khách hàng giúp các doanh nghiệp hiểu rõ hơn về khách hàng của mình, từ đó đưa ra các chiến lược phù hợp để tối ưu hóa kinh doanh và tăng cường tương tác với khách hàng

Hình 1.3 Ví dụ phân cụm dữ liệu

Nguồn: Tác giả biên tập từ [3]

1.5.1 Mô hình phân khúc khác hàng Kmeans

K-Means là thuật toán rất quan trọng và được sử dụng phổ biến trong kỹ thuật phân cụm trong máy học Tư tưởng chính của thuật toán K-Means là tìm cách phân nhóm các đối tượng (objects) đã cho vào K cụm (K là số các cụm được xác đinh trước, K nguyên dương) sao cho tổng bình phương khoảng cách giữa các đối tượng đến tâm nhóm (centroid ) là nhỏ nhất Thuật toán Kmeans được thực hiện với các bước chính sau:

1 Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster) Mỗi cụm được đại diện bằng các tâm của cụm

2 Tính khoảng cách giữa các đối tượng (objects) đến K tâm (thường dùng khoảng cách Euclidean)

Trang 28

3 Nhóm các đối tượng vào nhóm gần nhất

4 Xác định lại tâm mới cho các nhóm

5 Thực hiện lại bước 2 cho đến khi không có sự thay đổi nhóm nào của các đối tượng

Hình 1.4 Quy trình phân cụm Kmeans

Nguồn: https://goeco.link/UtRfa 1.5.2 Phương pháp chọn K tối ưu với phương pháp Eblow

Việc chọn số lượng K tối ưu là quan trọng để giúp đạt được hiệu quả cao nhất cho việc phân khúc dữ liệu, phương pháp được sử dụng phổ biến nhất là phương pháp Eblow Phương pháp Elbow là một cách giúp ta lựa chọn được số lượng các cụm phù hợp dựa vào đồ thị trực quan hoá bằng cách nhìn vào sự suy giảm của hàm biến dạng và lựa chọn ra điểm khuỷ tay (elbow point) Từ điểm biến dạng đó có thể

dễ dàng xác định được điểm K tối ưu

Trang 29

Hình 1.5 Ví dụ phương pháp Eblow

Nguồn: http://bis.net.vn/forums/t/1831.aspx

1.6 Giới thiệu ngôn ngữ R và thư viện sử dụng

1.6.1 Giới thiệu ngôn ngữ R

R là một ngôn ngữ lập trình và môi trường tính toán thống kê mã nguồn mở

Nó được phát triển bởi Ross Ihaka và Robert Gentleman tại Đại học Auckland, New Zealand vào năm 1993 và được phát hành dưới giấy phép GNU GPL R cung cấp cho người dùng một bộ công cụ mạnh mẽ để thực hiện phân tích dữ liệu, tính toán thống kê và tạo đồ thị

Ngôn ngữ R là một trong những công cụ phân tích thống kê học cũng như phân tích dữ liệu nói chung Trong 10 năm trở lại đây, R đã được nhiều trường đại

Trang 30

học trên thế giới sử dụng rộng rãi Đây là phần mềm mã nguồn mở (miễn phí) Nó mang đầy đủ những tính năng của các phần mềm thương mại khác hiện có như SPSS, AMOS, STATA hay Eviews

Hình 1.6 Logo ngôn ngữ R

Nguồn: https://vi.wikipedia.org/wiki/R_(ngôn_ngữ_lập_trình) 1.6.2 Tính năng của ngôn ngữ R

Ngôn ngữ R có chứa nhiều loại kỹ thuật thống kê (mô hình hóa tuyến tính và phi tuyến, kiểm thử thống kê cổ điển, phân tích chuỗi thời gian, phân loại, phân nhóm, v.v.) và đồ họa R, giống như S, được thiết kế xoay quanh một ngôn ngữ máy thực thụ, và nó cho phép người dùng thêm các tính năng bổ sung bằng cách định nghĩa các hàm mới

Cũng có một số khác biệt quan trọng đối với S, nhưng nhiều mã viết bằng S vẫn chạy được mà không cần thay đổi Nhiều hệ thống trong R được viết bằng chính ngôn ngữ của nó, giúp cho người dùng dễ theo dõi các giải thuật Để thực hiện công việc chuyên về tính toán, R có thể liên kết được với ngôn ngữ C, C++ và Fortran để

có thể được gọi trong khi chạy Người dùng thông thạo có thể viết mã C để xử lý

Trang 31

trực tiếp các đối tượng của ngôn ngữ R, cũng có tính mở rộng cao bằng cách sử dụng các gói cho người dùng đưa lên cho một số chức năng và lĩnh vực nghiên cứu cụ thể Một số tính năng chính của ngôn ngữ R như sau:

Thực hiện tính toán và phân tích thống kê: R cung cấp một bộ công cụ để

thực hiện các phép tính toán và phân tích thống kê, bao gồm tính trung bình, phương sai, phân phối, đồ thị hóa dữ liệu và kiểm định thống kê

Hỗ trợ nhiều loại dữ liệu: R có thể xử lý nhiều loại dữ liệu, bao gồm dữ liệu

văn bản, số liệu và hình ảnh

Hỗ trợ lập trình: R cũng là một ngôn ngữ lập trình, cho phép người dùng tạo

ra các chức năng mới và mở rộng tính năng của R

Có rất nhiều gói phần mềm: R có một cộng đồng lớn và phong phú của các

nhà phát triển, nghiên cứu viên và chuyên gia thống kê, do đó có rất nhiều gói phần mềm được phát triển để giúp người dùng xử lý dữ liệu và thực hiện các phân tích thống kê phức tạp

Hỗ trợ đồ họa: R có các tính năng đồ họa để hiển thị dữ liệu và kết quả phân

tích dưới dạng biểu đồ, đồ thị, bản đồ, …

Hỗ trợ các công cụ tích hợp khác: R hỗ trợ các công cụ tích hợp khác như

Python, SQL, LaTex, … để tăng tính linh hoạt và hiệu quả trong công việc

1.6.3 Cài đặt và sử dụng R

R có thể được tải xuống miễn phí tại trang chủ của nó (project.org/) Sau khi tải xuống và cài đặt, người dùng có thể sử dụng R bằng cách nhập các lệnh trong giao diện dòng lệnh hoặc sử dụng các công cụ đồ họa của R như RStudio hoặc Jupyter Notebook

https://www.r-1.6.4 Thư viện R sử dụng

a Thư viện dplyr

Trang 32

Thư viện dplyr là một trong những thư viện phổ biến nhất của ngôn ngữ lập trình R, được sử dụng để thực hiện các thao tác xử lý dữ liệu dạng bảng (data frame) một cách nhanh chóng và hiệu quả

Thư viện dplyr cung cấp một tập hợp các hàm cơ bản giúp thực hiện các thao tác dữ liệu phổ biến như chọn cột dữ liệu, lọc dữ liệu, thêm cột dữ liệu, xóa cột dữ liệu, tổng hợp dữ liệu và sắp xếp dữ liệu theo các tiêu chí khác nhau Các hàm trong thư viện dplyr được thiết kế để hoạt động nhanh chóng và hiệu quả trên các bảng dữ liệu lớn Vì vậy, thư viện dplyr thường được sử dụng trong các bài toán phân tích dữ liệu và xử lý dữ liệu trong R

b Thư viện ggplot2

Thư viện ggplot2 là một trong những thư viện phổ biến nhất trong R, được sử dụng để tạo ra các biểu đồ đẹp và chuyên nghiệp từ các bộ dữ liệu Thư viện ggplot2

có cách tiếp cận khác với các thư viện biểu đồ khác trong R bằng cách sử dụng cú pháp dựa trên lý thuyết đồ thị, cho phép người dùng dễ dàng xác định các yếu tố cấu thành biểu đồ như trục, tiêu đề, phông chữ, màu sắc,…

Thư viện ggplot2 cung cấp nhiều hàm và lớp đối tượng để tạo ra các loại biểu

đồ khác nhau như biểu đồ đường, biểu đồ cột, biểu đồ scatter, biểu đồ hộp… Thư viện ggplot2 là công cụ không thể thiếu cho các nhà phân tích dữ liệu và trình bày kết quả phân tích của họ với R

c Thư viện readxl

Thư viện readxl là một thư viện R dùng để đọc các file Excel (.xls và xlsx) vào trong môi trường R để phân tích dữ liệu Thư viện này cho phép người dùng đọc các file Excel có cấu trúc phức tạp và kích thước lớn một cách dễ dàng và nhanh chóng

Trang 33

Với thư viện readxl, người dùng có thể đọc dữ liệu từ các file Excel và chuyển đổi chúng thành các đối tượng R, chẳng hạn như các data frame Nó hỗ trợ việc đọc các sheet cụ thể, các dòng cụ thể, định dạng dữ liệu, và nhiều hơn nữa

Readxl là một thư viện mã nguồn mở, được phát triển và duy trì bởi Hadley Wickham và nhóm phát triển của ông tại RStudio

d Thư viện tibble

Thư viện tibble là một thư viện trong ngôn ngữ lập trình R, được phát triển bởi Hadley Wickham Thư viện này cung cấp một loại đối tượng dữ liệu mới gọi là

"tibble", được thiết kế để cải thiện tính linh hoạt và hiệu suất của việc làm việc với

dữ liệu trong R Tibble tương tự như data.frame, tuy nhiên, nó cung cấp một số cải tiến để giải quyết các vấn đề liên quan đến data.frame, chẳng hạn như cung cấp thông báo lỗi rõ ràng hơn, tự động ép kiểu dữ liệu và hỗ trợ cho các tập dữ liệu lớn

 Một số tính năng nổi bật của thư viện tibble:

 Tự động ép kiểu dữ liệu: Khi tạo tibble, thư viện tibble tự động ép kiểu dữ liệu của các cột để tránh lỗi ép kiểu dữ liệu không đúng

 Thông báo lỗi rõ ràng hơn: Nếu tibble bị lỗi, nó sẽ cung cấp các thông báo lỗi

rõ ràng hơn để giúp người dùng dễ dàng sửa chữa

 Hỗ trợ cho các tập dữ liệu lớn: Tibble được thiết kế để tối ưu hiệu suất khi làm việc với các tập dữ liệu lớn, giúp người dùng tiết kiệm thời gian và tăng tốc độ tính toán

Để sử dụng thư viện tibble trong R, bạn có thể cài đặt nó thông qua lệnh install.packages("tibble") Sau đó, bạn có thể tạo một tibble bằng cách sử dụng hàm tibble() và thực hiện các thao tác với dữ liệu như bình thườ

Trang 34

KẾT LUẬN CHƯƠNG 1

Trong chương 1 cung cấp cho chúng ta một cái nhìn tổng quan về phân tích hành vi khách hàng và các phương pháp để dự đoán hành vi sử dụng dịch vụ tương lai Qua đó, chúng ta đã thấy được tầm quan trọng của việc phân tích và hiểu được hành vi khách hàng để từ đó tối ưu hóa trải nghiệm của họ và cải thiện doanh số Chương 1 cũng đã giới thiệu các phương pháp phân nhóm khách hàng nhằm tìm ra các đặc tính chung của nhóm khách hàng để giúp tăng cường khả năng dự đoán và đưa ra các chiến lược kinh doanh phù hợp Ngoài ra, chương cũng giới thiệu ngôn ngữ lập trình R và các thư viện phổ biến để phân tích dữ liệu và xây dựng các mô hình dự đoán

Ngày đăng: 16/06/2023, 09:40

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w