SỰ TRỖI DẬY CỦA BIG DATA TRONG NGHIÊN CỨU MARKETING đề tài SỰ TRỖI DẬY CỦA BIG DATA TRONG NGHIÊN CỨU MARKETING tiểu luận SỰ TRỖI DẬY CỦA BIG DATA TRONG NGHIÊN CỨU MARKETING
Trang 1ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT KHOA QUẢN TRỊ KINH DOANH
NGHIÊN CỨU MARKETING
Đề tài: SỰ TRỖI DẬY CỦA BIG DATA TRONG NGHIÊN CỨU
MARKETING GVHD: ThS VÕ THỊ NGỌC TRINH
Thành phố Hồ Chí Minh, tháng 11 năm 2021
Trang 2skkn Tiểu Luận PRO(123docz.net)
MỤC LỤC
2.2 Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big
2.3 Mô hình trích xuất thông tin từ Big Data cho nghiên cứu marketing 9
2.4.3 Phương pháp phân loại (Classification analysis) 14
CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN CỨU
Trang 3skkn Tiểu Luận PRO(123docz.net)
Trang 4skkn Tiểu Luận PRO(123docz.net)
DANH MỤC BẢNG
Bảng 1.1 So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc 4 Bảng 2.1 So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử dụng
Bảng 3.1 Tóm tắt các ứng dụng Big Data trong nghiên cứu Marketing của Amazon 21
DANH MỤC HÌNH
Hình 2.1 Process for Extracting Insights From Big Data 10
Trang 5skkn Tiểu Luận PRO(123docz.net)
DANH SÁCH THÀNH VIÊN
STT
hoàn thành
2 Dương Thị Hoàng
Hạ (Nhómtrưởng)
K194070898 Nội dung + Thuyết trình 100%
3 Nguyễn Thị Hồng Huệ K194070904 Nội dung + Thuyết trình 100%
Trang 6LỜI MỞ ĐẦU
Cuộc Cách mạng công nghiệp lần thứ tư đã đi qua được một thập kỷ, tuy còn nhữngbất cập mà chúng ta chưa giải quyết được nhưng tầm quan trọng và lợi ích mà nó manglại là điều không thể chối cãi Mặc dù không phải là một khái niệm mới nhưng đến giaiđoạn này, thế giới mới thực sự chứng kiến sự bùng nổ của kỷ nguyên Big data Big Datathể hiện vai trò của mình trong mọi lĩnh vực từ y tế, viễn thông, sản xuất, hàng không, tàichính, ngân hàng, điện tử, giải trí, Có thể thấy, dữ liệu là vũ khí hết sức quan trọng, ainắm được thông tin, người đó sẽ vượt lên dẫn đầu và bỏ xa những đối thủ còn lại
Thật vậy, trong thế giới phẳng như hiện nay, việc nắm bắt tâm lý và hành vi củakhách hàng cũng ngày càng khó khăn hơn Doanh nghiệp muốn bắt kịp xu hướng chung
và phát triển bền vững cần tập trung vào chuyển đổi số, đầu tư vào công nghệ, đặc biệt làtrong lĩnh vực Marketing Nhằm thấu hiểu khách hàng, tạo ra trải nghiệm mua hàng tốtnhất Kết hợp với Big Data, doanh nghiệp sẽ nắm được nhiều thông tin hơn, thấu hiểukhách hàng hơn, từ đó gia tăng trải nghiệm khách hàng và giúp doanh nghiệp nắm đượclợi thế cạnh tranh so với các đối thủ Đó cũng chính là lý do nhóm chúng em chọn đề tài
“Sự bùng nổ của Big data trong Nghiên cứu Marketing” để tiến hành tìm hiểu và nghiêncứu
Chúng em xin cảm ơn Cô Võ Thị Ngọc Trinh đã cho nhóm những kiến thức bổ íchcũng như cơ hội để tiến hành đề tài này
Với thời gian và năng lực còn hạn chế sẽ không thể tránh những sai sót Chúng emrất mong cô thông cảm và được nhận những nhận xét, góp ý từ cô
Một lần nữa chúng em chân thành cảm ơn
Trang 7CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA1.1 Khái niệm
Big Data được xem là xu hướng công nghệ xuất hiện trong thời đại Cách mạngcông nghiệp 4.0 và hứa hẹn là lời giải cho rất nhiều bài toán kinh doanh hóc búa khôngchỉ đối với các doanh nghiệp trên thế giới mà còn cả với các doanh nghiệp Việt Namtrong bối cảnh hội nhập sâu và rộng vào nền kinh tế quốc tế Các tổ chức hàng đầu đangchuyển đổi tư duy của họ về dữ liệu, từ việc coi dữ liệu như một chi phí hoạt động cầnđược giảm thiểu sang nuôi dưỡng dữ liệu như một tài sản chiến lược cần được mua lại,làm sạch, được chuyển đổi, làm giàu và phân tích để mang lại thông tin chi tiết hữu ích
Vậy, Dữ liệu lớn (Big data) là một thuật ngữ về việc xử lý một tập dữ liệu rất lớn và phức tạp khác với cách truyền thống Dữ liệu này bao gồm các hoạt động khác nhau như: thu thập, tìm kiếm, giám sát, dự báo, phân tích hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác nhằm trích xuất những giá trị từ
dữ liệu mà ít khi đề cập đến kích thước dữ liệu này Cụ thể, nó có thể truy vấn những
tập tin phi cấu trúc (unstructured files) như video kỹ thuật số, hình ảnh, dữ liệu cảm biến,tập tin lưu nhật ký, thực sự bất cứ dữ liệu nào không có trong hồ sơ với các phạm vi tìmkiếm khác
Năm 2014, Gartner đưa ra một khái niệm mới về Big Data với mô hình “5Vs”tương ứng với năm tính chất quan trọng, như sau:
Volume: là sự tăng trưởng về mặt khối lượng Dữ liệu trong các hệ thống thông tin
luôn luôn và không ngừng tăng lên về mặt kích thước (khối lượng) Chúng ta có thể tìmthấy dữ liệu trong các định dạng video, music, image lớn trên các kênh truyền thông xãhội Khối lượng dữ liệu của một hệ thống thông tin có thể lên đến hàng Terabyte vàPetabyte Theo tài liệu của Intel hồi tháng 9/2013, cứ mỗi 11 giây, 1 PB1 dữ liệu được tạo
ra trên toàn thế giới, tương đương với một đoạn video HD dài 13 năm Facebook phải xử
lý khoảng 500 TB2 dữ liệu mỗi ngày
Velocity: là sự tăng trưởng về mặt tốc độ xử lý Bên cạnh sự tăng trưởng về khối
lượng, tốc độ tăng trưởng của dữ liệu cũng tăng lên một cách chóng mặt Các ứng dụngđược sử dụng phổ biến trên các lĩnh vực Internet, tài chính, ngân hàng, hàng không, quân
sự, y tế - sức khỏe ngày nay phần lớn đều được xử lý trong thời gian thực thông qua hệ
Trang 8thống Big Data Đơn cử, trên các mạng xã hội, đôi khi các thông báo cách đó vài giây(tweet, status….) đã là cũ và không được người dùng quan tâm Người dùng thường loại
bỏ các tin nhắn cũ và chỉ chú ý đến các cập nhật gần nhất Sự chuyển động của dữ liệugiờ đây hầu như là tức thời (real time), và tốc độ cập nhật thông tin đã giảm xuống đơn vịhàng mili giây
Variety: là sự tăng lên về tính đa dạng của dữ liệu Dữ liệu không chỉ ở dạng có
cấu trúc, mà còn bao gồm rất nhiều kiểu dữ liệu phi cấu trúc nữa (như video, hình ảnh, dữliệu cảm biến, giọng nói, blog, ) Big Data cho phép chúng ta phân tích và liên kết đadạng các chủng loại dữ liệu với nhau ví dụ như các bình luận, bài đăng của một nhómngười dùng nào đó trên Facebook với thông tin các video đã được chia sẻ từ các kênh xãhội khác nhau như YouTube, Twitter
Veracity: là tính xác thực của dữ liệu Với xu hướng “Social” ngày nay và sự gia
tăng mạnh mẽ tính tương tác và chia sẻ của người dùng di động đã làm cho khả năng xácđịnh về độ tin cậy và tính chính xác của dữ liệu ngày một khó khăn hơn Bài toán phântích và loại bỏ dữ liệu thiếu chính xác và gây nhiễu đang là một trong những tính chấtquan trọng của Big data
Value: Giá trị thông tin mang tính chất quan trọng nhất của xu hướng công nghệ
Big Data Thật vậy, doanh nghiệp phải hoạch định được những giá trị thông tin hữu íchcủa Big Data một cách phù hợp nhằm giải quyết cho những vấn đề, bài toán mà doanhnghiệp đang gặp phải hoặc mô hình hoạt động kinh doanh của mình Có thể nói việc đầutiên các doanh nghiệp cần làm trước khi bắt tay vào thực hiện Big Data là phải làm saoxác định được tính chất “Value” của nó
Dữ liệu có cấu trúc là những thông tin được thể hiện trong các cột và hàng có tiêu
đề, có thể dễ dàng đặt hàng và xử lý bằng các công cụ tìm kiếm dữ liệu Chúng ta có thể
Trang 9xem chúng như một tủ hồ sơ được tổ chức hoàn hảo, các dữ liệu được xác định, dán nhãn
và dễ dàng truy cập
Dữ liệu phi cấu trúc là những thông tin không được tổ chức thông qua các mô hình
hoặc lược đồ dữ liệu được xác định trước
Bảng 1.1 So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc
Dữ liệu có cấu trúc Dữ liệu phi cấu trúc
- SĐT, Số thẻ tín dụng
- Tên khách hàng, địa chỉ
- Tên sản phẩm, số lượng
- Các thông tin giao dịch
- Các file văn bản (text), file PDF
- Báo cáo
- Tin nhắn, Email
- File Audio, Video, ảnh
- Các nội dung truyền thôngtrên mạng xã hội
được xác định trước(thường chỉ có dạng vănbản)
- Dễ tìm kiếm
- Không có mô hình dữ liệuđược xác định trước
- Có thể là dạng văn bản, hìnhảnh, video, âm thanh hoặc địnhdạng khác
Được tạo bởi Con người và máy móc Con người và máy móc
(Nguồn: Internet)
1.3 Các giả định của Big Data
N = All
Trang 10Nếu thu thập thông tin dựa trên mẫu nhỏ, thậm chí những kết quả được thu thập
“một cách khoa học” thì thông tin đó cũng không đáng tin cậy (phương sai cao trên cácmẫu lặp lại), không mang tính đại diện và không đủ sức mạnh về mặt thống kê (tức là,các suy luận hợp lý bị hạn chế) Một số nhà nghiên cứu cho rằng Big Data có thể khắcphục những hạn chế này và sẵn sàng cung cấp các bài kiểm tra về các thông số dân số vì
nó tương đối rẻ, tương đối đại diện, được bổ sung liên tục và dễ dàng sao chép Tuynhiên, một lưu ý quan trọng liên quan đến giả định này: Big Data loại trừ những ngườikhông sử dụng internet hoặc công nghệ xử lý thông tin kỹ thuật số Việc tham gia vào nềntảng trực tuyến, cho dù thương mại hay không, thì cũng có sự khác biệt đáng kể theo vịtrí địa lý, tuổi tác, giới tính, chủng tộc và các yếu tố xã hội học khác (www.statista.com)
Today = Tomorrow
Bởi vì nó di động và có mặt khắp nơi, cuộc sống kỹ thuật số năng động hơn nhiều
so với cuộc sống thực Người tiêu dùng liên tục chuyển đổi, thử và từ bỏ sự hiện diện kỹthuật số của họ Các dấu vết của hành vi đó có thể trở thành đối tượng của cuộc điều tra.Ban đầu, Facebook giới hạn thành viên cho người dùng trong ngành giáo dục; do đó, chỉcần đăng ký một tài khoản email edu Khi Facebook mở rộng, nó đã được mở cho cảnhững người dùng phi giáo dục
Online behavior = Offline behavior
Người tiêu dùng có thể hiện các mô hình hành vi giống nhau cả trên trực tuyến vàngoại tuyến không? Điều này rất phức tạp và các nhà tiếp thị phải tìm hiểu cách ngườitiêu dùng biểu hiện trong cả hai mô hình hành vi mua hàng đối với các sản phẩm cụ thể
Behavior of all today = Behavior of all tomorrow
Giả định này tổng hợp ba giả định nói trên Big Data là sự phản ánh số hóa khônghoàn hảo về cuộc sống trực tuyến và ngoại tuyến của con người Các mô hình mô tả hành
vi của người tiêu dùng đang thay đổi để giải thích cho ảnh hưởng của công nghệ vàinternet
Những giả định này giúp kiểm soát những thông tin có được từ việc phân tích BigData Nhiều nhà tiếp thị tin rằng tất cả người tiêu dùng của họ đều có mặt trực tuyến và
Trang 11sẽ cư xử giống nhau cho dù trực tuyến hay ngoại tuyến Tuy nhiên, việc không đặt câuhỏi hoặc không quan tâm các giả định nói trên có thể cản trở khả năng tồn tại của cácphân tích Big Data đối với doanh nghiệp.
1.4 Thách thức khi sử dụng Big Data
Big Data là bước ngoặt đánh dấu sự phát triển của Cách mạng Công nghiệp 4.0,việc ứng dụng công nghệ này mang lại tiềm năng phát triển tuyệt vời cho doanh nghiệp.Tuy nhiên việc ứng dụng Big Data một cách hiệu quả thì không phải là điều dễ dàng vàcòn rất nhiều thách thức mà các doanh nghiệp cần phải đối mặt
Sự đa dạng thông tin: Trước khi tiến hành phân tích dữ liệu, doanh nghiệp cần
đảm bảo nguồn dữ liệu là chính xác và có định dạng phù hợp cho việc phân tích Trênthực tế thì sự tồn tại của một dữ liệu đồng nhất và có cấu trúc tốt với cùng kích thước vàcấu trúc là rất cần thiết Chính vì vậy, việc làm sạch và xử lý các lỗi từ các nguồn dữ liệukhông đầy đủ hay các dữ liệu gây nhiễu là tối quan trọng và không thể thiếu Tuy nhiên,điều đó đòi hỏi doanh nghiệp cần đầu tư một khoản chi phí (thời gian, ngân sách) lớn để
có được kết quả mang giá trị cao
Quy mô: Thực tế cho thấy rằng khối lượng dữ liệu đang gia tăng khá lớn và gần
như đã vượt qua khả năng sức mạnh xử lý và lưu trữ của máy tính Bên cạnh đó, việctruyền dữ liệu lớn thường phải gánh chịu chi phí cao Đây là “nút cổ chai” của việc tínhtoán Big Data
Yếu tố thời gian: Khi số lượng dữ liệu tăng nhanh chóng, các kết quả phân tích thì
cần phải được đưa ra một cách tức thì nghĩa là trong thời gian thực nên cần phải có sựphát triển các quy trình xử lý dựa vào sự gia tăng của các cấu trúc dữ liệu nhằm đạt đượcmục đích cuối cùng đó là đáp ứng yêu cầu truy cập thông tin một cách tức thì của người
sử dụng
Tính cá nhân và Bảo mật dữ liệu: Các yếu tố luật pháp liên quan đến các hạn chế
về quyền cá nhân hiện đang trở thành một mối đe dọa vì nó có thể hạn chế các ích lợitiềm năng Chính vì lý do đó mà các chính sách an ninh mạng hay cụ thể là an ninh thông
Trang 12tin chia sẻ các dữ liệu liên quan đến người dùng cá nhân cần phải được xem xét một cáchthận trọng và nghiêm túc Bên cạnh đó, một số ví dụ trong thực tế cho thấy, không chỉthông tin cá nhân người tiêu dùng, thông tin mật của các tổ chức mà ngay cả bí mật anninh quốc gia cũng có thể bị xâm phạm Do đó, giải quyết các vấn đề an ninh dữ liệubằng các công cụ kỹ thuật và các chính sách trở nên vô cùng cấp bách.
Thiếu chuyên gia công nghệ: Dù là thời đại công nghệ 4.0, hoạt động bằng máy
móc chiếm ưu thế, nhưng nếu không có con người vận hành, quản lý thì dù máy móc cóhiện đại đến đâu cũng khó có thể mang đến hiệu quả tốt nhất Công nghệ Big Data cũngvậy Các đánh giá của chuyên gia là hết sức cần thiết để có thể hiểu các nguồn dữ liệu và
để khai thác một cách tối ưu các tiềm năng của nó đòi hỏi sự phối hợp nhịp nhàng vànhuần nhuyễn giữa máy móc và con người
Đòi hỏi thay đổi văn hóa doanh nghiệp: Văn hóa doanh nghiệp được xây dựng và
phát triển không phải chỉ trong ngày một ngày hai Chính vì vậy, để một doanh nghiệpthay đổi văn hóa làm việc của mình, đặc biệt là từ truyền thống sang hiện đại, không phải
là điều đơn giản Theo khảo sát của New Vantage, chỉ có 32.4% doanh nghiệp thành côngtrong việc thay đổi văn hóa doanh nghiệp theo hướng hiện đại mới
Trang 13CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING
2.1 Khái niệm nghiên cứu Marketing
Theo Philip Kotler (2003) “Nghiên cứu marketing là xác định một cách có hệthống những tư liệu cần thiết do tình huống marketing đặt ra cho một công ty, thu thập,phân tích chúng và báo cáo kết quả”
Theo Hiệp hội Marketing Mỹ (AMA): Nghiên cứu marketing là quá trình thu thập
và phân tích có hệ thống những dữ liệu về các vấn đề liên quan đến các hoạt độngmarketing của doanh nghiệp
Tư tưởng chủ đạo của Marketing là “Mọi quyết định kinh doanh đều xuất phát từthị trường” Muốn thực hiện được tư tưởng chủ đạo này thì phải có đầy đủ thông tin vềthị trường, về môi trường kinh doanh Căn cứ vào các thông tin thu được qua nghiên cứuMarketing, các nhà quản lý sẽ vạch ra chiến lược, chính sách kinh doanh phù hợp nhắmvào thị trường mục tiêu
2.2 Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big Data
Nhìn chung mục đích của nghiên cứu marketing là để chuyển đổi dữ liệu thu thậpđược thành thông tin có giá trị và hiểu biết hữu ích cho việc ra quyết định Mặc dù kháiniệm và mục tiêu của nghiên cứu marketing vẫn không thay đổi trong bối cảnh Big Data,nhưng với lợi ích ngày càng lớn của việc phân tích big data như hiện nay thì đòi hỏi cần
có một quan điểm nghiên cứu marketing rộng hơn
Nhóm chúng tôi đưa ra một số điểm khác biệt giữa nghiên cứu Marketing truyềnthống và nghiên cứu Marketing sử dụng Big Data, các tiêu chí so sánh chủ yếu là về thuthập và phân tích dữ liệu Nghiên cứu Marketing truyền thống theo nhóm là nghiên cứuthường dựa trên sự giả định dữ liệu ngẫu nhiên và sử dụng các phương pháp thống kêtruyền thống, còn Nghiên cứu Marketing sử dụng Big Data giả định dữ liệu có độ phứctạp cao và sử dụng thêm các phương pháp thống kê nâng cao bên cạnh các phương phápthống kê truyền thống đã được cải tiến Đặc biệt, trong quá khứ chưa có sự bùng nổ củatiến bộ khoa học kỹ thuật như hiện nay
Trang 14Bảng 2.1 So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử
Chỉ thu được dữ liệu hạn chế
mô tả theo khoảng thời gian
Lưu trữ
và quản
lý dữ liệu
Thiết bị lưu trữ, quản lý có
dung lượng lưu nhỏ
Công nghệ điện toán đám mây cung cấp kỹthuật lưu trữ, quản lý với lưu lượng lớn vàhiệu quả Một số nền tảng lưu trữ đám mâyhiện nay gồm: Google Store, Amazon,Microsoft Azure, IBM Blue Cloud
liệu truyền thống bắt nguồn
từ thống kê và khoa học máy
tính như phân tích cụm, phân
tích nhân tố, phân tích tương
quan, phân tích hồi quy…
Phương pháp phân tích big data là các môhình thuật toán cũng dựa trên thống kê vàkhoa học máy tính hiện đại hơn cho phéptrích xuất thông tin và tạo ra các mô hình dựđoán hiệu quả cao ví dụ như mô hình thuậttoán MapReduce do Google đề xuất, kỹ thuậtphân tích và giải mã NLP…
(Nguồn: Nhóm tự tổng hợp)
Thực tế hiện nay chưa có nhiều phương pháp phân tích dữ liệu big data được pháttriển vì khối lượng và tốc độ của nó quá lớn Tuy nhiên trong thời đại công nghiệp 4.0như hiện nay, việc doanh nghiệp biết cách phân tích dữ liệu big data sẽ là một lợi thế rấtlớn
2.3 Mô hình trích xuất thông tin từ Big Data cho nghiên cứu marketing
Điều thực sự mang lại giá trị cho việc sử dụng big data là phân tích dữ liệu Nếu
không có phân tích, big data chỉ là một tập dữ liệu với việc sử dụng hạn chế
Trang 15Khi mà sự xuất hiện của big data đang dần định hình lại quá trình nghiên cứumarketing Mô hình dưới đây trình bày năm giai đoạn chính của nghiên cứu marketing sử
dụng big data Trong đó, năm giai đoạn này được nhóm thành quản lý dữ liệu (data management) và phân tích (analytics) Quản lý dữ liệu là những quy trình và công nghệ
hỗ trợ được thiết kế và sử dụng để thu thập, lưu trữ và trích xuất dữ liệu cho việc phân
tích ở giai đoạn sau Còn Phân tích là tập hợp các kỹ thuật được sử dụng để phân tích,
phác họa và tạo ra những thông tin có giá trị từ nguồn dữ liệu big data
Hình 2.1 Process for Extracting Insights From Big Data
(Nguồn: Gandomi & Haider, 2015; Japkowicz & Stefanowski, 2016; Labrinidis &
Jagadish, 2012)
2.3.1 Thu thập và lưu trữ dữ liệu
Để có dữ liệu thì đầu tiên cần phải thu thập, vấn đề chính gây khó khăn cho việcthu thập dữ liệu từ big data đó là sự phân tán của dữ liệu ở nhiều nguồn khác nhau Cáccông cụ thu thập dữ liệu từ thiết bị cảm biến người dùng (cảm biến là sự đo lường và biếnđổi đại lượng vật lý thành tín hiệu số có thể đọc được, dữ liệu cảm biến có thể là sóng âmthanh, giọng nói, rung động…), thiết bị có định vị vị trí, các phương tiện truyền thông xãhội, giao dịch tài chính, điện thoại thông minh,…
Dữ liệu sẽ được ghi lại và lưu trữ trên nhiều thiết bị lưu trữ như kho dữ liệu truyềnthống, data lakes hay điện toán đám mây
Dữ liệu được thu thập và lưu trữ ở giai đoạn này là dữ liệu thô, chưa có giá trị sửdụng cao
2.3.2 Xử lý làm sạch dữ liệu
Thông thường dữ liệu từ các nguồn công khai thường không đầy đủ, không có cấutrúc nhất quán (dữ liệu ở nhiều kiểu khác nhau như: văn bản, âm thanh, video…), bị lỗiđịnh dạng hay đơn giản là sai Ví dụ, những người tham gia khảo sát có thể trả lời sai hay
dữ liệu thu được từ các thiết bị theo dõi trên điện thoại thông minh (các app được hỗ trợ
Trang 16GPS) có thể sai do thiết bị đó bị hỏng… Để biến những dữ liệu thô này thành dữ liệu cógiá trị chúng ta cần tiến hành xử lý dữ liệu.
Xử lý dữ liệu là quá trình xác định và sửa lỗi dữ liệu để đảm bảo chất lượng của
dữ liệu bằng các thuật toán Ví dụ khi xác định được với dữ liệu bị lỗi định dạng thì tiếnhành thay đổi về định dạng phù hợp, hay tiến hành xóa bỏ những dữ liệu bị sai
Đây là bước quan trọng cần thiết để đảm bảo các tệp dữ liệu đáp ứng các tiêuchuẩn về chất lượng và có giá trị sử dụng
2.3.3 Tổng hợp, đối chiếu dữ liệu
Để tiến hành phân tích dữ liệu cần hợp nhất các tệp dữ liệu không đồng nhất vớikích thước đa dạng ở bước trên thành một tập dữ liệu tích hợp phù hợp với nhu cầunghiên cứu Sau đó, tiến hành đối chiếu dữ liệu, tìm những dữ liệu giống nhau, bị trùnglặp để loại bỏ Sự trùng lặp dữ liệu là rất phổ biến trong các tệp dữ liệu từ các nguồn khácnhau, việc loại bỏ những dữ liệu bị lặp nhằm tránh lãng phí không gian lưu trữ cũng như
để có cơ sở phân tích chính xác Ví dụ như một công ty thẻ tín dụng và một nhà bán lẻ cóthể ghi lại các giao dịch giống nhau của một khách hàng
2.3.4 Mô hình hóa và phân tích dữ liệu
Có rất nhiều loại phân tích được sử dụng để tìm ra các mẫu thông tin có ý nghĩatrong nguồn dữ liệu big data Phân tích văn bản có thể chuyển đổi văn bản như các tweetđánh giá thương hiệu của người tiêu dùng thành bản tóm tắt các ý chính có ý nghĩa Phântích âm thanh để trích xuất thông tin từ âm thanh không có cấu trúc, chẳng hạn như tệp
âm thanh cuộc gọi phàn nàn của khách hàng Tương tự, phân tích nội dung video để tríchxuất thông tin từ video, ví dụ như các unboxing video do người tiêu dùng tạo Phân tíchnội dung hình ảnh cho phép các nhà nghiên cứu trích xuất những dữ liệu từ những từđược in trong một bức ảnh của người tiêu dùng, chẳng hạn trên Twitter bị giới hạn 5000
ký tự nên người tiêu dùng thường chuyển dữ liệu văn bản vào ảnh Phương tiện truyềnthông xã hội và phân tích mạng để khám phá nội dung mà người tiêu dùng tạo trên cácnền tảng truyền thông xã hội và chuyển các nội dung đó thành âm thanh, video hay cácphân tích khác
Sau khi phân tích các kiểu dữ liệu trên thì nhà nghiên cứu đã có thể xây dựng một
mô hình về hành vi, thái độ và tình cảm của khách hàng
Trang 172.3.5 Trình bày, diễn giải dữ liệu
Những nhà nghiên cứu marketing phải có khả năng hiểu và diễn giải kết quả từbước phân tích và mô hình hóa dữ liệu Cụ thể là phải biết cách trình bày, truyền đạt kếtquả nghiên cứu cho những người ra quyết định để họ nắm vững tình huống và đưa raquyết định phù hợp, ít rủi ro nhất
2.4 Phân tích Big Data và mô hình 5Ps
Dựa vào lượng thông tin có được sau khi phân tích Big Data, doanh nghiệp có thểxây dựng được mô hình 5Ps như bảng dưới (theo Fan, Leu & Zheo, 2015)
Bảng 2.2 5Ps and Big Data Analytics
-Đặc điểm-Phân loại-Review củakhách hàng-Khảo sát
-Dữ liệutiếp thị
ữ liệukhảo sát
- Dữliệu giaodịch
ữ liệukhảo sát
- Các nền tảngkết nối mạng xãhội
-Dữ liệu khảosát
- Mô hìnhchủ đề(topicmodelling)
- Phântích kếthợp
- Phântích hồiquy
- Lọctươngtác
- Phântích kếthợp
- Phântích kếthợp
- Phântích hồiquy
- Phân tích hồiquy
-Sử dụngphương phápphân loại
Ứng
dụng
-Phânkhúckháchhàng-Phân tích dự
-Gợi ýsản phẩm
- Đo lường
sự phổ biếnbiến của của
- Hệthốnggợi ý
n tích hiệu
n lược vềgiá
tích đối thủ
-Tìm các nềntảng chạymarketing hiệuquả