DEMO PHÂN TÍCH VÀ TRỰC QUAN HOÁ DỮ LIỆU DOANH NGHIỆP ADVENTUREWORKS2014 VỚI NHÓM SẢN PHẨM BIKE BẰNG PHƯƠNG PHÁP RFM.
Trang 1ĐẠI HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI
KHOA CÔNG NGHỆ THÔNG TIN
-BÁO CÁO NHÓM MÔN HỌC THƯƠNG MẠI ĐIỆN TỬ
TÌM HIỂU BIG DATA
Cán bộ hướng dẫn:
Nhóm:
Lớp:
Hà Nội, tháng 8 năm 2023
Trang 2MỤC LỤC
BẢNG PHÂN CÔNG CÔNG VIỆC 2
Chương 1: GIỚI THIỆU ĐỀ TÀI 3
Chương 2: NỘI DUNG ĐỀ TÀI 4
I Tổng quan về Big Data 4
II Cơ sở lý thuyết của Big Data 6
III Kỹ thuật của Big Data 8
IV Vai trò của Big Data trong doanh nghiệp 9
V Khó khăn khi làm việc với Big Data 9
VI Quy trình hoạt động của Big Data 10
VII Các ứng dụng phổ biến của Big Data 12
VIII Các công nghệ dành cho Big Data 14
Chương 3: PHÂN TÍCH VÀ TRỰC QUAN HOÁ DỮ LIỆU DOANH NGHIỆP ADVENTUREWORKS2014 VỚI NHÓM SẢN PHẨM BIKE BẰNG PHƯƠNG PHÁP RFM 16
1 Cơ sở lý thuyết 16
2 Giới thiệu về bộ dữ liệu và thực hành 17
KẾT LUẬN 26
TÀI LIỆU THAM KHẢO 27
Trang 3Chương 1: GIỚI THIỆU ĐỀ TÀI
Big Data, một khái niệm đã trở nên rất quen thuộc trong thời đại số hóa,mang trong mình sức mạnh biến đổi đáng kể cách chúng ta nắm bắt, xử lý và tậndụng thông tin Đã từ lâu, dữ liệu đã không chỉ đơn thuần là những con số và thôngtin thô mà đã trở thành một tài sản vô giá, là nguồn cung cấp thông tin quan trọng,thúc đẩy sự phát triển và thay đổi toàn diện nhiều khía cạnh của cuộc sống và kinhtế
Chính sự gia tăng vượt bậc về khả năng lưu trữ, truyền tải và xử lý dữ liệu đãđánh dấu sự ra đời của Big Data Khái niệm này không chỉ dừng lại ở lượng dữ liệukhổng lồ mà còn đề cập đến tốc độ nhanh chóng của việc tạo ra dữ liệu, cũng như
đa dạng về các nguồn dữ liệu từ cấu trúc đến phi cấu trúc
Sự kết hợp của Big Data và các công nghệ như trí tuệ nhân tạo và học máy
đã mở ra cánh cửa cho việc khám phá thông tin tiềm ẩn, tạo ra dự đoán, và hiểu sâuhơn về thế giới xung quanh chúng ta Các lĩnh vực từ y tế, tài chính, quản lý đô thị,sản xuất đến bán lẻ và nông nghiệp đều tận dụng Big Data để tạo ra giá trị, tối ưuhóa hoạt động và định hình tương lai
Tuy nhiên, với quy mô và phức tạp của Big Data cũng đặt ra những tháchthức về bảo mật, quyền riêng tư và khả năng xử lý Hiểu biết về cách làm việc vớiBig Data, từ việc thu thập, lưu trữ, xử lý đến phân tích, đang trở thành một phầnquan trọng của sự phát triển trong thế giới số hóa
Trong bối cảnh mọi thứ đang dần trở nên kết nối và thông tin ngày càngthâm nhập vào cuộc sống hàng ngày, Big Data không chỉ là một khái niệm mà còn
Trang 4là một cuộc cách mạng trong cách chúng ta hiểu và tận dụng thông tin để hướng tới
sự tiến bộ và phát triển bền vững
Chương 2: NỘI DUNG ĐỀ TÀI
I Tổng quan về Big Data.
1 Định nghĩa.
Big Data là một thuật ngữ được sử dụng để miêu tả việc xử lý và phân tíchlượng lớn dữ liệu có quy mô khổng lồ, đa dạng và phức tạp, mà các công cụ vàphương pháp truyền thống không thể xử lý hiệu quả Khái niệm này thường đượcliên kết với ba yếu tố chính: 3V - Volume (lượng), Velocity (tốc độ), và Variety(đa dạng)
2 Đặc điểm.
-Volume (Lượng): Big Data ám chỉ khả năng thu thập và lưu trữ lượng dữliệu rất lớn, vượt quá khả năng của hệ thống thông thường Dữ liệu này có thể baogồm thông tin từ các nguồn như máy chủ, thiết bị cảm biến, mạng xã hội, hoạt độngtrực tuyến, v.v
-Velocity (Tốc độ): Dữ liệu Big Data thường được tạo ra và thu thập với tốc
độ nhanh chóng, đòi hỏi khả năng xử lý và phân tích dữ liệu trong thời gian thực
Ví dụ, các ứng dụng Internet of Things (IoT) có thể tạo ra dữ liệu liên tục từ cácthiết bị cảm biến
-Variety (Đa dạng): Dữ liệu trong môi trường Big Data không chỉ đến từ mộtnguồn duy nhất, mà đa dạng về định dạng, cấu trúc và nguồn gốc Điều này bao
Trang 5gồm dữ liệu cấu trúc (như cơ sở dữ liệu SQL), dữ liệu bán cấu trúc (như tệp CSV),
và dữ liệu phi cấu trúc (như văn bản, hình ảnh, video)
=>Để xử lý và tận dụng dữ liệu Big Data, các công cụ và kỹ thuật đặc biệtđược phát triển Các hệ thống xử lý dữ liệu lớn như Hadoop, Spark, và công nghệ
cơ sở dữ liệu NoSQL đã được phát triển để giúp lưu trữ, xử lý và phân tích dữ liệutrong quy mô lớn Các kỹ thuật Machine Learning và Data Mining cũng thườngđược sử dụng để khai thác thông tin ẩn chứa trong dữ liệu Big Data, để đưa ra dựđoán, phân loại, và hiểu rõ hơn về xu hướng và mô hình
Tổng cộng, khái niệm Big Data là một phản ánh của thực tế mà chúng tađang sống trong một thế giới mà dữ liệu ngày càng trở nên phong phú, đa dạng vàtăng về quy mô, và việc quản lý và sử dụng hiệu quả dữ liệu này đang là một tháchthức quan trọng trong nhiều lĩnh vực
3 Các giai đoạn hình thành.
Dữ liệu lớn là thuật ngữ được sử dụng để chỉ xử lý và quản lý dữ liệu lớn,phức tạp mà không thể xử lý bằng các công cụ truyền thông Sự phát triển của BigData đã được chia thành các giai đoạn từ 1.0 đến 4.0 để mô tả sự tiến hóa của nóqua thời gian Dưới đây là bản tóm tắt về các giai đoạn này:
-Big Data 1.0: Điểm khởi động
Giai đoạn đầu của Big Data bắt đầu khi các công ty và tổ chức bắt đầu nhận
ra giá trị của việc lưu trữ và xử lý dữ liệu lớn Các công nghệ như cơ sở dữ liệuphân tán (cơ sở dữ liệu phân tán) và khung Hadoop xuất hiện, cho phép lý dữ liệu
có quy định lớn hơn bằng cách tận dụng sức mạnh xử lý của nhiều máy tính kết nốivới nhau
-Big Data 2.0: Phân tích và Insight
Trang 6Giai đoạn thứ hai tập trung vào việc phân tích dữ liệu để trích xuất thông tin
và hiểu rõ hơn về khách hàng, xu hướng thị trường và các mô hình hành vi Cáccông nghệ và phương pháp phân tích dữ liệu phức tạp hơn như Machine Learning
và Data Mining bắt đầu được áp dụng để tạo thông tin hữu ích từ dữ liệu lớn
-Big Data 3.0: Thời đại kết nối và tương tác
Giai đoạn này tập trung vào việc kết hợp dữ liệu từ nhiều nguồn khác nhau
và tạo ra các mô hình phức tạp để dự đoán và đưa ra quyết định Internet of Things(IoT) đóng một vai trò quan trọng trong việc cung cấp lượng dữ liệu lớn từ các thiết
bị và cảm biến khác nhau, và các ứng dụng như Thành phố thông minh và hệ thống
tự động hóa được phát triển dựa trên kết nối nối và tương tác giữa các nguồn dữliệu
-Big Data 4.0: Trí tuệ nhân tạo và Tự động hóa cao cấp
Giai đoạn hiện tại, Big Data 4.0, tập trung vào việc sử dụng trí tuệ nhân tạo(AI) để tự động hóa và tối ưu hóa các quyết định dựa trên dữ liệu thay vì Các hệthống tự động hóa thông minh, như hệ thống sản xuất tự động, giao thông thôngminh và quản lý tài nguyên, dựa trên dữ liệu lớn và trí tuệ nhân tạo để hoạt độnghiệu quả hơn và đáp ứng nhu cầu ngày càng cao sự phát triển của xã hội
=>Sự phát triển của Dữ liệu lớn từ 1.0 đến 4.0 có thể hiện sự tiến hóa củacông việc lý và sử dụng dữ liệu lớn trong các lĩnh vực khác nhau, xử lý từ phân tích
cơ bản đến sự tương tác phức tạp và cuối cùng là sự kết hợp giữa trí tuệ nhân tạo và
tự động hóa cao cấp
II Cơ sở lý thuyết của Big Data.
Trang 7Cơ sở lý thuyết của Big Data dựa trên một số khái niệm và nguyên tắc từ các lĩnhvực như khoa học máy tính, xử lý dữ liệu, thống kê và hệ thống thông tin Dưới đây
là một số khía cạnh cơ sở lý thuyết quan trọng liên quan đến Big Data:
1 Thống kê và Xác xuất.
Cơ sở lý thuyết của thống kê và xác suất là cực kỳ quan trọng trong việc hiểu
và xử lý Big Data Các phương pháp thống kê giúp phân tích dữ liệu, xác định mẫu,
đo lường sự không chắc chắn trong dữ liệu và tạo ra dự đoán dựa trên mô hình Cácnguyên tắc xác suất giúp định lượng khả năng xảy ra của các sự kiện trong dữ liệu,đặc biệt là khi dữ liệu rất lớn và phức tạp
2 Xử lý dữ liệu lớn (Big Data Processing).
Đây là lĩnh vực tập trung vào việc xử lý dữ liệu có quy mô lớn Các công nghệ nhưHadoop và Apache Spark là những ví dụ điển hình của hệ thống xử lý dữ liệu lớn.Các nguyên tắc xử lý song song, phân tán và cân bằng tải là cơ sở lý thuyết quantrọng ở đây
3 Cơ sở dữ liệu.
Trong Big Data, việc lưu trữ và truy cập dữ liệu có quy mô lớn đòi hỏi các
cơ sở dữ liệu có hiệu suất cao và khả năng mở rộng Các cơ sở dữ liệu NoSQL nhưMongoDB, Cassandra, và hệ thống cơ sở dữ liệu cụ thể cho dữ liệu lớn (Big Datadatabases) đã được phát triển để đáp ứng các yêu cầu này
4 Mạng xã hội và Phân tích ngữ nghĩa.
Trong thời đại số hóa, dữ liệu xã hội và dữ liệu từ các nguồn như mạng xãhội, diễn đàn trực tuyến đang trở nên ngày càng quan trọng Phân tích ngữ nghĩa,khai phá dữ liệu xã hội và xử lý dữ liệu văn bản đòi hỏi kiến thức về xử lý ngônngữ tự nhiên (NLP) và các kỹ thuật khai thác thông tin
5 Trí tuệ nhân tạo và học máy.
Big Data thường đi kèm với việc sử dụng trí tuệ nhân tạo và học máy để tìmkiếm mẫu, tạo ra dự đoán và hiểu sâu hơn về dữ liệu Cơ sở lý thuyết của học máy,
Trang 8bao gồm các thuật toán phân loại, gom cụm, và học sâu (deep learning), cung cấpkhả năng hiểu dữ liệu và tạo ra giá trị từ nó.
6 Nhìn chung
Cơ sở lý thuyết của Big Data liên quan đến sự kết hợp của nhiều lĩnh vựckhác nhau, đặc biệt là khoa học máy tính, toán học, thống kê, và xử lý dữ liệu
III Kỹ thuật của Big Data.
1 Hadoop: Hadoop là một framework mã nguồn mở dựa trên
nguyên tắc xử lý phân tán Nó bao gồm hai thành phần chính là Hadoop DistributedFile System (HDFS) để lưu trữ dữ liệu phân tán và MapReduce để xử lý dữ liệuphân tán Hadoop cho phép xử lý dữ liệu lớn trên các cụm máy tính thông qua phântán và song song
2 Apache Spark: Spark là một framework xử lý dữ liệu lớn khác,
nhanh hơn và linh hoạt hơn so với MapReduce Nó hỗ trợ nhiều loại công việc xử
lý dữ liệu như xử lý batch, xử lý dựa trên luồng (streaming), xử lý đồ đạc và họcmáy
3 Cơ sở dữ liệu NoSQL: Các cơ sở dữ liệu NoSQL (Not Only
SQL) như MongoDB, Cassandra, và Redis được thiết kế để xử lý dữ liệu phi cấutrúc và có khả năng mở rộng tốt Chúng thích hợp cho việc lưu trữ và truy vấn dữliệu có quy mô lớn và đa dạng
4 Phân tích dữ liệu thời gian thực (Real-time Data Analytics):
Các hệ thống xử lý dữ liệu thời gian thực như Apache Kafka và Apache Flink chophép xử lý và phân tích dữ liệu ngay lập tức khi nó được tạo ra Điều này hữu íchtrong việc theo dõi sự kiện trực tiếp, phát hiện sự cố và đưa ra quyết định nhanhchóng
5 Học máy và Khai thác dữ liệu (Data Mining): Các thuật toán
học máy và khai thác dữ liệu giúp tìm kiếm mẫu và thông tin tiềm ẩn trong dữ liệu
Trang 9lớn Điều này có thể bao gồm việc dự đoán xu hướng, phân loại dữ liệu, gom cụm
dữ liệu và hơn thế nữa
6 Trích xuất thông tin từ dữ liệu văn bản (Text Mining): Trích
xuất thông tin từ dữ liệu văn bản, còn gọi là phân tích ngữ nghĩa, là một kỹ thuậtquan trọng để hiểu và khai thác dữ liệu văn bản Các kỹ thuật NLP (NaturalLanguage Processing) và xử lý ngôn ngữ tự nhiên được sử dụng để phân tích, phânloại và trích xuất thông tin từ văn bản
7 Trực quan hoá dữ liệu (Data Visualization): Trực quan hóa dữ
liệu là kỹ thuật biến dữ liệu thành các biểu đồ, đồ thị và hình ảnh dễ hiểu Công cụnhư Tableau, Power BI và D3.js giúp biểu diễn dữ liệu một cách trực quan để tạo rahiểu biết từ dữ liệu lớn
=>Nhìn chung, các kỹ thuật Big Data bao gồm một loạt công cụ và phươngpháp giúp xử lý, lưu trữ và phân tích dữ liệu lớn một cách hiệu quả, đáp ứng nhucầu ngày càng tăng về việc làm cho dữ liệu trở nên hữu ích và thông tin
IV Vai trò của Big Data trong doanh nghiệp.
- Hiểu và nhắm đúng khách hàng mục tiêu: dữ liệu của Big Data được thu
thập từ nhiều nguồn khác nhau, gồm cả lịch sử trình duyệt, mạng xã hội, Đây lànhững kênh người dùng sử dụng rất thường xuyên Vì vậy, doanh nghiệp phân tíchBig Data sẽ hiểu được hành vi, sở thích, nhu cầu của khách hàng đồng thời phânloại và lựa chọn đúng đối tượng khách hàng phù hợp với sản phẩm, dịch vụ củadoanh nghiệp
- Định lượng và tối ưu hóa hiệu suất cá nhân: nhờ các thiết bị di động thông
minh như smartphone, smartwatch mà thông tin, dữ liệu cá nhân có thể được thuthập dễ dàng Những dữ liệu cá nhân từ mỗi người dùng sẽ giúp doanh nghiệp cócái nhìn rõ nét về xu hướng hành vi mới nhất của khách hàng Từ đó, các nhà quản
lý có thể định hướng cho chiến lược, kế hoạch mới trong tương lai gần
Trang 10- Phòng chống an ninh, giảm thiểu rủi ro: Big Data được các doanh nghiệp
sử dụng để thăm dò, phát hiện và ngăn chặn các nguy cơ, rủi ro về gian lận, xâmnhập hệ thống, đánh cắp thông tin mật Ví dụ như các ngân hàng và công ty thẻ tíndụng dùng Big Data để ngăn chặn các giao dịch gian lận
- Tối ưu hóa giá cả: việc định giá sản phẩm, dịch vụ luôn là điều rất quan
trọng và cũng rất khó khăn đối với các doanh nghiệp Bởi vì doanh nghiệp cầnnghiên cứu rất kỹ về mong muốn khách hàng và mức giá hiện tại của đối thủ cạnhtranh Nhờ có Big Data mà công cuộc nghiên cứu, thu thập dữ liệu trên trở nên dễdàng, nhanh chóng, giúp doanh nghiệp định giá một cách chính xác, hiệu quả hơn
- Nắm bắt các giao dịch tài chính: thương mại điện tử đã và đang phát triển
mạnh mẽ trên toàn thế giới, trong đó có cả Việt Nam Do đó, các giao dịch tàichính trên website hay các app thương mại điện tử ngày càng tăng lên và thể hiện
rõ hành vi mua của khách hàng Các thuật toán Big Data được doanh nghiệp sửdụng để gợi ý, đưa ra quyết định giao dịch cho khách hàng, tăng tỷ lệ chốt đơn chodoanh nghiệp
V Khó khăn khi làm việc với Big Data.
1 Thác thức đến từ Bg Data.
Thách thức lớn nhất khi sử dụng Big Data đó là khối lượng quá lớn và tăngnhanh Khối lượng dữ liệu được cho là tăng gấp 2 lần sau mỗi 2 năm khiến việc lưutrữ gặp khó khăn Các doanh nghiệp, tổ chức vẫn luôn cố gắng để bắt kịp với sựtăng nhanh của dữ liệu và tìm cách lưu trữ đủ Big Data cần thiết Một thách thứcnữa là về thời gian xử lý Big Data Các nhà khoa học dữ liệu cho biết họ thườngdành 50% - 80% thời gian để quản lý và chuẩn bị dữ liệu trước khi có thể thực sự
sử dụng nó Ngoài ra, lượng dữ liệu lớn nên đôi khi chất lượng dữ liệu không đượcđảm bảo, nhiều dữ liệu lỗi gây khó khăn trong việc xử lý và lọc dữ liệu
2 Chỉ trích về cách sử dụng Big Data.
Trang 11Tuy lợi ích mà Big Data đem lại cho doanh nghiệp là rất lớn nhưng chi phíđầu tư cho nó cũng không hề nhỏ và không có nhiều người biết tận dụng nó Một sốdoanh nghiệp lớn đã đầu tư hàng tỷ đô cho Big Data để có được thông tin quantrọng nhưng chỉ có dưới 40% nhân viên thật sự hiểu và tận dụng được lượng dữliệu này, dẫn đến việc lãng phí tài nguyên Ngoài ra, việc sử dụng Big Data cũng bịchỉ trích vì có trường hợp xâm phạm đến quyền riêng tư của người dùng Tại một
số quốc gia thì đây là một việc vi phạm pháp luật
3 Chỉ trích về việc lấy thông tin từ Big Data.
Một số nhà nghiên cứu như Danah Boyd đã bày tỏ niềm quan ngại khi cácnhà quản lý doanh nghiệp quá phụ thuộc vào dữ liệu từ Big Data để chọn mẫuthống kê Họ cho rằng việc này có thể gây ra sự chủ quan, trong một số trường hợp
có thể ảnh hưởng đến kết quả cuối cùng của chiến lược khi thực thi trong tương lai
VI Quy trình hoạt động của Big Data.
1 Xây dựng chiến lược Big Data.
Ở cấp độ cao, chiến lược Big Data là một kế hoạch được thiết kế để giúp bạngiám sát và cải thiện cách thu thập, lưu trữ, quản lý, chia sẻ và sử dụng dữ liệu chodoanh nghiệp Khi phát triển chiến lược Big Data, điều quan trọng là phải xem xétcác mục tiêu và sáng kiến trong hiện tại, tương lai của doanh nghiệp Điều này đòihỏi việc doanh nghiệp phải coi Big Data giống như là một tài sản kinh doanh có giátrị thay vì chỉ là một công cụ thông thường
2 Xác định các nguồn Big Data.
- Dữ liệu truyền trực tiếp: dữ liệu từ Internet of Things (IoT) và các thiết bị
được kết nối truyền vào hệ thống công nghệ thông tin từ thiết bị như điện thoại
Trang 12thông minh, ô tô thông minh Bạn có thể phân tích Big Data khi nó được truyềnđến, quyết định dữ liệu nào nên giữ hoặc không giữ và dữ liệu nào cần phân tíchthêm
- Social Media (Facebook, YouTube, Instagram, ): Big Data ở dạng hình
ảnh, video, giọng nói, văn bản và âm thanh, rất hữu ích cho chức năng tiếp thị, bánhàng và hỗ trợ Dữ liệu này thường ở dạng phi cấu trúc hoặc bán cấu trúc, vì vậy nóđặt ra một thách th ức riêng cho việc tiêu thụ và phân tích
- Dữ liệu có sẵn được công bố: là các thông tin, dữ liệu được công bố rộng
rãi và công khai như các trang web chính thức của Chính phủ các nước
- Khác: một số nguồn dữ liệu khác đến từ khách hàng, nhà cung cấp hoặc dữ
liệu đám mây
3 Truy cập, quản lý và lưu trữ Big Data.
Các hệ thống máy tính hiện đại cung cấp tốc độ, sức mạnh và tính linh hoạtcần thiết để nhanh chóng truy cập số lượng lớn và các loại dữ liệu lớn Cùng vớikhả năng truy cập đáng tin cậy, các công ty cũng cần có các phương pháp tích hợp
dữ liệu, xây dựng đường ống dẫn dữ liệu, đảm bảo chất lượng dữ liệu, cung cấp khảnăng quản lý và lưu trữ dữ liệu cũng như chuẩn bị dữ liệu để phân tích Một số dữliệu lớn có thể được lưu trữ tại chỗ trong kho dữ liệu truyền thống nhưng cũng cócác tùy chọn linh hoạt, chi phí thấp để lưu trữ và xử lý dữ liệu lớn thông qua cácgiải pháp đám mây, hồ dữ liệu, đường ống dữ liệu và Hadoop
4 Tiến hành phân tích dữ liệu.
Với các công nghệ hiệu suất cao như điện toán lưới hoặc phân tích trong bộnhớ, các tổ chức, doanh nghiệp có thể chọn sử dụng tất cả dữ liệu lớn của họ đểphân tích Một cách tiếp cận khác là xác định trước dữ liệu nào có liên quan trướckhi phân tích Dù bằng cách nào, phân tích dữ liệu lớn là cách các công ty thu đượcgiá trị và thông tin chi tiết từ dữ liệu Ngày nay, nguồn cấp dữ liệu lớn cung cấp các
nỗ lực phân tích nâng cao như trí tuệ nhân tạo (AI) và máy học
Trang 135 Dựa trên dữ liệu, đưa ra quyết định.
Dữ liệu đáng tin cậy, được quản lý tốt dẫn đến các phân tích đáng tin cậy vàcác quyết định sáng suốt Để duy trì tính cạnh tranh, các doanh nghiệp cần nắm bắttoàn bộ giá trị của dữ liệu lớn và hoạt động theo hướng dữ liệu để đưa ra quyết địnhdựa trên dữ liệu đã được chứng minh rõ ràng Các tổ chức, doanh nghiệp dựa trên dữliệu sẽ hoạt động tốt hơn, dễ dự đoán hơn và sinh nhiều lợi nhuận hơn
VII Các ứng dụng phổ biến của Big Data.
1 Ngành tài chính-ngân hàng.
Trong ngành tài chính ngân hàng, Big Data được sử dụng để phân tích và xácđịnh các địa điểm tập trung nhiều nhu cầu của khách hàng tiềm năng để đề xuất lậpchi nhánh mới, dự đoán lượng tiền mặt cần thiết sẵn sàng cung ứng ở một chinhánh tại thời điểm cụ thể, nâng cao hệ thống ngân hàng kĩ thuật số, phát hiện cáchoạt động gian lận và báo cáo cho các chuyên viên liên quan giúp đảm bảo an ninhcho ngân hàng
3 Thương mại điện tử.
Đối với ngành thương mại điện tử, doanh nghiệp nào sở hữu và ứng dụng tốtBig Data sẽ tạo ra lợi thế cạnh tranh lớn trên thị trường Big Data giúp nhà quản lý
Trang 14xác định được sản phẩm nào được xem nhiều nhất để tối ưu thời gian hiển thị, tựgửi mã ưu đãi cho những sản phẩm khách hàng bỏ vào giỏ hàng nhưng không mua.Đặc biệt, Big Data có thể phân tích hành vi, sở thích, sự quan tâm của khách hàng,giúp nhà quản lý hiểu hơn về khách hàng để cung cấp các sản phẩm theo đúng xuhướng, nhu cầu thị trường.
5 Digital Marketing.
Digital Marketing ngày càng trở thành một công cụ quan trọng cho cácdoanh nghiệp hiện nay Khi ứng dụng Big Data, doanh nghiệp sử dụng DigitalMarketing có thể xác định đối tượng mục tiêu trên các trang mạng xã hội dựa trênthông tin nhân khẩu học, giới tính, tuổi tác, sở thích Bên cạnh đó, có thể cá nhânhóa các hoạt động tìm kiếm trên Google, Email Marketing, hiển thị quảng cáo phùhợp và tạo báo cáo chi tiết sau mỗi chiến dịch quảng cáo
6 Ngành công nghiệp.
- Phát triển phần mềm sản phẩm: Các công ty sử dụng Big Data để xây dựngcác mô hình dự đoán cho các sản phẩm và dịch vụ mới Họ phân loại các thuộc tínhchính của sản phẩm/dịch vụ trong quá khứ và hiện tại, sau đó mô hình hóa mốiquan hệ giữa các thuộc tính và phát triển thành phần mềm hoàn chỉnh