Thông qua nguồn Big Data của mạng xã hội, doanh nghiệp có thể chiết xuất ra những thông tin về sở thích, thói quen, lịch sử mua sắm của người tiêu dùng è Nắm được xu hướng tiêu dùng sử d
Trang 1Twitter: How
Twitter And IBM
Deliver Customer
Insights From
Big Data
GVHD: Ths Trần Thị Phi Phụng Group 15
Trang 22 Nguyễn Ngọc Ánh Hồng 71802410
Trang 31 Giới thiệu
2 Tổng quan về thực trạng
3 Phân tích chi tiết các thông tin
4 Phân tích mối liên hệ dữ liệu
5 Kết luận
Trang 41 Giới thiệu
Mạng xã hội Twitter
• Được sáng lập bởi Jack Dorsey , Evan Williams , Biz Stone và Noah Glass
• Là một trong những ứng dụng truyền thông xã hội
lớn nhất và được sử dụng rộng rãi nhất trên thế giới
• Chính thức hoạt động vào 7/2006
Trang 51 Giới thiệu
Mạng xã hội Twitter
• Có trụ sở chính tại San Francisco
và đã có hơn 25 văn phòng trên toàn thế giới
• Tính đến 03/2022, Twitter đã có hơn 1,3 tỷ tài
khoản, trong đó có hơn 330 triệu người hoạt động thường xuyên
• Người dùng chia sẻ suy nghĩ của mình những người
theo dõi mình qua các đoạn văn nhỏ gọi là kêu chiêm chiếp (tweets)
Tweet có thể:
q Có tối đa 280 ký tự
q Bao gồm chữ viết, ảnh hoặc video ngắn
Trang 6Thông qua nguồn Big Data của mạng xã hội, doanh nghiệp có thể chiết xuất ra những thông tin về sở thích, thói quen, lịch sử mua sắm của người tiêu dùng
è Nắm được xu hướng tiêu dùng sử dụng của họ nhằm thực hiện các chiến dịch
tiếp thị quảng bá sản phẩm.
2 Tổng quan về thực trạng
Các công ty khai thác và ứng dụng Big Data trong việc phân tích hành vi tiêu dùng của
khách hàng
Nguồn bên ngoài (external data sources): Facebook, Twitter, Google, LinkedIn…
Tự xây dựng hệ thống
thu thập và xử lý dữ liệu
Trang 72 Tổng quan về thực trạng
30/10/2014
IBM sẽ giúp các doanh nghiệp sử dụng dữ liệu của mạng xã hội Twitter để hiểu rõ hơn về các khách hàng, doanh nghiệp, các xu hướng thị trường và ra quyết định kinh doanh.
IBM
Trang 83 Phân tích chi tiết các thông tin
3.1 Dữ liệu lớn giúp Twitter giải quyết vấn đề gì?
Theo thống kê của
“Internet Live
Stats”
6.000 tw
eet mỗi
giây
350.000 tweet m
ỗi phút
500 triệu tweet mỗi ngày
Twitter kết hợp với những công ty phân tích dữ liệu nâng cao như IBM
giúp cho nguồn dữ liệu thô trở thành nguồn dữ liệu cho các doanh
nghiệp quảng cáo trên nền tảng dữ liệu đã được phân tích
à Đưa sản phẩm đến những khách hàng mục tiêu phù hợp nhất
Lượng dữ liệu khổng lồ mà hàng giây Twitter sản sinh
là một nguồn tài nguyên lớn chưa được khai thác
200 tỷ tweet mỗi năm
Trang 93 2 D ữ l i ệ u l ớ n h o ạ t đ ộ n g
n h ư t h ế n à o t r o n g t h ự c t ế ?
Tất cả dữ liệu này được Twitter cung cấp cho
IBM để phân tích dữ liệu thông qua API
“firehose”
Sau đó, các doanh nghiệp khác có thể truy cập dữ liệu của Twitter thông qua các công cụ của IBM.
Sau khi IBM nhận được dữ liệu từ API firehose của Twitter, họ
thực hiện phân tích dữ liệu cho khách nhu cầu sử dụng liệu của
Twitter.
Các dịch vụ phân tích mới của IBM kết hợp với dữ liệu của Twitter trên điện toán đám mây sẽ giúp các doanh nghiệp và nhà phát triển:
• Tạo ứng dụng hỗ trợ dữ liệu xã hội
• Kết hợp Phân tích dự đoán, phức tạp với Dữ liệu Twitter
• Dễ dàng hơn Phân tích dữ liệu Twitter
Trang 104 Phân tích mối liên
hệ dữ liệu trong case study
Cú pháp tiêu chuẩn được người dùng Twitter tuân theo trong khi tweet liên quan đến hashtags, retweets và những đề cập của người dùng
Các thương hiệu có thể phân tích các tweet
để biết được tình cảm của mọi người đối với sản phẩm của họ
Xu hướng Twitter đóng một vai trò quan trọng trong quá trình ra quyết định của các tổ chức và công ty khác nhau
Trang 11Để có quyền truy
cập vào API
Twitter:
• Bước 1: Đăng ký tài khoản
• Bước 2: Sau khi tài khoản được chấp
thuận, có thể tạo hoặc tìm thông tin
Nghiên cứu của Anisha và các cộng sự (2021), đề xuất các tweet thu thập bằng cách sử dụng API Twitter và các phương pháp đếm, các thuật toán học máy khác nhau để xác định các chủ đề thịnh hành trên Twitter
Trang 12Việc thu thập dữ liệu xảy ra với sự trợ giúp của nền tảng phát trực tuyến Apache Kafka Bộ sưu tập các tweet được ghi lại bởi Nhà sản xuất, đó là một daemon được viết bằng Python có công việc là nhận tweet ("trạng thái") từ API Twitter và đẩy chúng vào hàng đợi Kafka.
Ảnh minh họa hệ thống con thu thập dữ liệu
Trang 135 KẾT LUẬN
Trang 145 KẾT LUẬN
Hạn chế
• Việc chuyển đổi dữ liệu thành những thông tin có giá trị,
có thể hành động được là điều khá khó khăn nếu không
có kỹ năng hoặc cơ sở hạ tầng để khai thác
• Thông tin bị giới hạn trong những thông tin mà người
dùng MXH quyết định chia sẻ về bản thân họ
• Nhiều tài khoản giả, ảo à Khó đánh giá
Trang 15• Các doanh nghiệp nên đầu tư vào các cơ sở hạ tầng,
nâng cao kỹ năng để tăng khả năng tiếp cận, xử lý và khai thác dữ liệu
• Thiết lập quan hệ đối tác cho phép các công ty giàu dữ
liệu, chẳng hạn như mạng truyền thông xã hội, làm việc với các công ty có khả năng phân tích tiên tiến
5 KẾT LUẬN
Bài học rút ra
Trang 16THANKS YOU
FOR LISTENING !!!
Trang 17Do you have
any questions?