Xây dựng hệ thống quảng cáo dựa trên nơi chốn kết hợp với đánh giá của người dùng trong mạng xã hội di động
Trang 1X ây dựng hệ thống quảng cáo dựa trên nơi chốn kết hợp với đánh giá của người dùng trong mạng xã hội di động
www.egobile.com
Trang 2Nội dung
Tổng quan đề tài Tình hình nghiên cứu trong và ngoài nước
Mô hình khuyến nghị EgoRec Thực nghiệm và đánh giá mô hình EgoRec Kết luận
Trang 31 Tổng quan đề tài
Trang 41 Tổng quan đề tài
Trang 72 Tình hình nghiên cứu
• Memory-based: lịch sử đánh giá
của người dùng
• Model-based: mô hình lại hành vi
đánh giá của người dùng
Trang 9Tom Chao Zhou, H M., Michael R Lyu, Irwin King A User Recommendation
Framework in Social Tagging Systems, 2010.
Trang 113 Mô hình khuyến nghị EgoRec
Mô hình tổng quan của EgoRec
Trang 12
3 Mô hình khuyến nghị EgoRec
Rating Context Tag Result Result Result
Trang 133 Mô hình khuyến nghị EgoRec
Rating Context Tag Result Result Result
Trang 143 Mô hình khuyến nghị EgoRec
Rating Context Tag Result Result Result
Trang 153 Mô hình khuyến nghị EgoRec
Rating Context Tag Result Result Result
Ngữ cảnh thời gian Mã (giá trị số) Ý nghĩa
Ngày (Visiting day)
1 Ngày trong tuần (thứ 2 đến thứ 6)
2 Ngày cuối tuần (thứ bảy, chủ nhật)
Giờ (Visiting time)
Trang 163 Mô hình khuyến nghị EgoRec
Visiting
Trang 173 Mô hình khuyến nghị EgoRec
• Cạnh là số lần 2 tag cùng xuất hiện trong 1 hành vi.
[Newman] – Tìm kiếm cấu trúc cộng đồng (Finding Structure in Community)
Zhou đề xuất
Trang 183 Mô hình khuyến nghị EgoRec
𝐾𝐿𝐷 ( 𝑢∨𝑣 ) = ∑ Pr ( 𝑢 ,𝑜𝑢 𝑖 ) log Pr ( 𝑢,𝑜𝑢 𝑖 )
𝐽𝑆𝐷 ( 𝑢 | 𝑣 ) = 𝐾𝐿𝐷 ( 𝑢 | 𝑀 ) +𝐾𝐿𝐷(𝑣∨𝑀 )
2
Áp dụng: Jensen-Shannon divergence để tính mức độ tương đồng
giữa hai phân bố xác suất
u (a, b, c, d) 0.7 (e, f) 0.2 (g) 0.1
v (a, b, e) 0.75 (d, f) 0.25
JSD - Jensen-Shannon divergence KLD - Kullback-Leibler divergence
M
Zhou
Trang 193 Mô hình khuyến nghị EgoRec
Trang 203 Mô hình khuyến nghị EgoRec
Trang 214 Thực nghiệm và đánh giá
Thông tin cơ bản:
- Cấu hình thực nghiệm:
• Intel® Core™ i3 CPU M350 @ 2.27GHz 2.27GHz, 2GB RAM
• Intel® Core™ 2 Duo CPU E7300 @ 2.66GHz 2.67GHz, 2GB RAM
• Intel® Core™ 2 Duo CPU T5850 @ 2.16GHz 2.17GHz, 2GB RAM
- Bộ dữ liệu: MovieLen (cung cấp bởi GroupLen) và dữ liệu thu thập.
- Phương pháp thực nghiệm: tự xây dựng module xử lý và đánh giá
bằng PHP trên nền tảng Web
- Mô hình thực nghiệm:
Trang 22Kết quả
10
𝐺 𝑛 −1
9
Đánh giá
RT
Trang 244 Thực nghiệm và đánh giá
Thông tin bộ dữ liệu MovieLen
Số lượng
Số Tag được thiết lập (tas)
(Số bộ [user, movie, tag]
trong bảng dữ liệu tag)
Trang 284 Thực nghiệm và đánh giá
Thông tin bộ dữ liệu thu thập thực tế
Số lượng
Số Tag được thiết lập (tas)
(Số bộ [user, location, tag]
trong bảng dữ liệu tag)
200
Số User_Location được tag (user_location)
(Số bộ [user, location] trong bảng dữ liệu tag)
Trang 29Dự đoán bằng MMBCF 80 82.4%
Dự đoán bằng EgoRec 93 95.8%
13.4%
Trang 315 Kết luận
Phát triển ekit framework – Easy Toolkit.
Đề xuất mô hình khuyến nghị EgoRec (R x C x T)
Phiên bản thử nghiệm MXH định vị Egobile.
1 paper tại Hội nghị Quốc Tế iiWAS (ACM Indexed)
Hung Q Tao, V L Y N., Hieu M Nguyen, Viet H Huynh, Tuan A Nguyen
(2011) “Egobile: Where Social Networks Go Mobile” The 13th International
Conference on Information Integration and Web-based Applications & Services (iiWAS): 408-411 (05/12/2011).
Trang 32Hướng phát triển
Trang 336 Hiện thực – Demo
Trang 34Thống kê đề tài
Trang 35www.egobile.com – Everything Goes On Mobile
Thank You!
Trang 36Q&A: Mô hình chuẩn hóa Movielen
Movie (movie, genre)
Trang 37Q&A: Độ thưa dữ liệu tag
Bảng dữ liệu Movielen gốc bộ dữ liệu nhỏ Trung bình 10 kết hợp movie Chia nhỏ + Chia nhỏ + kết hợp movie và user
Độ thưa Giảm 10.32 lần Giảm 36.61 lần Giảm 84.34 lần
Bảng kết quả giảm độ thưa dữ liệu gán nhãn
Trang 38Q&A: Độ thưa dữ liệu tag
Số lượng
Số Tag được thiết lập (tas)
(Số bộ [user, movie, tag]
trong bảng dữ liệu tag)
Trang 39Q&A: Độ thưa dữ liệu tag
𝑢𝑠𝑒𝑟 𝑚𝑜𝑣𝑖𝑒= 22=1
Tag’
A E C D
𝑎𝑣𝑔𝑡𝑎𝑔 ′= 𝑡𝑎𝑠 𝑡𝑎𝑔= 4 4 =1
𝑠𝑝𝑎𝑟𝑠𝑒𝑡𝑎𝑔 ′= 𝑢𝑠𝑒𝑟 1
Trang 40Q&A: Độ thưa dữ liệu tag
Bảng dữ liệu Movielen gốc bộ dữ liệu nhỏ Trung bình 10 kết hợp movie Chia nhỏ + Chia nhỏ + kết hợp movie và user
Độ thưa Giảm 10.32 lần Giảm 36.61 lần Giảm 84.34 lần
Bảng kết quả giảm độ thưa dữ liệu gán nhãn
Trang 41Q&A: Tìm kiếm cấu trúc…
Các cách phân nhóm:
Cách 1: (a, b) (c, d) (e, f, g)Cách 2: (a, b, c, d) (e, f, g)Cách n: …
?
Rút ngắn chi phí tìm cách phân nhóm
?
Tìm được cách phân nhóm tốt nhất
Trang 42Q&A: Tìm kiếm cấu trúc…
Các cách phân nhóm:
Cách 1: (a, b) (c, d) (e, f, g)Cách 2: (a, b, c, d) (e, f, g)Cách n: …
Trang 43Q&A: Tìm kiếm cấu trúc…
Trang 44Q&A: Tìm kiếm cấu trúc…
! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness
Tính trọng số đỉnh và cạnh
Trang 45Q&A: Tìm kiếm cấu trúc…
! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness
Trang 46Q&A: Tìm kiếm cấu trúc…
! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness
a
Trang 47Q&A: Tìm kiếm cấu trúc…
! Rút ngắn chi phí tìm nhóm Shortest Path Betweeness