Một vài ứng dụng thực tế phổ biến như: gợi ý kết bạn trên facebook, tư vấn video trên Youtube.com, hệ gợi ý sản phẩm của Amazon.com … Đặc biệt, theo Jiliang Tang và cộng sự 2014, với sự
Trang 1KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
HÀ NỘI - 2016
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
Đỗ Thành Long
MỘT SỐ KỸ THUẬT TƯ VẤN XÃ HỘI HƯỚNG
ĐỊA ĐIỂM VÀ ỨNG DỤNG
KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC HỆ CHÍNH QUY
Ngành: Công nghệ thông tin
Cán bộ hướng dẫn: PGS TS Hà Quang Thụy
Cán bộ đồng hướng dẫn: ThS Trần Mai Vũ
HÀ NỘI - 2016
Trang 3VIETNAM NATIONAL UNIVERSITY UNIVERSITY OF ENGINEERING AND TECHNOLOGY
Trang 4i
LỜI CẢM ƠN
Trước tiên, em xin bày tỏ lòng biết ơn chân thành và sâu sắc nhất tới Thầy giáo, PGS-TS Hà Quang Thụy đã tận tình chỉ bảo, hướng dẫn, động viên và giúp đỡ em trong suốt quá trình thực hiện đề tài
Em xin gửi lời cảm ơn sâu sắc tới quý thầy cô giáo trong Khoa Công nghệ thông tin nói riêng và trong trường Đại học Công nghệ - Đại học Quốc Gia Hà Nội nói chung, đã truyền đạt kiến thức quý báu cho em trong những năm học đại học
Em cũng xin được gửi lời cảm ơn tới Ths Trần Mai Vũ, các anh chị và các bạn sinh viên trong phòng thí nghiệm Công nghệ tri thức và khoa học dữ liệu KT-Lab đã giúp em rất để hoàn thành tốt khóa luận
Em muốn gửi lời cảm vô hạn tới gia đình, những người thân yêu luôn bên cạnh
và động viên em trong suốt quá trình thực hiện khóa luận tốt nghiệp
Cuối cùng, xin gửi lời cảm ơn tới các anh chị và các bạn, đặc biệt là các thành viên lớp K57CLC đã ủng hộ, giúp đỡ trong suốt quá trình tôi học tập trên giảng đường đại học và thực hiện đề tài
Tôi xin chân thành cảm ơn!
Trang 5ii
TÓM TẮT
Tóm tắt: Trong những năm gần đây, hệ tư vấn đã trở nên cực kì phổ biến và được ứng dụng
trong rất nhiều lĩnh vực, ứng dụng mà có thể giúp đưa ra những nội dung, lời khuyên phù hợp cho từng cá nhân Một vài ứng dụng thực tế phổ biến như: gợi ý kết bạn trên facebook, tư vấn video trên Youtube.com, hệ gợi ý sản phẩm của Amazon.com … Đặc biệt, theo Jiliang Tang
và cộng sự (2014), với sự bùng nổ của các phương tiện xã hội như hiện nay, tư vấn xã hội hướng địa điểm được hình thành và phát triển nhanh chóng dựa trên việc khai thác thông tin đặc trưng bổ sung từ mạng xã hội cho hệ tư vấn
Khóa luận này tập trung vào bài toán tư vấn địa điểm dựa trên phương tiện xã hội và hướng giải quyết, dựa vào các kết quả nghiên cứu của Mao Ye và cộng sự (2011) Khóa luận
đề xuất một mô hình tư vấn địa điểm dựa trên khai thác ngữ cảnh xã hội từ phương tiện xã hội Brightkite, trong đó sử dụng độ tương đồng Cosin và sử dụng mối quan hệ tin cậy trong lọc cộng tác dựa trên người dùng để đưa ra đánh giá địa điểm cho 830 người dùng Khóa luận cũng xây một chương trình thi hành mô hình nói trên
Từ khóa: hệ tư vấn, phương tiện xã hội, tư vấn địa điểm
Trang 6iii
ABSTRACT
Abstract: In the recent years, recommender system has become popular and applied in many
fields which recommend reasonable content and advises to each particular Some of popular application sofwares such as: add friend suggestion on facebook, video consulting on youtube, product suggestion system on Amazon.com… Especially, According to Juliang Tang and his partners, when social network has been more popular recently, social consulting will rapidly develop based on exploiting featured information added from social network for recommender system
My graduation thesis focuses on consulting place based on social social network and solution for problem based on research of Mao Ye and his partners This thesis recommends type of consulting place based on exploiting social context from social network Brightkite in which Cosin commonality and reliable relationship based on users are applied to give place evaluation to users This thesis will also build programme for implementing this model
Trang 7iv
LỜI CAM ĐOAN
Tôi xin cam đoan các kỹ thuật sử dụng ngữ cảnh xã hội trong hệ tư vấn trên phương tiện xã hội được trình bày trong khóa luận này do tôi thực hiện dưới sự hướng dẫn của PGS.TS Hà Quang Thụy
Tất cả những tham khảo từ các nghiên cứu liên quan đều được nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo trong khóa luận Trong khóa luận, không có việc sao chép tài liệu, công trình nghiên cứu của người khác mà không chỉ rõ
về tài liệu tham khảo
Hà Nội, ngày tháng năm 2016
Sinh viên
Trang 8v
Mục lục
LỜI CẢM ƠN i
TÓM TẮT ii
ABSTRACT iii
LỜI CAM ĐOAN iv
Danh sách thuật ngữ và từ viết tắt vii
Danh sách bảng ix
Danh sách hình vẽ x
Mở đầu 1
Chương 1 Tư vấn địa điểm dựa trên mạng xã hội 3
1.1 Hệ tư vấn 3
1.1.1 Giới thiệu chung 3
1.1.2 Phân loại hệ tư vấn 3
1.2 Tư vấn địa điểm dựa trên mạng xã hội 7
1.2.1 Đặt vấn đề 7
1.2.2 Mạng xã hội 9
1.2.3 Tư vấn địa điểm 11
1.2.4 Tích hợp mạng xã hội vào tư vấn địa điểm 12
1.2.5 Các thách thức và cơ hội 13
1.3 Bài toán tư vấn trong khóa luận 13
Tóm tắt chương 1 14
Chương 2 Một số phương pháp tư vấn xã hội hướng địa điểm 15
2.1 Tư vấn địa điểm dựa trên địa lý - xã hội 15
2.2 Tư vấn địa điểm dựa trên thời gian 19
Trang 9vi
2.3 Tư vấn địa điểm dựa trên nội dung 21
2.4 Ý tưởng khai thác ngữ cảnh trong khóa luận 23
Tóm tắt chương 2 24
Chương 3 Một mô hình tư vấn địa điểm dựa trên mạng xã hội dựa trên địa lý - xã hội 25
3.1 Giới thiệu 25
3.2 Mô hình 25
3.2.1 Trích xuất dữ liệu 26
3.2.2 Tính toán đánh giá ban đầu 27
3.2.3 Đưa ra đánh giá người dùng 28
Tóm tắt chương 3 30
Chương 4 Thực nghiệm và đánh giá 31
4.1 Môi trường 32
4.2 Dữ liệu và xử lý 32
4.3 Kết quả thực nghiệm 34
4.4 Đánh giá mô hình 35
Tóm tắt chương 4 36
Kết luận 37
Kết quả đạt được của khóa luận 37
Định hướng tương lai 37
Tài liệu tham khảo 38
Tài liệu tiếng Việt 38
Tài liệu tiếng Anh 38
Trang 10vii
Danh sách thuật ngữ và từ viết tắt
Tiếng Anh/Từ viết tắt Tiếng Việt/Cụm từ đầy đủ
Collaborative Filtering/CF Lọc cộng tác
Cosin (độ tương đồng) Chỉ số thể hiện sự giống nhau về một
phương diện giữa hai người dùng
KNN (k nearest neighbors
algorithm)
Thuật toán dựa trên “k” người dùng gần nhất
Matrix factorization/MF Nhân tử hóa ma trận
Recommendation System |
Recommender System | RS
Hệ gợi ý
Trang 11xã hội
Trang 12ix
Danh sách bảng
Bảng 1.1 Ma trận user-item 3
Bảng 3.1 cấu trúc tệp dữ liệu user-friend 26
Bảng 3.2 Ma trận user-location 29
Bảng 4.1 Cấu hình hệ thống thực nghiệm 32
Bảng 4.2 các công cụ phần mềm được sử dụng 32
Bảng 4.3 Dữ liệu ban đầu 33
Bảng 4.4 Dữ liệu sau khi xử lý 34
Trang 13x
Danh sách hình vẽ
Hình 1.1 Phân loại hệ tư vấn 4
Hình 1.2 Tư vấn dựa trên nội dung 5
Hình 1.3 Tư vấn dựa trên lọc cộng tác 5
Hình 1.4 Lọc cộng tác dựa trên mô hình[9] 7
Hình 1.5 Các loại thông tin trên mạng xã hội[6] 8
Hình 1.6 Kết nối giữa mạng xã hội và thế giới vật lý[6] 9
Hình 1.7 Thống kê sơ bộ các mạng xã hội nổi tiếng[9] 10
Hình 1.8 Sự phát triển của mạng xã hội facebook[9] 10
Hình 1.9 Ví dụ về thông tin xã hội[9] 11
Hình 1.10 Ma trận người dùng – location 11
Hình 1.11 Phân loại tư vấn địa điểm dựa trên mạng xã hội[6] 12
Hình 1.12 Độ mạnh liên kết người dùng và ma trận thông tin user-item[9] 13
Hình 2.1 Độ tin cậy dựa trên bạn bè và khoảng cách[12] 15
Hình 2.2 Các nhóm người dùng theo kết nối xã hội và khoảng cách địa lý [6] 15
Hình 2.3 Hiệu quả thực tế xử lý vấn đề bắt đầu nguội 16
Hình 2.4 Tọa độ của hai người dùng trên hệ tọa độ 17
Hình 2.5 Thời gian biểu của người dùng trong một ngày 19
Hình 2.6 Sự giống nhau giữa hai tập người dùng trong tuần [12] 20
Hình 2.7 Dữ liệu check-in năm địa điểm trong một ngày[13] 20
Hình 2.8 Mô hình tư vấn địa điểm với hiệu ứng thời gian[9] 21
Hình 2.9 Một nội dung tag trên mạng xã hội[9] 21
Hình 2.10 Đánh giá giá trị các nội dung 23
Hình 3.1 Các pha chính trong mô hình 25
Hình 3.2 cấu trúc tệp dữ liệu check-in 26
Hình 3.3 Một mẫu đánh giá ban đầu 28
Hình 3.4 Kết nối bạn bè của người dùng id 0 29
Trang 14xi
Hình 4.1 Project thực hiện mô hình 31
Hình 4.2 kết quả thực nghiệm thu được 34
Hình 4.3 Các địa điểm có đánh giá cao nhất của người dùng id 0 35
Hình 4.4 Kết quả đánh giá mô hình bằng công cụ mymedialite 36
Trang 151
Mở đầu
Trong những năm gần đây, các phương tiện xã hội đã có sự bùng nổ mạnh mẽ Một số mạng xã hội nổi tiếng có thể kể tới như Facebook (Theo số liệu thống kê1, đến cuối tháng 11/2015 đã có hơn một tỷ năm trăm triệu người dùng mỗi tháng và hơn một
tỷ người dùng thường xuyên mỗi ngày) hay WhatsApp (có khoảng chín trăm triệu người dùng thường xuyên mỗi tháng) Với số lượng người dùng lớn như vậy thì lượng thông tin mà chúng mang lại góp phần không nhỏ làm giàu nguồn tài nguyên cho khai phá dữ liệu nói chung và hệ tư vấn nói riêng Nhưng ở một khía cạnh khác, lượng thông tin này lại rất phong phú và đa dạng về chủng loại, lĩnh vực; trong khi các hệ tư vấn thường chỉ tập trung vào một số lĩnh vực hẹp, vì vậy để có được những hệ tư vấn cho mọi lĩnh vực là điều không thể
Trong quá trình phát triển của mạng xã hội, địa điểm dựa trên mạng xã hội (LBSNs) đã có những bước đi nhanh chóng và ngày càng thu hút được nhiều người dùng Việc áp dụng thông tin địa điểm vào hệ tư vấn mang lại rất nhiều tiềm năng và
cơ hội
Ví dụ, một người muốn đi du lịch nhưng anh ta chưa biết chọn địa điểm nào Anh
ta lên “Google.com” để tìm kiếm và số lượng kết quả trả về khoảng mười lăm triệu trong khi anh ta chỉ cần một vài lựa chọn Lúc này một lời gợi ý là cần thiết cho vị khách du lịch Để làm được điều này, hệ tư vấn hoàn toàn có thể khai thác những thông tin, kết nối trên các phương tiện xã hội có liên quan tới anh ta để đưa ra được những lời khuyên sao cho phù hợp nhất Đây là một trong những ví dụ điển hình trong việc khai thác thông tin phương tiện xã hội để áp dụng vào hệ tư vấn
Theo phương pháp tiếp cận của Mao Ye và cộng sự [7], việc chọn ra các địa điểm phù hợp có thể dựa trên chính đánh giá từ bạn bè của người dùng bởi vì những người có kết nối với nhau thì thường có nhiều điểm chung hơn Vì vậy, khóa luận hướng tới xây dựng một hệ tư vấn địa điểm cho người dùng dựa trên các phương tiện
xã hội Các gợi ý được đưa ra dựa trên phương pháp lọc cộng tác dựa trên người dùng với độ đo tương đồng Cosin Sau đó sử dụng thuật toán KNN (k-nearest neighbors) để đưa ra đánh giá cuối cùng [7]
Nội dung của khóa luận được chia thành các chương như sau:
1 http://investor.fb.com
Trang 162
Chương 1: Tổng quan hệ tư vấn và mạng xã hội: Khóa luận giới thiệu khái quát
về hệ tư vấn truyền thống và tư vấn xã hội, các phương pháp giải quyết bài toán tư vấn truyền thống Ngoài ra, chương này cũng khái quát về sự phát triển mạnh mẽ của phương tiện xã hội và tiềm năng khai thác để sử dụng vào hệ tư vấn địa điểm trên phương tiện xã hội
Chương 2: Các phương pháp tư vấn địa điểm: Khóa luận trình bày các phương
pháp tư vấn địa điểm Đề cập đến giải pháp tư vấn địa điểm dựa trên vị trí-xã hội
Chương 3: Mô hình dựa trên lọc cộng tác: Khóa luận trình bày về tư tưởng
chính của mô hình đề xuất cho bài toán tư vấn địa điểm dựa trên phương tiện xã hội Đồng thời, khóa luận giới thiệu chi tiết các bước thực hiện trong mô hình với dữ liệu là tập hợp các kết nối của người dùng và dữ liệu về vị trí người dùng từ Brightkite
Chương 4: Thực nghiệm và đánh giá: Khóa luận trình bày một số thực nghiệm
việc đưa ra tư vấn địa điểm người dùng và đánh giá
Phần kết luận: Tổng kết các kết quả đạt được, các vấn đề còn tồn tại và định
hướng phát triển tương lai
Trang 173
Chương 1 Tư vấn địa điểm dựa trên mạng xã hội
1.1 Hệ tư vấn
1.1.1 Giới thiệu chung
Hệ tư vấn (recommender system hay recommendation system) là một phân lớp của hệ thống lọc thông tin dùng để dự đoán đánh giá hay sở thích của một người dùng
về các mục[10] Từ đó chúng ta có thể đưa ra những tư vấn, gợi ý sao cho phù hợp với yêu cầu của từng người dùng Một vài ví dụ điển hình như: gợi ý kết bạn trên facebook, gợi ý video trên youtube, gợi ý mua sắm của Amazon…
Thông thường, trong một hệ tư vấn sẽ bao gồm tập người dùng U={u1,u2,…,un}
và tập mục I={i1, i2,…im} với n là số lượng người dùng và m là số lượng mục Mỗi người dùng ui sẽ đánh giá một số lượng nhất định các sản phẩm ij và toàn bộ đánh giá của tất cả người dùng sẽ được biểu diễn bằng ma trận Rnxm Nhưng mà trận này thường rất thưa do người dùng chỉ quan tâm đến những mục mà mình quan tâm hoặc nhiều người dùng không có thói quen đánh giá Vì vậy, nhiệm vụ của hệ tư vấn ở đây đó chính là dự đoán những phần từ rij còn thiếu trong ma trận Rnxm
Bảng 1.1 Ma trận user-item 1.1.2 Phân loại hệ tư vấn
Theo sự nghiên cứu và tổng hợp của Guandong Xu và cộng sự[10], ta có thể phân loại các hệ tư vấn thành 3 nhóm:
● Hệ tư vấn dựa trên nội dung (content-based RS): dự đoán đánh giá một mục dựa trên những đánh giá của người dùng về các mục trong quá khứ
● Hệ tư vấn dựa trên lọc cộng tác (collaborative filtering-based RS): dự đoán đánh giá của một người dùng dựa trên những đánh người dùng khác
Trang 184
● Lai (Hybrid): kết hợp hai phương pháp trên
Hình 1.1 Phân loại hệ tư vấn
1.1.2.1 Hệ tƣ vấn dựa trên nội dung
Nguồn gốc của phương pháp này là từ truy hồi thông tin (information retrieval)
và lọc thông tin (information filtering) Phương pháp này dựa trên những đánh giá của người dùng về các mục trong quá khứ, rồi từ đó đưa ra gợi ý những sản phẩm tương tự cho chính người dùng đó
Ví dụ khi một người dùng mua sách trực tuyến trên một trang mạng, để đưa ra gợi ý một vài cuốn sách cho người dùng, hệ tư vấn sách của trang mạng sẽ phân tích những đặc điểm của những cuốn sách mà trước đó người dùng từng mua hoặc đánh giá cao, sau đó tính toán độ tương đồng và chỉ đưa ra gợi ý những cuốn sách có độ tương đồng cao với những cuốn sách ban đầu
Trang 19Hình 1.3 Tư vấn dựa trên lọc cộng tác
Lọc cộng tác có thể chia ra làm 2 loại:
Thuật toán lọc cộng tác dựa trên kinh nghiệm sử dụng toàn bộ hoặc một phần của
ma trận user-item để đưa ra một dự đoán Người dùng sẽ được chia thành các nhóm
Trang 20o ̅là trung bình đánh giá của người dùng x
Lọc cộng tác dựa trên kinh nghiệm lại được chia ra làm hai loại:
● Theo người dùng: chúng ta sẽ dự đoán hạng của người dùng x cho mục
i bằng cách tìm k người hàng xóm gần nhất của x ( kNN) và tính trung bình
đánh giá mục i của những người này:
̅ ∑ ( )∑ ( )( ( ) ̅ )
với sản phẩm đang được đánh giá:
̅ ∑ ( )∑ ( )( ( ) ̅ )
Phương pháp này đưa ra những dự đoán đánh giá dựa trên một mô hình được xây dựng từ kĩ thuật học máy và khai phá dữ liệu trên tập dữ liệu huấn luyện[5] Để xây dựng mô hình, một loạt các thuật toán học máy thống kê có thể được sử dụng cho việc huấn luyện tập dữ liệu mẫu, ví dụ như mô hình Bayesian, mạng nơtron, mô hình phân cụm CF, nhân tử hóa ma trận (matrix factorization)… Trong đó thuật toán nhân tử hóa
Trang 217
ma trận được coi là tốt nhất và áp dụng rộng rãi để xây dựng hệ tư vấn [9]
Thay vì lưu cả ma trận người dùng - mục thì phương pháp lọc cộng tác dựa trên
mô hình chỉ lưu các tham số Sau đó các tham số này được đưa vào mô hình đã xây dựng để đưa ra những dự đoán[9]
Hình 1.4 Lọc cộng tác dựa trên mô hình[9]
Ma trận người dùng – mục ban đầu sẽ được tách thành hai ma trận là U và I tương ứng với người dùng và mục Kết quả dự đoán đánh giá sẽ được tổng hợp từ phép nhân ma trận R = UV với V là ma trận chuyển vị của I
1.1.2.3 Hệ tƣ vấn lai
Để hệ tư vấn có thể dự đoán kết quả tốt hơn, ta có thể kết hợp hai phương pháp nêu ở trên Theo Jiliang Tang và cộng sự[9], có ba cách kết hợp chính:
● Cài đặt riêng rẽ sau đó kết hợp
● Tích hợp phương pháp dựa trên nội dung vào phương pháp lọc cộng tác
● Tích hợp phương pháp lọc cộng tác vào phương pháp dựa trên nội dung
1.2 Tƣ vấn địa điểm dựa trên mạng xã hội
1.2.1 Đặt vấn đề
Các phương tiện xã hội đem lại cho chúng ta một lượng thông tin khổng lồ và vô cùng đa dạng Ở nơi mà tất cả người dùng đều có thể kết nối với nhau một cách dễ dàng này, chúng ta có thể tải lên các tệp hình ảnh, âm thanh, video hay các dòng trạng thái
Trang 228
Hình 1.5 Các loại thông tin trên mạng xã hội[6]
Đặc biệt với sự phát triển nhanh chóng của các thiết bị định vị, nền tảng Web 2.0
và các thiết bị điện thoại, ngoài những loại thông tin cơ bản được chia sẻ thì hiện nay người dùng mạng xã hội còn chia sẻ một loại thông tin khác đó là vị trí Hàng ngày người dùng mạng xã hội chia sẻ về vị trí hiện tại của mình, những địa điểm đã ghé thăm hay hành trình của họ trên mạng xã hội Theo những báo cáo từ Pew Internet và American Life Project[6], số lượng người trưởng thành ở Mỹ sử dụng điện thoại thông minh đã tăng từ 35% năm 2011 lên 46% năm 2012 Trong số đó, khoảng 74% những người sử dụng điện thoại thông minh để cập nhật thông tin vị trí trong thời gian thực
để lấy chỉ dẫn đường hoặc nhận gợi ý từ máy chủ Đồng thời, có khoảng 18% người dùng check-in các địa điểm để chia sẻ chúng với bạn bè của mình Sự phát triển nhanh chóng của địa điểm dựa trên các phương tiện xã hội (LBSN) mang lại cho chúng ta một lượng dữ liệu khổng lồ, bao gồm cả các mối quan hệ bạn bè của người dùng, cho thấy được những cơ hội và thách thức cho hệ tư vấn địa điểm[6]
Trang 239
Hình 1.6 Kết nối giữa mạng xã hội và thế giới vật lý[6]
Nhiệm vụ của chúng ta đó là cần đưa những thông tin vị trí từ mạng xã hội ảo ra ứng dụng cho thế giới thật, tạo cầu nối giữa thế giới vật lý và mạng xã hội [6] Ví dụ, một người dùng sử dụng một chiếc điện thoại có thể đẩy lên mạng xã hội thông tin về
vị trí hiện tại, những bình luận về một nhà hàng để những người sử dụng khác có thể đọc những bình luận khi tới địa điểm này hoặc địa điểm gần đó Ở đây việc chia sẻ thông tin trên thế giới ảo đã có tác động ra bên ngoài thế giới thực Và xa hơn, chúng
ta hoàn toàn có thể sử dụng những thông tin này để đưa ra gợi ý, đánh giá cho những người dùng có cùng sở thích
1.2.2 Mạng xã hội
Mạng xã hội, hay gọi là mạng xã hội ảo (social network) là dịch vụ kết nối các thành viên cùng sở thích trên Internet lại với nhau với nhiều mục đích khác nhau không phân biệt không gian và thời gian[16] Một số chức năng chính của mạng xã hội như chat, e-mail, phim ảnh, voice chat, video chat, chia sẻ tệp, blog, xã luận…
Ngày nay, với sự phát triển của các thiết bị công nghệ, số lượng thành viên tham gia vào mạng xã hội tăng lên một cách nhanh chóng Ví dụ như mạng xã hội facebook tính tới tháng 11/2015 đã có hơn một tỷ rưỡi người dùng mỗi tháng và hơn một tỷ người dùng thường xuyên mỗi ngày
Trang 2410
Hình 1.7 Thống kê sơ bộ các mạng xã hội nổi tiếng[9]
Hình 1.8 Sự phát triển của mạng xã hội facebook[9]
Với một lượng người dùng khổng lồ và thường xuyên như vậy, mạng xã hội đã tạo ra một xã hội thông tin lớn chưa từng có Việc phân tích nội dung do người dùng tạo ra
và các mối quan hệ trên mạng xã hội sẽ tạo ra những thông tin vô cùng hữu ích cho hệ
tư vấn
Trang 2511
1.2.3 Tƣ vấn địa điểm
Địa điểm là một trong ba loại thông tin được phân loại trên mạng xã hội[9] (bao gồm thông tin xã hội, thông tin nội dung và thông tin địa điểm) Trong đó, thông tin xã hội bao gồm các mối quan hệ trực tiếp giữa người dùng như bạn bè, người thân hay chỉ đơn giản là theo dõi Thông tin nội dung đa dạng hơn, ví dụ như ảnh, video, đánh giá Thông tin địa điểm có thể bao gồm vị trí tọa độ của địa điểm, chi tiết về địa điểm
Hình 1.9 Ví dụ về thông tin xã hội[9]
Hình 1.10 Ma trận người dùng – location
Tư vấn địa điểm cơ bản là đưa ra gợi ý cho người dùng về những địa điểm mà họ
có thể quan tâm Trước đây khi chưa có hệ tư vấn, người ta thường dùng việc dự đoán địa điểm (location prediction) để đưa ra gợi ý Điểm khác biệt chính của tư vấn địa điểm và phương pháp dự đoán địa điểm truyền thống đó là việc dự đoán địa điểm chỉ
có thể đưa ra danh sách các địa điểm đã tồn tại trong lịch sử của người dùng, trong khi
tư vấn địa điểm có thể đưa ra những địa điểm hoàn toàn mới mà người dùng chưa từng tới trước đó[6]
Ví dụ, do thời gian hạn hẹp, một người muốn đi ăn tối với gia đình ở một nhà hàng trong thành phố Cách thứ nhất, đơn giản và nhanh chóng, đó là anh ta sử dụng công cụ tìm kiếm của google.com Sẽ có một hàng dài cả trăm nghìn kết quả và thật khó để lựa chọn cái nào tốt hơn cái nào Cách thứ hai hiệu quả hơn, có một hệ tư vấn dựa trên dữ liệu của gia đình, bạn bè, những người trong thành phố và chính bản thân
Trang 2612
anh ta để đưa ra danh sách những nhà hàng sẽ có khả năng cao nhất anh chàng đó và gia đình sẽ muốn tới Đây là một bài toán phổ biến và điển hình trong tư vấn địa điểm
1.2.3.1 Phân loại tƣ vấn địa điểm
Hình 1.11 Phân loại tư vấn địa điểm dựa trên mạng xã hội[6]
Theo Jiliang Tang và cộng sự [9], tư vấn địa điểm có thể chia làm ba loại dựa trên những đặc điểm của từng loại:
o dựa trên địa lý - xã hội
o dựa trên địa lý - thời gian
o dựa trên địa lý - nội dung
Trong đó tư vấn dựa trên địa lý – xã hội bao gồm hai thuộc tính chính là khoảng cách vật lý thật (Geographical Distance) có thể tính toán theo kinh vĩ độ và kết nối xã hội (Social connections) hay mạng lưới bạn bè của người dùng Tư vấn dựa trên địa lý – thời gian cũng bao gồm hai thuộc tính là: thói quen của người dùng trong một ngày (ví dụ ăn trưa vào 12 giờ ) và thói quen của người dùng một ngày trong tuần (đi xem phim vào cuối tuần ) Còn tư vấn dựa trên địa lý – nội dung là việc khai thác những nội dung mà người dùng đăng tải lên mạng xã hội ví dụ như: tag, comment
1.2.4 Tích hợp mạng xã hội vào tƣ vấn địa điểm
Trong phần lớn các hệ tư vấn, việc dự đoán một đánh giá phụ thuộc khá nhiều vào đánh giá của những người dùng khác Điều quan trọng ở đây đó là tìm ra những nhóm người có cùng quan điểm, sở thích Mạng xã hội cung cấp cho chúng ta một lượng người dùng khổng lồ để có thể khai thác cho vấn đề này Mạng xã hội đồng thời