Lê Anh Cường Năm bảo vệ: 2010 Abstract: Trình bày tổng quan về hệ tư vấn với các chức năng và nhiệm vụ của một hệ tư vấn trong thương mại điện tử.. Trình bày ba phương pháp tiếp cận tư
Trang 1Lưu Ngọc Tuấn
Trường Đại học Công nghệ Luận văn ThS Chuyên ngành: Công nghệ thông tin; Mã số: 60 48 05
Người hướng dẫn: TS Lê Anh Cường
Năm bảo vệ: 2010
Abstract: Trình bày tổng quan về hệ tư vấn với các chức năng và nhiệm vụ của một hệ tư vấn
trong thương mại điện tử Kiến trúc của hệ tư vấn và quá trình xây dựng một hệ tư vấn hoàn chỉnh Mô hình hóa bài toán tư vấn chuyển từ những yêu cầu thực tế thành bài toán khai phá và
xử lý dữ liệu trong lĩnh vực công nghệ thông tin Trình bày ba phương pháp tiếp cận tư vấn để xây dựng và mở rộng hệ tư vấn Đồng thời đưa ra những hạn chế còn tồn tại trong các phương pháp Kết hợp nghiên cứu hai kỹ thuật chính là đánh giá dựa hàm kinh nghiệm và đánh giá dựa
mô hình để giải quyết bài toán hệ tư vấn Khảo sát bộ dữ liệu chuẩn và thực hiện xây dựng chương trình thực nghiệm Kết quả thực nghiệm được so sánh và đánh giá giữa các phương pháp
tư vấn cũng như giữa các mô hình phân lớp
Keywords: Phần mềm; Thương mại điện tử; Công nghệ thông tin; Tư vấn
Trang 2MỞ ĐẦU
Ngày nay cùng với sự phát tiển không ngừng của hệ thống mạng toàn cầu Internet, các khách hàng của các hệ thống thông tin đặc biệt là của các website thương mại điện tử từng bước làm quen và sử dụng thường xuyên các giao dịch điện tử trong nhiều lĩnh vực như: chứng khoán, bảo hiểm, tài chính, ngân hàng, công nghệ, viễn thông,… Tuy nhiên, với khối lượng thông tin khổng lồ, các khách hàng thường gặp khó khăn trong việc tìm kiếm và lựa chọn thông tin cần thiết và phù hợp để giải quyết những vấn đề nhất định Ví dụ như khách hàng muốn gửi tiền vào ngân hàng nhưng không biết phải lựa chọn sản phẩm nào của ngân hàng nào cho phù hợp, khách hàng nên lựa chọn một sản phẩm tiền gửi được bảo hiểm hay không, có chính sách khuyến khích nào của ngân hàng hay không? Lợi ích và rủi ro có thể gặp phải là gì và đâu là sản phẩm tốt nhất với khách hàng? Khách hàng có quá nhiều sự lựa chọn nhưng không đủ thời gian hoặc tri thức để đánh giá sản phẩm nào là phù hợp và không thể đưa ra các quyết định tối ưu
Mặt khác, từ phía các nhà cung cấp sản phẩm, các công ty doanh nghiệp hiện nay luôn mong muốn những sản phẩm tốt nhất của mình đến được với khách hàng Làm thế nào có thể hỗ trợ khách hàng trong việc lựa chọn sản phẩm trong khi khách hàng luôn có sự so sánh đánh giá giữa các sản phẩm để có quyết định lựa chọn tốt nhất Và khi khách hàng đã mua hoặc đã quan tâm tới một sản phẩm nào đó thì cần giới thiệu tới khách hàng những sản phẩm nào khác, cần phải đề xuất tới khách hàng bao nhiêu sản phẩm là hợp lý Các nhà cung cấp hết sức quan tâm tới quá trình giới thiệu các sản phẩm mới, những sản phẩm này sẽ phù hợp với những đối tượng khách hàng nào khi mà sản phẩm chưa có những đánh giá từ khách hàng,…
Xuất phát từ những vấn đề còn hạn chế trong quá trình tương tác giữa khách hàng với các sản phẩm của doanh nghiệp trong thương mại điện tử, hệ tư vấn được hình thành và phát triển để hỗ trợ tốt hơn cho khách hàng và các doanh nghiệp có những quyết định tốt nhất Các website với hệ thống giao dịch điện tử cần thiết có một hệ thống tư vấn tốt sẽ giúp thu được lợi nhuận không nhỏ Bởi
vì khi đó, khách hàng có thể tìm thấy ngay những sản phẩm mà họ ưa thích và
họ sẽ có xu hướng mua Ngược lại, nếu họ không tìm thấy được những sản phẩm họ quan tâm họ không những không mua mà có thể sẽ rời bỏ và tìm đến những nơi cung cấp dịch vụ tốt hơn
Trang 3Hệ thống tư vấn đã trở thành một lĩnh vực nghiên cứu quan trọng xuất phát từ các công trình nghiên cứu đầu tiên trong việc xây dựng các hệ thống lọc cộng tác Sự phát triển đồng thời từ những ứng dụng mang tính thực tiễn và những nghiên cứu mang tính khoa học đã đưa hệ tư vấn trợ thành một lĩnh vực quan trọng trong việc hỗ trợ con người trong quá trình khai thác thông tin Trong những năm gần đây, hệ tư vấn đã không ngừng phát triển và được hoàn thiện, tuy nhiên trong tương lai vẫn đòi hỏi có những cải thiện để đưa ra những phương pháp hiệu tư vấn hiệu quả hơn và được áp dựng nhiều hơn trong các ứng dụng thực tế Việc cải tiến bao gồm những phương pháp tốt hơn để xác định những hành vi của khách hàng, thông tin về sản phẩm cho khách hàng về những sản phẩm cần tư vấn, đưa ra nhiều hơn những phương pháp để thuận lợi hơn trong việc tư vấn, và có những chỉ số để có thể đánh giá hiệu năng của các hệ tư vấn
Với những nghiên cứu và tìm hiểu về hệ hỗ trợ tư vấn, luận văn được hoàn thành với các mục đích và nhiệm vụ chính như sau:
Trình bày tổng quan về hệ tư vấn với các chức năng và nhiệm vụ của một hệ
tư vấn trong thương mại điện tử Kiến trúc của hệ tư vấn và quá trình xây dựng một hệ tư vấn hoàn chỉnh
Mô hình hóa bài toán tư vấn chuyển từ những yêu cầu thực tế thành bài toán khai phá và xử lý dữ liệu trong lĩnh vực công nghệ thông tin
Trình bày ba phương pháp tiếp cận tư vấn để xây dựng và mở rộng hệ tư vấn Đồng thời đưa ra những hạn chế còn tồn tại trong các phương pháp Kết hợp nghiên cứu hai kỹ thuật chính là đánh giá dựa hàm kinh nghiệm và đánh giá dựa mô hình để giải quyết bài toán hệ tư vấn
Khảo sát bộ dữ liệu chuẩn và thực hiện xây dựng chương trình thực nghiệm Kết quả thực nghiệm được so sánh và đánh giá giữa các phương pháp tư vấn cũng như giữa các mô hình phân lớp
Nội dung của luận văn được thiết kế thành 04 chương:
Chương 1 Tổng quan về hệ tư vấn: Giới thiệu khái quát về một hệ thống
hỗ trợ tư vấn với các chức năng chính của hệ tư vấn Trình bày các nội dung cơ bản về kiến trúc và mô hình hóa bài toán tư vấn trong thương mại điện tử
Chương 2 Các phương pháp tư vấn: Trình bày các phương pháp tiếp cận
để xây dựng hệ tư vấn với 3 phương pháp chính là tư vấn dựa nội dung, tư vấn dựa cộng tác và phương pháp lai Đưa ra các ưu điểm và hạn chế của từng phương pháp
Trang 4Chương 3 Các mơ hình học máy: Giới thiệu về hai mơ hình học máy là
mơ hình phân lớp Nạve Bayes và mơ hình phân lớp Máy hỗ trợ vector (SVM -
Support Vector Machines)
Chương 4 Kết quả thực nghiệm và đánh giá: Chuẩn hĩa dữ liệu từ bộ dữ
liệu của MovieLens Xây dựng thử nghiệm với mơ hình phân lớp Nạve Bayes
và thử nghiệm với mơ hình phân lớp máy hỗ trợ vector thực hiện bằng Weka
trên bộ dữ liệu chuẩn với ba phương pháp tư vấn So sánh và đánh giá các kết
quả đạt được
Phần kết luận và hướng phát triển tổng kết nội dung chính của luận
văn, các vấn đề cịn tồn tại và hướng phát triển tiếp theo của để tài
Trang 5TÀI LIỆU THAM KHẢO
Tiếng Anh
1 ACM Homepage http://recsys.acm.org/2010
2 Amazon home page http://www.amazon.com/
3 Andreas Mild and Martin Natter “Collaborative filtering or regression models for internet recommendation system?” Journal of Targeting,
Measurement and Analysis for Marketing, 2002,Vol 10, Nr 4, pp 304-313
4 Balabanovic, M and Y Shoham “Fab: Content-based, collaborative recommendation” Communications of the ACM, p66-72, 1997
5 Basu, C., H Hirsh, and W Cohen “Recommendation as classification: Using social and content-based information in recommendation” In
Recommender Systems Papers from 1998 Workshop Technical Report
WS-98-08 AAAI Press, 1998
6 Bernhard S., Isabelle G., Jason W., Statistical Learning and Kernel Methods
in Bioinformatics, 2003
7 Billsus, D and M Pazzani “Learning collaborative information filters” In
International Conference on Machine Learning, Morgan Kaufmann Publishers,
1998
8 Breese, J S., D Heckerman, and C Kadie “Empirical analysis of predictive algorithms for collaborative filtering” In Proceedings of the Fourteenth
Conference on Uncertainty in Artificial Intelligence, Madison, WI, 1998
9 Chien, Y-H and E I George “A bayesian model for collaborative filtering”
In Proc of the 7th International Workshop on Artificial Intelligence and Statistics, 1999
10 Chihiro Ono, Yoichi Motomura, Hideki Asoh, “A Study of Probabilistic Models for Integrating Collaborative and Content-based Recommendation,”
p162-168, Multidisciplinary IJCAI-05 Workshop on Advances in Preference Handling Ronen Brafman and Ulrich Junker (organizers) July 31 - August 1,
2005 Edinburgh, Scotland
Trang 611 Claypool, M., A Gokhale, T Miranda, P Murnikov, D Netes, and M
Sartin “Combining content-based and collaborative filters in an online newspaper” In ACM SIGIR'99 Workshop on Recommender Systems:
Algorithms and Evaluation, August 1999
12 D Pavlov, E Manavoglu, D Pennock, and C Giles “Collaborative filtering with maximum entropy” IEEE Intelligent Systems, Special Issue on Mining the
Web Actionable Knowledge, 2004
13 G.Adomavicius, A.Tuzhilin Towards the Next Generation of Recommender Systems:A Survey of the State-of-the-Art and Possible Extensions, IEEE
Transactions on Knowledge and Data Engineering, 2005
A4 Grouplens home page http://www.grouplens.org
14 IMDB home page http://www.imdb.com/
15 Janusz Sobecki, “Implementations of Web-based Recommender Systems Using Hybrid Methods”, International Journal of Computer Science &
Applications Vol 3 Issue 3, pp 52-64
16 J Salter and N Antonopoulos, “CinemaScreen recommender agent: Combining collaborative and content-based filtering,” IEEE Intell Syst.,vol 21,
no 1, pp 35–41, Jan./Feb 2006
17 J.Wang, A Vries, and M Reinders, “Unifying user-based and item-based collaborative filtering approaches by similarity fusion,” in Proc SIGIR Conf.,
2006, pp 501–508
18 Library for Support Vector Machines home page:
http://www.csie.ntu.edu.tw/~cjlin/libsvm/
19 Linden, G., B Smith, and J York “Amazon.com Recommendations: Item-to-Item Collaborative Filtering” IEEE Internet Computing, Jan-Feb/ 2003
20 Mark van Setten, Mettina Veenstra, Anton Nijholt, Betsy van Dijk “Case-Based Reasoning as a Prediction Strategy for Hybrid Recommender Systems”
21 Mooney, R J., P N Bennett, and L Roy “Book recommending using text categorization with extracted information” In Recommender Systems Papers
from 1998 Workshop Technical Report WS-98-08 AAAI Press, 1998
Trang 722 MovieLens home page http://movielens.umn.edu
23 M.Vozalis, K.G.Margaritis, “Collaborative filtering enhanced by demographic correlation,” in: Proceedings of the AIAI Symposium on
Professional Practice in AI, Part of the 18th World Computer Congress, Toulouse, France, 2004, pp 393-402
24 Pazzani, M A framework for collaborative, content-based and demographic filtering Artificial Intelligence Review, pages 393-408, December 1999
25 Pazzani M., & Billsus, D (1997) “Learning and Revising User Profiles: The identification of interesting web sites” Machine Learning 27, p313-331
26 P Li, S Yamada, “A movie recommender system based on inductive learning,” in: Proceedings of the IEEE Conference on Cybernetics and
Intelligent Systems, vol 1, December 2004, pp 318-323
27 Prem Melville, R Mooney, and R.Nagarajan “Content-boosted collaborative filtering” Proceedings of the SIGIR-2001 Workshop on
Recommender Systems, New Orleans, LA, September 2001
28 P.Resnick, N Iakovou, M Sushak, P Bergstrom, and J Riedl,“GroupLens:
An Open Architecture for Collaborative Filtering of Netnews” Proc 1994
Computer Supported Cooperative Work Conf.,1994
29 Rickard Coster “The Architecture and Implementation of a System for Collaborative and Content-based Filtering”,November 28, 2002
30 Si, L and R Jin Flexible Mixture Model for Collaborative Filtering In
Proceedings of the 20th International Conference on Machine learning,Washington, D.C., August 2003
31 Soboroff, I and C Nicholas “Combining content and collaboration in text filtering” In 43 IJCAI'99 Workshop: Machine Learning for Information
Filtering, August 1999
32 Support Vector Machines (SVMs) home page http://www.svms.org/survey/
33 Ungar, L H., and D P Foster “Clustering methods for collaborative filtering” In Recommender Systems Papers from 1998 Workshop Technical
Report WS-98-08 AAAI Press, 1998
Trang 834 U Shardanand and P Maes, “Social Information Filtering: Algorithms for Automating „Word of Mouth‟” Proc Conf Human Factors in Computing
Systems, 1995
35 X Jin, Y Zhou, and B Mobasher, “A maximum entropy web recommendation system: Combining collaborative and content features,” in
Proc ACM SIGKDD Conf., 2005, pp 612–617
36 Van Setten, M (2002) Experiments with a recommendation technique that learns category interests Proceedings of IADIS WWW/Internet 2002, Lisbon,
Portugal, pp 722-725
37 Wendy Kogel “Faster Training of Neural Networks for Recommender Systems” Worcester Polytechnic Institue , May 2002
38 Weka homepage http://www.cs.waikato.ac.nz/ml/weka/
39 Wikipedia homepage http://en.wikipedia.org