2. Mục đích nội dung của ĐATN: Xây dựng website cung cấp và gợi ý tin tức dựa trên lịch sử đọc tin của người dùng và cộng đồng, để giúp người dùng tìm đễ dàng tìm thấy tin tức mà họ quan tâm. 3. Các nhiệm vụ cụ thể của ĐATN Tìm hiểu công nghệ: cấu trúc của RSS, cách thu thập tin tức qua RSS Feeds sử dụng Google Feed API, tìm hiểu framwork CakePHP. Tìm hiểu về các phương pháp gợi ý: phương pháp gợi ý dựa trên nội dung và phương pháp gợi ý lọc cộng tác, phương pháp gợi ý lai ghép. Cách thức xây dựng hệ gợi ý. Tìm hiểu mô hình không gian vector và thuật toán tính trọng số của từ TFIDF Đề xuất là phương pháp gợi ý lai ghép (kết hợp giữa phương pháp gợi ý dựa trên nội dung và phương pháp gợi ý lọc cộng tác) cho website đọc tin tức RSS Xây dựng website đọc tin tức RSS với những chức năng chính sau o Thu thập tin tức thông qua nguồn tin RSS o Cấu hình nguồn thu thập tin tức o Đưa ra gợi ý các tin tức liên quan o Sắp xếp tin tức theo mức độ liên quan tới người dùng, sắp xếp tin tức mới nhất, sắp xếp tin tức hot nhất.
Trang 1TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
──────── * ───────
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
NGÀNH CÔNG NGHỆ THÔNG TIN
XÂY DỰNG WEBSITE CUNG CẤP VÀ GỢI
Trang 2PHIẾU GIAO NHIỆM VỤ ĐỒ ÁN TỐT NGHIỆP
1 Thông tin về sinh viên
Họ và tên sinh viên: ĐẶNG ĐÌNH DIỆN
Tên đề tài: Xây dựng website cung cấp và gợi ý tin tức
Đồ án tốt nghiệp được thực hiện tại: Trường Đại Học Bách Khoa Hà Nội
Thời gian làm ĐATN: Từ ngày 08/2014 đến 05/2015
2 Mục đích nội dung của ĐATN: Xây dựng website cung cấp và gợi ý tin tức dựa trên lịch sử đọc tin của người dùng và cộng đồng, để giúp người dùng tìm đễ dàng tìm thấy tin tức mà họ quan tâm
3 Các nhiệm vụ cụ thể của ĐATN
sử dụng Google Feed API, tìm hiểu framwork CakePHP
phương pháp gợi ý lọc cộng tác, phương pháp gợi ý lai ghép Cách thức xây dựng hệ gợi ý
TF-IDF
trên nội dung và phương pháp gợi ý lọc cộng tác) cho website đọc tin tức RSS
o Thu thập tin tức thông qua nguồn tin RSS
o Đưa ra gợi ý các tin tức liên quan
nhất, sắp xếp tin tức hot nhất
4 Lời cam đoan của sinh viên:
Tôi - Đặng Đình Diện - cam kết ĐATN là công trình nghiên cứu của bản thân tôi
Trang 3Các kết quả nêu trong ĐATN là trung thực, không phải là sao chép toàn văn của bất
Hà Nội, ngày tháng năm
Giáo viên hướng dẫn
TS Vũ Thị Hương Giang
Trang 4TÓM TẮT NỘI DUNG ĐỒ ÁN TỐT NGHIỆP
Ngày nay với sự phát triển không ngừng của báo điện tử, có rất nhiều đầu báo khác nhau, đa dạng về nội dung và hình thức, nhằm đáp ứng nhu cầu của người dùng Bởi vậy, hàng ngày có rất nhiều tin tức được đăng tải trên báo điện tử Chính điều
đó làm cho người dùng khó khăn trong việc tìm đọc các tin tức mà mình quan tâm
Hệ gợi ý là hệ thống giúp người dùng có thể đưa ra quyết định trong hoàn cảnh có quá nhiều thống tin Bởi vậy hệ gợi ý rất hữu ích giúp cho người dùng có thể dễ dàng hơn trong việc tìm kiếm tin tức của mình
Từ nhu cầu cần phải có một hệ gợi ý phù hợp cho các website tin tức ĐATN của
em tập trung xây dựng một website thu thập tin tức qua RSS, có sử dụng phương pháp gợi ý lai ghép (kết hợp phương pháp gợi ý dựa trên nội dung và phương pháp gợi ý lọc cộng tác)
Cấu trúc của luận văn
PHẦN 1: ĐẶT VẤN ĐỀ VÀ ĐỊNH HƯỚNG GIẢI QUYẾT
Trong phần này trình bày các nội dung
Đưa ra các vấn đề và định hướng giải quyết
Hệ gợi ý, các phương pháp gợi ý, nhược điểm của các phương pháp
PHẦN 2: CÁC KẾT QUẢ ĐẠT ĐƯỢC
Trong phần này trình bày các nội dung
Trình bày chi tiết thiết kế chức năng và cơ sở dữ liệu
Trình bày hệ gợi ý lai ghép (kết hợp hai phương pháp gợi ý lọc dựa trên nội dung
và gợi ý lọc cộng tác)
Trình bày kết quả chạy thử nghiệm các chức năng chính
Trình bày đánh giá, nhận xét về đồ án
PHẦN 3:
Trong phần này trình bày các nội dung
Trình bày kết quả đạt được của đồ án tốt nghiệp và những thiếu sót của đồ án
Nêu định hướng phát triển
Trang 5LỜI CẢM ƠN
Trước tiên, tôi xin gửi lời cảm ơn tới các thầy cô giáo trong trường Đại học Bách Khoa Hà Nội nói chung, Viện Công Nghệ Thông Tin và Truyền Thông, các thầy cô trong dự án Việt Nhật nói riêng đã tận tình giảng dạy, truyền đạt cho tôi những kiến thức, kinh nghiệm quý báu trong suốt thời gian qua
Đặc biệt, tôi xin chân thành cảm ơn TS.Vũ Thị Hương Giang - người thầy đã tận tình giúp đỡ, trực tiếp chỉ bảo, hướng dẫn tôi trong suốt quá trình làm đồ án tốt nghiệp Trong thời gian được sự hướng dẫn của thầy, tôi không chỉ tiếp thu thêm nhiều kiến thức bổ ích mà còn học tập được tinh thần làm việc, thái độ nghiên cứu khoa học nghiêm túc, hiệu quả, đây là những điều rất cần thiết cho tôi trong quá trình học tập và làm việc sau này
Cuối cùng, tôi xin gửi lời cảm ơn tới gia đình, bạn bè đã động viên, đóng góp ý kiến giúp đỡ tôi trong quá trình học tâp, tìm hiểu và hoàn thành đồ án tốt nghiệp
Tuy nhiên do thời gian và trình độ có hạn nên đồ án này chắc chắn không thiếu khỏi những thiếu sót, tôi rất mong được sự đóng góp ý kiến quý báu của các thầy, các cô
và toàn thể các bạn.Tôi xin chân thành cảm ơn
Hà Nội, ngày tháng 5 năm 2015
Tác giả ĐATN
Trang 6MỤC LỤC
DANH MỤC HÌNH VẼ 1
DANH MỤC BẢNG 2
Danh sách thuật ngữ 4
PHẦN 1: ĐẶT VẤN ĐỀ VÀ ĐỊNH HƯỚNG GIẢI PHÁP 5
1 Đặt vấn đề 5
2 Các vấn đề cần giải quyết 6
2.1 Vấn đề thu thập tin tức 6
2.2 Vấn đề gợi ý tin tức 6
3 Định hướng giải pháp 6
3.1 Định hướng giải pháp cho vấn đề thu thập tin tức 6
3.2 Định hướng giải pháp cho vấn đề gợi ý tin tức 6
4 Cơ sở lý thuyết 6
4.1 Giới thiệu về hệ gợi ý 6
4.2 Các phương pháp gợi ý phổ biến 7
4.1.1 Phương pháp gợi ý dựa trên lọc cộng tác (Collaborative Filtering) 7
4.1.2 Phương pháp gợi ý lọc dựa trên nội dung (Content-based Filtering) 8
4.1.3 Hệ gợi ý lai ghép (Hybrid Recommender Systems) 8
PHẦN 2: CÁC KẾT QUẢ ĐẠT ĐƯỢC 10
1 Thiết kế các chức năng 10
1.1 Sơ đồ usecase 10
1.2 Mô tả các chức năng 11
1.2.1 Mô tả chức năng đăng nhập 11
1.2.2 Mô tả chức năng đăng xuất 11
1.2.3 Mô tả chức năng đăng ký 11
1.2.4 Mô tả chức năng tìm kiếm nguồn tin tức 12
1.2.5 Mô tả chức năng tìm kiếm nguồn rss feed 12
1.2.6 Mô tả chức năng tìm kiếm bộ sưu tập của người dùng khác 13
1.2.7 Mô tả chức năng lựa chọn nguồn tin tức có sẵn 13
1.2.8 Mô tả chức năng gợi ý tin tức liên quan 14
1.2.9 Mô tả chức năng gợi ý nguồn tin tức khác 14
1.2.10 Mô tả chức năng sắp xếp tin tức 15
1.2.11 Mô tả chức năng sắp xếp tin tức theo mức độ liên quan đến người dùng (Most relevant) 15
1.2.12 Mô tả chức năng sắp xếp tin tức mới nhất (Most recent) 15
1.2.13 Mô tả chức năng sắp xếp tin tức hot nhất (Top stories) 16
1.2.14 Mô tả chức năng thích tin tức 16
Trang 71.2.16 Mô tả chức năng tự tạo bộ sưu tập tin tức của mình 17
1.2.17 Mô tả chức năng lưu lại tin tức để đọc sau 18
1.2.18 Mô tả chức năng cấu hình nguồn tin tức 18
1.2.19 Mô tả chức năng thêm nguồn tin tức 18
1.2.20 Mô tả chức năng sửa nguồn tin tức 19
1.2.21 Mô tả chức năng xóa nguồn tin tức 19
2 Thiết kế cơ sở dữ liệu 21
2.1 Bảng users 22
2.2 Bảng rss_feeds 22
2.3 Bảng rss_feed_subscriptions 22
2.4 Bảng groups 23
2.5 Bảng articles 23
2.6 Bảng bookmarks 23
2.7 Bảng comments 23
2.8 Bảng liked_items 24
2.9 Bảng read_histories 24
2.10 Bảng collections 24
2.11 Bảng collections_ articles 24
2.12 Bảng collection_subscriptions 25
2.13 Bảng categories 25
2.14 Bảng preferences 25
3 Thiết kế giao diện 25
3.1 Sitemap 25
3.2 Giao diện người dùng 26
3.2.1 Giao diện trang chủ 26
3.2.2 Giao diện xem chi tiết tin tức 27
3.2.3 Giao diện trang Discover 27
3.2.4 Giao diện trang Search 28
3.2.5 Giao diện trang Your Collection 28
3.2.6 Giao diện trang Manage Subscriptions 29
3.3 Giao diện người quản trị 29
3.3.1 Giao diện quản lý nguồn tin tức 29
3.3.2 Giao diện thêm nguồn tin tức mới 30
4 Phương pháp thu thập tin tức 30
4.1 Lý do lựa chọn công nghệ RSS để thu thập tin tức 30
Trang 84.3 Quá trình thu thập tin tức 33
5 Các phương pháp gợi ý sử dụng trong hệ thống 34
5.1 Kịch bản gợi ý 34
5.2 Đề xuất sử dụng phương pháp gợi ý lai ghép cho chức năng sắp xếp tin tức theo mức độ liên quan đến người dùng (Most Relevant) 35
5.2.1 Các pha trong quá trình sắp xếp tin tức theo mức độ liên quan đến người dùng 35
5.2.2 Mô hình không gian vector và thuật toán TF-IDF 36
5.2.3 Phương pháp gợi ý lọc dựa trên nội dung 38
5.2.4 Phương pháp gợi ý lọc cộng tác 39
5.2.5 Hàm kết hợp hai phương pháp trên 39
5.3 Đề xuất sử dụng phương pháp gợi ý dựa trên nội dung cho chức năng gợi ý tin tức liên quan 40
5.4 Gợi ý các nguồn tin tức khác 41
6 Cài đặt và thử nghiệm hệ thống 41
6.1 Môi trường cài đặt 41
6.2 Các thư viện sử dụng 42
6.3 Các bước cài đặt website trên localhost (ubuntu) 42
6.4 Chạy thử nghiệm 42
6.4.1 Chạy thử chức năng gợi ý các tin tức liên quan 42
6.4.2 Chạy thử chức năng sắp xếp tin tức theo mức độ liên quan tới người dùng 43
6.4.3 Chạy thử chức năng gợi ý nguồn tin tức khác 44
6.4.4 Chạy thử chức năng thu thập tin tức 44
6.4.5 Chạy thử khả năng tính toán thuật toán tf-idf 45
6.5 Đánh giá 45
PHẦN 3: KẾT LUẬN 46
1 Kết quả đạt được 46
2 Hướng phát triển 46
TÀI LIỆU THAM KHẢO 47
Trang 9DANH MỤC HÌNH VẼ
Hình 1: Hệ gợi ý đưa ra danh sách sản phẩm có khả năng người dùng thích 7
Hình 2: Sơ đồ usecase 10
Hình 3: Sơ đồ thực thể ERD 21
Hình 4: Sitemap của website 26
Hình 5: Giao diện trang chủ 26
Hình 6: Giao diện xem chi tiết tin tức 27
Hình 7: Giao diện trang discover 27
Hình 8: Giao diện trang Search 28
Hình 9: Giao diện trang Collection 28
Hình 10: Giao diện trang Manage Subscriptions 29
Hình 11: Giao diện quản lý nguồn tin tức 29
Hình 12: Giao diện thêm nguồn tin tức mới 30
Hình 13: Quá trình thu thập tin tức 33
Hình 14: Các pha trong quá trình sắp xếp tin tức theo mức độ tương đồng 35
Hình 15: Quá trình tính các tin tức liên quan 40
Hình 16: Quá trình gợi ý nguồn tin tức khác 41
Hình 17: Thử nghiệm chức năng gợi ý tin tức liên quan 42
Hình 18: Đầu vào chức năng sắp xếp theo mức độ liên quan 43
Hình 19: Đầu ra chức năng sắp xếp tin tức liên quan 43
Hình 20: Gợi ý các nguồn tin khác 44
Hình 21: Các tin tức mới được thêm vào CSDL 45
Trang 10DANH MỤC BẢNG
Bảng 1: Đặc tả chức năng đăng nhập 11
Bảng 2: Đặc tả chức năng đăng xuất 11
Bảng 3: Đặc tả chức năng đăng ký 12
Bảng 4: Đặc tả chức năng tìm kiếm nguồn rss feed 12
Bảng 5: Đặc tả chức năng tìm kiếm bộ sưu tập tin tức của người dùng khác 13
Bảng 6: Đặc tả chức năng lựa chọn nguồn tin tức có sẵn 13
Bảng 7: Mô tả chức năng gợi ý tin tức liên quan 14
Bảng 8: Mô tả chức năng gợi ý nguồn tin tức khác 14
Bảng 9: Đặc tả chức năng sắp xếp tin tức theo mức độ liên quan đến người dùng 15
Bảng 10: Đặc tả chức năng sắp xếp tin tức mới nhất 16
Bảng 11: Đặc tả chức năng sắp xếp tin tức hot nhất 16
Bảng 12: Đặc tả chức năng thích tin tức 17
Bảng 13: Đặc tả chức năng bình luận tin tức 17
Bảng 14: Đặc tả chức năng tự tạo bộ sưu tập tin tức của mình 18
Bảng 15: Đặc tả chức năng lưu lại tin tức để đọc sau 18
Bảng 16: Đặc tả chức năng thêm nguồn tin tức 19
Bảng 17: Đặc tả chức năng sửa nguồn tin tức 19
Bảng 18: Đặc tả chức năng xóa nguồn tin tức 20
Bảng 19 : Mô tả bảng users 22
Bảng 20: Mô tả bảng rss_feeds 22
Bảng 21: Mô tả bảng rss_feed_subscriptions 22
Bảng 22: Mô tả bảng groups 23
Bảng 23 : Mô tả bảng articles 23
Bảng 24: Mô tả bảng bookmarks 23
Bảng 25: Mô tả bảng comments 24
Bảng 26: Mô tả bảng linked_items 24
Bảng 27: Mô tả bảng read_histories 24
Bảng 28: Mô tả bảng collections 24
Trang 11Bảng 29: Mô tả bảng collections_articles 24
Bảng 30: Mô tả bảng collection_subscriptions 25
Bảng 31: Mô tả bảng categories 25
Bảng 32: Mô tả bảng preferences 25
Trang 12Danh sách thuật ngữ
Một định dạng tập tin thuộc họ XML để chia sẻ tin tức trong web
Một con số thu được qua thống kê, thể hiện mức độ quan trọng của từ này trong một văn bản
Trang 13PHẦN 1: ĐẶT VẤN ĐỀ VÀ ĐỊNH HƯỚNG GIẢI PHÁP
1 Đặt vấn đề
Báo điện tử hay báo mạng là loại hình báo chí được xây dựng dưới hình thức một trang web và phát hành dựa trên nền tảng Internet Nó có các đặc trưng riêng biệt, đó là tính đa phương tiện, tính thời sự với khả năng cập nhật thông tin nhanh mới, tính phi định kỳ, và khả năng truyền tải thông tin không hạn chế Với những đặc trưng đó mà báo điện tử trở thành kênh truyền thông vô cùng hiệu quả, ngày càng trở nên phổ biến và phát triển mạnh mẽ Hiện nay có rất nhiều các trang báo mạng với sự đa dạng về nội dung xuất hiện, bởi vậy lượng tin tức được đăng lên hằng ngày vô cùng lớn Điều này gây nhiều khó khăn cho người dùng trong việc tìm kiếm và đọc những tin tức mà mình quan tâm
Hệ gợi ý được sử dụng rộng rãi để giải quyết vấn đề thông tin quá tải Hệ gợi
ý có vai trò đưa ra gợi ý, những thứ mà người dùng có khả năng thích Chúng ta có thể dễ dàng bắt gặp hệ gợi ý trên một số website nổi tiếng như Youtube (gợi ý xem video khác), Amazon (gợi ý sản phẩm khác cùng thể loại), Facebook (gợi ý kết bạn)
Hiện nay có các dịch vụ đọc tin tức thịnh hành trên nền web như yahoo news hay trên nền di động như ứng dụng flipboard, feedly Song cũng chỉ dừng lại ở việc cung cấp các tin tức từ nhiều nguồn khác nhau, chưa giải quyết được khó khăn trong việc tìm kiếm tin tức của người dùng
Bởi vậy, để giúp người đọc dễ dàng tìm thấy những tin tức mà họ quan tâm,
em đề xuất xây dựng hệ gợi ý sử dụng phương pháp gợi ý lai ghép (kết hợp giữa phương pháp gợi ý dựa trên nội dung và phương pháp gợi ý lọc cộng tác) nhằm sắp xếp lại các tin tức theo mức độ liên quan đến người dùng
Trang 143.1 Định hướng giải pháp cho vấn đề thu thập tin tức
Làm thế nào để thu thập tin tức:
API để đọc file RSS, rồi lưu vào CSDL
3.2 Định hướng giải pháp cho vấn đề gợi ý tin tức
Gợi ý tin tức như thế nào để giúp người dùng dễ dàng hơn trong việc tìm kiếm tin tức mà mình quan tâm:
Để giải quyết bài toán này, hệ thống gợi ý trong đồ án sẽ kết hợp hai phương pháp gợi ý, đó là gợi ý dựa trên nội dung và gợi ý dựa trên lọc cộng tác
4 Cơ sở lý thuyết
4.1 Giới thiệu về hệ gợi ý
Hệ gợi ý (Recommender Systems) [1] là một phân lớp của hệ thống lọc
thông tin mà nó sẽ tìm cách dự đoán trước được “đánh giá” hay “sự ưu tiên” của người dùng với một sản phẩm hay một đối tượng nào đó
Trang 15Hình 1: Hệ gợi ý đưa ra danh sách sản phẩm có khả năng người dùng thích
Hệ gợi ý trở nên phổ biến trong những năm gần đây, và nó được áp dụng
trong nhiều ứng dụng khác nhau Phổ biến nhất có thể kể đến đó là: phim truyện, tin
tức, sách báo, bài báo khoa học, câu lệnh tìm kiếm, mạng xã hội tags, và các sản
phẩm thông thường
Hệ gợi ý thường đưa ra danh sách các gợi ý theo một trong hai cách: thông
qua lọc cộng tác hoặc lọc dựa trên nội dung Lọc cộng tác hướng tới xây dựng một
mô hình từ những hành vi của người dùng trong quá khứ (Như các sản phẩm mua
trước đây, và các đánh giá của người dùng) cũng như dự đoán trước độ tương đồng
giữa hai người dùng Sau đó sử dụng một mô hình dự đoán các sản phẩm (hoặc
đánh giá cho sản phẩm) mà người dùng có thể thích Phương pháp lọc dựa trên nội
dung hướng tới việc sử dụng một loạt các đặc tính riêng biệt của sản phẩm để gợi ý
thêm các sản phẩm có đặc tính tương tự Hai phương pháp này có thể được kết hợp
với nhau trong hệ gợi ý lai ghép
4.2 Các phương pháp gợi ý phổ biến
4.1.1 Phương pháp gợi ý dựa trên lọc cộng tác (Collaborative Filtering)
Một phương pháp tiếp cận hệ gợi ý được sử dụng rộng rãi là lọc cộng tác
[1] Phương pháp lọc cộng tác dựa trên việc thu thập và phân tích một lượng lớn
các thông tin từ hành vi, hoạt động hay sở thích của người dùng và dự đoán sản
phẩm mà người dùng thích dựa trên độ tương đồng với người dùng khác Một ưu
điểm nổi trội của phương pháp gợi ý lọc cộng tác là không phụ thuộc vào nội dung
của sản phẩm, do đó nó có thể đưa ra gợi ý chính xác mà không cần hiểu nội dung
của sản phẩm đó Rất nhiều thuật toán được sử dụng để tính toán độ tương đồng
giữa người dùng trong hệ gợi ý Ví dụ như là: k lân cận gần nhất (k-NN), sự tương
quan Pearson
Phương pháp lọc cộng tác thường gặp phải ba vấn đề:
Trang 16 Khởi đầu kém (Cold Start): Phương pháp này thường yêu cầu lượng lớn
dữ liệu từ người sử dụng để đưa ra gợi ý, nên khi hệ thống mới được xây dựng, lượng dữ liệu còn ít, khó có thể đưa ra gợi ý một cách chính xác
có hàng triệu người sử dụng và sản phẩm thì sẽ yêu cầu khả năng tính toán lớn để đưa ra gợi ý
thương mại điện tử là rất lớn Tuy nhiên đã số các người dùng thường chỉ đưa ra đánh giá một tập nhỏ các sản phẩm trong CSDL Vì thế, thậm chí các sản phẩm phổ biến nhất cũng chỉ có rất ít đánh giá
4.1.2 Phương pháp gợi ý lọc dựa trên nội dung (Content-based Filtering)
Một phương pháp phổ biến khác để tiếp cận hệ gợi ý là phương pháp lọc dựa
trên nội dung [1] Phương pháp lọc dựa trên nội dung dựa trên mô tả về sản phẩm
và sở thích của người dùng Trọng hệ gợi ý dựa trên nội dung, từ khóa được sử dụng để mô tả sản phẩm và hồ sơ của người dùng được xây dựng để chỉ là kiểu mà người dùng thích Hay nói cách khác, thuật toán này cố gắng đưa ra danh sách gợi ý
mà nó tương đồng với những gì người dùng thích trong quá khứ
Để tóm tắt được những đặc trưng của sản phẩm trong hệ thống, một thuật toán biểu diễn sản phẩm sẽ được sử dụng Thuật toán phổ biến được sử dụng đó là TF-IDF
Để tạo hồ sơ của người dùng, hệ thống thường tập trung vào 2 kiểu thống tin sau: 1 Mô hình về sở thích của người dùng 2 Lịch sử sử dụng người dùng trong hệ thống
Về cơ bản, phương pháp này sử dụng thông tin về sản phẩm (ví dụ như tập thuộc tính và đặ trưng của sản phẩm) để mô tả sản phẩm đó Hệ thống tạo hồ sơ của người dùng dựa trên trọng lượng vector của đặc trưng sản phẩm Trọng lượng này biểu thị tầm quan trọng của mỗi đặc trưng, nó được tính toán dựa trên vector bằng những kỹ thuật khác nhau Phương pháp tiếp cận sử dụng giá trị trung bình của vector sản phẩm trong khi các phương pháp phức tạp khác sử dụng các kỹ thuật như phân lớp Bayes (Bayesian Classifiers), phân tích nhóm (Cluster analysis), Cây quyết định (Decision trees), mạng thần kinh nhân tạo (artificial neural networks) để đánh giá khả năng người dùng sẽ thích sản phẩm đó
Đối với người dùng mới chưa sử dụng hệ thống Thì dữ liệu về hồ sơ của người dùng không có, do đó không thể đưa ra đánh giá chính xác được
4.1.3 Hệ gợi ý lai ghép (Hybrid Recommender Systems)
Nghiên cứu gần đây cho thấy hệ gợi ý lai ghép [1] giữa phương pháp lọc
cộng tác và phương pháp lọc dựa trên nội dung có hiệu quả hơn trong một số trường
Trang 17hợp Hệ gợi ý lai ghép có thể cài đặt theo một số cách sau: Hoặc tính toán chỉ số bằng phương pháp lọc dựa trên nội dung và lọc cộng tác riêng biệt rồi sau đó kết hợp 2 chỉ số đó với nhau, hoặc băng việc thêm khả năng lọc dựa trên nội dung vào phương pháp tiếp cận lọc cộng tác, hoặc hợp nhất hai phương pháp vào một mô hình Một số nghiên cứu so sánh hiệu quả của hệ gợi ý lai với các phương pháp gợi
ý đơn thuần như lọc cộng tác và lọc dựa trên nội dung, nó chỉ ra rằng hệ gợi ý lai đưa ra gợi ý chính xác hơn các phương pháp gợi ý đơn thuần Những phương pháp này có thể sử dụng để khắc phục một số vấn đề thường gặp như khởi đầu kém hay vấn đề thưa thớt
Trang 19Bảng 2: Đặc tả chức năng đăng xuất
1.2.3 Mô tả chức năng đăng ký
Trang 201.2.4 Mô tả chức năng tìm kiếm nguồn tin tức
Chức năng tìm kiếm nguồn tin tức có thể là:
Tìm kiếm nguồn rss feed
Tìm kiếm bộ sưu tập của người dùng khác
1.2.5 Mô tả chức năng tìm kiếm nguồn rss feed
Thành phần Mô tả
Mô tả về chức
năng
Người dùng tìm kiếm nguồn tin tức mà mình muốn đọc
Các bước thực
hiện chức năng
Bước 1: Kích vào nút “Add News Feeds”
Bước 2: Nhập từ khóa mà bạn muốn tìm kiếm Bước 3: Nhấn vào nút GO
từ khóa đó
Bảng 4: Đặc tả chức năng tìm kiếm nguồn rss feed
Trang 211.2.6 Mô tả chức năng tìm kiếm bộ sưu tập của người dùng khác
Thành phần Mô tả
Bước 1: Kích vào nút “Add News Feeds”
Bước 2: Nhập từ khóa mà bạn muốn tìm kiếm Bước 3: Nhấn vào nút GO
Bước 4: Chọn tab “Collection”
từ khóa đó
Bảng 5: Đặc tả chức năng tìm kiếm bộ sưu tập tin tức của người dùng khác
1.2.7 Mô tả chức năng lựa chọn nguồn tin tức có sẵn
Thành phần Mô tả
Mô tả về chức
năng
Sau khi tìm kiếm nguồn tin tức, người dùng có thể theo dõi (lựa chọn) nguồn tin tức
Chưa lựa chọn nguồn tin tức này Các bước thực
Trang 221.2.8 Mô tả chức năng gợi ý tin tức liên quan
Thành phần Mô tả
Mô tả về chức
năng
Khi người dùng đọc 1 tin tức, thì 3 tin tức có nội dung tương đồng nhất với tin tức đang đọc được đưa ra, nhằm gợi ý cho người dùng
tâm
Các bước thực
hiện chức năng
Bước 1: Kích vào đọc một tin tức bất kỳ
tin tức đang đọc
Bảng 7: Mô tả chức năng gợi ý tin tức liên quan
1.2.9 Mô tả chức năng gợi ý nguồn tin tức khác
Thành phần Mô tả
Và chưa lựa chọn nguồn tin đó Các bước thực
hiện chức năng
Không phải làm gì cả Các nguồn tin được gợi ý sẽ hiển thị ở giao diện trang chủ
Bảng 8: Mô tả chức năng gợi ý nguồn tin tức khác
Trang 231.2.10 Mô tả chức năng sắp xếp tin tức
Mô tả về chức
năng
Sắp xếp các tin tức dựa trên ngày đăng tin tức
Trang 24trên đầu, cũ ở dưới
Bảng 10: Đặc tả chức năng sắp xếp tin tức mới nhất
1.2.13 Mô tả chức năng sắp xếp tin tức hot nhất (Top stories)
Thành phần Mô tả
Mô tả về chức
năng
Sắp xếp các tin tức dựa trên số lượt thích và bình luận
đang được mọi người quan tâm
Bảng 11: Đặc tả chức năng sắp xếp tin tức hot nhất
1.2.14 Mô tả chức năng thích tin tức
Người dùng thích tin tức đang đọc
giúp hệ thống có thể tính toán gợi ý dựa trên phương pháp gợi ý lọc cộng tác
Trang 25Điều kiện Đã login thành công vào hệ thống
Chưa thích tin tức đó Các bước thực
hiện chức năng
Bước 1: Chọn một tin tức để đọc Bước 2: Nhấn nút like
Bảng 12: Đặc tả chức năng thích tin tức
1.2.15 Mô tả chức năng bình luận tin tức
Thành phần Mô tả
Mô tả về chức
năng
Người dùng đưa ra bình luận về tin tức đang đọc
Các bước thực
hiện chức năng
Bước 1: Chọn tab comment Bước 2: Nhập bình luận Bước 3: Nhấn nút GO
Bảng 13: Đặc tả chức năng bình luận tin tức
1.2.16 Mô tả chức năng tự tạo bộ sưu tập tin tức của mình
Thành phần Mô tả
Mô tả về chức
năng
Người dùng thu thập các tin tức mà họ đã đọc để thêm vào bộ sưu tập Để sau đó có thể dễ dàng tìm thấy
thích, và giúp người khác có thể theo dõi bộ sưu tập của mình
Trang 26Các bước thực
hiện chức năng
Bước 1: Nhấn nút Add Bước 2: Lựa chọn tên của bộ sưu tập mà mình muốn thêm
Bước 3: Nhấn nút submit
Bảng 14: Đặc tả chức năng tự tạo bộ sưu tập tin tức của mình
1.2.17 Mô tả chức năng lưu lại tin tức để đọc sau
Thành phần Mô tả
Mô tả về chức
năng
Lưu lại tin tức để lúc khác người dùng đọc sau
Và chưa lưu tin tức này Các bước thực
hiện chức năng
Bước 1: Kích vào nút “Bookmarks”
bookmarks, và trong Bookmarks sẽ thêm tin tức này
Bảng 15: Đặc tả chức năng lưu lại tin tức để đọc sau
1.2.18 Mô tả chức năng cấu hình nguồn tin tức
Chức năng quản lý nguồn tin tức có thể là:
Thêm nguồn tin tức
Sửa nguồn tin tức
Xóa nguồn tin tức
1.2.19 Mô tả chức năng thêm nguồn tin tức
Thành phần Mô tả
Trang 27Mô tả về chức
năng
Ngoài những nguồn tin tức đã có sẵn có thể thêm nguồn tin RSS mới vào
Các bước thực
hiện chức năng
Bước 1: Nhấn vào Manage Rss Feeds Bước 2: Nhập các thông tin về nguồn RSS Feeds Bước 3: Nhấn nút thêm
Bảng 16: Đặc tả chức năng thêm nguồn tin tức
1.2.20 Mô tả chức năng sửa nguồn tin tức
Thành phần Mô tả
Mô tả về chức
năng
Thay đổi tiêu đề, mô tả của nguồn tin
Các bước thực
hiện chức năng
Bước 1: Kích vào chức năng Manage Rss Feeds Bước 2: Kích nút edit ở nguồn tin mà bạn muốn thay đổi
Bước 3: Nhấn save
Bảng 17: Đặc tả chức năng sửa nguồn tin tức
1.2.21 Mô tả chức năng xóa nguồn tin tức
Thành phần Mô tả
Mô tả về chức
năng
Xóa nguồn tin tức