Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.Nghiên cứu phương pháp xử lý dữ liệu cho hệ thống gợi ý và triển khai trên các thiết bị có tài nguyên hạn chế.
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠOĐẠI HỌC BÁCH KHOA HÀ NỘI
DƯƠNG TẤN NGHĨA
NGHIÊN CỨU PHƯƠNG PHÁP XỬ LÝ DỮ LIỆUCHO HỆ THỐNG GỢI Ý VÀ TRIỂN KHAI TRÊNCÁC THIẾT BỊ CÓ TÀI NGUYÊN HẠN CHẾ
Ngành: Kỹ thuật điện tử
Mã số: 9520203
TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT ĐIỆN TỬ
HÀ NỘI - 2023
Trang 2Công trình này được hoàn thành tạiĐại học Bách khoa Hà Nội
Luận án được bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp trường
họp tại Đại học Bách khoa Hà Nội
vào hồi giờ, ngày tháng năm
Có thể tìm hiểu luận án tại:
1 Thư viện Tạ Quang Bửu, ĐHBK Hà Nội
2 Thư viện Quốc gia Việt Nam
Trang 3MỞ ĐẦU
1 Giới thiệu chung về hệ thống gợi ý
1.1 Khái niệm hệ thống gợi ý
Trong những năm gần đây, sự phát triển mạnh mẽ của các mạng truyềnthông không dây tốc độ cao như 4G/5G cùng với sự phổ biến của các thiết
bị di động đã góp phần thay đổi đáng kể cách thức tiếp cận và xử lý thôngtin của mỗi chúng ta Các hệ thống gợi ý (Recommendation System - RS)ngày nay giữ vai trò đặc biệt quan trọng trong quá trình vận hành của cácnền tảng thương mại điện tử và truyền thông đa phương tiện với mục tiêu
đề xuất cho từng khách hàng những sản phẩm mà họ có khả năng sẽ yêuthích hay sử dụng
RS là một dạng của hệ thống hỗ trợ ra quyết định, cung cấp giải phápmang tính cá nhân hóa mà không phải trải qua quá trình tìm kiếm phứctạp Có thể định nghĩa RS là một hệ thống lọc thông tin để dự đoán về sởthích của người dùng, từ đó đề xuất với người dùng các sản phẩm phù hợpnhất một cách hiệu quả Gần đây, hầu hết các RS đều được triển khai từ hệthống điện toán đám mây đến các thiết bị biên (cloud-to-edge) Việc tínhtoán trực tiếp trên thiết bị biên có thể giảm độ trễ cho băng thông, giúp hệthống nắm bắt được sở thích người dùng dễ dàng hơn từ đó đưa ra các đềxuất thỏa đáng hơn
Luận án này tập trung nghiên cứu các phương pháp và thuật toán xử lý
dữ liệu trong RS nhằm tăng cường chất lượng thông tin Điều này giúp xử
lý và phân tích các dữ liệu đã được thu thập được, tăng tính chính xác vàtính nhất quán của thông tin đầu ra và phục vụ cho việc triển khai RS trêncác thiết bị biên
1.2 Tình hình nghiên cứu hệ thống gợi ý trên thế giới và ở Việt NamDựa theo loại dữ liệu được áp dụng nhằm đề xuất sản phẩm cho người dùng,
RS thường được chia làm ba hướng tiếp cận chính (Hình 1) Hệ thống lọcdựa trên nội dung đề xuất sản phẩm dựa trên thông tin về đặc trưng của
Trang 4sản phẩm và người dùng.
Hình 1: Phân loại hệ thống gợi ý.
Trái lại, hệ thống CF dựa vào lịch sử tương tác giữa người dùng với cácsản phẩm để xác định sở thích của họ và đưa ra gợi ý phù hợp Có hai nhánhtiếp cận chính đối với hệ thống CF: gợi ý dựa trên ghi nhớ (Memory-basedCF) và gợi ý dựa vào mô hình (Model-based CF) Nhánh tiếp cận dựa trênghi nhớ tính toán độ tương quan giữa các sản phẩm hoặc giữa các người dùngqua lịch sử tương tác rồi từ đó tìm ra những sản phẩm tương đồng nhất vớisản phẩm mà một người thích Mặt khác, nhánh tiếp cận dựa vào mô hình
đã chứng tỏ được tính hữu hiệu của nó đối với ma trận tương tác rất thưa.Nhiều nghiên cứu trên phương pháp phân rã ma trận (Matrix Factorization
- MF) cũng cho thấy với phương pháp khởi tạo thích hợp, có thể cải thiệntốc độ hội tụ và độ chính xác của hệ thống
Tuy nhiên, đối với người dùng hoặc sản phẩm mới, hệ thống thườngkhông có đủ dữ liệu tương tác để đưa ra gợi ý chính xác, dẫn đến vấn đềkhởi động nguội (Cold-start problem) Để khắc phục vấn đề này, các hệthống sử dụng phương pháp kết hợp được đề xuất
Dù thu được nhiều kết quả đáng chú ý, hiệu năng của các mô hình truyềnthống vẫn bị giới hạn bởi tính tuyến tính Đối với dữ liệu có cấu trúc phứctạp, kiến trúc mạng nơ-ron là một hướng tiếp cận mới giúp nâng cao độchính xác của RS CNN gần đây cũng nhận được nhiều sự chú ý trong RS,được áp dụng với bài toán gợi ý bài hát hay văn bản
Ở Việt Nam, học máy nói chung và RS qua đó ngày càng nhận đượcnhiều quan tâm nghiên cứu của các nhà khoa học và các doanh nghiệp trongnước Trong đó, nhằm hạn chế vấn đề khởi động nguội, nhiều nghiên cứu về
RS ở Việt Nam tích hợp thông tin phụ vào để đưa ra gợi ý đề xuất các môhình gợi ý sử dụng dữ liệu mô tả sản phẩm Ngoài ra, một số nghiên cứukhác tập trung nghiên cứu phương pháp mô hình hoá hành vi tuần tự củangười dùng
Trang 52 Tính cần thiết của luận án và những vấn đề sẽ giải quyết2.1 Những thách thức trong quá trình nghiên cứu hệ thống gợi ý
2.1.1 Thách thức trong thu thập dữ liệu
Thứ nhất, lượng sản phẩm và người dùng lớn tạo nên một ma trận tươngtác có kích thước khổng lồ, tuy nhiên một người dùng thường chỉ tương tác
và cung cấp đánh giá cho một vài sản phẩm, khiến cho ma trận tương táctrở trong thực tế trở nên rất thưa thớt
Thứ hai, bất kì RS nào cũng tiềm ẩn khả năng gặp phải vấn đề khởiđộng nguội khi thuật toán không thể đưa ra bất cứ dự đoán đáng tin cậynào cho người dùng do chưa thu thập đủ thông tin
Cuối cùng, việc thu thập dữ liệu nói chung và cho nghiên cứu nói riêngphải đảm bảo các chính sách bảo mật dữ liệu người dùng
2.1.2 Thách thức trong triển khai thuật toán
Thứ nhất, số lượng sản phẩm và người dùng quá lớn, khiến chi phí lưu trữ
và thực hiện thuật toán trên bộ nhớ ngày càng tăng, gây khó khăn khi mởrộng hệ thống
Cùng với đó, các hệ thống lọc dựa trên nội dung hay kết hợp với CF phụthuộc rất nhiều vào chất lượng của dữ liệu đặc trưng sản phẩm và ngườidùng Tuy nhiên, đa phần dữ liệu mang thông tin về sản phẩm hay sở thíchcủa người dùng đều là dữ liệu thô, không thể sử dụng trực tiếp
2.2 Những vấn đề luận án sẽ giải quyết
Để thực hiện nhiệm vụ như trình bày ở phần trên, RS trong thực tiễn cầnđáp ứng các mục tiêu: chính xác, mới lạ, ngẫu nhiên, đa dạng, riêng tư.Trong đó, các nghiên cứu trong luận án này tập trung vào cải thiện tínhchính xác của các thuật toán gợi ý
Cụ thể, luận án sẽ tập trung giải quyết ba vấn đề chính sau:
Vấn đề 1: độ chính xác của thuật toán CF bị suy giảm đáng kể khi matrận tương tác giữa người dùng với sản phẩm rất thưa thớt
Vấn đề 2: dữ liệu đặc trưng sản phẩm có chất lượng chưa tốt, chưađược phân tích kỹ và tận dụng triệt để trong CF
Vấn đề 3: khó khăn trong thu thập dữ liệu về sở thích của người dùng
do các vấn đề bảo mật, và các mô hình CF truyền thống cũng chưa cókhả năng tận dụng dữ liệu người dùng triệt để
Trang 63 Mục tiêu, đối tượng, phạm vi và phương pháp nghiên cứu3.1 Mục tiêu nghiên cứu
Đề xuất thuật toán đo độ tương đồng nhằm tăng độ chính xác của môhình CF dựa trên ghi nhớ
Đề xuất các mô hình trích xuất đặc trưng ẩn và xử lý dữ liệu đặc trưngcủa sản phẩm
Đề xuất các phương pháp xây dựng dữ liệu sở thích người dùng, và đềxuất cải thiện các thuật toán CF sử dụng nguồn dữ liệu người dùngmới
Chứng minh khả năng triển khai của các mô hình đề xuất trên thiết
bị có phần bứng hạn chế
3.2 Đối tượng và phạm vi nghiên cứu
Các thuật toán CF phổ biến như kNN, SVD, SVD++, NMF
Phương pháp xác định độ tương đồng giữa các sản phẩm
Quá trình tiền xử lí dữ liệu mô tả nội dung sản phẩm
Hai tập dữ liệu về đánh giá phim nổi tiếng là MovieLens 20M và 25M:luận án sẽ tập trung khai thác dữ liệu đánh giá của người dùng và cácthẻ Genome phản ánh đặc trưng của các bộ phim
3.3 Phương pháp nghiên cứu
Phương pháp nghiên cứu được sử dụng trong luận án là từ các phân tích vàđánh giá những mô hình hiện có, đưa ra các đề xuất cải thiện và tiến hànhtriển khai các mô hình mới sử dụng dữ liệu thực tế Mô hình mới được sosánh với những mô hình tham chiếu dựa trên các tiêu chí độ chính xác dựđoán và thời gian thực thi để kiểm nghiệm một cách toàn diện hiệu quả hoạtđộng Quá trình này có thể lặp lại nhiều lần để liên tục nâng cao độ chínhxác của các mô hình
4 Các đóng góp mới của luận án
Luận án đã lần lượt giải quyết những vấn đề đưa ra ở phần 2 và thu đượcnhững kết quả sau:
Trang 7 Đề xuất các thuật toán cải thiện độ chính xác của phép đo độ tươngđồng giữa các sản phẩm sử dụng phương pháp thống kê và dữ liệu đặctrưng của sản phẩm.
Thiết kế quy trình làm sạch thông tin sản phẩm sử dụng mô hình NLP,đồng thời áp dụng kiến trúc AE và CNN nhằm nén dữ liệu và tríchxuất đặc trưng ẩn
Xây dựng dữ liệu mô tả người dùng để giải quyết bài toán khởi tạotrong các mô hình MF và tăng cường mô hình CF dựa trên ghi nhớ
Triển khai thành công các mô hình đề xuất trên thiết bị có phần cứnghạn chế, giảm thiểu thời gian phản hồi và tăng tính bảo mật trong quátrình truyền tải dữ liệu
5 Cấu trúc nội dung của luận án
Chương 1 “Tổng quan về hệ thống gợi ý” giới thiệu tổng quan về cácthuật toán trong RS cho bài toán dự đoán đánh giá
Chương 2 “Cải thiện thuật toán đo độ tương đồng giữa hai sảnphẩm trong lọc cộng tác dựa theo ghi nhớ” đề xuất một số thuật toánmới nhằm đo độ tương đồng giữa các sản phẩm sử dụng phân tích thống kê,
và thông tin đặc trưng sản phẩm
Chương 3 “Hệ thống gợi ý áp dụng cách thức biểu diễn sảnphẩm sử dụng các kỹ thuật học sâu” giới thiệu phương pháp nén dữliệu Tag Genome sử dụng NLP và AE Chương này cũng đề xuất một kiếntrúc AE mới có tên HCAE, tích hợp CNN vào làm bộ phân tách đặc trưng
ẩn từ dữ liệu Tag Genome
Chương 4 “Phương pháp sinh dữ liệu người dùng nhân tạo ứngdụng trong lọc cộng tác” đề xuất một số phương pháp ước lượng sở thíchngười dùng từ dữ liệu đặc trưng sản phẩm, ứng dụng vào CF dựa trên ghinhớ và bài toán khởi tạo cho mô hình MF
Trang 8Chương 1
TỔNG QUAN VỀ HỆ THỐNG GỢI Ý
1.1 Ma trận lịch sử tương tác trong hệ thống gợi ý
Hai thực thể chính trong RS là người dùng và sản phẩm Mục tiêu của bàitoán này là dự đoán giá trị tại các ˆrui chưa biết
Thông thường, mỗi người dùng thường chỉ đánh giá một số lượng rấtnhỏ các sản phẩm và gây ra vấn đề “khởi động nguội”
1.2 Các phương án triển khai hệ thống gợi ý cho bài toán dự đoánđánh giá
1.2.1 Hệ thống gợi ý dựa trên nội dung
RS dựa trên nội dung dựa vào thông tin mô tả nội dung sản phẩm để đềxuất với người dùng những sản phẩm có liên quan Mỗi sản phẩm được mô
tả bởi một bộ hồ sơ, biểu diễn dưới dạng một vector X Tuy nhiên, việc phụthuộc vào hồ sơ sản phẩm khiến cho hệ thống hoạt động kém khi không cónguồn dữ liệu hoặc dữ liệu kém tin cậy
1.2.2 Lọc cộng tác dựa trên ghi nhớ
Mô hình lọc cộng tác (Collaborative Filtering - CF) dựa trên ghi nhớ thựchiện dự đoán các sản phẩm phù hợp nhất cho người dùng dựa trên độ tươngđồng giữa các sản phẩm (hoặc giữa các người dùng) Có hai dạng mô hình
CF dựa theo ghi nhớ chính: (i) mô hình hướng người dùng và (ii) mô hìnhhướng sản phẩm
Một hệ thống CF hướng sản phẩm (item-item CF hay ii-CF) gợi ý nhữngsản phẩm tương đồng nhất với sản phẩm mà một người dùng thích (có đánhgiá cao hoặc đã từng mua) Độ tương đồng sij giữa sản phẩm i và j có thểtính theo công thức Cos hoặc PCC
Trang 9Từ các sij, ta có thể xác định k sản phẩm tương đồng nhất với j mà đãđược đánh giá bởi u Để dự đoán đánh giá ˆrui, kNN sử dụng công thức sau:
1.2.3 Lọc cộng tác dựa trên mô hình
Ý tưởng chính của mô hình nhân tố ẩn là tìm cách khám phá những đặctrưng ẩn của từng người dùng và sản phẩm nhằm ánh xạ ma trận tương táctrong tập dữ liệu về chiều không gian ẩn có kích thước nhỏ hơn
Bằng cách áp dụng thuật toán SVD lên ma trận R, các người dùng vàsản phẩm lần lượt được ánh xạ sang không gian nhân tố ẩn có số chiều k(k ≪ m, n) Mô hình SVD ước lượng đánh giá bằng phép nhân vô hướngđơn giản và có công thức như sau:
ˆ
rui= bui+ qiTpu (1.2)
1.3 Thiết lập thí nghiệm
1.3.1 Tập dữ liệu MovieLens 20M
Để đánh giá hiệu quả các RS trong luận án này, tập dữ liệu MovieLens 20M
và MovieLens 25M được sử dụng làm cơ sở đánh giá
Bảng 1.1: Tổng quan về tập dữ liệu MovieLens 20M.
Trang 10Sau khi tiền xử lý, tập dữ liệu chỉ còn lại 19,793,342 đánh giá, với độthưa thớt xấp xỉ 98.97% so với 99.47% ban đầu, được đưa ra bởi 138,185người dùng cho 10,239 sản phẩm.
ra bởi 162,540 người dùng cho 13,816 sản phẩm
1.3.3 Phương pháp đánh giá
Để phục vụ đánh giá mô hình, tập dữ liệu sau khi tiền xử lý được chia làmhai phần tách biệt: 80% đánh giá của mỗi sản phẩm được sử dụng làm tậphuấn luyện, và 20% còn lại được sử dụng cho tập kiểm tra Để so sánh độhiệu quả giữa các mô hình, RMSE, Precision@k (P@k) và Recall@k (R@k)được sử dụng theo các công thức sau
RMSE =
sX
Trang 112.1.1 Hạn chế trong phân bố thống kế độ tương đồng
Các mô hình CF dựa theo ghi nhớ sử dụng phép đo Cos cho thấy 97% cácgiá trị độ tương đồng nằm trong khoảng [0.85; 1] với hệ số biến thiên (CV)bằng 4.83% (Hình 2.1a) Khi sử dụng PCC, CV = 7.80% Với CV nhỏ nhưvậy, ranh giới giữa cặp sản phẩm tương đồng và cặp sản phẩm ít tương đồnghơn là rất nhỏ
Từ đó có thể thấy rằng cần có một phương pháp đo độ tương đồng mới
có khả năng cho ra biểu đồ tần suất độ tương đồng có “độ rộng” lớn hơn và
Sự liên quan giữa các sản phẩm bị bỏ qua
Thời gian, chi phí tính toán lớn
2.2 Phương pháp tính độ tương đồng mới cải thiện hạn chế trongphân bố thống kê
Phép đo độ tương đồng mới được định nghĩa như sau:
Trang 122.3 Phương pháp Lọc cộng tác dựa theo ghi nhớ tích hợp nội dungsản phẩm
2.3.1 Phương pháp tích hợp nội dung của sản phẩm vào hệ thống lọc cộngtác dựa theo ghi nhớ
Tác giả đề xuất phương pháp mới nhằm đánh giá độ tương đồng giữa bằngcách tận dụng dữ liệu Tag Genome Trong phần này, phương pháp tính độ
Trang 13tương đồng sg i ,g j sử dụng PCC được tính như sau.
ut
Để áp dụng phép đo độ tương đồng mới, sP CCgenome
g i ,g j được thay thế cho sijtrong kNNBasic và kNNBaseline Mô hình này được đặt tên là kNNContent
2.3.2 Xây dựng ma trận tương đồng kết hợp trong hệ thống gợi ý dựa trênghi nhớ
Phần này phân tích một số kỹ thuật kết hợp hai ma trận tương đồng, Sr
và Sc, với các phương pháp sau Trong đó, ⊙ ký hiệu phép nhân theo từngphần tử giữa Sr và Sc
Bảng 2.1: So sánh độ hiệu quả của mô hình sử dụng phép đo mới.
Trang 142.4.2 Kết quả tích hợp nội dung của sản phẩm vào hệ thống lọc cộng tácdựa theo ghi nhớ
Bảng 2.2: Hiệu năng của mô hình CF dựa trên ghi nhớ kết hợp với dữ liệu Tag Genome với k = 40 và k = 10.
Tập dữ liệu MovieLens 20M kNNBasic
Theo Bảng 2.2, khi kích thước tập các láng giềng được chọn bằng 40,
mô hình kNN với ma trận tương đồng tính theo công thức PCCgenome choRMSE cao hơn 0.22% và 0.38% so với các mô hình đối thủ sử dụng dữ liệulịch sử tương tác lần lượt là mô hình SVD++ và cubedPCCBaseline
2.4.3 Kết quả tích hợp ma trận tương đồng kết hợp trong hệ thống gợi ýdựa trên ghi nhớ
Bảng 2.3 cho thấy mô hình hiệu quả nhất, kNNBaseline sử dụng phép nhântheo từng phần tử giữa S và S , đạt RMSE thấp hơn 1.88% và cải thiện
Trang 15Bảng 2.3: Hiệu suất của mô hình kNN sử dụng ma trận độ tương đồng kết hợp so với các mô hình tham chiếu khác.
gian [s]
từ 2.51% - 3.67% trên tác vụ xếp hạng k sản phẩm so với SVD, trong khi
so với mô hình ghép kết quả dự đoán giữa kNNBaseline và kNNContent thìRMSE thấp hơn 0.77% và cải thiện từ 0.66% - 0.71% trên tác vụ xếp hạng
k sản phẩm So với mô hình ghép kết quả dự đoán trong các nghiên cứu liênquan, ma trận độ tương đồng kết hợp linh hoạt hơn nhiều về phương phápkết hợp, trong khi cung cấp hiệu suất tốt hơn
2.4.4 Kết quả triển khai các mô hình trên thiết bị máy tính Jetson Nano
Bảng 2.4: Hiệu suất, tài nguyên tiêu thụ và thời gian thực hiện các mô hình đề xuất triển khai trên máy tính Jetson Nano.
Mô
hình
Frq:1.5 GHz Huấn luyện 3.6 GB RAM
Kết quả trong bảng 2.4 cho thấy:
Trang 16 Thuật toán của các mô hình đều đã được tối ưu để hạn chế mức tàinguyên tiêu thụ của thiết bị.
Mô hình kNNBaseline phảu lưu trữ khối dữ liệu lớn nên gần như đã
sử dụng tối đa tài nguyên của thiết bị và phải sử dụng swap để có thể
đủ bộ nhớ đệm lưu trữ
Hai mô hình SVD và SVD++ chỉ sử dụng một phần tài nguyên vì trên
cả hai mô hình không cần phải lưu trữ nhiều dữ liệu
Thời gian thực hiện đều cao hơn khoảng 4-6 lần
Hình 2.2: Kết quả thực hiện gợi ý của hệ thống sử dụng mô hình SVD.
Hình 2.2 thể hiện kết quả gợi ý của hệ thống sử dụng mô hình SVD,chứng minh khả năng triển khai RSs trên thiết bị biên là hoàn toàn khảthi Với 10 gợi ý phim mà hệ thống đưa ra, có 6/10 phim nằm trong top 10phim mà người dùng yêu thích Ngoài ra, hoàn toàn có thể tinh chỉnh cácsiêu tham số trực tiếp trên ứng để phân tích và tinh chỉnh mô hình trực tiếptrên thiết bị biên
2.5 Kết luận
Trong chương này, tác giả đã đề xuất các công thức tính toán độ tương đồngmới giúp cải thiện đáng kể khả năng dự đoán của các mô hình kNNBaseline.Tiếp theo đó, một phương pháp tính toán độ tương đồng mới giữa hai sảnphẩm đã được đề xuất sử dụng dữ liệu mô tả nội dung sản phẩm dưới dạngcác vector điểm số genome Cuối cùng, tác giả phát triển một ma trận tươngđồng mới kết hợp cả hai nguồn thông tin về lịch sử đánh giá và nội dungsản phẩm Những kết quả trên đã được trình bày trong các nghiên cứu [C1],[C2] và [C3]