Với sự bùng nổ của dữ liệu lớn, các ý kiến đánh giá của khách hàng trên các nền tảng trực tuyến cần được thu thập, khai thác, phân tích một cách tự động dưới sự hỗ trợ của các hệ thống t
Trang 1LỜI MỞ ĐẦU
1 Cơ sở hình thành đề tài
a) Bối cảnh chung
Kiểm soát chất lượng đã trở nên quan trọng trong hệ thống quản
trị doanh nghiệp (Becser và Zoltay-Paprika, 2003) Hiện nay,
việc theo dõi và đánh giá chất lượng thường dựa trên việc khảo
sát thông tin khách hàng, và được thực hiện bằng những cách
thức như: phỏng vấn trực tiếp, phỏng vấn qua điện thoại, thảo
luận nhóm, khảo sát qua thư, khảo sát trực tuyến (tiêu chuẩn ISO
10004) Ngày nay, những tiến bộ của công nghệ đã làm thay đổi
cách thức truyền thông giúp cho khách hàng dễ dàng truy cập
thông tin và trao đổi ý kiến về sản phẩm và dịch vụ trên một quy
mô lớn trong thời gian thực Với sự bùng nổ của dữ liệu lớn, các
ý kiến đánh giá của khách hàng trên các nền tảng trực tuyến cần
được thu thập, khai thác, phân tích một cách tự động dưới sự hỗ
trợ của các hệ thống thông tin, cho phép các nhà kinh doanh có
thể dễ dàng theo dõi hành vi mua sắm, sở thích và đánh giá sự
hài lòng của khách hàng về chất lượng sản phẩm và dịch vụ
b) Bối cảnh thực tiễn ngành du lịch
Sự phát triển của Internet đã cung cấp nhiều phương thức mới để
kinh doanh dịch vụ du lịch và quảng bá các sản phẩm cho du
khách Việc ứng dụng công nghệ thông tin vào du lịch ngày càng
mang đến những cơ hội chiến lược và các công cụ mạnh mẽ cho
tăng trưởng kinh tế, phân phối lại của cải và phát triển công bằng
trên toàn cầu (Masron và cộng sự, 2016) Tại Việt Nam, xu
hướng ứng dụng công nghệ thông tin trong ngành du lịch cũng
đã có những chuyển biến mạnh mẽ với sự xuất hiện các công ty kinh doanh dịch vụ du lịch trực tuyến, các ứng dụng đặt tour trên nền tảng di động và nhiều website, diễn đàn, cổng thông tin xã hội, nhằm trao đổi, chia sẻ các chủ đề về du lịch (như TripAdvisor.com.vn, Agoda.com, Booking.com, ) Những áp lực cạnh tranh mới trong kỷ nguyên số khiến cho vấn đề kiểm soát và đánh giá chất lượng dịch vụ du lịch càng trở nên quan trọng đối với các doanh nghiệp Tuy nhiên, thực trạng đánh giá chất lượng dịch vụ du lịch vẫn được thực hiện bằng những cách thức truyền thống theo hướng dẫn của tiêu chuẩn chất lượng ISO
10004 Những phương pháp này không thể giám sát sự hài lòng của khách hàng một cách liên tục, và không có khả năng theo dõi
xu hướng chất lượng dịch vụ trong dài hạn (Yussupova và cộng
sự, 2016)
c) Tình hình nghiên cứu và ứng dụng
Nghiên cứu xây dựng các hệ thống hỗ trợ ra quyết định trong lĩnh vực du lịch đã được quan tâm nhiều bởi cộng đồng các nhà khoa học và đã có nhiều hệ thống được đề xuất và sử dụng tại doanh nghiệp trong ngành du lịch Tuy nhiên, có ít bằng chứng khoa học cho thấy có những nghiên cứu xây dựng hệ thống hỗ trợ ra quyết định giúp cho nhà quản trị có thể theo dõi, kiểm soát và cải tiến chất lượng dịch vụ du lịch tốt hơn
Những năm gần đây, cộng đồng các nhà khoa học cũng như các nhà quản trị doanh nghiệp đã quan tâm nhiều đến khai thác ý kiến dựa trên những phản hồi của khách hàng về các chủ đề du lịch
Trang 2nhằm giúp cho nhà quản trị có thể phân tích các khía cạnh dịch
vụ du lịch Kết quả tổng quan tình hình nghiên cứu cũng đã cho
thấy chưa có nhiều nghiên cứu đi sâu vào ứng dụng của khai thác
ý kiến để giải quyết các mối quan tâm của doanh nghiệp kinh
doanh dịch vụ du lịch; và cũng có rất ít bằng chứng khoa học cho
thấy có nghiên cứu tiếp cận theo hướng xây dựng hệ thống hỗ trợ
ra quyết định dựa trên ứng dụng phương pháp khai thác ý kiến
của khách hàng từ cộng đồng trực tuyến để hỗ trợ nhà quản trị
trong việc theo dõi, đánh giá chất lượng dịch vụ du lịch
Xuất phát từ bối cảnh chung, bối cảnh thực tiễn của ngành du
lịch, tình hình nghiên cứu và ứng dụng như đã trình bày bên trên,
nghiên cứu sinh chọn hướng nghiên cứu Xây dựng hệ thống hỗ
trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương
pháp khai thác ý kiến khách hàng trực tuyến làm đề tài nghiên
cứu trong luận án này
2 Mục tiêu nghiên cứu
1) Nghiên cứu và đề xuất mô hình kiến trúc của hệ thống
hỗ trợ ra quyết định trong đánh giá chất lượng dịch vụ
du lịch, tiếp cận dựa trên phương pháp khai thác ý kiến
khách hàng trực tuyến
2) Nghiên cứu và đề xuất phương pháp khai thác ý kiến, hỗ
trợ cho nhà quản trị trong việc đánh giá chất lượng dịch
vụ du lịch
3) Nghiên cứu và đề xuất phương pháp tư vấn, hỗ trợ cho
khách hàng lựa chọn dịch vụ dựa trên ứng dụng kết quả
khai thác ý kiến
4) Thực nghiệm xây dựng hệ thống hỗ trợ người dùng đánh giá và cải tiến chất lượng dịch vụ du lịch
3 Câu hỏi nghiên cứu
1) Những thành phần chức năng đặc trưng của mô hình hệ thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý kiến cần phải có là gì? 2) Các phương pháp khai thác ý kiến nào là phù hợp để sử dụng trong việc đánh giá chất lượng dịch vụ du lịch dựa trên bộ dữ liệu thu thập được?
3) Các phương pháp nào để tư vấn cho khách hàng lựa chọn dịch vụ du lịch là phù hợp?
4) Cần phải làm những gì để xây dựng hệ thống hỗ trợ người dùng đánh giá và cải tiến chất lượng dịch vụ du lịch?
4 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu của luận án là hệ thống hỗ trợ đánh giá
chất lượng dịch vụ du lịch Đối tượng nghiên cứu bao gồm ba yếu tố chính là: (i) Bài toán đánh giá chất lượng dịch vụ du lịch; (ii) Phương pháp khai thác ý kiến khách hàng trực tuyến; và (iii)
Mô hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ thống
hỗ trợ đánh giá chất lượng dịch vụ du lịch
Phạm vi nghiên cứu của luận án được giới hạn tập trung vào
loại hình dịch vụ khách sạn Dữ liệu phục vụ cho nghiên cứu là
những ý kiến bình luận bằng tiếng Việt của khách du lịch về các khách sạn tại các tỉnh và thành phố lớn tại Việt Nam Dữ liệu được thu thập tự động trên trang web Agoda.com
Trang 35 Phương pháp nghiên cứu
Luận án này tiếp cận nghiên cứu theo phương pháp kỹ thuật hệ
thống (System Engineering Methodology) Quy trình nghiên cứu
được thực hiện theo các bước của phương pháp khai thác dữ liệu
theo chuẩn công nghiệp CRISP-DM (Cross Industry Standard
Process for Data Mining) của Chapman và cộng sự (1999)
6 Khung nghiên cứu tổng quát
Trong khung nghiên cứu tổng quát, các khoảng trống nghiên cứu
được nhận dạng, mục tiêu nghiên cứu và câu hỏi nghiên cứu được
đặt ra trên cơ sở rút trích từ thực trạng việc đánh giá chất lượng
Hình 3: Khung nghiên cứu tổng quát
dịch vụ và các công nghệ hỗ trợ hiện tại Cơ sở tri thức là các lý thuyết nền tảng, phương pháp luận và các công cụ hỗ trợ cho việc thực hiện luận án Hoạt động nghiên cứu được thực hiện bao gồm: (i) xác định các bài toán liên quan đến khai thác ý kiến khách hàng trong đánh giá và tư vấn dịch vụ du lịch; (ii) phát triển mô hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ thống hỗ trợ đánh giá chất lượng dịch vụ; (iii) thực nghiệm xây dựng hệ thống, đánh giá và điều chỉnh cho phù hợp Các kết quả nghiên cứu của luận án được đề xuất áp dụng trong thực tiễn ngành du lịch và đóng góp thêm vào cơ sở tri thức liên quan
7 Những đóng góp mới của luận án
Đóng góp thứ nhất: Luận án đã góp phần luận giải trên cơ sở
khoa học và thực tiễn về vai trò và sự cần thiết của một hệ thống
hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên những tiến bộ của phương pháp và nền tảng mới của công nghệ thông tin
Đóng góp thứ hai: Luận án đã đóng góp vào khung lý thuyết về
hệ thống hỗ trợ ra quyết định, đó là tiếp cận mới dựa trên khai thác ý kiến trong xây dựng các hệ thống hỗ trợ ra quyết định
Đóng góp thứ ba: Luận án đã đề xuất một mô hình kiến trúc cùng
với các giải pháp xây hệ thống hỗ trợ đánh giá chất lượng dịch
vụ dựa trên phương pháp khai thác ý kiến khách hàng trực tuyến Đóng góp thứ tư: Luận án đã xây dựng bản thử nghiệm hệ thống
hỗ trợ cho doanh nghiệp trong việc theo dõi, đánh giá và cải tiến chất lượng dịch vụ du lịch tại Việt Nam Bên cạnh đó, hệ thống còn giúp tư vấn cho du khách có cơ sở để lựa chọn những dịch
vụ du lịch được đánh giá tốt, phù hợp với nhu cầu
Trang 4CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU VỀ
HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH VÀ
KHAI THÁC Ý KIẾN TRONG DU LỊCH
1.1 Tổng quan nghiên cứu về hệ thống hỗ trợ ra quyết định
trong du lịch
Nghiên cứu về hệ thống hỗ trợ ra quyết định trong lĩnh vực du
lịch đã được cộng đồng các nhà nghiên cứu quan tâm rất nhiều,
đa dạng về hình thức, tiếp cận cả về công nghệ lẫn ứng dụng để
hỗ trợ giải quyết nhiều vấn đề liên quan đến du lịch Tuy nhiên,
hướng nghiên cứu này vẫn có khía cạnh chưa khai thác hết, cần
cải tiến nhằm hướng đến các ứng dụng hệ thống hỗ trợ đánh giá
chất lượng dịch vụ du lịch thông qua cách tiếp cận khai thác ý
kiến khách hàng trực tuyến
1.2 Tổng quan nghiên cứu khai thác ý kiến trong du lịch
Đối với các nghiên cứu về khai thác ý kiến trong du lịch có hai
hướng nghiên cứu phổ biến: (i) các nghiên cứu về phương pháp
phân loại và tổng hợp ý kiến thường tập trung vào việc xây dựng,
áp dụng hoặc so sánh giữa các phương pháp tính toán nhằm tìm
ra phương pháp tốt nhất trong việc khai thác, phân tích và tổng
hợp ý kiến; và (ii) các nghiên cứu tác động của khai thác ý kiến
đối với hoạt động kinh doanh thường tiếp cận theo phân tích hành
vi, dựa trên các lý thuyết hành vi dự định và các mô hình định
lượng để phân tích xu hướng hoặc đo lường tác động của các ý
kiến đánh giá của khách hàng trực tuyến đối với hiệu quả hoạt
động kinh doanh của doanh nghiệp trong ngành du lịch
1.3 Nhận định các khoảng trống nghiên cứu
Nhận định thứ nhất: Các nghiên cứu về hệ thống hỗ trợ ra quyết
định trong lĩnh vực du lịch đã được quan tâm rất nhiều, hướng tiếp cận đa dạng cả về công nghệ lẫn ứng dụng để hỗ trợ giải quyết nhiều vấn đề liên quan đến du lịch Tuy vậy, gần như chưa tìm thấy có nghiên cứu nào trong và ngoài nước đề cập đến ứng dụng trong hỗ trợ đánh giá chất lượng dịch vụ du lịch
Nhận định thứ hai: Hướng tiếp cận nghiên cứu phương pháp
khai thác ý kiến cho thấy có rất nhiều kỹ thuật và công cụ hỗ trợ
đã được áp dụng trong các nghiên cứu Câu hỏi đặt ra là phương pháp nào được xem là tốt nhất để sử dụng làm giải pháp cho đề tài nghiên cứu?
Nhận định thứ ba: Hướng tiếp cận nghiên cứu khai thác ý kiến
nhằm ứng dụng kết quả khai thác ý kiến trong phân tích hành vi
và phân tích hiệu quả hoạt động kinh doanh của doanh nghiệp cũng rất đa dạng về chủ đề nghiên cứu Tuy nhiên, các nghiên cứu khai thác ý kiến ứng dụng trong phân tích thái độ, sở thích, quá trình ra quyết định chọn dịch vụ và đánh giá chất lượng dịch
vụ du lịch dựa trên dữ liệu lớn là một hướng nghiên cứu chưa được khai thác triệt để
Nhận định thứ tư: Hướng nghiên cứu phương pháp khai thác ý
kiến (đa phần là các nghiên cứu thuộc ngành khoa học máy tính)
và hướng nghiên cứu ứng dụng kết quả khai thác ý kiến (đa phần
là các nghiên cứu thuộc ngành kinh tế xã hội) thường rất tách biệt Trong khi hướng nghiên cứu thứ nhất thường dừng lại ở việc phân loại và tổng hợp ý kiến, thiếu bài toán áp dụng, còn ở hướng
Trang 5nghiên cứu thứ hai thường khai thác ý kiến dưới dạng tường
minh, dựa vào điểm đánh giá sẵn có trong tập dữ liệu, không đi
sâu vào khai thác các ý kiến dưới dạng văn bản phi cấu trúc và
do đó sẽ bỏ qua những nhân tố ẩn chứa trong dữ liệu bình luận
của khách hàng
Nhận định thứ năm: Có rất ít bằng chứng thực nghiệm cho thấy
có nghiên cứu thực hiện khai thác ý kiến đối với ngôn ngữ tiếng
Việt Phải chăng khai thác ý kiến trên ngôn ngữ tiếng Việt là một
thách thức đối với cộng đồng các nhà nghiên cứu Việt Nam? Vấn
đề này cũng cần được làm sáng tỏ thêm trong đề tài nghiên cứu
Nhận định thứ sáu: Có thể khẳng định về mặt nghiên cứu thực
nghiệm, tại Việt Nam gần như ít có bằng chứng khoa học cho
thấy có nghiên cứu về hệ thống hỗ trợ ra quyết định trong đánh
giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý
kiến khách hàng trực tuyến
CHƯƠNG 2: CƠ SỞ LÝ LUẬN VỀ ĐÁNH GIÁ
CHẤT LƯỢNG DỊCH VỤ DU LỊCH, HỆ THỐNG HỖ
TRỢ RA QUYẾT ĐỊNH VÀ PHƯƠNG PHÁP
KHAI THÁC Ý KIẾN
2.1 Đánh giá chất lượng dịch vụ du lịch
2.1.1 Quan điểm về quản trị chất lượng
Quản trị chất lượng đã trở thành một phần quan trọng trong hệ
thống quản lý của doanh nghiệp (Becser và Zoltay-Paprika,
2003) Đối với doanh nghiệp hoạt động sản xuất, nhà quản lý
thường sử dụng các mô hình trong việc lựa chọn hướng đi phù
hợp để cải tiến chất lượng sản phẩm Tuy nhiên, các nhà quản lý của các doanh nghiệp cung cấp dịch vụ thường dựa vào trực giác khi ra các quyết định mang tính chiến lược liên quan đến chất lượng Mô hình PDCA (Plan-Do-Check-Act) của Ishikawa (1985) thường được áp dụng cho quá trình ra quyết định của doanh nghiệp về cải tiến chất lượng
2.1.2 Chất lượng dịch vụ du lịch
Theo Luật Du lịch Việt Nam, “dịch vụ du lịch là việc cung cấp các dịch vụ về lữ hành, vận chuyển, lưu trú, ăn uống, vui chơi giải trí, thông tin, hướng dẫn và những dịch vụ khác nhằm đáp ứng nhu cầu của khách du lịch”
2.1.3 Phương pháp đánh giá chất lượng dịch vụ du lịch
Trong lĩnh vực du lịch, mô hình đánh giá chất lượng dịch vụ của Gronroos (1984) và mô hình khoảng cách chất lượng dịch vụ của Parasuraman và cộng sự (1985) cùng với thang đo chất lượng dịch vụ SERVQUAL (Parasuraman và cộng sự, 1988) được sử dụng phổ biến
2.2 Hệ thống hỗ trợ ra quyết định
2.2.1 Quá trình ra quyết định
Theo Simon (1960), Shim và cộng sự (2002) (được trích bởi Felsberger và cộng sự, 2016), một quá trình ra quyết định bao gồm 6 bước: Xác định vấn đề, Xác định các giải pháp, Phát triển
mô hình ra quyết định, Phân tích các giải pháp, Lựa chọn một giải pháp và Triển khai giải pháp
Trang 62.2.2 Các khái niệm về hệ thống hỗ trợ ra quyết định
Theo Keen và Scott-Morton (1978), “Hệ thống hỗ trợ quyết định
là hệ thống kết hợp tri thức của con người và năng lực của máy
tính để nâng cao chất lượng quyết định Đây là một hệ thống dựa
trên máy tính, giúp nhà quản trị giải quyết các vấn đề có tính chất
bán cấu trúc”
2.2.3 Kiến trúc hệ thống hỗ trợ ra quyết định
Kiến trúc của một hệ thống hỗ trợ quyết định thường có 3 thành
phần chính (Galipalli và Madyala, 2012; Borissova và
Mustakerov, 2012): Hệ quản trị cơ sở dữ liệu, Hệ quản trị cơ sở
mô hình, Giao diện người dùng
2.2.4 Phân loại hệ thống hỗ trợ ra quyết định
Dựa vào cơ chế hỗ trợ ra quyết định, theo tổng hợp các nghiên
cứu của Felsberger và cộng sự (2016) và Borissova và
Mustakerov (2012), có 5 kiểu hệ thống hỗ trợ quyết định, bao
gồm: dựa trên mô hình (Model driven), dựa trên dữ liệu (Data
driven), dựa trên giao tiếp (Communication driven), dựa trên tài
liệu (Document driven) và dựa trên tri thức (Knowledge driven)
2.2.5 Hệ thống tư vấn thông tin
Hệ thống tư vấn là một dạng hệ thống hỗ trợ ra quyết định, hướng
đến hỗ trợ cho người dùng giải quyết vấn đề quá tải thông tin
(Hashler, 2012) Theo tổng hợp của Burke (2007) và Van
Capelleveen và cộng sự (2019), kỹ thuật tư vấn thông tin được
chia ra làm 5 loại chính: dựa trên nội dung (content-based), lọc
cộng tác (collaborative filtering), dựa trên tri thức
(knowledge-based), dựa vào nhân khẩu học và ngữ cảnh (demographic and context-based); và kỹ thuật lai (hybrid methods)
2.3 Phương pháp khai thác ý kiến
2.3.1 Ý kiến, quan điểm của khách hàng
Ngày nay, khách hàng có thể dễ dàng truy cập thông tin và trao đổi ý kiến về công ty, sản phẩm và dịch vụ trên một quy mô lớn, trong thời gian thực Sự bùng nổ của thế hệ Web 2.0, và chuyển sang nền tảng di động, sau đó là sự ra đời của một số lượng lớn các nền tảng đánh giá sản phẩm trực tuyến (TripAdvisor, Yelp.com, Amazon,…) Những nền tảng này cho phép khách hàng có cơ hội đăng bài đánh giá sản phẩm với nội dung dưới dạng điểm số và các ý kiến về sản phẩm Ý kiến từ mạng xã hội
và các website không chỉ tác động đến quá trình ra quyết định mua sắm của khách hàng mà còn hướng dẫn các nhà kinh doanh trong việc đưa ra các quyết định chiến lược (Piccoli và Pigni, 2013)
2.3.2 Khái quát về phương pháp khai thác ý kiến
Khai thác ý kiến (opinion mining), hay còn có một tên gọi khác
là phân tích cảm xúc (sentiment analysis), là một lĩnh vực nghiên cứu nhằm phân tích, đánh giá nhận định của con người về các đối tượng như: sản phẩm, dịch vụ, tổ chức, cá nhân, sự kiện, chủ đề
và các thuộc tính của đối tượng (Pang và Lee, 2008; Liu, 2012) Một quy trình khai thác ý kiến thường gồm ba bước chính: (i) Thu thập ý kiến (opinion retrieval), (ii) Phân loại ý kiến (opinion classification) và (iii) Tổng hợp ý kiến (opinion summarization) (Ali, 2015; Kumar và Reddy, 2016) Trong đó, phân loại ý kiến
Trang 7được xem là bước quan trọng nhất nhằm mục đích phân lớp ý
kiến theo các quan điểm: lạc quan, tích cực (positive); bi quan,
tiêu cực (negative) và trung lập (neutral)
2.3.3 Kỹ thuật phân loại ý kiến
Có hai cách tiếp cận phổ biến trong phân loại ý kiến: dựa vào
phương pháp máy học (Machine learning), dựa vào từ vựng
(Lexicon based) (Medhat và cộng sự, 2014; Dhokrat và cộng sự,
2015; Yadav, 2015; Sun và cộng sự, 2017) Ngoài ra, để gia tăng
hiệu suất của việc phân loại ý kiến, các nghiên cứu đã dùng
phương pháp lai kết hợp hai phương pháp máy học và từ vựng
2.3.4 Đánh giá tính hiệu quả của phân loại ý kiến
Hệu quả của phân loại ý kiến thường được đánh giá dựa trên 4
chỉ số: Accuracy, Precision, Recall và F1
Bảng 2.3: Ma trận sai lầm
Thực tế: Negative False Positive (FP) True Negative (TN)
Các chỉ số được xác định bằng các công thức sau:
• =
• =
• 1 = × ×!"##
CHƯƠNG 3: ĐỀ XUẤT MÔ HÌNH HỆ THỐNG HỖ TRỢ ĐÁNH GIÁ CHẤT LƯỢNG DỊCH VỤ DU LỊCH DỰA TRÊN PHƯƠNG PHÁP KHAI THÁC Ý KIẾN KHÁCH HÀNG TRỰC TUYẾN 3.1 Mô hình nghiên cứu đề xuất
3.1.1 Mô hình lý thuyết
Nghiên cứu đề xuất xây dựng mô hình hệ thống như hình 3.1:
3.1.2 Mô hình kiến trúc hệ thống
Hệ thống bao gồm ba phân hệ chính: (1) Phân hệ thu thập dữ liệu, (2) Phân hệ phân tích dữ liệu, và (3) Giao diện người dùng
Hình 3.1: Mô hình nghiên cứu đề xuất
Trang 83.2 Thiết kế nghiên cứu
Quy trình thực nghiệm gồm các bước: (1) Thu thập và Tiền xử
lý dữ liệu, (2) Thử nghiệm mô hình phân loại ý kiến, (3) Xây
dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ, (4) Xây
dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ, và (5) Xây
dựng giao diện người dùng
3.2.1 Thu thập và tiền xử lý dữ liệu
Nghiên cứu này tiến hành thu thập dữ liệu bằng chương trình tự
động, dữ liệu lấy từ trang web agoda.com Với đối tượng và phạm
vi nghiên cứu hướng đến là ngôn ngữ tiếng Việt, kỹ thuật khai
phá dữ liệu sử dụng để lọc chọn những bình luận của khách hàng
Hình 3.2: Mô hình kiến trúc hệ thống
bằng tiếng Việt Nghiên cứu tiến hành tiền xử lý dữ liệu bằng cách loại bỏ những dữ liệu khuyết, những bình luận không chứa đựng thông tin cần thiết để tiến hành bước xử lý tiếp theo
3.2.2 Thử nghiệm mô hình phân loại ý kiến
Trình tự thử nghiệm mô hình phân loại ý kiến:
• Gán nhãn dữ liệu (Data Labeling)
• Làm sạch dữ liệu (Data Cleaning)
• Tách từ (Words Segmentation)
• Trích xuất đặc trưng (Feature Extraction)
• Huấn luyện (Training)
• Đánh giá mô hình (Validation)
3.2.3 Xây dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ
Việc tổng hợp và xếp hạng dịch vụ du lịch theo quan điểm của
du khách có thể dựa vào công thức:
$=% & %
! % (3.1)
Trong đó:
• Hi: là điểm xếp hạng của khách sạn thứ i
• TPi: là số bình luận được đánh giá là “tích cực” của khách sạn thứ i
• TNi: là số bình luận được đánh giá là “tiêu cực” của khách sạn thứ i
• TRi: là tổng số bình luận nhận được của khách sạn thứ i Ngoài ra, có thể chuẩn hóa theo thang đo khác tùy thuộc vào mục đích so sánh, đánh giá khách sạn:
R′= + *+% &, -+ ,+ 0 ,…,+ 2 34×*5&"4 ,"6-+ ,+ 0 ,…,+ 2 3&, -+ ,+ 0 ,…,+ 2 3 (3.2)
Trang 9Trong đó:
• R’i: điểm xếp hạng của khách sạn thứ i đã chuẩn hóa
• a và b là cận dưới và cận trên của thang đo (ví dụ nếu
muốn đưa về thang đo 1-5 điểm, lúc này a = 1, b = 5)
Nghiên cứu này sử dụng phương pháp xếp hạng khía cạnh dịch
vụ của Marrese-Taylor và cộng sự (2014), được mô tả như sau:
Gọi Pi và Ni là số quan điểm tích cực (positive) và số quan điểm
tiêu cực (negative) của khía cạnh (thuộc tính) ai
P_scorei và N_scorei là giá trị chuẩn hóa của Pi và Ni theo qui tắc
Min-Max, P_scorei và N_scorei sẽ nhận giá trị từ 0 đến 1, như
công thức sau:
=
⎩
⎨
% &, - , 0 ,…, 2 3 ,"6- , 0 ,…, 2 3&, - , 0 ,…, 2 3 ≠ 0
(3.3)
>_ =
⎩
⎨
⎪
⎧ 0, > = 0
% &, - , 0 ,…, 2 3 ,"6- , 0 ,…, 2 3&, - , 0 ,…, 2 3 , > ≠ 0
(3.4)
Độ lệch chuẩn điểm số của khía cạnh ai được tính bằng công thức
bên dưới, trong đó AV_scorei là điểm trung bình và STD_scorei
là độ lệch chuẩn:
?_= _% %
(3.5)
@AB_= C*_ % & DE_ % 4 0 % & DE_ % 4 0
(3.6)
Chuẩn hóa STD_scorei sẽ tính được mức độ quan trọng tương đối (Relative importance) RIi của mỗi khía cạnh ai:
RI=
GH_ % &, -GH_ ,GH_ 0 ,…,GH_ 2 3 ,"6-GH_ ,GH_ 0 ,…,GH_ 2 3&, -GH_ ,GH_ 0 ,…,GH_ 2 3
(3.7)
3.2.4 Xây dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ
Trình tự thực hiện được tiến hành như sau:
• Bước 1: Xác định độ tương tự của khách hàng mới so với khách hàng đã có trong hệ thống
• Bước 2: Dự đoán mức độ ưa thích khách sạn của khách hàng trong hệ thống bằng phương pháp lọc cộng tác Nghiên cứu này sẽ tiến hành huấn luyện và thử nghiệm một số
kỹ thuật dự đoán phổ biến thuộc phương pháp lọc cộng tác, bao gồm: Phân phối chuẩn ND (Normal Distribution), Thuật toán KNN (K-Nearest Neighbors), Đồng phân cụm CC (Co-Clustering), Kỹ thuật phân rã ma trận MF (Matrix Factorization)
3.2.5 Xây dựng giao diện người dùng
Màn hình giao diện hệ thống hỗ trợ người dùng đánh giá chất lượng dịch vụ khách sạn được xây dựng trên cơ sở tổng hợp các
xử lý, tính toán, phân tích để người dùng có thể tự động hóa quy trình đánh giá và cải tiến chất lượng
Trang 10CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM XÂY DỰNG
HỆ THỐNG HỖ TRỢ ĐÁNH GIÁ CHẤT LƯỢNG
DỊCH VỤ DU LỊCH DỰA TRÊN PHƯƠNG PHÁP
KHAI THÁC Ý KIẾN KHÁCH HÀNG TRỰC TUYẾN
4.1 Kết quả thực nghiệm nghiên cứu
4.1.1 Kết quả thu thập và tiền xử lý dữ liệu
Kết quả thu thập dữ liệu được 39.976 bình luận bao gồm cả tiếng
Anh và tiếng Việt, trong khoảng thời gian từ năm 2010 đến năm
2019 Sau khi lọc bỏ các bình luận bằng tiếng Anh, chỉ giữ lại
các bình luận bằng Tiếng Việt, dữ liệu cịn lại để tiến hành thực
nghiệm là 14.559 bình luận của 521 khách sạn ở 40 tỉnh thành
trên cả nước
4.1.2 Kết quả thử nghiệm mơ hình phân loại ý kiến
Nghiên cứu này tiến hành thử nghiệm bằng 6 thuật tốn, bao
gồm: Nạve Bayes (NB), Support Vector Machines (SVM),
Logistic Regression (LR), Neural Network (NN), DecisionTree
(DT), RandomForest (RF) Kết quả thử nghiệm cho thấy các mơ
hình LR, SVM và NN cĩ độ chính xác khá cao (lần lượt là 0,79;
0,78 và 0,79) Nghĩa là các mơ hình này tương đối phù hợp với
tập dữ liệu huấn luyện Tuy nhiên, nếu xét thêm yếu tố thời gian
thì chỉ nên chọn mơ hình LR và SVM là tốt nhất Do đĩ, các ứng
dụng tiếp theo cĩ thể dùng hai mơ hình này như một cơng cụ để
phân loại ý kiến cho các dữ liệu bình luận chưa được phân loại
hoặc các dữ liệu bình luận mới phát sinh mà khơng cần phải huấn
luyện lại Kết quả nghiên cứu này đã giúp xác định phương pháp
và cơng cụ phân loại ý kiến phù hợp
4.1.3 Kết quả hỗ trợ đánh chất lượng dịch vụ
Việc xếp hạng khách sạn theo quan điểm của du khách được thực hiện như trong cơng thức (3.1) và (3.2) Nghiên cứu này sử dụng thang điểm từ 1 đến 5 và thực hiện làm trịn điểm số Kết quả cho thấy khách sạn được đánh giá 4 điểm chiếm số lượng cao nhất (209 khách sạn) và khách sạn được đánh giá 1 điểm chiếm số lượng thấp nhất (12 khách sạn)
4.1.3.2 Kết quả trích xuất khía cạnh dịch vụ
Nghiên cứu này dùng phương pháp TF-IDF để trích xuất ra khoảng 200 danh từ và cụm danh từ cĩ chỉ số TF-IDF cao nhất trong tập dữ liệu Sau khi xem xét về ngữ nghĩa và tham khảo các chuyên gia, kết quả giữ lại 40 khía cạnh cĩ ý nghĩa trong lĩnh vực khách sạn Kết quả thực nghiệm tính tốn với cơng thức (3.7) đã xác định được mức độ quan trọng tương đối của các khía cạnh dịch vụ khách sạn, và được xem như bộ tiêu chí cĩ trọng số cho các yếu tố chất lượng dịch vụ khách sạn, làm cơ sở cho nhà kinh doanh dịch vụ du lịch xem xét, đánh giá và so sánh chất lượng dịch vụ giữa các khách sạn trong cùng một tỉnh thành hoặc giữa các tỉnh thành khác nhau
4.1.4 Kết quả tư vấn hỗ trợ lựa chọn dịch vụ
Kết quả trên cho thấy phương pháp MF cĩ sai số thấp nhất là 0,4373; kế đến là phương pháp KNN cĩ sai số 0,4408; thứ ba là
CC với sai số 0,456 và cuối cùng là ND cĩ sai số cao nhất là