1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Nghiên cứu xây dựng hệ thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý kiến khách hàng trực tuyến TT

12 19 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 12
Dung lượng 700,9 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

Với sự bùng nổ của dữ liệu lớn, các ý kiến đánh giá của khách hàng trên các nền tảng trực tuyến cần được thu thập, khai thác, phân tích một cách tự động dưới sự hỗ trợ của các hệ thống t

Trang 1

LỜI MỞ ĐẦU

1 Cơ sở hình thành đề tài

a) Bối cảnh chung

Kiểm soát chất lượng đã trở nên quan trọng trong hệ thống quản

trị doanh nghiệp (Becser và Zoltay-Paprika, 2003) Hiện nay,

việc theo dõi và đánh giá chất lượng thường dựa trên việc khảo

sát thông tin khách hàng, và được thực hiện bằng những cách

thức như: phỏng vấn trực tiếp, phỏng vấn qua điện thoại, thảo

luận nhóm, khảo sát qua thư, khảo sát trực tuyến (tiêu chuẩn ISO

10004) Ngày nay, những tiến bộ của công nghệ đã làm thay đổi

cách thức truyền thông giúp cho khách hàng dễ dàng truy cập

thông tin và trao đổi ý kiến về sản phẩm và dịch vụ trên một quy

mô lớn trong thời gian thực Với sự bùng nổ của dữ liệu lớn, các

ý kiến đánh giá của khách hàng trên các nền tảng trực tuyến cần

được thu thập, khai thác, phân tích một cách tự động dưới sự hỗ

trợ của các hệ thống thông tin, cho phép các nhà kinh doanh có

thể dễ dàng theo dõi hành vi mua sắm, sở thích và đánh giá sự

hài lòng của khách hàng về chất lượng sản phẩm và dịch vụ

b) Bối cảnh thực tiễn ngành du lịch

Sự phát triển của Internet đã cung cấp nhiều phương thức mới để

kinh doanh dịch vụ du lịch và quảng bá các sản phẩm cho du

khách Việc ứng dụng công nghệ thông tin vào du lịch ngày càng

mang đến những cơ hội chiến lược và các công cụ mạnh mẽ cho

tăng trưởng kinh tế, phân phối lại của cải và phát triển công bằng

trên toàn cầu (Masron và cộng sự, 2016) Tại Việt Nam, xu

hướng ứng dụng công nghệ thông tin trong ngành du lịch cũng

đã có những chuyển biến mạnh mẽ với sự xuất hiện các công ty kinh doanh dịch vụ du lịch trực tuyến, các ứng dụng đặt tour trên nền tảng di động và nhiều website, diễn đàn, cổng thông tin xã hội, nhằm trao đổi, chia sẻ các chủ đề về du lịch (như TripAdvisor.com.vn, Agoda.com, Booking.com, ) Những áp lực cạnh tranh mới trong kỷ nguyên số khiến cho vấn đề kiểm soát và đánh giá chất lượng dịch vụ du lịch càng trở nên quan trọng đối với các doanh nghiệp Tuy nhiên, thực trạng đánh giá chất lượng dịch vụ du lịch vẫn được thực hiện bằng những cách thức truyền thống theo hướng dẫn của tiêu chuẩn chất lượng ISO

10004 Những phương pháp này không thể giám sát sự hài lòng của khách hàng một cách liên tục, và không có khả năng theo dõi

xu hướng chất lượng dịch vụ trong dài hạn (Yussupova và cộng

sự, 2016)

c) Tình hình nghiên cứu và ứng dụng

Nghiên cứu xây dựng các hệ thống hỗ trợ ra quyết định trong lĩnh vực du lịch đã được quan tâm nhiều bởi cộng đồng các nhà khoa học và đã có nhiều hệ thống được đề xuất và sử dụng tại doanh nghiệp trong ngành du lịch Tuy nhiên, có ít bằng chứng khoa học cho thấy có những nghiên cứu xây dựng hệ thống hỗ trợ ra quyết định giúp cho nhà quản trị có thể theo dõi, kiểm soát và cải tiến chất lượng dịch vụ du lịch tốt hơn

Những năm gần đây, cộng đồng các nhà khoa học cũng như các nhà quản trị doanh nghiệp đã quan tâm nhiều đến khai thác ý kiến dựa trên những phản hồi của khách hàng về các chủ đề du lịch

Trang 2

nhằm giúp cho nhà quản trị có thể phân tích các khía cạnh dịch

vụ du lịch Kết quả tổng quan tình hình nghiên cứu cũng đã cho

thấy chưa có nhiều nghiên cứu đi sâu vào ứng dụng của khai thác

ý kiến để giải quyết các mối quan tâm của doanh nghiệp kinh

doanh dịch vụ du lịch; và cũng có rất ít bằng chứng khoa học cho

thấy có nghiên cứu tiếp cận theo hướng xây dựng hệ thống hỗ trợ

ra quyết định dựa trên ứng dụng phương pháp khai thác ý kiến

của khách hàng từ cộng đồng trực tuyến để hỗ trợ nhà quản trị

trong việc theo dõi, đánh giá chất lượng dịch vụ du lịch

Xuất phát từ bối cảnh chung, bối cảnh thực tiễn của ngành du

lịch, tình hình nghiên cứu và ứng dụng như đã trình bày bên trên,

nghiên cứu sinh chọn hướng nghiên cứu Xây dựng hệ thống hỗ

trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương

pháp khai thác ý kiến khách hàng trực tuyến làm đề tài nghiên

cứu trong luận án này

2 Mục tiêu nghiên cứu

1) Nghiên cứu và đề xuất mô hình kiến trúc của hệ thống

hỗ trợ ra quyết định trong đánh giá chất lượng dịch vụ

du lịch, tiếp cận dựa trên phương pháp khai thác ý kiến

khách hàng trực tuyến

2) Nghiên cứu và đề xuất phương pháp khai thác ý kiến, hỗ

trợ cho nhà quản trị trong việc đánh giá chất lượng dịch

vụ du lịch

3) Nghiên cứu và đề xuất phương pháp tư vấn, hỗ trợ cho

khách hàng lựa chọn dịch vụ dựa trên ứng dụng kết quả

khai thác ý kiến

4) Thực nghiệm xây dựng hệ thống hỗ trợ người dùng đánh giá và cải tiến chất lượng dịch vụ du lịch

3 Câu hỏi nghiên cứu

1) Những thành phần chức năng đặc trưng của mô hình hệ thống hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý kiến cần phải có là gì? 2) Các phương pháp khai thác ý kiến nào là phù hợp để sử dụng trong việc đánh giá chất lượng dịch vụ du lịch dựa trên bộ dữ liệu thu thập được?

3) Các phương pháp nào để tư vấn cho khách hàng lựa chọn dịch vụ du lịch là phù hợp?

4) Cần phải làm những gì để xây dựng hệ thống hỗ trợ người dùng đánh giá và cải tiến chất lượng dịch vụ du lịch?

4 Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu của luận án là hệ thống hỗ trợ đánh giá

chất lượng dịch vụ du lịch Đối tượng nghiên cứu bao gồm ba yếu tố chính là: (i) Bài toán đánh giá chất lượng dịch vụ du lịch; (ii) Phương pháp khai thác ý kiến khách hàng trực tuyến; và (iii)

Mô hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ thống

hỗ trợ đánh giá chất lượng dịch vụ du lịch

Phạm vi nghiên cứu của luận án được giới hạn tập trung vào

loại hình dịch vụ khách sạn Dữ liệu phục vụ cho nghiên cứu là

những ý kiến bình luận bằng tiếng Việt của khách du lịch về các khách sạn tại các tỉnh và thành phố lớn tại Việt Nam Dữ liệu được thu thập tự động trên trang web Agoda.com

Trang 3

5 Phương pháp nghiên cứu

Luận án này tiếp cận nghiên cứu theo phương pháp kỹ thuật hệ

thống (System Engineering Methodology) Quy trình nghiên cứu

được thực hiện theo các bước của phương pháp khai thác dữ liệu

theo chuẩn công nghiệp CRISP-DM (Cross Industry Standard

Process for Data Mining) của Chapman và cộng sự (1999)

6 Khung nghiên cứu tổng quát

Trong khung nghiên cứu tổng quát, các khoảng trống nghiên cứu

được nhận dạng, mục tiêu nghiên cứu và câu hỏi nghiên cứu được

đặt ra trên cơ sở rút trích từ thực trạng việc đánh giá chất lượng

Hình 3: Khung nghiên cứu tổng quát

dịch vụ và các công nghệ hỗ trợ hiện tại Cơ sở tri thức là các lý thuyết nền tảng, phương pháp luận và các công cụ hỗ trợ cho việc thực hiện luận án Hoạt động nghiên cứu được thực hiện bao gồm: (i) xác định các bài toán liên quan đến khai thác ý kiến khách hàng trong đánh giá và tư vấn dịch vụ du lịch; (ii) phát triển mô hình kiến trúc và các giải pháp kỹ thuật để xây dựng hệ thống hỗ trợ đánh giá chất lượng dịch vụ; (iii) thực nghiệm xây dựng hệ thống, đánh giá và điều chỉnh cho phù hợp Các kết quả nghiên cứu của luận án được đề xuất áp dụng trong thực tiễn ngành du lịch và đóng góp thêm vào cơ sở tri thức liên quan

7 Những đóng góp mới của luận án

Đóng góp thứ nhất: Luận án đã góp phần luận giải trên cơ sở

khoa học và thực tiễn về vai trò và sự cần thiết của một hệ thống

hỗ trợ đánh giá chất lượng dịch vụ du lịch dựa trên những tiến bộ của phương pháp và nền tảng mới của công nghệ thông tin

Đóng góp thứ hai: Luận án đã đóng góp vào khung lý thuyết về

hệ thống hỗ trợ ra quyết định, đó là tiếp cận mới dựa trên khai thác ý kiến trong xây dựng các hệ thống hỗ trợ ra quyết định

Đóng góp thứ ba: Luận án đã đề xuất một mô hình kiến trúc cùng

với các giải pháp xây hệ thống hỗ trợ đánh giá chất lượng dịch

vụ dựa trên phương pháp khai thác ý kiến khách hàng trực tuyến Đóng góp thứ tư: Luận án đã xây dựng bản thử nghiệm hệ thống

hỗ trợ cho doanh nghiệp trong việc theo dõi, đánh giá và cải tiến chất lượng dịch vụ du lịch tại Việt Nam Bên cạnh đó, hệ thống còn giúp tư vấn cho du khách có cơ sở để lựa chọn những dịch

vụ du lịch được đánh giá tốt, phù hợp với nhu cầu

Trang 4

CHƯƠNG 1: TỔNG QUAN NGHIÊN CỨU VỀ

HỆ THỐNG HỖ TRỢ RA QUYẾT ĐỊNH VÀ

KHAI THÁC Ý KIẾN TRONG DU LỊCH

1.1 Tổng quan nghiên cứu về hệ thống hỗ trợ ra quyết định

trong du lịch

Nghiên cứu về hệ thống hỗ trợ ra quyết định trong lĩnh vực du

lịch đã được cộng đồng các nhà nghiên cứu quan tâm rất nhiều,

đa dạng về hình thức, tiếp cận cả về công nghệ lẫn ứng dụng để

hỗ trợ giải quyết nhiều vấn đề liên quan đến du lịch Tuy nhiên,

hướng nghiên cứu này vẫn có khía cạnh chưa khai thác hết, cần

cải tiến nhằm hướng đến các ứng dụng hệ thống hỗ trợ đánh giá

chất lượng dịch vụ du lịch thông qua cách tiếp cận khai thác ý

kiến khách hàng trực tuyến

1.2 Tổng quan nghiên cứu khai thác ý kiến trong du lịch

Đối với các nghiên cứu về khai thác ý kiến trong du lịch có hai

hướng nghiên cứu phổ biến: (i) các nghiên cứu về phương pháp

phân loại và tổng hợp ý kiến thường tập trung vào việc xây dựng,

áp dụng hoặc so sánh giữa các phương pháp tính toán nhằm tìm

ra phương pháp tốt nhất trong việc khai thác, phân tích và tổng

hợp ý kiến; và (ii) các nghiên cứu tác động của khai thác ý kiến

đối với hoạt động kinh doanh thường tiếp cận theo phân tích hành

vi, dựa trên các lý thuyết hành vi dự định và các mô hình định

lượng để phân tích xu hướng hoặc đo lường tác động của các ý

kiến đánh giá của khách hàng trực tuyến đối với hiệu quả hoạt

động kinh doanh của doanh nghiệp trong ngành du lịch

1.3 Nhận định các khoảng trống nghiên cứu

Nhận định thứ nhất: Các nghiên cứu về hệ thống hỗ trợ ra quyết

định trong lĩnh vực du lịch đã được quan tâm rất nhiều, hướng tiếp cận đa dạng cả về công nghệ lẫn ứng dụng để hỗ trợ giải quyết nhiều vấn đề liên quan đến du lịch Tuy vậy, gần như chưa tìm thấy có nghiên cứu nào trong và ngoài nước đề cập đến ứng dụng trong hỗ trợ đánh giá chất lượng dịch vụ du lịch

Nhận định thứ hai: Hướng tiếp cận nghiên cứu phương pháp

khai thác ý kiến cho thấy có rất nhiều kỹ thuật và công cụ hỗ trợ

đã được áp dụng trong các nghiên cứu Câu hỏi đặt ra là phương pháp nào được xem là tốt nhất để sử dụng làm giải pháp cho đề tài nghiên cứu?

Nhận định thứ ba: Hướng tiếp cận nghiên cứu khai thác ý kiến

nhằm ứng dụng kết quả khai thác ý kiến trong phân tích hành vi

và phân tích hiệu quả hoạt động kinh doanh của doanh nghiệp cũng rất đa dạng về chủ đề nghiên cứu Tuy nhiên, các nghiên cứu khai thác ý kiến ứng dụng trong phân tích thái độ, sở thích, quá trình ra quyết định chọn dịch vụ và đánh giá chất lượng dịch

vụ du lịch dựa trên dữ liệu lớn là một hướng nghiên cứu chưa được khai thác triệt để

Nhận định thứ tư: Hướng nghiên cứu phương pháp khai thác ý

kiến (đa phần là các nghiên cứu thuộc ngành khoa học máy tính)

và hướng nghiên cứu ứng dụng kết quả khai thác ý kiến (đa phần

là các nghiên cứu thuộc ngành kinh tế xã hội) thường rất tách biệt Trong khi hướng nghiên cứu thứ nhất thường dừng lại ở việc phân loại và tổng hợp ý kiến, thiếu bài toán áp dụng, còn ở hướng

Trang 5

nghiên cứu thứ hai thường khai thác ý kiến dưới dạng tường

minh, dựa vào điểm đánh giá sẵn có trong tập dữ liệu, không đi

sâu vào khai thác các ý kiến dưới dạng văn bản phi cấu trúc và

do đó sẽ bỏ qua những nhân tố ẩn chứa trong dữ liệu bình luận

của khách hàng

Nhận định thứ năm: Có rất ít bằng chứng thực nghiệm cho thấy

có nghiên cứu thực hiện khai thác ý kiến đối với ngôn ngữ tiếng

Việt Phải chăng khai thác ý kiến trên ngôn ngữ tiếng Việt là một

thách thức đối với cộng đồng các nhà nghiên cứu Việt Nam? Vấn

đề này cũng cần được làm sáng tỏ thêm trong đề tài nghiên cứu

Nhận định thứ sáu: Có thể khẳng định về mặt nghiên cứu thực

nghiệm, tại Việt Nam gần như ít có bằng chứng khoa học cho

thấy có nghiên cứu về hệ thống hỗ trợ ra quyết định trong đánh

giá chất lượng dịch vụ du lịch dựa trên phương pháp khai thác ý

kiến khách hàng trực tuyến

CHƯƠNG 2: CƠ SỞ LÝ LUẬN VỀ ĐÁNH GIÁ

CHẤT LƯỢNG DỊCH VỤ DU LỊCH, HỆ THỐNG HỖ

TRỢ RA QUYẾT ĐỊNH VÀ PHƯƠNG PHÁP

KHAI THÁC Ý KIẾN

2.1 Đánh giá chất lượng dịch vụ du lịch

2.1.1 Quan điểm về quản trị chất lượng

Quản trị chất lượng đã trở thành một phần quan trọng trong hệ

thống quản lý của doanh nghiệp (Becser và Zoltay-Paprika,

2003) Đối với doanh nghiệp hoạt động sản xuất, nhà quản lý

thường sử dụng các mô hình trong việc lựa chọn hướng đi phù

hợp để cải tiến chất lượng sản phẩm Tuy nhiên, các nhà quản lý của các doanh nghiệp cung cấp dịch vụ thường dựa vào trực giác khi ra các quyết định mang tính chiến lược liên quan đến chất lượng Mô hình PDCA (Plan-Do-Check-Act) của Ishikawa (1985) thường được áp dụng cho quá trình ra quyết định của doanh nghiệp về cải tiến chất lượng

2.1.2 Chất lượng dịch vụ du lịch

Theo Luật Du lịch Việt Nam, “dịch vụ du lịch là việc cung cấp các dịch vụ về lữ hành, vận chuyển, lưu trú, ăn uống, vui chơi giải trí, thông tin, hướng dẫn và những dịch vụ khác nhằm đáp ứng nhu cầu của khách du lịch”

2.1.3 Phương pháp đánh giá chất lượng dịch vụ du lịch

Trong lĩnh vực du lịch, mô hình đánh giá chất lượng dịch vụ của Gronroos (1984) và mô hình khoảng cách chất lượng dịch vụ của Parasuraman và cộng sự (1985) cùng với thang đo chất lượng dịch vụ SERVQUAL (Parasuraman và cộng sự, 1988) được sử dụng phổ biến

2.2 Hệ thống hỗ trợ ra quyết định

2.2.1 Quá trình ra quyết định

Theo Simon (1960), Shim và cộng sự (2002) (được trích bởi Felsberger và cộng sự, 2016), một quá trình ra quyết định bao gồm 6 bước: Xác định vấn đề, Xác định các giải pháp, Phát triển

mô hình ra quyết định, Phân tích các giải pháp, Lựa chọn một giải pháp và Triển khai giải pháp

Trang 6

2.2.2 Các khái niệm về hệ thống hỗ trợ ra quyết định

Theo Keen và Scott-Morton (1978), “Hệ thống hỗ trợ quyết định

là hệ thống kết hợp tri thức của con người và năng lực của máy

tính để nâng cao chất lượng quyết định Đây là một hệ thống dựa

trên máy tính, giúp nhà quản trị giải quyết các vấn đề có tính chất

bán cấu trúc”

2.2.3 Kiến trúc hệ thống hỗ trợ ra quyết định

Kiến trúc của một hệ thống hỗ trợ quyết định thường có 3 thành

phần chính (Galipalli và Madyala, 2012; Borissova và

Mustakerov, 2012): Hệ quản trị cơ sở dữ liệu, Hệ quản trị cơ sở

mô hình, Giao diện người dùng

2.2.4 Phân loại hệ thống hỗ trợ ra quyết định

Dựa vào cơ chế hỗ trợ ra quyết định, theo tổng hợp các nghiên

cứu của Felsberger và cộng sự (2016) và Borissova và

Mustakerov (2012), có 5 kiểu hệ thống hỗ trợ quyết định, bao

gồm: dựa trên mô hình (Model driven), dựa trên dữ liệu (Data

driven), dựa trên giao tiếp (Communication driven), dựa trên tài

liệu (Document driven) và dựa trên tri thức (Knowledge driven)

2.2.5 Hệ thống tư vấn thông tin

Hệ thống tư vấn là một dạng hệ thống hỗ trợ ra quyết định, hướng

đến hỗ trợ cho người dùng giải quyết vấn đề quá tải thông tin

(Hashler, 2012) Theo tổng hợp của Burke (2007) và Van

Capelleveen và cộng sự (2019), kỹ thuật tư vấn thông tin được

chia ra làm 5 loại chính: dựa trên nội dung (content-based), lọc

cộng tác (collaborative filtering), dựa trên tri thức

(knowledge-based), dựa vào nhân khẩu học và ngữ cảnh (demographic and context-based); và kỹ thuật lai (hybrid methods)

2.3 Phương pháp khai thác ý kiến

2.3.1 Ý kiến, quan điểm của khách hàng

Ngày nay, khách hàng có thể dễ dàng truy cập thông tin và trao đổi ý kiến về công ty, sản phẩm và dịch vụ trên một quy mô lớn, trong thời gian thực Sự bùng nổ của thế hệ Web 2.0, và chuyển sang nền tảng di động, sau đó là sự ra đời của một số lượng lớn các nền tảng đánh giá sản phẩm trực tuyến (TripAdvisor, Yelp.com, Amazon,…) Những nền tảng này cho phép khách hàng có cơ hội đăng bài đánh giá sản phẩm với nội dung dưới dạng điểm số và các ý kiến về sản phẩm Ý kiến từ mạng xã hội

và các website không chỉ tác động đến quá trình ra quyết định mua sắm của khách hàng mà còn hướng dẫn các nhà kinh doanh trong việc đưa ra các quyết định chiến lược (Piccoli và Pigni, 2013)

2.3.2 Khái quát về phương pháp khai thác ý kiến

Khai thác ý kiến (opinion mining), hay còn có một tên gọi khác

là phân tích cảm xúc (sentiment analysis), là một lĩnh vực nghiên cứu nhằm phân tích, đánh giá nhận định của con người về các đối tượng như: sản phẩm, dịch vụ, tổ chức, cá nhân, sự kiện, chủ đề

và các thuộc tính của đối tượng (Pang và Lee, 2008; Liu, 2012) Một quy trình khai thác ý kiến thường gồm ba bước chính: (i) Thu thập ý kiến (opinion retrieval), (ii) Phân loại ý kiến (opinion classification) và (iii) Tổng hợp ý kiến (opinion summarization) (Ali, 2015; Kumar và Reddy, 2016) Trong đó, phân loại ý kiến

Trang 7

được xem là bước quan trọng nhất nhằm mục đích phân lớp ý

kiến theo các quan điểm: lạc quan, tích cực (positive); bi quan,

tiêu cực (negative) và trung lập (neutral)

2.3.3 Kỹ thuật phân loại ý kiến

Có hai cách tiếp cận phổ biến trong phân loại ý kiến: dựa vào

phương pháp máy học (Machine learning), dựa vào từ vựng

(Lexicon based) (Medhat và cộng sự, 2014; Dhokrat và cộng sự,

2015; Yadav, 2015; Sun và cộng sự, 2017) Ngoài ra, để gia tăng

hiệu suất của việc phân loại ý kiến, các nghiên cứu đã dùng

phương pháp lai kết hợp hai phương pháp máy học và từ vựng

2.3.4 Đánh giá tính hiệu quả của phân loại ý kiến

Hệu quả của phân loại ý kiến thường được đánh giá dựa trên 4

chỉ số: Accuracy, Precision, Recall và F1

Bảng 2.3: Ma trận sai lầm

Thực tế: Negative False Positive (FP) True Negative (TN)

Các chỉ số được xác định bằng các công thức sau:

•  =

•  = 

• 1 = ×  ×!"##

CHƯƠNG 3: ĐỀ XUẤT MÔ HÌNH HỆ THỐNG HỖ TRỢ ĐÁNH GIÁ CHẤT LƯỢNG DỊCH VỤ DU LỊCH DỰA TRÊN PHƯƠNG PHÁP KHAI THÁC Ý KIẾN KHÁCH HÀNG TRỰC TUYẾN 3.1 Mô hình nghiên cứu đề xuất

3.1.1 Mô hình lý thuyết

Nghiên cứu đề xuất xây dựng mô hình hệ thống như hình 3.1:

3.1.2 Mô hình kiến trúc hệ thống

Hệ thống bao gồm ba phân hệ chính: (1) Phân hệ thu thập dữ liệu, (2) Phân hệ phân tích dữ liệu, và (3) Giao diện người dùng

Hình 3.1: Mô hình nghiên cứu đề xuất

Trang 8

3.2 Thiết kế nghiên cứu

Quy trình thực nghiệm gồm các bước: (1) Thu thập và Tiền xử

lý dữ liệu, (2) Thử nghiệm mô hình phân loại ý kiến, (3) Xây

dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ, (4) Xây

dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ, và (5) Xây

dựng giao diện người dùng

3.2.1 Thu thập và tiền xử lý dữ liệu

Nghiên cứu này tiến hành thu thập dữ liệu bằng chương trình tự

động, dữ liệu lấy từ trang web agoda.com Với đối tượng và phạm

vi nghiên cứu hướng đến là ngôn ngữ tiếng Việt, kỹ thuật khai

phá dữ liệu sử dụng để lọc chọn những bình luận của khách hàng

Hình 3.2: Mô hình kiến trúc hệ thống

bằng tiếng Việt Nghiên cứu tiến hành tiền xử lý dữ liệu bằng cách loại bỏ những dữ liệu khuyết, những bình luận không chứa đựng thông tin cần thiết để tiến hành bước xử lý tiếp theo

3.2.2 Thử nghiệm mô hình phân loại ý kiến

Trình tự thử nghiệm mô hình phân loại ý kiến:

• Gán nhãn dữ liệu (Data Labeling)

• Làm sạch dữ liệu (Data Cleaning)

• Tách từ (Words Segmentation)

• Trích xuất đặc trưng (Feature Extraction)

• Huấn luyện (Training)

• Đánh giá mô hình (Validation)

3.2.3 Xây dựng phương pháp hỗ trợ đánh giá chất lượng dịch vụ

Việc tổng hợp và xếp hạng dịch vụ du lịch theo quan điểm của

du khách có thể dựa vào công thức:

$= % &  %

! % (3.1)

Trong đó:

• Hi: là điểm xếp hạng của khách sạn thứ i

• TPi: là số bình luận được đánh giá là “tích cực” của khách sạn thứ i

• TNi: là số bình luận được đánh giá là “tiêu cực” của khách sạn thứ i

• TRi: là tổng số bình luận nhận được của khách sạn thứ i Ngoài ra, có thể chuẩn hóa theo thang đo khác tùy thuộc vào mục đích so sánh, đánh giá khách sạn:

R′=  + *+% &, -+ ,+ 0 ,…,+ 2 34×*5&"4 ,"6-+ ,+ 0 ,…,+ 2 3&, -+ ,+ 0 ,…,+ 2 3 (3.2)

Trang 9

Trong đó:

• R’i: điểm xếp hạng của khách sạn thứ i đã chuẩn hóa

• a và b là cận dưới và cận trên của thang đo (ví dụ nếu

muốn đưa về thang đo 1-5 điểm, lúc này a = 1, b = 5)

Nghiên cứu này sử dụng phương pháp xếp hạng khía cạnh dịch

vụ của Marrese-Taylor và cộng sự (2014), được mô tả như sau:

Gọi Pi và Ni là số quan điểm tích cực (positive) và số quan điểm

tiêu cực (negative) của khía cạnh (thuộc tính) ai

P_scorei và N_scorei là giá trị chuẩn hóa của Pi và Ni theo qui tắc

Min-Max, P_scorei và N_scorei sẽ nhận giá trị từ 0 đến 1, như

công thức sau:

 =

% &, - , 0 ,…, 2 3 ,"6- , 0 ,…, 2 3&, - , 0 ,…, 2 3 ≠ 0

(3.3)

>_ =

⎧ 0, >  = 0

% &, - , 0 ,…, 2 3 ,"6- , 0 ,…, 2 3&, - , 0 ,…, 2 3 , > ≠ 0

(3.4)

Độ lệch chuẩn điểm số của khía cạnh ai được tính bằng công thức

bên dưới, trong đó AV_scorei là điểm trung bình và STD_scorei

là độ lệch chuẩn:

?_= _% %

 (3.5)

@AB_= C* _ % & DE_ % 4 0 % & DE_ % 4 0

(3.6)

Chuẩn hóa STD_scorei sẽ tính được mức độ quan trọng tương đối (Relative importance) RIi của mỗi khía cạnh ai:

RI=

GH_ % &, -GH_ ,GH_ 0 ,…,GH_ 2 3 ,"6-GH_ ,GH_ 0 ,…,GH_ 2 3&, -GH_ ,GH_ 0 ,…,GH_ 2 3

(3.7)

3.2.4 Xây dựng phương pháp tư vấn hỗ trợ lựa chọn dịch vụ

Trình tự thực hiện được tiến hành như sau:

• Bước 1: Xác định độ tương tự của khách hàng mới so với khách hàng đã có trong hệ thống

• Bước 2: Dự đoán mức độ ưa thích khách sạn của khách hàng trong hệ thống bằng phương pháp lọc cộng tác Nghiên cứu này sẽ tiến hành huấn luyện và thử nghiệm một số

kỹ thuật dự đoán phổ biến thuộc phương pháp lọc cộng tác, bao gồm: Phân phối chuẩn ND (Normal Distribution), Thuật toán KNN (K-Nearest Neighbors), Đồng phân cụm CC (Co-Clustering), Kỹ thuật phân rã ma trận MF (Matrix Factorization)

3.2.5 Xây dựng giao diện người dùng

Màn hình giao diện hệ thống hỗ trợ người dùng đánh giá chất lượng dịch vụ khách sạn được xây dựng trên cơ sở tổng hợp các

xử lý, tính toán, phân tích để người dùng có thể tự động hóa quy trình đánh giá và cải tiến chất lượng

Trang 10

CHƯƠNG 4: KẾT QUẢ THỰC NGHIỆM XÂY DỰNG

HỆ THỐNG HỖ TRỢ ĐÁNH GIÁ CHẤT LƯỢNG

DỊCH VỤ DU LỊCH DỰA TRÊN PHƯƠNG PHÁP

KHAI THÁC Ý KIẾN KHÁCH HÀNG TRỰC TUYẾN

4.1 Kết quả thực nghiệm nghiên cứu

4.1.1 Kết quả thu thập và tiền xử lý dữ liệu

Kết quả thu thập dữ liệu được 39.976 bình luận bao gồm cả tiếng

Anh và tiếng Việt, trong khoảng thời gian từ năm 2010 đến năm

2019 Sau khi lọc bỏ các bình luận bằng tiếng Anh, chỉ giữ lại

các bình luận bằng Tiếng Việt, dữ liệu cịn lại để tiến hành thực

nghiệm là 14.559 bình luận của 521 khách sạn ở 40 tỉnh thành

trên cả nước

4.1.2 Kết quả thử nghiệm mơ hình phân loại ý kiến

Nghiên cứu này tiến hành thử nghiệm bằng 6 thuật tốn, bao

gồm: Nạve Bayes (NB), Support Vector Machines (SVM),

Logistic Regression (LR), Neural Network (NN), DecisionTree

(DT), RandomForest (RF) Kết quả thử nghiệm cho thấy các mơ

hình LR, SVM và NN cĩ độ chính xác khá cao (lần lượt là 0,79;

0,78 và 0,79) Nghĩa là các mơ hình này tương đối phù hợp với

tập dữ liệu huấn luyện Tuy nhiên, nếu xét thêm yếu tố thời gian

thì chỉ nên chọn mơ hình LR và SVM là tốt nhất Do đĩ, các ứng

dụng tiếp theo cĩ thể dùng hai mơ hình này như một cơng cụ để

phân loại ý kiến cho các dữ liệu bình luận chưa được phân loại

hoặc các dữ liệu bình luận mới phát sinh mà khơng cần phải huấn

luyện lại Kết quả nghiên cứu này đã giúp xác định phương pháp

và cơng cụ phân loại ý kiến phù hợp

4.1.3 Kết quả hỗ trợ đánh chất lượng dịch vụ

Việc xếp hạng khách sạn theo quan điểm của du khách được thực hiện như trong cơng thức (3.1) và (3.2) Nghiên cứu này sử dụng thang điểm từ 1 đến 5 và thực hiện làm trịn điểm số Kết quả cho thấy khách sạn được đánh giá 4 điểm chiếm số lượng cao nhất (209 khách sạn) và khách sạn được đánh giá 1 điểm chiếm số lượng thấp nhất (12 khách sạn)

4.1.3.2 Kết quả trích xuất khía cạnh dịch vụ

Nghiên cứu này dùng phương pháp TF-IDF để trích xuất ra khoảng 200 danh từ và cụm danh từ cĩ chỉ số TF-IDF cao nhất trong tập dữ liệu Sau khi xem xét về ngữ nghĩa và tham khảo các chuyên gia, kết quả giữ lại 40 khía cạnh cĩ ý nghĩa trong lĩnh vực khách sạn Kết quả thực nghiệm tính tốn với cơng thức (3.7) đã xác định được mức độ quan trọng tương đối của các khía cạnh dịch vụ khách sạn, và được xem như bộ tiêu chí cĩ trọng số cho các yếu tố chất lượng dịch vụ khách sạn, làm cơ sở cho nhà kinh doanh dịch vụ du lịch xem xét, đánh giá và so sánh chất lượng dịch vụ giữa các khách sạn trong cùng một tỉnh thành hoặc giữa các tỉnh thành khác nhau

4.1.4 Kết quả tư vấn hỗ trợ lựa chọn dịch vụ

Kết quả trên cho thấy phương pháp MF cĩ sai số thấp nhất là 0,4373; kế đến là phương pháp KNN cĩ sai số 0,4408; thứ ba là

CC với sai số 0,456 và cuối cùng là ND cĩ sai số cao nhất là

Ngày đăng: 17/06/2021, 07:42

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w