Bookmark not defined.. Bookmark not defined.. Bookmark not defined.. Các thách th c trong khai phá quan đi m .... Nh ng ng i khác nhau có phong cách vi t khác nhau .... Các bài toán khai
Trang 1TR NG I H C CỌNG NGH
V TH NH N
T NG H P QUAN I M TR C TUY N C A
NG I TIểU DÙNG THEO TệNH N NG C A
S N PH M
LU N V N TH C S CỌNG NGH THỌNG TIN
Trang 2TR NG I H C CỌNG NGH
V TH NH N
T NG H P QUAN I M TR C TUY N C A
NG I TIểU DÙNG THEO TệNH N NG C A
S N PH M
Ngành: Công ngh thông tin
Chuyên ngành: H th ng thông tin
Mã s : 60 48 01 04
LU N V N TH C S CỌNG NGH THỌNG TIN
HẨ N I - 2016
Trang 3M c l c
L i cam đoan Error! Bookmark not defined
M c l c 1
Danh m c hình v Error! Bookmark not defined Danh m c b ng bi u Error! Bookmark not defined L i c m n Error! Bookmark not defined M đ u 3
Ch ng 1 T ng quan v khai phá quan đi m 5
1.1 Gi i thi u 5
1.1.1 i t ng 6
1.1.2 Các đ c tr ng n và hi n 6
1.1.3 o n đánh giá 6
1.1.4 Quan đi m n, hi n 7
1.1.5 Ng i đánh giá 7
1.2 Các thách th c trong khai phá quan đi m 7
1.2.1 Nh ng ng i khác nhau có phong cách vi t khác nhau 7
1.2.2 Quan đi m thay đ i theo th i gian 7
1.2.3 m nh c a quan đi m 8
1.2.4 Quan đi m theo ng c nh 8
1.2.5 Các câu đánh giá có s pha tr n 8
1.2.6 Quan đi m mang tính châm bi m, m a mai 9
1.2.7 X lỦ ngôn ng t nhiên trong câu quan đi m 9
1.3 Các ng d ng trong khai phá quan đi m 9
1.3.1 Nghiên c u th tr ng dành cho ng i mua và bán 9
1.3.2 C i thi n ch t l ng c a s n ph m, d ch v 9
1.3.3 H th ng g i Ủ 10
1.3.4 H tr thông minh trong chính quy n 10
1.3.5 H tr đ a ra quy t đ nh 10
1.4 Các bài toán khai phá quan đi m 10
1.4.1 Phân l p quan điêm 11
Trang 41.4.2 Khai phá quan đi m so sánh 11
1.4.3 T ng h p quan đi m 11
Ch ng 2 Các ph ng pháp ti p c n bài toán t ng h p quan đi m theo tính n ng c a
s n ph m Error! Bookmark not defined
2.1 Xác đ nh đ i t ng Error! Bookmark not defined
2.2 Trích xu t khía c nh Error! Bookmark not defined
defined
2.2.3 Mô hình ch đ Error! Bookmark not defined
Ch ng 3 T ng h p quan đi m tr c tuy n c a ng i tiêu dùng Vi t Nam theo tính
n ng c a s n ph m Error! Bookmark not defined
3.1.1 Ti n x lỦ d li u Error! Bookmark not defined
3.1.2 Tách câu quan đi m Error! Bookmark not defined
3.3 T ng h p quan đi m Error! Bookmark not defined
Ch ng 4 Th c nghi m và đánh giá Error! Bookmark not defined
Ch ng 5 K t lu n Error! Bookmark not defined
Các công trình đã công b Error! Bookmark not defined
TÀI LI U THAM KH O 13
Trang 5
M đ u
“Ng i khác ngh gì” luôn là m t câu h i đ t ra cho m i chúng ta trong nh ng l n ra
quy t đ nh Khi b n có nhu c u mua m t chi c tivi, b n s có xu h ng tìm hi u xem
ng i khác nói gì v s n ph m này V i cùng m t s ti n b ra, b n s l a ch n đ c
Cùng v i s phát tri n c a kinh t xã h i, Internet ngày càng phát tri n M i ng i d n
bi t đ n các trang blog, di n đàn hay các trang m ng xã h i khác ó là n i h cùng bày
thông tin quan tr ng đ i v i m i ng i khi có nhu c u tìm hi u v v n đ nào đó
Hình 1 Khai phá quan đi m ng i dùng
ng i tiêu dùng đánh giá nh th nào v s n ph m c a mình T đó, h đ a ra đ c
công ty l n nhân đinh , Ủ ki n cua khach hàn g là môt phân quan trong trong viêc hốnh thành quan đi m Ủ ki n c a các khách hàng khác và s tin t ng vào th ng hi u , quyêt đinh mua hang s liên quan đên các chính sách qu ng bá th ng hi u c a công ty h V i
s phong phú c a các ngu n tài nguyên v quan đi m nh hi n nay, c h i va thach th c
Trang 6là r t l n trong vi c s dung công nghê thông tin đê tốm kiêm va hiêu đ c y kiên cua
ng i khac [24]
Ng i tiêu dùng khi đánh giá v m t s n ph m d ch v nào đó, h có th đ a ra Ủ ki n
có các Ủ ki n đ a ra đ đánh giá ch t l ng c a m t tính n ng (khía c nh, đ c tr ng) nào
đó c a s n ph m nh Màn hình c a chi c Iphone 6s là đ p ho c camera r t nét Các Ủ
công s m t nhi u th i gian và s c ng i M t công c t ng h p Ủ ki n t đ ng c a ng i tiêu dùng s làm gi m th i gian và công s c Chính vì v y, tôi đã ch n h ng nghiên c u
m t ph ng pháp t ng h p quan đi m, s d ng lu t lan truy n kép k t h p v i vi c tách câu ghép và câu ph c thành các câu đ n (m i m t câu đ n ch a m t tính n ng c a s n
cu i cùng, tôi s d ng ph ng pháp th ng kê đ t ng h p quan đi m đánh giá c a ng i tiêu dùng v t ng tính n ng c a s n ph m
Lu n v n c a tôi đ c chia thành các ph n nh sau:
Ch ng 1: Trong ch ng này, tôi trình bày t ng quan v khai phá quan đi m và m t s khái ni m liên quan ng th i, tôi trình bày nh ng khó kh n và thách th c c a khai phá quan đi m và m t vài l nh v c ng d ng c a khai phá quan đi m đ c ng d ng trên th
gi i hi n nay
Ch ng 2: Trình bày khái quát m t s ph ng pháp v x lỦ ngôn ng t nhiên, h c máy, th ng kê đ c các nhà nghiên c u trên th gi i nghiên c u và áp d ng vào vi c t ng
h p Ủ ki n theo tính n ng c a s n ph m trên th gi i c ng nh Vi t Nam hi n nay
Ch ng 3: Trong ch ng này, tôi trình bày m t cách chi ti t m t ph ng pháp t ng
h p Ủ ki n theo tính n ng c a s n ph m đ c tôi nghiên c u và th nghi m v i d li u
ti ng Vi t
Ch ng 4: K t qu th c nghi m và đánh giá đ c trình bày trong ch ng này
Ch ng 5: Trình bày nh ng v n đ mà lu n v n đã và ch a th c hi n; đ nh h ng m t
s h ng phát tri n ti p theo c a lu n v n
Trang 7Ch ng 1 T ng quan v khai phá quan đi m
1.1 Gi i thi u
Chúng ta đã bi t, cùng v i s phát tri n c a Internet, các m ng xã h i, di n đàn, blog
nh Facebook, Twitter, Zing Me,… thu hút hàng tri u ng i Vi t Nam s d ng T i đó
m i ng i th hi n quan đi m c a mình v r t nhi u v n đ , r t nhi u đ i t ng t tình
lo i nào Anh ta có th h i Ủ ki n c a b n bè, nh s t v n c a ng i bán hàng M t cách thông minh h n là anh ta có th tham kh o thông tin trên m ng, nh ng s ph i đ c
ng i tiêu dùng có ph n ng nh th nào v s n ph m c a h H có th thuê nhân viên
các Ủ ki n v s n ph m đó sau khi h đã s d ng Tuy nhiên, vi c th c hi n t ng h p các
Ủ ki n đánh giá đó thành m t b n t ng h p có th nhìn tr c quan nh t thì vi c t ng h p
th công m t r t nhi u th i gian Vì v y, c n thi t ph i có m t công c th c hi n t ng h p các Ủ ki n đó m t cách t đ ng Vi c t đ ng t ng h p Ủ ki n, quan đi m v m t đ i
t ng hay v n đ c th nào đó g i là t ng h p quan đi m Khi đó máy tính s tr giúp
ng i dùng b ng cách thu th p và phân tích v n b n ch a quan đi m và đ a ra k t qu
t ng h p
Quan đi m là Ủ ki n c a cá nhân m t ng i v m t đ i t ng nào đó trong m t th i
Chi n tho t
t t
N i gi m
Đ ng
Hình 1.1 Mô hình khai phá quan đi m
Trang 8sijkl, hk, tl) trong đó ei là tên c a ch th , aij là đ c tr ng c a ei, sijkl là quan đi m v đ c
tr ng aij c a ei, hk là ng i gi quan đi m và tllà th i đi m mà quan đi m đó đ c đ a ra
m c đ khác nhau
Trong đ nh ngh a c a Liu có m t s khái ni m v đ i t ng, đ c tr ng, ng i gi quan
đi m đ c làm rõ nh sau:
1.1.1 i t ng
i t ng đ c dùng đ ch th c th (ng i, s n ph m, s ki n, ch đ ,…) đ c đánh giá M i đ i t ng có m t t p các thành ph n (components) hay thu c tính (attributes) g i chung là các đ c tr ng (tính n ng) (features) [12] M i thành ph n hay thu c tính l i có
t p các thu c tính c a đ i t ng O
Ví d : Máy nh có m t t p thành ph n nh ng kính, pin và các thu c tính nh kích c ,
cân n ng, ch t l ng nh Thành ph n pin có các thu c tính con nh kích c , th i gian, dung l ng
1.1.2 Các đ c tr ng n và hi n
trong r, ta nói f là đ c tr ng hi n (explicit feature) Ng c l i, ta nói f là đ c tr ng n
(implicit feature) [12]
Ví d :
Máy nh này đ t quá c tr ng giá là đ c tr ng n
Màu s c này đ p ghê c tr ng màu s c là đ c tr ng hi n
1.1.3 o n đánh giá
o n đánh giá v m t đ c tr ng f c a đ i t ng O trong r là m t t p các câu liên ti p
thi u ít nh t m t câu [12]
Ví d :
Trang 9Hôm qua, tôi mua m t chi c đi n tho i Iphone 5S siêu th đi n máy Tr n Anh Tôi r t thích nó Kích th c c a nó phù h p v i tay tôi c m Giá c ph i ch ng mà ch t l ng
c ng t t
Hai ví d trên có s l ng câu và đ dài là khác nhau nh ng chúng đ u là các đo n đánh giá cho s n ph m đi n tho i
1.1.4 Quan đi m n, hi n
Quan đi m hi n (explicit opinion) v m t đ c tr ng f là quan đi m mang tính ch quan,
không t ng minh [12]
Ví d :
i n tho i này đ p quá Quan đi m hi n – khen chi c đi n tho i đ p
Máy nh m i mua và đã h ng Quan đi m n – chê chi c máy nh không t t
1.1.5 Ng i đánh giá
Là ng i hay t ch c c th đ a ra các Ủ ki n đánh giá c a cá nhân (t ch c) Trong
tr ng h p đánh giá các s n ph m trên các forum, blog thì ng i đánh giá luôn là các tác
1.2 Các thách th c trong khai phá quan đi m
1.2.1 Nh ng ng i khác nhau có phong cách vi t khác nhau
Các Ủ ki n đánh giá đ c đ a ra b i nh ng ng i khác nhau thì h có các cách di n
đ t khác nhau, t cách th c s d ng ngôn t , ch vi t t t hay ng pháp trong câu là m t thách th c riêng khi x lỦ
1.2.2 Quan đi m thay đ i theo th i gian
M t thách th c khác c n ph i xét đ n là v n đ làm th nào đ có th theo dõi các quan
đi m thay đ i theo th i gian M t s n ph m có th là t t nh t t i th i đi m này nh ng t i
th i đi m 2, 3 n m sau thì nó không ph i là t t nh t n a, ng i ta s có nhi u s l a ch n
h n khi các s n ph m m i t t h n v giá c và ch t l ng Tuy nhiên, c ng có nh ng s n
ph m ban đ u đ a ra ngoài th tr ng ch a đ c t t nh ng qua quá trình c i thi n ch t
l ng c a s n ph m ho c d ch v thì l i đ c ng i tiêu dùng đánh giá cao h n
Trang 10Ví d : T i th i đi m n m 2012, dòng đi n tho i Iphone 4 đ c ng i tiêu dùng đánh giá r t cao Nh ng n m 2014, s n ph m Iphone 5 ra đ i thì m i ng i chuy n sang s
d ng Iphone 5 Lúc này, ch t l ng, t c đ x lỦ c a Iphone 4 đ c ng i tiêu dùng đánh giá th p h n h n
1.2.3 m nh c a quan đi m
Xác đ nh đ m nh c a m t quan đi m là m t thách th c ph i đ i m t trong khai phá quan đi m Nhi u n l c đã đ c th c hi n đ xác đ nh các y u t quy t đ nh s c m nh
m c đ xu h ng quan đi m khác nhau, m t s t b ngh a có th đ c dùng đ xác đ nh
đ m nh c a quan đi m(“r t”, “m t chút”, “h t s c”, “h i”,…) C m t “r t hài lòng”
và “h i hài lòng” s đ c phân l p thành r t tích c c và kém tích c c n u “r t” và “h i”
đ c phân tích và s d ng đ xác đ nh m c đ đ i l p
1.2.4 Quan đi m theo ng c nh
T ng t nh phân lo i m t quan đi m là tích c c, tiêu c c ho c trung l p có th là
tích c c trong m t tình hu ng này nh ng nó l i mang tính tiêu c c trong tình hu ng khác
M t quan đi m v m t s n ph m ho c m t tính n ng s n ph m c ng có th gây hi u
đ mô t tu i th c a pin c a máy tính xách tay theo m t cách đó là “tu i th pin c a
máy tính xách tay là dài”, nó s đ c coi là tích c c nh ng n u nó đ c s d ng theo m t
cách khác đó là “th i gian kh i đ ng c a máy tính xách tay dài”, nó s đ c coi là m t Ủ
ki n tiêu c c
1.2.5 Các câu đánh giá có s pha tr n
M t thách th c l n đ i v i khai phá quan đi m xu t hi n khi m i ng i th hi n đánh giá tích c c và tiêu c c trong cùng m t câu M i ng i có nhi u Ủ ki n khác nhau trong cùng m t câu Nh ng câu nh v y có th gây khó kh n đ phân tích cú pháp ho c khai phá quan đi m
công c tách các Ủ quan đi m trong các câu có đánh giá v nhi u tính n ng thành các Ủ
nh Trong đó, m i Ủ ch bao g m m t tính n ng và m t Ủ ki n đánh giá (Chi ti t tôi xin trình bày ch ng 3)
Trang 111.2.6 Quan đi m mang tính châm bi m, m a mai
Các quan đi m mang tính châm bi m, m a mai t n t i khá nhi u trong v n b n Trong
đó m t quan đi m tiêu c c nh ng l i đ c ng i nêu quan đi m th hi n d i d ng quan
đi m tích c c i u này gây khó kh n r t l n trong quá trình phân tích quan đi m Ví d
1.2.7 X lỦ ngôn ng t nhiên trong câu quan đi m
Các Ủ ki n mà m i ng i nêu lên trên các trang m ng xã h i th ng là h vi t theo ngôn ng r t t nhiên c a h H có th dùng ngôn ng , cách vi t t t hay các bi u t ng
c m xúc riêng M i ng i khác nhau s có các phong cách vi t khác nhau Vì th nên các câu đánh giá th ng d ng bán c u trúc Trong khi vi c c n thi t là t nh ng d li u bán
c u trúc, đ c vi t b ng ngôn ng r t t nhiên đó, chúng ta ph i đ a ra đ c các thông tin
h u ích Tuy nhiên, trong đánh giá c a ng i tiêu dùng th ng, h th ng dùng các ngôn
ng v n b n là không chính th c và không theo quy t c ng pháp Vì v y, v n đ x lỦ ngôn ng t nhiên trong vi c x lỦ các Ủ ki n đánh giá là m t v n đ c c k khó kh n
1.3 Các ng d ng trong khai phá quan đi m
1.3.1 Nghiên c u th tr ng dành cho ng i mua và bán
Khi chúng ta mu n mua m t s n ph m nào, chúng ta không bi t đ c lo i s n ph m này có phù h p hay không, c a hàng nào có d ch v khách hàng t t, giá bán đâu r h n,
ch t l ng đâu t t h n,… thì các quan đi m v s n ph m c a nh ng ng i dùng tr c
là m t kênh thông tin quan tr ng cho chúng ta
Hay đ i v i nh ng ng i b t đ u kinh doanh, h ch a bi t kinh doanh m t hàng gì,
h p lỦ, kinh doanh khu v c nào thu đ c l i nhu n cao nh t Khi đó, các hành vi c a
khách hàng s h tr cho h
1.3.2 C i thi n ch t l ng c a s n ph m, d ch v
Ta xem xét m t ví d sau: M t nhà s n xu t máy vi tính l n đang th t v ng v doanh
không mua máy tính c a chúng ta?” Nh ng thông tin c th nh giá thành, ch t l ng
xét
Trang 121.3.3 H th ng g i Ủ
Khai phá quan đi m c ng có vài trò quan tr ng nh m t công ngh h tr cho các h
th ng khác M t ng d ng ti m n ng đó là ta có th áp d ng khai phá quan đi m trong các h th ng khuy n cáo, giúp cho h th ng đ a ra các g i Ủ v các s n ph m cho ng i
dùng mà có kh n ng ng i dùng quan tâm là cao nh t, t ng l i nhu n cho doanh nghi p Trong các h th ng tr c tuy n, các qu ng cáo đ c hi n th góc màn hình c n đ c
ki m tra xem có phù h p v i n i dung trang web hay không Ví d trong m t trang web
có n i dung chuyên v gan mà hi n th các qu ng cáo v các s n ph m r u là không h p
lỦ, n u hi n th qu ng cáo v các lo i thu c tr viêm gan s phù h p v i n i dung h n
1.3.4 H tr thông minh trong chính quy n
Thông minh trong chính quy n là m t d ng ng d ng vô cùng h u ích đ i v i các chính tr gia Ch ng h n nh khi m t d lu t đ c đ a ra, qu c h i r t mu n l y Ủ ki n
c a nhân dân v d th o lu t, xem r ng nó có h p lỦ hay không, nhân dân có nh ng ph n
ng nh th nào v nó Hay đ i v i nh ng cu c b u c t ng th ng, th t ng, nh ng Ủ
ki n đánh giá c a ng i dân gi m t vai trò quan tr ng đ i v i k t qu c a cu c b u c
1.3.5 H tr đ a ra quy t đ nh
Khai phá quan đi m có vai trò to l n trong vi c h tr ra quy t đ nh Ho c đ i v i
ng không đ ng tình c a ng i dân đã có tác đ ng to l n đ i v i chính quy n y ban nhân dân thành ph Hà N i, Bí th thành y Hà N i ph i ra quy t đ nh xem xét và x lỦ
đ i v i s , ban ngành liên quan1 Hay đ i v i tin t c v v x ph t đ i v i quán café Xin
chào t i thành ph H Chí Minh đã bu c th t ng Nguy n Xuân Phúc ra ch đ o xem
xét, d ng kh i t v án2
1.4 Các bài toán khai phá quan đi m
Khai phá quan đi m là m t l nh v c đ c nghiên c u t nh ng n m 90, tuy nhiên v i
nh ng khó kh n và thách th c c a nó mà nó v n đ c c ng đ ng nghiên c u trên th gi i
và t i Vi t Nam nghiên c u
Theo nghiên c u c a Liu [7], khai phá quan đi m g m 3 bài toán chính nh sau:
Phân l p quan đi m
1
http://vnexpress.net/tin-tuc/thoi-su/bi-thu-ha-noi-khong-xu-ly-kieu-hoa-ca-lang-vu-chat-cay-xanh-3161498.html
2 http://thanhnien.vn/thoi-su/thu-tuong-chi-dao-xem-xet-dung-khoi-to-vu-chu-quan-ca-phe-xin-chao-694327.html