PA: Xác xuất sự kiện A NER: Named Entity Recognition SoA: Sentiment analysis - Phân tích cảm xúc... Đặt vấn đề - Câu truy vấn bất kỳ của người dùng được đưa vào hệ thống đề xuất mô hình
Trang 1TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT
KHOA KỸ THUẬT CÔNG NGHỆ
Tên đề tài: NGHIÊN CỨU RÚT TRÍCH THÔNG TIN
DỰA TRÊN CƠ SỞ PHÂN TÍCH CẢM XÚC
Mã số:
Chuyên đề:
rpi • Aj ■ A • ■ • A A _ A _ 1 A — ■-
Thiết kế giao diện và các chức năng phần mềm
hỗ trợ người dùng sử dụng thuật toán
Chủ nhiệm đề tài : ThS.Nguyễn Tấn Lộc
Người chủ trì thực hiện chuyên đề : ThS.Nguyễn Tấn Lộc
Bình Dương, 08/01/2018 Mục lục
Trang 21 Đặt vấn đề 1
2 Phương pháp nghiên cứu, cách tiếp cận 1
3 Kết quả đạt được 2
4 Kết luận và kiến nghị 4
5 Tài liệu tham khảo 5
Danh mục chữ viết tắt
TF: term frequency
IDF: inverse document frequency
TF.IDF: term frequency inverse document frequency
DTM: document term matrix
Logistic: hồi quy logistic
P(A): Xác xuất sự kiện A
NER: Named Entity Recognition
SoA: Sentiment analysis - Phân tích cảm xúc
Trang 31 Đặt vấn đề
- Câu truy vấn bất kỳ của người dùng được đưa vào hệ thống đề xuất (mô hình ở hình chuyên đề 4) Câu truy vấn không đòi hỏi phải đúng cú pháp và có cấu trúc
- Hệ thống sẽ thực hiện các bước tiền xử lý như đã nêu ở các chuyên đề trên với câu truy vấn để xác định câu truy vấn có cảm xúc không, và có giá trị positive hay negative
- Nếu câu truy vấn mang yếu tố chủ quan (có cảm xúc), hệ thống sẽ xác định xem câu truy vấn có giá trị positive hay negative, để người dùng quyết định rút trích thông tin từ tập tin có cảm xúc nào trong cơ sở dữ liệu
- Sau khi xác định được tập dữ liệu cảm xúc để rút trích thông tin cho câu truy vấn, hệ thống sẽ thực hiện rút trích bằng phương pháp rút trích thông tin mà luận văn lựa chọn là chia nhỏ câu truy vấn thành các vectơ từ và so trùng với
cơ sở dữ liệu đã được phân loại Các giải thuật này được viết trên python
2 Phương pháp nghiên cứu, cách tiếp cận
- Thiết kế giao diện HTML, CSS
- Sử dụng ngôn ngữ lập trình python với IDE jupyter notebook
Results
z Thực hiện Câu văn tối đa 100 từ
Trang 43 Kết quả đạt được
- Tìm theo câu và tự phân loại cảm xúc
Ví dụ như: Nhập vào 1 câu "like pho Vietnam" và chọn position thì Nó sẽ tìm kiếm câu nào có cụm từ đó hoặc câu chỉ cần có screen hoặc like hoặc pho thì nó cũng sẽ liệt kê ra tất cả
- Nếu được thì khi nó liệt kê ra theo kiểu sắp xếp cái nào có nhiều đối tượng giống như câu tìm kiếm thì sẽ liệt kê ở những hàng trên, những câu có ít đối tượng hơn thì liệt kê phía dưới
- Bình luận nằm nhóm đầu 10 được bình luận tốt nhất, nhóm 10 bình luận hàng đầu theo quốc gia:
Trang 5name st
categ ories
Kai 4 This is a belated review for a meal that took American
(New) Cain's Saloon 5 Great beer list always changing it up Follows American
(New) Olive Garden Italian Restaurant 2 In the last few years Ive tried my best to lik Italian
Olive Garden Italian Restaurant 1 I dont know what is happening to Olive Garden Italian
NYPD Pizza 5 My favorite lunch spot in the area Im from NJ Italian
Sunup Brewing 4 Nice cozy neighborhood brewery Friendly staff American (New) Murphy's Pub 4 Well its an institution here at the u of I You American
(New) Randy's Restaurant & Ice Cream 4 I go here when i am working and want to get aw American (New) Filibertos Mexican Food 1 After hearing a few individualstalk about Fil Mexican
Hiro Sushi 5 This IS as good as it gets for sushi in Arizon Japanese
Bảng 1 Các bình luận cảm xúc tích cực nhất cho các doanh nghiệp
name sta
Loving Hut 5 We love this place Th is is gonna be a long rev Vietnames
e Loving Hut 5 Yummmmmmm Best Phoen vegetarian restaurant in Vietnamese
Tram's Kitchen 5 It might be a holeinthewall but its a pretty n Vietnamese
Saigon Pho & Seafood 5 Fast service delicious food and excellent pile Vietnamese Tea Light Cafe 5 Im giving Tea Light Cafe an extra star well de Vietnamese Tea Light Cafe 4 Ive been driving by Tea Lite for awhile but ne Vietnamese Savor Flavor Asia 5 This is a great little spot casual and quick a Vietnamese Pho Minh 5 Best place for pho in the city I have tried th Vietnames
e Saigon Pho & Seafood 5 Saigon is by far my favorite pho stop I come h Vietnames
e Cyclo Vietnamese
Cuisine 4 We really like this place I love the owners Vietnamese
Bảng 2 Các bình luận cảm xúc tích cực nhất cho các doanh nghiệp Việt Nam
- Nhóm 10 bình luận cảm xúc tiêu cực nhất cho các nhà hàng Việt Nam, dữ liệu phản ánh khá hợp lý với xếp hạng 1 đến 3 sao
Trang 6name sta
Phu Thanh 1 Being a huge fan of Vietnamese food and how he Vietnames
e Saigon Pho & Seafood 1 Dont go to this restaurant The employees are Vietnames
e
e Saigon Pho & Seafood 1 Very VERY disappointed in the service This was Vietnamese Cyclo Vietnamese
Saigon Pho & Seafood 1 We always eat here when we crave Saigon Pho To Vietnamese Saigon Pho & Seafood 1 We had dinner and had the worst experience we Vietnames
e
Bảng 3.Nhóm bình luận cảm xúc tiêu cực nhất cho doanh nghiệp Việt Nam
Kết quả phân loại cảm xúc tích cực và tiêu cực ảnh hưởng rất mạnh đến kết quả rút trích thông tin Nếu kết quả phân loại chính xác, truy vấn sẽ rút trích thông tin có độ chính xác cao
Hình 1 Các từ ảnh hưởng mạnh ẩm thực Việt
4 Kết luận và kiến nghị
.- Trong thời gian tới chúng tôi sẽ khảo sát, nghiên cứu các tính năng và thiết kế giao diện tiện dụng hơn nữa nhằm đáp ứng tốt hỗ trợ người dùng
- Phát triển ứng dụng trên nền di động Android
Trang 7Computational Linguistics (CICLing 13), vol 7817, pp 13-24, 2013
[2] A Basant, M Namita, B Pooja, Sonal Garg “Sentiment Analysis Using Common-Sense and Context Information” Hindawi Publishing Corporation Computational Intelligence and Neuroscience (2015)
[3] RuiXia, FengXu, JianfeiYu,” Polarity shift detection, elimination and ensemble: A three stage model for document-level sentiment analysis” Information Processing and Management 52 (2016) 36- 45
[4] Y Ainur, Y Yisong, C Claire “Multi-level structured models for document-level sentiment classification”.Proceedings of the 2010 Conference on Empirical Methods in Natural Language Processing, MIT, Massachusetts, Association for Computational Linguistics, USA (2010), pp 1046-1056
[5] F Noura, C Elie, A.A Rawad, H Hazem “Sentence-level and documentlevel sentiment mining for arabic texts”.Proceeding IEEE International Conference on Data Mining Workshops (2010)
[6] Hao chen Zhou and Fei Song.(2015) “Aspect-level sentiment analysis based on
a generalized probabilistic topic and syntax model” Proceedings of the Twenty-Eighth International Florida Artificial Intelligence Research Society Conference, Association for the Advancement of Artificial Intelligence (2015)
[7] Ariyasriwatana, W., Buente, W., Oshiro, M., & Streveler, D (2014) Categorizing health-related cues to action: using Yelp reviews of restaurants in Hawaii New Review of Hypermedia and Multimedia, 20(4), 317-340
[8] Hicks, A., Comp, S., Horovitz, J., Hovarter, M., Miki, M., & Bevan, J L (2012) Why people use Yelp com: An exploration of uses and gratifications Computers in Human Behavior, 28(6), 2274-2279
[9] Huang, J., Rogers, S., & Joo, E (2014) “Improving restaurants by extracting
subtopics from yelp reviews” iConference 2014 (Social Media Expo).
[10] Ruhui Shen, Jialiang Shen, Yuhong Li & Haohan Wang (2016), ” Predicting usefulness of Yelp reviews with localized linear regression models”, 2016 7th IEEE International Conference on Software Engineering and Service Science (ICSESS)
[11] Solov'ev A N., Antonova A Ju., Pazel'skaia A G., (2012), Using
sentiment-analysis for text information extraction I-Teco (Moscow).
[12] Wanxiang Che, Yanyan Zhao, Honglei Guo, Zhong Su, and Ting Liu,”
Sentence Compression for spect-Based Sentiment Analysis” IEEE/ACM
Trang 8TRANSACTIONS ON AUDIO, SPEECH, AND LANGUAGE PROCESSING, VOL 23, NO 12, DECEMBER 2015
[13] P.D Turney,(2000), “Learning algorithms for keyphrase extraction”
Information Retrieval vol 2, no 4, pp 303 - 336
[14] I.H Witten, G.W Paynter, E Frank, C Gutwin and C.G Nevill- Manning (1999) “KEA: Practical automatic Keyphrase Extraction.” The proceedings of Digital Libraries '99: The Fourth ACM Conference on Digital Libraries, pp 254-255
[15] Huong Nguyen Thi Xuan, Anh Cuong Le ; Le Minh Nguyen, (2012)
”Linguistic Features for Subjectivity classification“ Asian Language Processing
(IALP), 2012 International Conference.