Đề tài nghiên cứu của em tập trung vào phát triển một công cụ phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán để hiểu hành vi con người trên nền tảng YouTube.. Bằng cá
Trang 1ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM
NGUYỄN KIM THIÊN
KHÓA LUẬN TỐT NGHIỆP
PHÁT TRIỂN CÔNG CỤ PHÂN TÍCH DỮ LIỆU VỚI MÔ HÌNH TRONG KHOA HỌC XÃ HỘI TÍNH TOÁN ĐỂ
HIỂU HÀNH VI CON NGƯỜI
Developing data analysis tools with models in Computational Social Sciences to understand human behavior
KỸ SƯ/ CỬ NHÂN NGÀNH KỸ THUẬT PHẦN MỀM
Trang 2TP HỒ CHÍ MINH, 2023
Trang 3ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM
NGUYỄN KIM THIÊN – 17521078
KHÓA LUẬN TỐT NGHIỆP
PHÁT TRIỂN CÔNG CỤ PHÂN TÍCH DỮ LIỆU VỚI
MÔ HÌNH TRONG KHOA HỌC XÃ HỘI TÍNH TOÁN
ĐỂ HIỂU HÀNH VI CON NGƯỜI
Developing data analysis tools with models in Computational Social Sciences to understand human behavior
KỸ SƯ/ CỬ NHÂN NGÀNH KỸ THUẬT PHẦN MỀM
GIẢNG VIÊN HƯỚNG DẪN THS NGUYỄN THỊ THANH TRÚC
Trang 4TP HỒ CHÍ MINH, 2023
Trang 5THÔNG TIN HỘI ĐỒNG CHẤM KHÓA LUẬN TỐT NGHIỆP
Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số ……… ngày ……… của Hiệu trưởng Trường Đại học Công nghệ Thông tin
Trang 6LỜI CẢM ƠN
Em xin gửi lời cảm ơn chân thành đến những người đã đóng góp và hỗ trợ em trong quá trình thực hiện khóa luận tốt nghiệp này Sự giúp đỡ của mọi người đã là nguồn động lực không thể thiếu để em hoàn thành nhiệm vụ này
Đầu tiên, em muốn bày tỏ lòng biết ơn sâu sắc đến Ths Nguyễn Thị Thanh Trúc Cô đã dành thời gian, kiến thức và kinh nghiệm để chỉ dẫn và hỗ trợ em trong suốt quá trình hiện khóa luận tốt nghiệp Sự chỉ bảo của cô đã giúp em hiểu sâu hơn
về lĩnh vực này và phát triển kỹ năng nghiên cứu của mình
Em cũng gửi lời cảm ơn đến khoa Công nghệ phần mềm và trường Công nghệ thông tin đã tạo điều kiện cho em thực hiện khóa luận tốt nghiệp này Bằng cách cung cấp chương trình đào tạo chất lượng, tài liệu tham khảo và cơ sở vật chất hiện đại, khoa và nhà trường đã tạo ra môi trường học tập và nghiên cứu một cách đáng kính Em cảm nhận được sự quan tâm sâu sắc và đầu tư từ khoa và nhà trường trong việc phát triển năng lực và kiến thức của sinh viên
Trang 7MỤC LỤC
CHƯƠNG 1 GIỚI THIỆU 2
1.1 T ỔNG QUAN VỀ ĐỀ TÀI .2
1.2 M ỤC TIÊU NGHIÊN CỨU .3
1.2.1 Xây dựng một công cụ phân tích dữ liệu mạnh mẽ 3
1.2.2 Hiểu hành vi người dùng trên Youtube 3
1.2.3 Đóng góp vào lĩnh vực khoa học xã hội tính toán 4
1.3 Ý NGHĨA NGHIÊN CỨU .4
1.3.1 Ý nghĩa học thuật 4
1.3.2 Ý nghĩa ứng dụng 4
1.3.3 Ý nghĩa xã hội 5
1.4 P HẠM VI VÀ GIỚI HẠN CỦA NGHIÊN CỨU .6
1.4.1 Phạm vi nghiên cứu 6
1.4.2 Giới hạn của nghiên cứu 7
CHƯƠNG 2 LÝ THUYẾT VÀ PHƯƠNG PHÁP 9
2.1 P HÂN TÍCH DỮ LIỆU TRONG KHOA HỌC XÃ HỘI TÍNH TOÁN 9
2.1.1 Giới thiệu về phân tích dữ liệu trong khoa học xã hội tính toán 9
2.1.1.1 Định nghĩa phân tích dữ liệu trong khoa học xã hội tính toán 9
2.1.1.2 Vai trò của phân tích dữ liệu trong khoa học xã hội tính toán 9
2.1.1.3 Lợi ích và thách thức của phân tích dữ liệu trong khoa học xã hội tính toán 10
2.1.2 Các phương pháp phân tích dữ liệu phổ biến 12
2.1.2.1 Phân tích mạng xã hội (Social Network Analysis – SNA) 12
2.1.2.2 Phân tích tương tác xã hội (Social Interaction Analysis) 13
2.1.2.3 Phân tích ngữ liệu (Text Analysis) 15
2.1.2.4 Phân tích tư duy (Opinion Mining/Sentiment Analysis) 16
2.1.2.5 Phân tích dữ liệu địa lý (Geospatial Analysis) 17
CHƯƠNG 3 ĐẶC TẢ CÔNG CỤ PHẦN MỀM VÀ KẾT QUẢ 19
3.1 Đ ẶC TẢ PHẦN MỀM 19
3.1.1 Mục tiêu 19
3.1.2 Yêu cầu chức năng 19
3.1.3 Yêu cầu phi chức năng 19
3.1.4 Kiến trúc hệ thống 19
3.1.5 Công cụ và công nghệ sử dụng 19
Trang 83.1.6 Giao diện người dùng 19
3.2 T RIỂN KHAI PHẦN MỀM 19
3.2.1 Môi trường triển khai 19
3.2.2 Quy trình triển khai 19
3.2.3 Cấu hình phần mềm và các bước cài đặt 19
3.3 K ẾT QUẢ THỰC HIỆN 19
3.3.1 Thu thập dữ liệu 19
3.3.2 Kết quả phân tích và trực quan hóa dữ liệu 19
3.3.3 Đánh giá hiệu suất phần mềm 19
3.4 K HẢ NĂNG MỞ RỘNG VÀ TÙY CHỈNH 19
3.4.1 Tính năng mở rộng 19
3.5 K IỂM THỬ VÀ ĐÁNH GIÁ 19
3.6 H ẠN CHẾ VÀ HƯỚNG PHÁT TRIỂN TIẾP THEO 19
Trang 9DANH MỤC HÌNH
Hình 1.1: Tên hình 1 8
Trang 10DANH MỤC BẢNG
Bảng 1.1: Tên bảng 1 8Bảng 2.1: Tên bảng 1 18
Trang 11DANH MỤC TỪ VIẾT TẮT
Trang 121
TÓM TẮT KHÓA LUẬN
Trang 13Tuy nhiên, việc hiểu và phân tích hành vi con người trên YouTube là một thách thức lớn Để làm điều này, cần phải áp dụng các phương pháp và công cụ phân tích dữ liệu mạnh mẽ để xác định, tìm hiểu và giải thích hành vi con người trong một quy mô lớn Trong lĩnh vực khoa học xã hội tính toán, mô hình hóa hành
vi con người đã trở thành một phương pháp quan trọng để hiểu và dự đoán các xu hướng và hành vi trong xã hội
Đề tài nghiên cứu của em tập trung vào phát triển một công cụ phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán để hiểu hành vi con người trên nền tảng YouTube Việc sử dụng công cụ này sẽ giúp em thu thập và phân tích các dữ liệu từ YouTube để khám phá các mẫu, xu hướng và sự biến đổi trong hành
vi người dùng, từ đó đưa ra những thông tin giá trị về xã hội, văn hóa và tư duy của con người
Bằng cách áp dụng mô hình trong khoa học xã hội tính toán, em hy vọng rằng công cụ phân tích dữ liệu sẽ cung cấp một cái nhìn tổng quan về hành vi con người trên YouTube, nhằm cung cấp thông tin hữu ích cho các nhà nghiên cứu, nhà quản
lý và nhà hoạch định chính sách Đồng thời, nghiên cứu này cũng đóng góp vào sự phát triển của lĩnh vực khoa học xã hội tính toán, mở ra các cơ hội mới cho việc áp
Trang 141.2 Mục tiêu nghiên cứu
1.2.1 Xây dựng một công cụ phân tích dữ liệu mạnh mẽ
Mục tiêu đầu tiên của nghiên cứu là phát triển một công cụ phân tích dữ liệu đáng tin cậy và hiệu quả Công cụ này sẽ có khả năng thu thập dữ liệu từ YouTube, tiền xử lý dữ liệu và áp dụng mô hình trong khoa học xã hội tính toán để phân tích hành vi người dùng Mục tiêu là tạo ra một công cụ mạnh mẽ và linh hoạt, cho phép nhận diện các mẫu, xu hướng và sự biến đổi trong hành vi con người trên YouTube
1.2.2 Hiểu hành vi người dùng trên Youtube
Mục tiêu thứ hai là sử dụng công cụ phân tích dữ liệu để hiểu rõ hơn về hành
vi người dùng trên YouTube Em muốn phân tích các yếu tố như lượt xem, lượt tương tác, nhận xét và chia sẻ để xác định các xu hướng, sự tương tác và tư duy của người dùng trên nền tảng này Mục tiêu là khám phá và phân tích các mẫu và hành
vi khác nhau của người dùng trong việc tiêu thụ và tương tác với nội dung trên YouTube
Trang 154
1.2.3 Đóng góp vào lĩnh vực khoa học xã hội tính toán
Mục tiêu cuối cùng của nghiên cứu là đóng góp vào lĩnh vực khoa học xã hội tính toán Em muốn cung cấp một cái nhìn mới và đáng tin cậy về việc áp dụng mô hình và công cụ phân tích dữ liệu trong lĩnh vực khoa học xã hội tính toán Mục tiêu
là phát triển và ứng dụng một phương pháp tiên tiến để hiểu và phân tích hành vi con người trên nền tảng YouTube, đóng góp vào việc mở rộng kiến thức và cung cấp các công cụ hữu ích cho các nhà nghiên cứu, nhà quản lý và nhà hoạch định chính sách
1.3 Ý nghĩa nghiên cứu
1.3.1 Ý nghĩa học thuật
Nghiên cứu này đóng góp vào lĩnh vực khoa học xã hội tính toán bằng cách
áp dụng các mô hình và công cụ phân tích dữ liệu tiên tiến để hiểu hành vi con người trên nền tảng YouTube Việc phát triển công cụ phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán giúp cung cấp một phương pháp tiên tiến cho việc nghiên cứu và phân tích hành vi người dùng trong môi trường trực tuyến Nghiên cứu này mở ra những cơ hội mới để khai thác và hiểu rõ hơn về dữ liệu người dùng trên nền tảng YouTube, từ đó cung cấp thông tin quan trọng về tư duy, thái độ và hành vi của con người trong thế giới kỹ thuật số Điều này có thể đóng góp vào việc nâng cao kiến thức về xã hội học, tâm lý học và lĩnh vực liên quan
1.3.2 Ý nghĩa ứng dụng
Nghiên cứu này có ý nghĩa ứng dụng trong nhiều lĩnh vực khác nhau Công
cụ phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán có thể được
áp dụng trong các hoạt động tiếp thị và quảng cáo trên YouTube Những thông tin được thu thập và phân tích từ công cụ này có thể giúp nhà quảng cáo và nhà tiếp thị
Trang 165
hiểu rõ hơn về khách hàng tiềm năng, từ đó đưa ra các chiến lược tiếp thị hiệu quả
và tăng cường tương tác và gắn kết với khách hàng
Ngoài ra, công cụ phân tích dữ liệu này cũng có thể hỗ trợ các nhà nghiên cứu và nhà hoạch định chính sách trong việc hiểu và đánh giá tác động của nội dung trên YouTube đến cộng đồng và xã hội Việc hiểu rõ hơn về hành vi người dùng và tương tác trên YouTube có thể cung cấp thông tin quan trọng để đưa ra quyết định chính sách liên quan đến việc quản lý và giám sát nền tảng này
Nghiên cứu này cũng mang lại ý nghĩa ứng dụng trong lĩnh vực nghiên cứu thị trường và phân tích dữ liệu khách hàng Công cụ phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán có thể giúp các doanh nghiệp hiểu rõ hơn về sự tiêu thụ và tương tác của khách hàng trên YouTube, từ đó tối ưu hóa chiến lược kinh doanh và phát triển sản phẩm và dịch vụ phù hợp với nhu cầu của khách hàng
1.3.3 Ý nghĩa xã hội
Nghiên cứu này có ý nghĩa xã hội trong việc hiểu và đánh giá tác động của YouTube đến xã hội và cộng đồng trực tuyến Việc phân tích hành vi người dùng và tương tác trên YouTube giúp chúng ta nhìn nhận rõ hơn về ảnh hưởng của nền tảng này đến quan điểm, ý kiến, và hành vi của mọi người
Thông qua việc hiểu rõ hơn về hành vi người dùng trên YouTube, nghiên cứu này có thể đóng góp vào việc xây dựng một môi trường trực tuyến tích cực, thông minh và bền vững Các kết quả và thông tin từ nghiên cứu này có thể hỗ trợ việc tạo ra các chính sách và quy định phù hợp để đảm bảo an toàn, đa dạng và chất lượng của nội dung trên YouTube, từ đó tạo điều kiện thuận lợi cho sự phát triển của cộng đồng trực tuyến và xã hội toàn cầu
Tóm lại, nghiên cứu này mang lại ý nghĩa học thuật, ứng dụng và xã hội bằng cách cung cấp công cụ và phương pháp phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán để hiểu và đánh giá hành vi con người trên nền tảng YouTube Đồng thời, nghiên cứu này cũng đóng góp vào việc mở rộng kiến thức về
Trang 17Ngoài ra, nghiên cứu này còn cung cấp những thông tin quan trọng cho các nhà quản lý và quyết định chính sách Việc hiểu rõ hơn về hành vi người dùng trên nền tảng YouTube giúp các nhà quản lý đưa ra các quyết định thông minh và hiệu quả
về quản lý, an ninh, quảng cáo và trải nghiệm người dùng trên nền tảng này
Cuối cùng, nghiên cứu này cũng có tầm quan trọng đối với người dùng cuối Việc phân tích hành vi và tương tác người dùng trên YouTube có thể cung cấp thông tin hữu ích để người dùng tự nhận biết và điều chỉnh hành vi của mình, từ đó tạo ra một môi trường trực tuyến an toàn, tích cực và mang lại lợi ích cho mọi người
Tổng kết lại, nghiên cứu này mang ý nghĩa học thuật, ứng dụng và xã hội bằng cách đóng góp vào việc hiểu và phân tích hành vi con người trên nền tảng YouTube thông qua phát triển công cụ và áp dụng các mô hình trong khoa học xã hội tính toán Nghiên cứu này cung cấp thông tin quan trọng cho lĩnh vực khoa học
xã hội, doanh nghiệp, nhà quản lý và người dùng cuối, góp phần vào sự phát triển
và quản lý bền vững của môi trường trực tuyến
1.4 Phạm vi và giới hạn của nghiên cứu
1.4.1 Phạm vi nghiên cứu
Nghiên cứu này tập trung vào việc phát triển công cụ phân tích dữ liệu dựa trên mô hình trong khoa học xã hội tính toán để hiểu hành vi con người trên nền tảng YouTube Nghiên cứu sẽ sử dụng dữ liệu từ YouTube để xây dựng mô hình và thực hiện phân tích hành vi người dùng
Trang 187
Phạm vi nghiên cứu bao gồm việc thu thập dữ liệu từ YouTube và áp dụng các phương pháp và công cụ phân tích dữ liệu để hiểu hành vi con người Nghiên cứu sẽ tập trung vào các yếu tố như lượt xem, bình luận, đánh giá, tương tác xã hội
và các đặc điểm của nội dung để tìm hiểu cách con người tương tác trên nền tảng này
Mặc dù nghiên cứu này có mục tiêu quan trọng và tiềm năng trong việc hiểu hành vi con người trên nền tảng YouTube, nhưng cũng tồn tại một số giới hạn:
• Giới hạn dữ liệu: Nghiên cứu sẽ sử dụng dữ liệu từ YouTube nhưng sẽ giới hạn trong một khoảng thời gian nhất định và một số kênh/công cụ phân tích cụ thể
Do đó, kết quả của nghiên cứu có thể không phản ánh toàn diện hành vi của tất cả người dùng trên YouTube
• Giới hạn mô hình: Nghiên cứu sẽ xây dựng một mô hình trong khoa học xã hội tính toán dựa trên dữ liệu từ YouTube, tuy nhiên, sự chính xác và hiệu quả của
mô hình có thể bị ảnh hưởng bởi sự hạn chế của các phương pháp và công cụ phân tích dữ liệu sử dụng
• Giới hạn nguồn dữ liệu: Dữ liệu từ YouTube có thể chứa các rào cản về quyền riêng tư và khả năng truy cập Một số nguồn dữ liệu có thể không được công khai hoặc bị giới hạn về quyền truy cập, dẫn đến việc hạn chế khả năng thu thập dữ liệu toàn diện
• Giới hạn thời gian: Do tính chất của đề tài nghiên cứu, có thể sẽ không thể phân tích và đánh giá toàn bộ quá trình phát triển và biến đổi của hành vi con người trên YouTube Nghiên cứu sẽ giới hạn trong một khoảng thời gian cụ thể và tập trung vào các khía cạnh quan trọng
• Giới hạn lý thuyết và phương pháp: Nghiên cứu này dựa trên mô hình trong khoa học xã hội tính toán, tuy nhiên, có thể có các lý thuyết và phương pháp khác trong lĩnh vực này chưa được khám phá hoặc không được áp dụng trong nghiên cứu
Trang 19Tuy nhiên, dù có những giới hạn nêu trên, nghiên cứu này vẫn mang lại những thông tin quan trọng và có giá trị đối với việc hiểu hành vi con người trên nền tảng YouTube và cung cấp cơ sở cho các nghiên cứu tương lai trong lĩnh vực
này
Hình 1.1: Tên hình 1
Bảng 1.1: Tên bảng 1
Trang 209
Chương 2 LÝ THUYẾT VÀ PHƯƠNG PHÁP
2.1 Phân tích dữ liệu trong khoa học xã hội tính toán
2.1.1 Giới thiệu về phân tích dữ liệu trong khoa học xã hội tính toán
2.1.1.1 Định nghĩa phân tích dữ liệu trong khoa học xã hội tính toán
1 Phân tích dữ liệu trong khoa học xã hội tính toán là quá trình sử dụng các phương pháp và công cụ tính toán để khám phá, xử lý và hiểu các dữ liệu số hóa trong lĩnh vực khoa học xã hội Nó bao gồm việc áp dụng các kỹ thuật từ khoa học dữ liệu, thống kê, máy học và lý thuyết mạng xã hội để trích xuất thông tin, tạo mô hình dữ liệu, và phân tích hành vi và tương tác của con người
2 Phân tích dữ liệu trong khoa học xã hội tính toán giúp chúng ta hiểu sâu hơn
về mối quan hệ xã hội, tương tác giữa con người, và ảnh hưởng của các yếu
tố xã hội đến hành vi con người Nó cho phép chúng ta khám phá xu hướng, phân loại và dự đoán hành vi, và tạo ra hiểu biết cần thiết để đưa ra quyết định và chiến lược thông minh trong nhiều lĩnh vực như tiếp thị, quản lý nguồn lực, nghiên cứu xã hội, chính sách công,…
2.1.1.2 Vai trò của phân tích dữ liệu trong khoa học xã hội tính toán
Phân tích dữ liệu trong khoa học xã hội tính toán đóng vai trò quan trọng trong việc cung cấp thông tin và hiểu biết về các hiện tượng xã hội và hành vi con người Với sự phát triển của công nghệ và việc số hóa dữ liệu, chúng ta có sẵn một lượng lớn thông tin về hành vi, ý kiến, tương tác và mối quan hệ giữa con người
Các phương pháp và công cụ phân tích dữ liệu trong khoa học xã hội tính toán cho phép chúng ta:
1 Khám phá và khai phá dữ liệu: Chúng ta có thể tìm hiểu và khám phá các mẫu, xu hướng và cấu trúc trong dữ liệu xã hội Điều này giúp chúng ta hiểu
rõ hơn về cách con người tương tác, hành vi và phản ứng trong môi trường