Như trong một cuốn sách với tựa đề Groundswell của nhà xuất bản Forrester Research ra đời năm 2008, mạng xã hội và tác động của nó đã được mô tả với thuật ngữ “groundswell”, tạm hiểu l
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
LÊ SỸ THÔNG
KỸ THUẬT, CÔNG CỤ PHÂN TÍCH MẠNG XÃ HỘI VÀ THỬ NGHIỆM
ỨNG DỤNG TRONG PHÂN TÍCH SỐ LIỆU VIỄN THÔNG
Chuyên ngành: Công nghệ thông tin
LUẬN VĂN THẠC SỸ KỸ THUẬT
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS HUỲNH QUYẾT THẮNG
Hà Nội – Năm 2016
Trang 2LỜI CAM ĐOAN
Tôi xin cam đoan :
1 Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn trực tiếp của PGS.TS Huỳnh Quyết Thắng
2 Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác giả, tên công trình, thời gian, địa điểm công bố
3 Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tôi xin chịu hoàn toàn trách nhiệm
Người cam đoan
LÊ SỸ THÔNG
Trang 3MỤC LỤC
Trang
Trang bìa phụ
Lời cam đoan
Danh mục các ký hiệu, các chữ viết tắt
Danh mục các bảng
Danh mục các hình vẽ
MỞ ĐẦU 1
Chương 1 - TỔNG QUAN VỀ MẠNG XÃ HỘI 4
1.1 Khái niệm về mạng xã hội 4
1.2 Đặc điểm của mạng xã hội 5
1.3 Xây dựng các mạng xã hội dựa trên các nút và liên kết 8
1.4 Cấu trúc các mạng xã hội 10
1.5 Phương pháp phân tích cho mạng xã hội 12
1.6 Kết luận chương 14
Chương 2 - PHÂN TÍCH MẠNG XÃ HỘI VÀ ỨNG DỤNG TRONG PHÂN TÍCH SỐ LIỆU TRONG KINH DOANH 15
2.1 Khái quát về phân tích mạng xã hội 15
2.1.1 Khái niệm về phân tích mạng xã hội 15
2.1.2 Sự phát triển của phân tích mạng xã hội 16
2.1.3 Lý thuyết đồ thị và phân tích mạng xã hội 22
2.1.4 Khoa học thống kê và phân tích mạng xã hội 27
2.1.5 Một số độ đo được sử dụng trong phân tích mạng xã hội 29
2.2 Ứng dụng mạng xã hội trong phân tích số liệu kinh doanh viễn thông 33
2.2.1 Số liệu và bài toán kinh doanh viễn thông 33
2.2.2 Kỹ thuật phân tích mạng xã hội trong môi trường kinh doanh viễn thông 38
2.2.3 Mô hình hệ số ảnh hưởng khách hàng cho kinh doanh viễn thông 39
Trang 42.3 Công cụ PAJEK hỗ trợ phân tích mạng xã hội 48
2.4 Kết luận chương 49
Chương 3 - ỨNG DỤNG THỬ NGHIỆM KỸ THUẬT PHÂN TÍCH MẠNG XÃ HỘI TRONG XỬ LÝ PHÂN TÍCH SỐ LIỆU BÀI TOÁN KINH DOANH VIỄN THÔNG 51
3.1 Đặt vấn đề 51
3.2.Xây dựng mạng xã hội thử nghiệm cho việc phân tích số liệu trong kinh doanh viễn thông 51
3.3.Thử nghiệm 52
3.3.1 Phương pháp thử nghiệm 53
3.3.2 Kết quả thử nghiệm và đánh giá 53
3.4 Kết luận chương 52
KẾT LUẬN 58
A Kết quả đạt được trong luận văn 58
B Hướng phát triển của luận văn 59
TÀI LIỆU THAM KHẢO 61
Trang 5
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
triển CASOS tại Carnegie Mellon
Trang 6DANH MỤC CÁC BẢNG
Trang Bảng 1.1: Tiềm năng đối với mạng xã hội thông qua vài con số 7 Bảng 2.1: Các thành phần được sử dụng để tính toán nhân tố ảnh hưởng của khách hàng 47
Trang 7DANH MỤC CÁC HÌNH
Trang
Hình 1.1: Đồ thị biểu diễn cấu trúc đơn giản của mạng xã hội 4
Hình 1.2: Các mạng Small world 9
Hình 1.3: Bốn cấu trúc mạng được xác định bởi Borgatti và các đồng nghiệp tại MIT Mỗi nút biểu diễn một người; mỗi đường biểu diễn kênh giao tiếp giữa người với người Nút trung tâm nhất trong mỗi mạng là màu đỏ 11
Hình 2.1: Ví dụ cho biểu đồ mạng xã hội 16
Hình 2.2: Mô tả thiết lập kết nối bằng số lượng các đường kết nối 24
Hình 2.3: Mô tả thiết lập kết nối thể hiện bằng độ dầy của liên kết 24
Hình 2.4: Bài toán bẩy cây cầu của Königsberg 25
Hình 2.5: Chu trình Euler cho bài toán bẩy cây cầu 26
Hình 2.6: Minh họa bậc của nút trong mạng xã hội 29
Hình 2.7: Độ đo trung tâm của nút theo màu (từ đỏ = 0 tới xanh nước biển = max) 30 Hình 2.8: Minh họa độ đo k-neighbours 32
Hình 2.9: Trung tâm bậc 1 40
Hình 2.10: Trung tâm bậc 2 41
Hình 2.11: Các thuộc tính nhân tố ảnh hưởng của khách hàng cho các cuộc gọi đi 43 Hình 2.12: Các thuộc tính nhân tố ảnh hưởng của khách hàng nhận các cuộc gọi đến44 Hình 2.13: Các thuộc tính trọng số cho các cuộc gọi đi và đến 45
Hình 2.14: Giảm sự phân tán của các thuộc tính liên quan tới các nhân tố ảnh hưởng của khách hàng 46
Hình 2.15: Giao diện chính của PAJEK 49
Hình 3.1: Mô hình mạng xã hội thử nghiệm cho việc phân tích số liệu trong bài toán kinh doanh viễn thông 52
Hình 3.2: Kết quả cho Betweenness 53
Hình 3.3: Kết quả cho Closeness gọi đến 53
Hình 3.4: Kết quả cho Closeness gọi đi 54
Trang 8Hình 3.5: Kết quả cho Closeness cả cuộc gọi đi và gọi đến 54
Hình 3.6: Kết quả k-neighbours của đỉnh 42 – cả hai chiều 55
Hình 3.7: Đồ thị sau khi lấy đỉnh 42 làm trung tâm và phân loại mức gần xa 55
Hình 3.8: Kết quả k-neighbours của đỉnh 98 – chiều gọi đi 56
Hình 3.9: Đồ thị sau khi lấy đỉnh 98 làm trung tâm và phân loại mức gần xa theo chiều gọi đi 56
Hình 3.10: K-neighbours của đỉnh 46 – gọi vào 57
Trang 9và thúc đẩy các nhà cung cấp dịch vụ luôn luôn hỏi: “Chúng tôi có thể làm như thế
nào để tốt hơn?”
Một cách để các nhà cung cấp dịch vụ viễn thông làm tốt hơn đó là quan tâm những người đặc biệt – những người kết nối Vậy những người kết nối đó là ai? và cái gì tạo ra cho họ đặc biệt?
Có rất nhiều phương pháp để có thể tìm được câu trả lời cho vấn đề ở trên Tuy nhiên một trong những phương pháp mà đã và đang được nhiều nhà nghiên cứu khoa học quan tâm hiện nay là sử dụng kỹ thuật phân tích mạng xã hội cho việc phân tích số liệu trong bài toán kinh doanh viễn thông Từ phương pháp này, những nhà cung cấp dịch vụ viễn thông có thể hiểu được hành vi của khách hàng khi có sự kiện diễn ra, tìm được các khách hàng có ảnh hưởng lớn Từ đó, sẽ có những chiến lược kinh doanh hoặc những dịch vụ chăm sóc phù hợp để có thể thu hút được nhiều khách hàng sử dụng dịch vụ của mình
Ngoài ra, qua quá trình tìm hiểu và nghiên cứu, tôi nhận thấy lĩnh vực ứng dụng kỹ thuật phân tích mạng xã hội cho việc phân tích số liệu trong bài toán kinh doanh viễn thông trong nước ta chưa thực sự được những nhà nghiên cứu khoa học
quan tâm Do vậy, tôi đã chọn đề tài: “Kỹ thuật, công cụ phân tích mạng xã hội và thử nghiệm ứng dụng trong phân tích số liệu viễn thông”
Mục tiêu: Nghiên cứu tổng quan về mạng xã hội để nắm những kiến thức cơ bản như khái niệm, đặc điểm, cấu trúc và phương pháp phân tích mạng xã hội nói
Trang 10chung; Nghiên cứu khái quát về phân tích mạng xã hội như khái niệm Phân tích mạng xã hội gắn với lý thuyết đồ thị và khoa học thống kê Ứng dụng phân tích mạng xã hội trong phân tích số liệu kinh doanh viễn thông Cuối cùng, tiến hành thử nghiệm phân tích số liệu kinh doanh viễn thông bằng phần mềm phân tích mạng xã hội PAJEK
Cấu trúc của luận văn được chia thành ba chương cụ thể như sau:
Chương 1: Tổng quan về mạng xã hội
Trình bày những khái niệm cơ bản liên quan đến mạng xã hội, đặc điểm của mạng xã hội, và phương pháp phân tích mạng xã hội nói chung
Chương 2: Phân tích mạng xã hội và ứng dụng phân tích số liệu kinh doanh viễn thông
Trình bày tổng quan về phân tích mạng xã hội, trong đó phân tích mạng xã hội gắn liền với lý thuyết đồ thị và ứng dụng phân tích mạng xã hội trong phân tích số liệu kinh doanh viễn thông Đồng thời, trong chương này cũng trình bày về phần mềm PAJEK dùng để phân tích mạng xã hội
Chương 3: Ứng dụng thử nghiệm kỹ thuật phân tích mạng xã hội trong
xử lý phân tích số liệu viễn thông
Trình bày mô hình mạng xã hội thử nghiệm cho việc phân tích số liệu trong bài toán kinh doanh viễn thông cùng với phương pháp thử nghiệm Sử dụng phần mềm phân tích mạng xã hội PAJEK để phân tích mô hình mạng xã hội thử nghiệm trên dựa trên các độ đo Từ đó đưa ra kết quả và nhận xét đối với mô hình mạng xã hội thử nghiệm
Kết luận
Chương này tóm tắt những kết quả đạt được của đề tài cùng với những những khó khăn trong quá trình thực hiện đề tài và hướng giải quyết Sau đó trình bày những hướng nghiên cứu của đề tài
Để hoàn thành được luận văn, em xin được gửi lời cảm ơn tới các Thầy giáo trong Bộ môn Công nghệ phần mềm – Viện Công nghệ thông tin và truyền thông –
Trang 11Trường Đại học Bách Khoa Hà Nội đã tận tình giảng dạy, cung cấp nguồn kiến thức quý giá trong suốt quá trình học tập
Đặc biệt em xin chân thành cảm ơn thầy giáo PGS TS Huỳnh Quyết Thắng
đã tận tình hướng dẫn, góp ý, tạo điều kiện cho em hoàn thành luận văn này
Trang 12Chương 1 TỔNG QUAN VỀ MẠNG XÃ HỘI
Trong chương này, nghiên cứu và trình bày những khái niệm cơ liên quan đến mạng xã hội như khái niệm, đặc điểm và cấu trúc mạng xã hội… Đặc biệt, trình bày sơ lược về phương pháp phân tích mạng xã hội
1.1 Khái niệm về mạng xã hội
Theo Wikipedia và Whatissocialnetworking.com, mạng xã hội hay còn gọi là mạng xã hội ảo là một cấu trúc mang tính xã hội tạo thành từ các nút, mỗi nút có thể
là cá nhân, hay tổ chức Mạng xã hội làm nhiệm vụ kết nối các thành viên, người dùng trên Internet lại với nhau dựa theo những tiêu chí nào đó, với nhiều mục đích khác nhau, không phân biệt thời gian và không gian
Hình 1.1: Đồ thị biểu diễn cấu trúc đơn giản của mạng xã hội
Cấu trúc xã hội của mạng xã hội được thể hiện ở cách thức mạng xã hội “giả
lập” xã hội loài người Mạng xã hội nhìn nhận những mối quan hệ xã hội thông qua
các nút và ràng buộc giữa các nút Trong một mạng xã hội, các nút là các cá thể, và ràng buộc giữa các nút là các mối quan hệ giữa các cá thể đó Với cấu trúc đơn giản
như vậy, một mạng xã hội có thể được biểu diễn thành một “đồ thị” như Hình 1.1,
Trang 13trong đó mỗi cá thể (mỗi nút) là một điểm trên đồ thị, và quan hệ giữa các nút được thể hiện bằng một đoạn nối điểm này với điểm khác
1.2 Đặc điểm của mạng xã hội
Có thể nói, mạng xã hội có thể phát triển mạnh mẽ được như hiện nay là do những ưu thế đáng kể so với các phương pháp cộng đồng truyền thống Dưới đây, là một số ưu điểm mà mạng xã hội:
Vấn đề chi phí
Có thể thấy rằng việc tham gia vào các mạng xã hội, dù là đối với các cá nhân hay tổ chức đều chiếm một chi phí tương đối thấp, trên thực tế, các mạng xã hội hiện nay hầu hết cho phép đăng ký và sử dụng miễn phí Trong khi đó, khi đã trở thành một thành viên của một mạng xã hội, các cá nhân hay tổ chức đó có thể có được rất nhiều thông tin hữu ích Ví dụ như một công ty sau khi tham gia vào một mạng xã hội nào đó, có thể chỉ cần vài cú nhấp chuột là đã có thể tìm hiểu về các sở thích của người dùng, xu hướng của những sở thích đó Qua đó, công ty có thể phát hiện ra được những khách hàng tiềm năng, vạch ra một chiến lược kinh doanh mới cho thời kỳ khó khăn Những việc làm này có thể giúp ích rất nhiều cho hoạt động kinh doanh hiện tại của công ty đó
Khả năng xây dựng các mối quan hệ tin cậy
Nhờ vào việc quan sát được các bài viết, đánh giá của các thành viên trong mạng xã hội, một tổ chức có thể nắm bắt được nhu cầu và đánh giá của khách hàng
về các sản phẩm hay dịch vụ mà họ cung cấp Hơn thế là khi họ có những phản hồi
tích cực đối với khách hàng, từ đó xây dựng một mối quan hệ “ảo” với khách hàng trong khi có thể mang lại một niềm tin “thực” Không quá tốn kém như những hệ
thống chăm sóc khách hàng lớn mà mang lại hiệu quả cũng không hề nhỏ, đó chính
là lợi thể của mạng xã hội
Hay đối với những cá nhân, nhờ việc đọc được những bài viết phần nào mang tính chất riêng tư, tâm sự của bạn bè, hay con cái, họ có thể có được những hiểu biết rõ ràng hơn về bạn bè, con cái của mình, thấy được vấn đề mà người kia đang gặp phải, từ đó giúp họ giải quyết vấn đề dễ dàng hơn Nghiên cứu cho thấy,
Trang 14giới trẻ đang có xu hướng kể ra những phức tạp cá nhân trên blog, trên mạng xã hội,
vì thông qua mạng xã hội dễ dàng chia sẻ hơn là nói chuyện trực tiếp với các bậc phụ huynh, bạn bè Khi ấy niềm tin trong mối quan hệ cũng được nâng lên đáng kể
Dễ dàng tạo ra các mối quan hệ trong mạng xã hội
Trong một mạng xã hội nào đó, người dùng có một vài người bạn và những người ấy lại có nhiều bạn bè khác và cứ như vậy Nhờ vào mạng xã hội, ban đầu, người dùng có thể thiết lập một mối quan hệ với bất cứ ai chỉ đơn giản bằng việc gửi đi một lời nhắn đề nghị được kết nối bạn bè Sau khi được chấp nhận từ phía bên kia, việc cần làm để giữ gìn mối quan hệ đó là cố gắng cân bằng giữa việc cho
đi và nhận lại Việc này ở trên một mạng xã hội tỏ ra đơn giản hơn so với việc duy trì mối quan hệ trong xã hội thực tế vì cho đi và nhận về trong mạng xã hội nhiều khi chỉ nằm ở mức có những bình luận trong những bài viết
Những ưu điểm mà mạng xã hội mang lại như đã trình bày ở trên là rất to lớn, tuy nhiên, mạng xã hội cũng có những mặt hạn chế như sau:
Vấn đề về thông tin cá nhân của người dùng
Khi đã kết nối vào một mạng xã hội, có bạn bè trên đó đồng nghĩa với việc người dùng cũng phải đối mặt với nguy cơ bị lợi dụng các thông tin cá nhân để đăng tải lên đó Với những thông tin như vậy, những kẻ có ý đồ không tốt có thể lợi dụng những thông tin cá nhân của người dùng đó để thực hiện những hành vi xuyên tạc Điều này có thể làm ảnh hưởng tới lợi ích cá nhân của người dùng đó ngay trong thời điểm hiện tại cũng như tương lai Biết đâu một bức ảnh xưa có thể được lôi ra để làm hại tới thanh danh của người dùng đó về sau này?
Cơ chế vận hành của các mạng xã hội
Mạng xã hội cũng như mọi trang web khác, đều phải giải quyết các vấn đề liên quan tới bảo mật thông tin Hơn nữa, các trang mạng xã hội còn gặp phải một
số vấn đề như tình trạng tin nhắn rác làm phiền những thành viên tham gia Vấn đề này xuất hiện khá nhiều trên các phương tiện thông tin đại chúng gần đây, có thể lấy vài sự cố các tài khoản mạng xã hội của những người nổi tiếng bị hacker kiểm soát, những thông tin nhạy cảm được tung ra
Trang 15 Việc tiêu tốn thời gian sử dụng mạng xã hội
Việc tham gia một mạng xã hội, kiểm tra các thay đổi gần đây từ bạn bè, cập nhật những thay đổi, thông tin cho chính mình nhiều khi làm mất thời gian của người tham gia Tất nhiên điều này còn tùy thuộc vào cách từng người phân phối
thời gian của mình cho việc “online” trên các mạng xã hội mà họ tham gia Tuy vậy
theo những phân tích gần đây thì có tình trạng khá nhiều người trẻ bị hội chứng
“nghiện” khi tham gia mạng xã hội Nếu tình trạng này xảy ra ở diện rộng thì sẽ có
rất nhiều hiệu ứng không tốt kèm theo
Như vậy, cũng như những dịch vụ khác triển khai và khai thác trên nền Internet, mạng xã hội cũng thể hiện được những ưu và nhược điểm nhất định Nhược điểm của mạng xã hội phần lớn kế thừa từ những nhược điểm vốn có của các dịch vụ nền web, nhưng những ưu điểm của dịch vụ này lại mang tính chất đột phá so với các phương pháp truyền thông truyền thống Như trong một cuốn sách
với tựa đề Groundswell của nhà xuất bản Forrester Research ra đời năm 2008,
mạng xã hội và tác động của nó đã được mô tả với thuật ngữ “groundswell”, tạm
hiểu là: “Một bước tiến tự nhiên của loài người khi sử dụng các công cụ trên mạng
để kết nối, tích lũy kiến thức, lấy những gì họ cần – thông tin, hỗ trợ, các ý tưởng, các sản phẩm hay khả năng thương lượng với cộng đồng”1 Và với những tiềm năng hiện tại mà mạng xã hội mang lại (xem Bảng 1.1), việc tham gia, phân tích và tận dụng những điểm mạnh mà mạng xã hội mang lại là cần thiết
Bảng 1.1: Tiềm năng đối với mạng xã hội thông qua vài con số [11],[13]
1
Nguyên văn: “a spontaneous movement of people using online tools to connect, take charge of their own experience, and get what they need-information, support, ideas, products, and bargaining
Trang 161.3 Xây dựng các mạng xã hội dựa trên các nút và liên kết
Phân tích mạng xã hội không phải là một phương pháp mới vì đã phổ biến trong giới nghiên cứu Các nhà nghiên cứu đã công bố các thử nghiệm mô tả các kết nối giữa mọi người trong các môi trường khác nhau Cùng với các thử nghiệm, một
số lý thuyết liên quan đến phân tích mạng xã hội và liên quan đến các thuật toán tính toán các độ đo mạng cũng đã được công bố Một trong những bài báo lâu đời nhất về phân tích mạng xã hội là bài báo Small world experiment [10] Đây là bài báo nổi tiếng và nói về độ dài đường đi trong một mạng xã hội cụ thể
Trang 17Hình 1.2: Các mạng Small world Stanley Milgram đã tiến hành một số thử nghiệm để xác định độ dài trung bình đường đi cho một số mạng xã hội đặc thù Mục đích chủ yếu của những thử nghiệm này đã thể hiện rằng: các cộng đồng người không quá lớn (một người có thể quen một người khác thông qua số bước tối đa nào đó, nói theo cách khác, thông qua một số người trung gian) Các kết quả nghiên cứu trên đã đưa ra như sau: các mạng xã hội được đặc trưng bởi đường đi ngắn giữa các nút
Milgram là đồng tác giả của thử nghiệm bài toán Small world, đã công bố rộng rãi thông qua một số nghiên cứu và tập trung vào các khái niệm rằng thế giới
đã trở nên tương tác kết nối cao Thử nghiệm này đã được triển khai năm 1967 Bây giờ, không khó để tưởng tượng sự ảnh hưởng của những khái niệm về các mối quan
hệ có thể có của con người có thể được thiết lập với việc sử dụng các thiết bị, các công nghệ, các địa lý khác nhau
Thử nghiệm của Milgram đã nhấn mạnh sự thật rằng: hai người được lựa chọn ngẫu nhiên có thể biết nhau Đây là cách để giải quyết bài toán Small world Một phương pháp chính xác để giải quyết bài toán Small world là bằng cách tính
Trang 18toán độ dài trung bình các đường đi kết nối giữa hai nút bất kỳ bên trong mạng xã hội Cuối cùng, thử nghiệm của Migram đã đưa ra thuật toán tính toán số lượng trung bình các liên kết mà kết nối giữa hai nút bất kỳ
Thủ tục liên quan đến bài toán Small world đã được trình bày trong bài báo
“Một nghiên cứu thử nghiệm của bài toán Small world” của Jeffrey Travers và
Stanley Milgram [10]
Travers and Milgram cũng đã định nghĩa quy tắc của người tham gia cho
nghiên cứu của họ, miêu tả cách những người tham gia sẽ lấy những thông tin cá
nhân và chuyển tài liệu đi Quy tắc này cũng định nghĩa người đích, người phân
công (có chức năng tránh lặp đi lặp lại) và các thẻ dấu vết
1.4 Cấu trúc các mạng xã hội
Dựa vào loại mạng xã hội và cấu trúc của mạng xã hội, các kết quả của các
độ đo khác nhau, dẫn đến các phương pháp khác nhau để khám phá các mạng xã hội
Dựa vào nghiên cứu của Borgatti [3], có 4 nhóm chính để phân loại các Mạng xã hội
- Mạng lan truyền tham số biểu diễn các mạng xã hội có các kết nối được
phân tán trên phạm vi rộng bởi các nút
- Mạng điều chỉnh tham số biểu diễn hai nút có vị trí mạng tương tự nhau,
nghĩa là có những hành vi tương tự nhau khi đối mặt với những hoàn cảnh tương tự nhau
- Mạng gắn kết tham số biểu diễn hai mạng xã hội con gắn kết với nhau, do
vậy chúng hoạt động như một mạng đơn
- Mạng loại trừ tham số chỉ biểu diễn một liên kết cụ thể Nghĩa là trong
mạng chỉ có một loại liên kết, không chứa nhiều loại liên kết
Trang 19Hình 1.3: Bốn cấu trúc mạng được xác định bởi Borgatti và các đồng nghiệp tại MIT Mỗi nút biểu diễn một người; mỗi đường biểu diễn kênh giao tiếp giữa người với người Nút trung tâm nhất trong mỗi mạng là màu đỏ
Trong viễn thông, loại mạng lan truyền tham số là thích hợp nhất Với một vài hình thức giao tiếp như tin nhắn văn bản các kết nối bên trong mạng loại này
có thể lan truyền nhanh hơn và rộng hơn những loại mạng khác Xét chiến dịch tiếp thị có quy mô và tin nhắn rác, mạng lan truyền tham số có thể rất thích hợp để phân tích cấu trúc và hành vi mạng
Loại mạng điều chỉnh tham số có hai khía cạnh khác nhau, đó là:
- Xảy ra đồng thời
- Xảy ra tuần tự
Khi hai nút thực hiện cùng sự kiện tại cùng thời điểm và hai nút không có kết nối với nhau, có thể xét rằng các vị trí tương tự nhau bên trong các mạng con hoặc các ràng buộc và các tình huống tương tự nhau có thể cũng diễn ra cùng một lúc Tuy nhiên nếu hai nút mà có kết nối với bằng kiểu kết nối nào đó, hoặc thậm chí hai nút có một mối quan hệ gắn kết, có thể xét rằng hai nút có ảnh hưởng lẫn nhau nào
đó Hai nút này có thể trước đấy đã quyết định thực hiện sự kiện giống nhau diễn ra cùng thời điểm Trong trường hợp hai nút không có kết nối với nhau, loại mạng điều chỉnh tham số phù hợp cho miêu tả môi trường và kịch bản nhưng trong trường
Trang 20hợp hai nút có kết nối với nhau, loại mạng điều chỉnh tham số này phù hợp cho miêu tả sự ảnh hưởng
Loại mạng gắn kết tham số liên quan chặt chẽ với một khái niệm được gọi là điểm khớp nối Điểm khớp nối là nút mà liên kết hai thành phần được kết nối với nhau Các thành phần gồm tập nút liên quan với nhau, không quan tâm đến đường
đi mà chúng kết nối với nhau Các nút mà đóng vai trò là điểm khớp nối thường là các nút trung tâm, kết nối các nhóm nhỏ, các mạng con hoặc thậm chí kết nối các cộng đồng với nhau Tất cả các nút là các điểm khớp nối có thể là chủ đề nghiên cứu trong tương lai
Loại mạng trừ tham số không thể ứng dụng trong viễn thông Ví dụ, một mạng xã hội dựa trên người sử dụng lao động và người lao động, nếu hai người đã kết hôn thì họ không thể làm việc trong cùng công ty Như vậy, trong mạng trừ tham số liên kết kết hôn loại trừ liên kết đồng nghiệp Tuy nhiên, trong viễn thông,
có thể có vài loại liên kết tại cùng thời điểm như các cuộc gọi, các văn bản, phương tiện, email
1.5 Phương pháp phân tích cho mạng xã hội
Tất cả dữ liệu trong các mạng xã hội quyết định cho việc sử dụng phương pháp phân tích Ở đây, dữ liệu gồm có thông tin về các nút và các liên kết, cũng như các loại nút, các loại liên kết, các trọng số của các nút và các liên kết [4]
Một trong những phân tích quan trọng nhất trong các mạng xã hội đó là so sánh giữa các hành vi khác nhau Các hành vi này không chỉ được gắn với các nút
mà cũng được gắn với các liên kết Thông thường, các hành vi của các liên kết – tần suất, độ phù hợp Có thể thay đổi tầm quan trọng của nút được gắn với các liên kết Đối với các mạng xã hội trong viễn thông, các khách hàng mà có một số các liên kết tới các nút rất quan trọng thì cũng trở nên quan trọng Phân tích mạng xã hội trong viễn thông, có thể có các thuộc tính đặc thù như phân khúc khách hàng, giá trị khách hàng, hóa đơn trung bình và khi đó, sử dụng các thuộc tính đặc thù này trong phân tích mạng xã hội trong viễn thông Như vậy, có thể có các thuộc tính đặc thù cho các liên kết như giá cuộc gọi, thời gian… và khi đó sử dụng các thuộc tính
Trang 21này trong phân tích Các thuộc tính khác nhau này có thể tạo ra các trọng số khác nhau cho các nút và các liên kết và do vậy chúng thay đổi trong phân tích Nhắc lại lần nữa, các nút có các liên kết giá trị cao trở thành quan trọng hơn, và các liên kết kết nối các nút giá trị cao cũng trở nên quan trọng
Vài độ đo có thể được tính toán để biểu diễn các thuộc tính hoặc đặc tính của mạng xã hội, cũng như các mạng xã hội con hoặc các đồ thị con bên trong các mạng
xã hội Các độ đo trong các mạng xã hội gồm có số lượng các kết nối mà một nút
có Độ đo này có thể phân chia thành hai độ đo khác nhau:
- Miêu tả số lượng các kết nối đi vào
- Miêu tả số lượng các kết nối đi ra
Điều này là khá phù hợp trong lĩnh vực viễn thông, biểu diễn giá trị các cuộc gọi đi và đến giữa các khách hàng Các độ đo khác liên quan đến đường đi mạng như độ dài các đường đi kết nối các nút, khoảng cách giữa các nút, bao nhiêu nút trung tâm có trong mạng xã hội
Ngoài ra, khoảng cách các mối quan hệ trên có thể trình bày vài thuộc tính liên quan đến cấu trúc của mạng xã hội Độ mạnh của các liên kết là rất quan trọng khi thiết lập hành vi mối quan hệ giữa các nút Một liên kết đặc thù giữa hai nút có thể là trung tâm của toàn bộ mạng xã hội Do vậy, không chỉ các nút có giá trị gần nhau mà các liên kết cũng có giá trị phụ thuộc cách các liên kết kết nối các nút với nhau trong mạng xã hội
Hơn nữa, khi phân tích mạng diễn ra, các thuộc tính của toàn mạng xã hội sẽ được tính toán Các thuộc tính như số bậc cho mỗi nút, các liên kết đi vào và đi ra trung tâm và sự ảnh hưởng của các nút đối với nút khác tất cả sẽ được tính toán chính xác và được so sánh với nhau Phân tích sự so sánh này làm tăng mẫu hành vi cho toàn bộ mạng nhưng đặc biệt làm tăng mẫu hành vi riêng cho mỗi nút và mỗi liên kết bên trong mạng xã hội, phát hiện các nút có giá trị cao theo các độ đo mạng
Các mạng xã hội cũng có thể được phân tích bằng cách chia toàn bộ mạng thành các cộng đồng nhỏ kết nối với nhau Tương tự phân tích so sánh cho các nút
và các liên kết, sự đánh giá so sánh dựa trên các cộng đồng nhỏ có thể phát hiện bao
Trang 22nhiêu mạng được phân cụm và bao nhiêu cộng đồng là quan trọng hơn theo các độ
đo mạng Với cách này, có thể thấy rằng các độ đo mạng trung bình cho các nút của các cộng đồng cũng là các độ đo mạng cho chính bản thân các cộng đồng
Phân tích cộng đồng có thể phát hiện hành vi mạng, nhưng chủ yếu là có ích trong việc làm nổi bật các cụm không mong muốn bên trong mạng theo hành vi Khi xét việc sử dụng của các nút, các nhóm nút không thường xuyên – ví dụ như trong viễn thông, khả năng miêu tả một tập khách hàng thực hiện các sự kiện gian lận Nếu các khách hàng này không tham gia gian lận mà chỉ mới là các khách hàng
sử dụng các dịch vụ viễn thông cao, nhóm các nút này sẽ được kiểm soát bởi công
ty viễn thông, giữ khách hàng từ các đối thủ cạnh tranh
1.6 Kết luận
Trong chương này, đầu tiên nghiên cứu và trình bày khái niêm về mạng xã hội Tiếp đến, trình bày các ưu điểm và nhược điểm của mạng xã hội mang lại… Đặc biệt, nghiên cứu và trình bày phương pháp phân tích cho mạng xã hội
Như vậy, để phân tích được mạng xã hội, cần phải có dữ liệu về mạng xã hội, dữ liệu về các nút, các liên kết và các trọng số gán tới nút, liên kết trong mạng
xã hội Sau đó, xác định tầm quan trọng của các nút và các liên kết theo bài toán đặt
ra Để nghiên cứu sâu hơn về phân tích mạng xã hội, trong chương tới sẽ nghiên cứu và trình bày phân tích mạng xã hội và ứng dụng phân tích mạng xã hội để phân tích dữ liệu trong kinh doanh viễn thông
Trang 23Chương 2 PHÂN TÍCH MẠNG XÃ HỘI VÀ ỨNG DỤNG TRONG PHÂN TÍCH SỐ
LIỆU TRONG KINH DOANH
Như đã trình bày trong chương 1, chương này sẽ tập trung nghiên cứu và trình bày những vấn đề cơ bản liên quan đến phân tích mạng xã hội Đặc biệt, trình bày ứng dụng phân tích mạng xã hội trong phân tích số liệu kinh doanh viễn thông để giúp các công ty kinh doanh viễn thông có thể đạt được hiệu quả kinh doanh với mục tiêu đạt được doanh thu tốt nhất
2.1 Khái quát về phân tích mạng xã hội
2.1.1 Khái niệm về phân tích mạng xã hội
Phân tích mạng xã hội (Social network analysis - SNA) sử dụng lý thuyết mạng để phân tích các mạng xã hội Phân tích mạng xã hội xem xét các mối quan hệ
xã hội theo khía cạnh của lý thuyết mạng, gồm có: các nút miêu tả các cá nhân có trong mạng xã hội, và các liên kết (ties, cũng có thể gọi là các cạnh, các kết nối)
miêu tả các mối quan hệ giữa các cá nhân trong mạng, ví dụ như quan hệ bạn bè, quan hệ họ hàng, quan hệ cơ quan (công ty) và quan hệ giới tính Các mạng xã hội thường được thể hiện bằng một biểu đồ (diagram) mạng xã hội, Hình 2.1, trong biểu
đồ thì các nút chính là các điểm và các ties chính là các đường liên kết [13]
Trang 24Hình 2.1: Ví dụ cho biểu đồ mạng xã hội Phân tích mạng xã hội đã trở thành một công cụ gồm tập các phương pháp
sử dụng cho việc phân tích các cấu trúc xã hội Các phương pháp này phục vụ chuyên biệt cho điều tra, khảo sát sự quan hệ theo một khía cạnh nào đó của các cấu trúc xã hội Do vậy, sử dụng phương pháp này phụ thuộc vào mối quan hệ hơn là sử dụng các thuộc tính của dữ liệu [13]
2.1.2 Sự phát triển của phân tích mạng xã hội
Phân tích mạng xã hội nghiên cứu cuộc sống xã hội theo các mối quan hệ giữa các cá nhân khác nhau Các hành vi bên trong mạng quyết định việc hiểu các kết nối xã hội và quan trọng hơn, ngụ ý rằng các hành vi tạo ra bên trong một cộng đồng Ngụ ý thích hợp nhất là mỗi người trong mạng xã hội có thể ảnh hưởng lẫn nhau như thế nào khi thực hiện các sự kiện giống nhau Xét trong lĩnh vực kinh doanh, cái gì tạo ra sự khác biệt giữa người dẫn dắt và người theo sau? Khi một công ty kinh doanh viễn thông mất một khách hàng có ảnh hưởng bên trong mạng
xã hội thì tác động như thế nào? Các công ty có thể thuyết phục các khách hàng mua sản phẩm mới hoặc sử dụng dịch vụ mới được không? Hiểu được các kết quả
từ hành vi mới của các mối quan hệ xã hội có thể cho phép các công ty dự báo được các sự kiện kinh doanh mới và tập trung vào quản lý mối quan hệ khách hàng chính xác hơn
Nghiên cứu các mạng xã hội được định nghĩa hình thức như là tập các nút
(gồm các thành phần của mạng) Các nút này được kết nối bằng các loại quan hệ
khác nhau (được định nghĩa hình thức như là các liên kết) Nghiên cứu phân tích
mạng xem xét tất cả các liên kết này như là các khối kiến trúc cơ bản của xã hội Nghiên cứu phân tích mạng không chỉ tập trung vào mỗi kiểu dữ liệu thuộc tính như phân tích truyền thống chỉ nghiên cứu các dữ liệu thuộc tính mà phân tích mạng xã hội còn xem xét các đặc trưng của các quan hệ từ các hoàn cảnh khác nhau Các phương pháp truyền thống của phân tích dữ liệu thường xem xét các đặc trưng riêng
lẻ từ tất cả các quan sát để phân tích thông tin tồn tại bên trong dữ liệu Cái gì là nét đặc trưng từ một quần thể gồm các công ty, các nhân viên, các khách hàng hoặc các
Trang 25thị trường? Trong kinh doanh viễn thông sử dụng các phương pháp truyền thống là khá phổ biến để phân tích dữ liệu riêng lẻ để hiểu hành vi các khách hàng như hóa đơn, hình thức thanh toán, tần số và số lượng sử dụng dịch vụ… Bên cạnh các đặc trưng riêng lẻ, phân tích mạng xã hội còn xem xét tất cả thông tin về các mối quan
hệ giữa các thành viên của mạng (các nút) Từ thực tế, thông tin về các mối quan hệ giữa các cá nhân bên trong một mạng xã hội thường thích hợp hơn các thuộc tính riêng lẻ của từng cá nhân Các mối quan hệ giữa các cá nhân có thể cho biết thông tin về các khách hàng nhiều hơn là các đặc trưng riêng lẻ của các khách hàng Đây
là sự khác nhau cơ bản giữa phân tích dữ liệu và phân tích mạng xã hội Bạn là gì không quan trọng bằng bạn ứng xử và kết nối với người khác như thế nào?
Alexandra Marin và Barry Wellman [1] đã công bố công trình nghiên cứu
mô tả một số trường hợp nghiên cứu về các mối quan hệ xã hội
Về cơ bản, một mạng xã hội gồm tập các nút được kết nối bằng một hay nhiều liên kết (các loại quan hệ khác nhau) Ví dụ, trong kinh doanh viễn thông, các nút là các khách hàng, các đường truyền, dải sóng rộng, thiết bị di động hoặc loại thiết bị truyền thông khác Các liên kết, đặc biệt trong môi trường điện thoại, là các cuộc gọi, các tin nhắn, thư điện tử
Khái niệm các nút và liên kết có thể thay đổi theo bài toán cần giải quyết hoặc lĩnh vực kinh doanh mà được nghiên cứu Trong ngành tài chính và ngân hàng, các nút có thể không chỉ là các khách hàng mà còn có thể là các tài khoản và các liên kết có thể được biểu diễn bởi các giao dịch, các chính sách, các thế chấp
Một trong những bước quan trọng nhất trong phân tích mạng xã hội đó là định nghĩa chính xác vai trò các nút và các liên kết Bước này quyết định các ứng dụng liên quan đến các vấn đề kinh doanh Nếu không định nghĩa vai trò của các nút và liên kết thì có thể xây dựng và phân tích mạng xã hội nhưng sẽ không giải quyết cho các ứng dụng kinh doanh
Nhiệm vụ lựa chọn loại dữ liệu có sẵn nào để sử dụng, dựa trên các loại bài toán khác nhau để xây dựng công việc của phân tích mạng xã hội Một vấn đề thực
tế, cùng một lĩnh vực kinh doanh, nhưng lại có các bài toán khác nhau (dữ liệu
Trang 26giống nhau những có thể được sử dụng khác nhau) Ví dụ, trong môi trường kinh doanh viễn thông, các số điện thoại thường coi như là các nút và các cuộc gọi coi như là các liên kết Tuy nhiên, nếu nội dung là gian lận, và xác định những thủ phạm gian lận cần phải tập trung, số điện thoại có thể được coi như là liên kết kết nối hai cá nhân Như vậy, số điện thoại có thể được sử dụng để làm thành nút cho bài toán cụ thể nào đó và cũng có thể được sử dụng để làm thành liên kết cho bài toán khác
Như vậy, việc đầu tiên trong phương pháp phân tích mạng xã hội là định nghĩa chính xác các nút biểu diễn cái gì và các liên kết biểu diễn cái gì Trong kinh doanh viễn thông khá rõ ràng, định nghĩa các khách hàng là các nút và các cuộc gọi
là các liên kết, đặc biệt trong hoạt động điện thoại di động, thậm chí có nhiều hơn một kiểu liên kết trong hoạt động điện thoại di động như các cuộc gọi, các tin nhắn văn bản, các tin nhắn đa phương tiện, e-mail, và thậm chí truy cập Internet Trong trường hợp truy cập Internet, nút đích là gì ? Là trang web? Ngay cả trong kịch bản đơn giản như kinh doanh viễn thông, có thể hình dung nhiều hơn một loại nút và nhiều hơn một loại liên kết Hình dung về điện thoại cố định, ở đây mối quan hệ giữa thiết bị và khách hàng không phải là một-một, các nút có thể định nghĩa theo những cách khác nhau Ví dụ, các nút có thể định nghĩa là các thành viên trong một
hộ gia đình, phân chia các liên kết giữa các thành viên trong hộ gia đình, tập hợp các liên kết thành số điện thoại
Một số ngành kinh doanh phức tạp hơn kinh doanh viễn thông như bảo hiểm
và ngân hàng, có thể xác định các loại nút và các loại liên kết thì phải liên quan tới loại bài toàn kinh doanh được quan tâm giải quyết
Như vậy, khi có nhiều hơn một loại nút và nhiều hơn một loại liên kết thì có thể có các trọng số khác nhau cho các nút và các liên kết, các trọng số này để phân biệt chúng dựa trên nguyên tắc nào đó
Laumann [8] đã đưa ra ba phương pháp khác nhau để lựa chọn các nút và
liên kết theo đặc điểm của cạnh trong mạng xã hội:
Trang 27- Phương pháp đầu tiên là dựa vào vị trí, xét số thành viên trong một tổ chức hoặc cộng đồng như là các nút trong mạng xã hội
- Phương pháp thứ hai là dựa vào sự kiện, xét các nút với vị trí tốt của các nút được định nghĩa bên trong một tổ chức hoặc cộng đồng như là các thành viên của mạng xã hội
- Phương pháp thứ ba là dựa trên mối quan hệ, xét các thành viên trong một
tổ chức hoặc cộng đồng dựa trên tập các nút biểu diễn mối quan hệ bền vững trong một mạng
Tất cả các phương pháp trên có thể áp dụng đồng thời và cũng có thể được
áp dụng tại cùng thời điểm cho vài loại mạng khác nhau Như vậy, định nghĩa không chỉ các nút và liên kết mà cũng phải định nghĩa các biên của mạng (giúp định nghĩa các nút và liên kết trong nghiên cứu cộng đồng)
Trong kinh doanh viễn thông, những khách hàng có thể được xem như là phương pháp dựa trên vị trí, ở đây loại khách hàng có thể được xem như là nút Cũng vậy, trong nhiều trường hợp, các công ty tác động đến khách hàng của chính mình và ranh giới của phân tích mạng của các công ty có thể được xem là mạng chính bản thân các công ty Tuy nhiên, xét sự di chuyển của khách hàng lớn giữa các công ty kinh doanh viễn thông (đặc biệt là số lượng trong hoạt động di động, số lượng di động nào đó có thể được chấp nhận) như là các thành viên bên trong mạng Các nút bên ngoài có thể là thích hợp cho việc hiểu và giữ được khách hàng, và do vậy các nút bên ngoài có thể được nằm trong quá trình xử lý phân tích mạng bên trong Cuối cùng, xem xét quần thể cần quan tâm quyết định đến việc phân tích mạng Vì xét điện thoại nào đó như là một khách hàng và sau đó xem như là một nút, vài số điện thoại sẽ được loại bỏ khỏi mạng như các số khẩn cấp, các số chăm sóc khách hàng, vài dịch vụ đặc biệt dựa trên chế độ trả lời tự động Các loại số trên không miêu tả một nút trong hoàn cảnh xã hội Hơn nữa, khi phân tích các khách hàng theo mối quan hệ, có thể xem xét tất cả các liên kết và tất cả các nút, nhưng để so sánh việc sử dụng giữa các khách hàng, có lẽ vài loại khách hàng sẽ
Trang 28được loại bỏ từ quần thể đang xét như các công ty tư nhân và các cá nhân đặc biệt hoạt động với vai trò chuyên nghiệp
Vì quá trình xác định các nút và các liên kết không phải lúc nào cũng dễ làm, thời gian và công sức sẽ được sử dụng đáng kể trong giai đoạn này Quá trình này là nhân tố chính trong việc phân tích mạng xã hội thành công hay không
Khi các mạng xã hội được xem xét, các mối quan hệ giữa các nút sẽ được xem xét nhiều hơn là chỉ mỗi thuộc tính của các nút Như vậy, các cá nhân sẽ có một tập các thuộc tính mà phải được phân tích khi xây dựng mạng Để nghiên cứu các ảnh hưởng của các thuộc tính như doanh thu trung bình, hóa đơn, lịch sử thanh toán, các sản phẩm và dịch vụ hoạt động Chúng sẽ được phân loại phù hợp trong môi trường mạng
Sự ảnh hưởng của các thuộc tính thương mại trong phân tích mạng xã hội theo thời gian có thể phát hiện ra hành vi cá nhân được gắn kết với vài sự kiện thương mại Ví dụ, khi phân tích sự cạnh tranh dịch vụ và sản phẩm, về tương quan,
có thể phân tích những khách hàng có ảnh hưởng, một người dẫn những khách hàng khác mua các loại sản phẩm hoặc dịch vụ giống nhau và khi đó làm nổi bật các giá trị trung bình của vài thuộc tính thương mại cụ thể đối với những khách hàng này Bằng cách này, các công ty có thể xác định những người có ảnh hưởng cho các sự kiện thương mại cụ thể; thêm nữa, các công ty có thể xác định hành vi trung bình theo hướng sử dụng và các đặc trưng
Cần chú ý rằng, khi các thuộc tính được tách ra độc lập, các cá nhân có các thuộc tính chung có thể đưa ra kết quả giống nhau Phân tích thuộc tính độc lập có thể liên kết các cá nhân có giá trị trung bình giống nhau cho các biến thuộc tính thương mại, thậm chí các cá nhân có hành vi khác biệt hoàn toàn theo hướng sử dụng hoặc mối quan hệ
Ngược lại, khi nghiên cứu một mạng xã hội và hành vi của nó, các cá nhân
đã được phân tích bởi các mối quan hệ của họ (sức khỏe, tần suất, tầm quan trọng ) Phương pháp này có thể đưa việc phân tích theo một hướng khác hoàn toàn: đánh giá các cá nhân có các thuộc tính chung theo các cách khác nhau, do đó
Trang 29cho ra các kết quả khác nhau Ngược lại, để đánh giá các thuộc tính cá nhân, phân tích mạng xã hội có thể đặt các nút có hành vi tương tự nhau cùng với nhau theo các mối quan hệ, mặc dù các thuộc tính cá nhân giữ các giá trị hoàn toàn khác nhau về thuộc tính cá nhân của họ Điểm mấu chốt để tạo nhóm các nút tương tự nhau là mối quan hệ chứ không phải chỉ mỗi các thuộc tính
Thông điệp muốn nói ở đây đó là các cá nhân có các đặc trưng chung có thể
có hành vi theo các cách hoàn toàn khác nhau Sử dụng các kỹ thuật phân cụm truyền thống, các cá nhân này có thể xem xét tương đương nhau vì các thuộc tính của họ và sẽ nằm trong cùng nhóm Tuy nhiên, dựa trên cơ sở phân tích mạng xã hội, các cá nhân giống nhau này sẽ nằm trong các nhóm hoặc các cộng đồng khác nhau Mặc dù các cá nhân có các thuộc tính chung có thể có hành vi theo các cách
tương tự nhau, trong phân tích mạng xã hội, phân tích thích hợp nhất là mối quan hệ với các nút láng giềng thay vì các đặc điểm của chính các nút
Bằng việc phân tích hành vi được nhúng trong các mạng xã hội, có thể khám phá các mức độ khác nhau của các mẫu dữ liệu Các kết quả đặc biệt có ích cho việc kinh doanh, đặc biệt trong quá trình lan truyền có liên quan đến bán được các sản phẩm và dịch vụ Các hành vi tương tự nhau có thể chỉ dẫn thương mại mua loại sản phẩm và dịch vụ mới
Trong hầu hết các lĩnh vực công nghiệp, đặc biệt trong viễn thông, bán được sản phẩm và dịch vụ có thể được hiểu như là chuỗi các sự kiện Nói cách khác, một
số khách hàng quan trọng (người dẫn dắt) có thể chỉ dẫn các khách hàng khác bỏ đi sau khi họ dẫn dắt hoặc họ có thể dẫn dắt các khách hàng khác mua các sản phẩm
và dịch vụ tương tự nhay sau khi họ dẫn dắt Với lý do trên, đây là yếu tố chủ yếu
để đạt được tập khách hàng mong muốn trong chiến dịch cụ thể (có thể liên quan đến duy trì khách hàng hoặc bán được sản phẩm) Tập khách hàng mong muốn có thể lan truyền các dịch vụ hoặc sản phẩm trong mạng viễn thông
Cũng vậy, phân tích các mạng xã hội yêu cầu tìm kiếm các cá nhân chứ
không tìm kiếm nhóm, thay vào đó, là tìm kiếm cộng đồng Một nhóm bao gồm các
Trang 30cá nhân có các đặc trưng tương tự nhau, trong khi một cộng đồng được nhóm cùng nhau bởi các hành vi tương tự nhau
Phân tích mạng xã hội cũng xem xét chiến lược kinh doanh, chỉ ra các trọng
số quan trọng khác nhau được sử dụng trong phân tích mạng xã hội của các nút và liên kết Trong viễn thông, có thể xem xét các trọng số khác nhau theo các kiểu khác nhau của các liên kết (các cuộc gọi, tin nhắn văn bản, tin nhắn đa phương tiện, thư điện tử ) Ví dụ, để tăng dịch vụ tin nhắn văn bản lên, phân tích mạng xã hội
sẽ xem xét trọng số các liên kết được thiết lập dựa trên tin nhắn văn bản vì phù hợp trong mối quan hệ mạng viễn thông, đúng hơn là phải xem xét các liên kết được thiết lập dựa trên các cuộc gọi Tương tự, để tăng gói chuyển vùng đặc biệt, tất cả cuộc gọi chuyển vùng phải được coi là quan trọng hơn các cuộc gọi khác Mặc dù tất cả các kiểu liên lạc hoặc các kiêu mối quan hệ khác nhau (các cuộc gọi địa phương, cuộc gọi quốc gia, cuộc gọi quốc tế, tin nhắn văn bản, tin nhắn đa phương tiện ) sẽ được xem xét trong phân tích mạng xã hội nhưng các cuộc gọi chuyển vùng đặc biệt sẽ có trọng số cao hơn các cuộc gọi khác để nhấn mạnh sự phù hợp
của chuyển vùng theo tình huống đặc biệt
2.1.3 Lý thuyết đồ thị và phân tích mạng xã hội
Phân tích mạng xã hội có thể được khám phá và được trình bày bởi hai phương pháp khác nhau: Khoa học xã hội và khoa học toán học
Khoa học toán học miêu tả và trình bày Phân tích mạng xã hội dựa trên lý thuyết đồ thị Các khái niệm và độ đo liên quan tới phân tích mạng xã hội đến từ lý thuyết đồ thị Một ưu điểm lớn nhất của lý thuyết đồ thị là các công thức toán học
có thể được áp dụng để tính toán và được áp dụng trong các bài toán kinh doanh
Các đồ thị có thể được xem xét là các cấu trúc toán học được sử dụng mô hình hóa các cặp quan hệ giữa các đối tượng khác nhau Các đồ thị sẽ gồm tập các đỉnh hoặc các nút và tập các cạnh hoặc các liên kết (kết nối cặp các đỉnh hoặc các nút) Về cơ bản, việc miêu tả bằng đồ thị giống với miêu tả bằng khoa học xã hội, nhưng miêu tả bằng đồ thị sử dụng các công thức toán học Dựa trên các công thức,
có thể hoàn thành các thuật toán và do vậy áp dụng phân tích mạng xã hội cho các
Trang 31bài toàn thực tế Khoa học xã hội thường chỉ phù hợp với các mạng nhỏ, số lượng các nút và các liên kết hợp lý Tuy nhiên, với các bài toán kinh doanh trong vài lĩnh vực công nghiệp như viễn thông, ngân hàng, và các công ty thẻ, mạng xã hội có thể
là lớn, có số lượng các nút và các liên kết thực sự lớn Ví dụ, công ty viễn thông trung bình có mười triệu khách hàng, một mạng thông thường có thể đạt được mười triệu các nút với một tỷ liên kết Do vậy, dựa trên các phương pháp toán học, các thuật toán hiệu quả được hướng tới giải quyết các vấn đề kinh doanh trong các lĩnh vực công nghiệp trên
Một đồ thị có thể là vô hướng hoặc có hướng Các liên kết vô hướng nghĩa là
không phân biệt giữa hai đỉnh được liên kết bởi mỗi cạnh; nói theo cách khác, không có hướng gắn với liên kết kết nối hai nút với nhau Nút A liên quan tới nút B theo cách giống nhau với nút B liên quan tới nút A Khái niệm này được hiểu đầy
đủ khi xem xét về mối quan hệ như sau: Andre là người bạn của Bruno theo cách giống với Bruno là người bạn của Andre Không có sự khác nhau giữa các liên kết
kết nối các nút Các liên kết có hướng nghĩa rằng có một sự chỉ dẫn trong mối quan
hệ kết nối giữa hai nút phân biệt Trong trường hợp này, nút A có thể liên quan tới nút B theo cách khác với nút B liên quan tới nút A Trong viễn thông, các đồ thị truyền thông luôn luôn là có hướng: Nút A gọi tới nút B hoặc nút B gọi tới nút A Tương tự, nếu Andre gọi tới Bruno 100 lần và Bruno gọi tới Andre chỉ mới 10 lần,
sự khác biệt này sẽ là rõ ràng trong mạng xã hội Cách để tạo ra rõ ràng trên bằng cách là thiết lập hướng cho các liên kết Có hai phương pháp mà có thể biểu diễn trường hợp trên
- Phương pháp thứ nhất là tạo ra một trăm liên kết (các mũi tên) từ Andre tới Bruno và thêm mười liên kết (các mũi tên) từ Bruno tới Andre
Trang 32Hình 2.2: Mô tả thiết lập kết nối bằng số lượng các đường kết nối
- Phương pháp thứ hai là tạo ra một liên kết (mũi tên) từ Andre tới Bruno và liên kết khác (mũi tên) từ Bruno tới Andre Trong trường hợp này, liên kết từ Andre tới Bruno sẽ dầy gấp 10 lần so với liên kết từ Bruno tới Andre
Hình 2.3: Mô tả thiết lập kết nối thể hiện bằng độ dầy của liên kết
Một trong những người đầu tiên sử dụng lý thuyết đồ thị là Leonhard Euler vào năm 1736, khi đó ông đã đề xuất giải pháp cho bài toán về bẩy cây cầu của Königsberg, được trình bày trong quyển sách của tác giả Barabási [2] Hình 2.4 trình bày câu hỏi của bẩy cây cầu, một bài toán lịch sử trong toán học Vì nhiều thành phố ở Châu Âu phát triển gần các dòng sông, Königsberg đã thiết lập các cạnh cùng nhau của Pregel River Các thành phố gồm có hai đảo lớn được kết nối với đất liền bởi bẩy cây cầu Bài toán đã được công thức hóa để tìm một cách để đi qua mỗi cây cầu chỉ một lần
Euler đã đưa ra một đặc điểm quan trọng trong bài toán đặc biệt trên đó là sự liên tục của các cây cầu được đi qua Do vậy, chúng ta có thể loại bỏ thứ hạng của các đặc điểm ngoại trừ danh sách các cây cầu kết nối hai vùng đất liền Bài toán này
là nền tảng của lý thuyết đồ thị Ngoại suy khái niệm này tới phân tích mạng xã hội, mỗi vùng đất là một nút, và mỗi cây cầu là một liên kết Cấu trúc toán học được gắn
Trang 33tới bài toán này được biết như là một đồ thị, và trong lĩnh vực khoa học xã hội, các thành phần cấu thành một mạng
Hình 2.4: Bài toán bẩy cây cầu của Königsberg Trong bài toán này, chỉ thông tin kết nối là thích hợp Đồ thị có thể được biểu diễn theo các hình thức khác nhau ngoài việc thay đổi các kết nối giữa các cặp nút Sự có mặt hoặc sự thiếu vắng một liên kết giữa một cặp các nút đại diện mọi thứ trong phân tích mạng xã hội Các liên kết được xem xét khi thực hiện tính toán các độ đo mạng cá nhân cho các nút Ví dụ, cấp độ của một nút là số lượng các nút liên quan tới nó Các nút liên quan được thiết lập bởi liên kết giữa nút đang xét và một nút liên quan Khi đó cấp độ độ đo của nút đang xét được tính toán bằng cách đếm số lượng các liên kết Phân tích mạng xã hội nghiên cứu mối quan hệ bên trong các nút, và mối quan hệ được định nghĩa theo hoàn cảnh của các liên kết
Quay trở lại bài toán bẩy cây cầu, Euler đã quan sát rằng, mỗi khi người đi
bộ nhận một liên kết và đi tới một đỉnh bởi một cây cầu, người đi bộ rời đỉnh này bởi một cây cầu Trong thực tế, khi đi bộ qua thành phố, số lần một người đi bộ đi vào một cây cầu bằng số lần người đi bộ này rời một cây cầu
Trong toán học, Euler nói rằng tồn tại một đường đi trong một đồ thị phụ thuộc vào các bậc của các nút Bậc của một nút là số lượng các liên kết mà nút có,
Trang 34không quan trọng liên kết là đi tới nút hoặc đi ra từ nút Quan trọng là số lượng các liên kết mà gắn tới nút Khi đó, bằng sự quan sát của Euler, điều kiện cần thiết cho việc đi bộ qua các cây cầu đó là đồ thị được liên thông và có hai nút hoặc không có nút nào có bậc là lẻ
Hình 2.5: Chu trình Euler cho bài toán bẩy cây cầu Một phát biểu khác cho bài toán cây cầu đó là tìm một đường đi mà qua tất
cả các cây cầu và, điểm xuất phát và điểm kết thúc giống nhau Đường đi này được biết là Chu trình Euler Đường đi này chỉ tồn tại nếu đồ thị là liên thông và không
có nút nào có bậc lẻ Nếu Chu trình này đi qua bẩy cây cầu chỉ một lần thì Chu trình Euler được gọi là Đường đi Euler Hình 2.5 trình bày bài toán bẩy cây cầu
Ngày nay, lý thuyết đồ thị được sử dụng thường xuyên cho việc tìm các cộng đồng trong các mạng Các thuật toán phát hiện cộng đồng đã được tăng dần mỗi ngày, làm cho các thuật toán có thể đáp ứng các bài toán kinh doanh và các bài toán thực tế hơn Các thuật toán không chỉ phát hiện các mạng nhỏ, các cộng đồng, hoặc các đồ thị con, mà còn phát hiện các cấu trúc của các mạng phân cấp, chu trình Có thể áp dụng phân tích mạng xã hội cho nhiều loại bài toán khác nhau như bán hàng
và tăng tốc độ bán hàng trong kinh doanh Bằng việc hiểu các cộng đồng nhỏ và
Trang 35các cấu trúc của chúng, có thể hiểu được hành vi của cộng đồng (mạng) và cũng là cách các mạng lan truyền theo thời gian, thậm chí cho phép vài dự đoán
Các kiểu ứng dụng thực tế của phân tích mạng xã hội ngày càng tăng Phân tích mạng xã hội sẽ có thể hướng tới ngày càng nhiều loại bài toán trong tương lai bằng cách sử dụng phương pháp luận này Các loại công nghiệp khác nhau, các quy
mô khác nhau sẽ có thể là đích của các bài toán kinh doanh, đặc biệt là những bài toán liên quan tới các mối quan hệ và hành vi, bằng cách sử dụng kỹ thuật phân tích mạng xã hội
Có hai phương pháp khác nhau cho việc sử dụng phân tích mạng xã hội trong viễn thông
- Phương pháp đầu tiên là sử dụng phân tích mạng xã hội cho sự khuấy động, trong đó bao gồm việc xác định các khách hàng có ảnh hưởng nhất, khách hàng này
có thể dẫn dắt khách hàng khác rời khỏi công ty
- Phương pháp thứ hai là sử dụng phân tích mạng xã hội cho việc mua hàng, xác định lại một lần nữa những khách hàng có khả năng dẫn dắt các khách hàng khác mua các sản phẩm tương tự trong tương lai Những khách hàng có ảnh hưởng này được xác định dựa trên các mối quan hệ bên trong mạng xã hội Các độ đo mạng liên quan đến bậc, khoảng cách và đường đi sẽ định nghĩa khả năng là người
có ảnh hưởng và mức độ ảnh hưởng của họ tác động đến các khách hàng khác
2.1.4 Khoa học thống kê và phân tích mạng xã hội
Phân tích mạng xã hội đã bắt đầu như là khoa học xã hội, và do đó, phân tích mạng xã hội có thể được coi là một nhánh của xã hội học dạng toán học hơn là phân
tích mạng xã hội được coi là phân tích thống kê hoặc phân tích định lượng
Tuy nhiên, ranh giới giữa phương pháp khoa học xã hội ở dạng toán học và phương pháp phân tích thống kê không được rõ ràng Các phương pháp luận khoa học xã hội ở dạng toán học thường xử lý phân tích mạng xã hội theo hướng nghiên cứu quyết định, đánh giá các dữ liệu mạng xã hội dựa trên các thuật toán tính toán các mối quan hệ giữa các nút và độ mạnh, tần số, tính chất mới xảy ra, hướng của