MỞ ĐẦU Cùng với sự phát triển của công nghệ thông tin, các hệ thống thông tin doanhnghiệp ngày càng được ứng dụng phổ biến, trong đó có thể kể đến những cái têntiêu biểu: HRM – hệ thống
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
TRẦN THỊ PHƯƠNG
KHAI PHÁ MẠNG XÃ HỘI DỰA TRÊN CÁC BẢN GHI SỰ KIỆN HOẠT ĐỘNG CỦA DOANH NGHIỆP
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HÀ QUANG THỤY
Hà Nội - 2015
Trang 2LỜI CÁM ƠN
Lời đầu tiên, tôi xin chân thành cảm ơn sự hướng dẫn và chỉ bảo tận tình củaPGS.TS Hà Quang Thụy – người đã đưa ra định hướng khoa học và luôn quantâm, động viên, thông cảm, tạo điều kiện thuận lợi cho tôi trong suốt quá trìnhthực hiện luận văn
Tôi xin cảm ơn Phòng thí nghiệm Khoa học dữ liệu và Công nghệ Tri thức(DS&KTLab)và Đề tài cấp Đại học Quốc Gia Hà Nội, mã số QG.15.22 đã địnhhướng cho tôi trong đề tài nghiên cứu này
Cuối cùng, tôi xin gửi lời cảm ơn tới các bạn bè đã giúp đỡ, hỗ trợ tôi cả vềmặt tinh thần và nền tảng kiến thức để tôi có thể hoàn thành luận văn
Hà Nội, tháng 10 năm 2015
Trần Thị Phương
Trang 3LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá
nhân tôi, không sao chép lại của người khác Trong toàn bộ nội dung của luận
văn, những điều đã trình bày là của cá nhân tôi hoặc được tôi tổng hợp từ nhiều
nguồn tài liệu Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được
trích dẫn hợp pháp
Tôi xin chịu toàn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định
cho lời cam đoan của tôi
Hà Nội, tháng 10năm 2015
Trần Thị Phương
LỜI CÁM ƠN
LỜI CAM ĐOAN
DANH MỤC TỪ VIẾT TẮT
DANH MỤC BẢNG BIỂU
DANH MỤC HÌNH VẼ
MỞ ĐẦU
Chương 1 Những khái niệm cơ bản về nhật ký sự kiện và khai phá quy trình
1.1 Khái niệm nhật ký sự kiện
1.2 Khai phá quy trình
Chương 2 Khai phá mạng xã hội
2.1 Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện
2.2 Các độ đo trong xây dựng đồ thị quan hệ xã hội
2.2.1 Độ đo dựa trên quan hệ nhân quả
Trang 42.2.3 Độđ o d ự a tr ê n c á c hoạt động chung
2.3 Phân tích mạng xã hội
Chương 3 Cải thiện độ đo trong xây dựng đồ thị quan hệ xã hội
3.1 Đặt vấn đề
3.2 Giải pháp
3.2.2 Áp dụng trọng số chuyển giao vào công thức độ đo
Trang 5Chương 4 Cài đặt, thực nghiệm
4.1 Công cụ MiSoN
4.2 Thiết kế và cài đặt
4.2.1 Thiết kế tổng thể
4.2.2 Cấu trúc tệp nhật ký sự kiện đầu vào
4.3 Kết quả thực nghiệm
Kết luận
Trang 7DANH MỤC BẢNG BIỂU
Bảng 1.1 Một ví dụ nhật ký sự kiện tổng quát
Bảng 1.2 Nhật ký sự kiện tổng quát đã sắp xếp theo từng trường hợp
Bảng 2.1 Giá trị độ đo dựa trên sự chuyển giao công việc
Bảng 2.2 Ma trận tần xuất thực thi hoạt động
Bảng 4.1 Bảng trọng số các hoạt động
Bảng 4.2 Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, bỏ qua chuyển giao gián tiếp
Bảng 4.3 Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, có tính tới chuyển giao gián tiếp
Bảng 4.4 Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ qua chuyển giao gián tiếp
Bảng 4.5 Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ qua chuyển giao gián tiếp
Trang 8DANH MỤC HÌNH VẼ
Hình 1.1 Sơ đồ quy trình tuyển dụng
Hình 1.2 Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quát
Hình 2.1 Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1
Hình 2.2 Đồ thị minh họa về độ gần của nút trong đồ thị
Hình 2.3 Đồ thị minh họa về độ trung tâm cục bộ của nút
Hình 2.4 Đồ thị minh họa về độ trung gian
Hình 4.1 Kiến trúc của MiSoN
Hình 4.2 Giao diện MiSoN hiển thị đồ thị quan hệ xã hội với dữ liệu từ Staffware log
Hình 4.3 Vị trí và mối quan hệ của package SocialNetwork trong ProM
Hình 4.4 Thiết kế lớp cài đặt độ đo chuyển giao công việc
Hình 4.5 Biểu đồ công tác xây dựng đồ thị quan hệ xã hội
Hình 4.6 Sơ đồ luồng tính toán ma trận trọng số
Trang 9MỞ ĐẦU
Cùng với sự phát triển của công nghệ thông tin, các hệ thống thông tin doanhnghiệp ngày càng được ứng dụng phổ biến, trong đó có thể kể đến những cái têntiêu biểu: HRM – hệ thống quản lý nhân sự, CRM - quản trị quan hệ kháchhàng… Các hệ thống này lưu trữ dữ liệu sự kiện hoạt động của doanh nghiệpdưới dạng các bản ghi có cấu trúc kèm theo thông tin về thời gian, chi tiết hoạtđộng, đối tượng tham gia…, nhờ đó chúng ta có thể hình dung được luồng côngviệc một cách có hệ thống Tuy nhiên, các hệ thống nói trên mới mới chỉ dừng ởmức lưu trữ và thống kê, dữ liệu sự kiện của các doanh nghiệp vẫn chưa được sửdụng một cách hiệu quả trong việc hỗ trợ nhà quản trị đưa ra quyết định điềuhành
Việc phân tích các bản ghi sự kiện đã được thực hiện từ rất sớm với nhiều côngtrình nghiên cứu khác nhau Hầu hết các đề tài nghiên cứu hiện nay đều đi theohướng khai phá quy trình - sử dụng các bản ghi sự kiện phục vụ việc xây dựng,cải tiến và kiểm chứng mô hình quy trình Tuy nhiên, bên cạnh các thông tin vềthời gian, công việc thì nhiều hệ thống còn ghi lại cả thông tin về yếu tố conngười (ví dụ người thực thi hành động, người được chuyển giao công việc…).Như vậy, các bản ghi sự kiện ngoài việc phản ánh luồng công việc còn có thểphản ánh được mối quan hệ cộng tác trong công việc giữa các cá nhân, nhómngười trong doanh nghiệp
Môi trường doanh nghiệp cũng có thể coi là một xã hội thu nhỏ, và mối quan hệtrong công việc có thể coi là một loại quan hệ xã hội trong xã hội thu nhỏ đó.Các cá nhân, nhóm người trong doanh nghiệp cùng mối quan hệ giữa họ hìnhthành nên mạng xã hội Từ các bản ghi sự kiện chúng ta có thể xây dựng nên môhình mạng xã hội cũng như phân tích dữ liệu để cho ra những thông tin tổng hợpdưới góc nhìn thuận tiện, hữu ích, hỗ trợ cho nhà quản trị doanh nghiệp
Luận văn của tôi dựa trên nghiên cứu của WMP Van der Aalst và Minseok Songtrình bày trong [1] Trong đó, các bản ghi sự kiện sẽ được sử dụng trong khaiphá mạng xã hội (mà cụ thể hơn là khai phá mối quan hệ giữa các cá nhân/nhómngười) nhằm phục vụ cho việc quản trị nhân sự trong doanh nghiệp
Nội dung đề tài tôi sẽ trình bày bao gồm các phần như sau:
Chương 1: Trình bày những khái niệm cơ bản về nhật ký sự kiện, khai phá quytrình và những kiến thức khác liên quan đến đề tài
Trang 10Chương 2: Trình bày về khai phá mạng xã hội bao gồm những khái niệm cơ bản,các độ đo trong trích xuất đồ thị quan hệ xã hội và phân tích mạng xã hội.
Chương 3: Cải thiện độ đo trong trích xuất đồ thị quan hệ xã hội
Chương 4: Cài đặt và thực nghiệm
Hà Nội, ngày18 tháng10 năm 2015
Trần Thị Phương
Trang 11sự kiện (event log) và khai phá quy trình(process mining).
1.1 Khái niệm nhật kýsự kiện
Giả sử rằng các hệ thống thông tin doanh nghiệp lưu trữ lịch sử hoạt động củadoanh nghiệp trong nhật ký sự kiện (event log)dưới dạng các bản ghi có cấu trúcgọi là sự kiện (event) Các sự kiện ghi trong nhật ký sự kiện thỏa mãn nhữngtính chất sau[2]:
- Mỗi sự kiện tương ứng với một trường hợp (case), một thể hiện quy trình hoạt động
- Mỗi sự kiện tương ứng với một hoạt động(activity), một bước nào đó trong một thể hiện quy trình hoạt động
- Mỗi sự kiện tương ứng có một người thực thi (performer hoặc resource)
- Trong cùng một trường hợp, các sự kiện được ghi lại theo đúng trình tự thực hiện về thời gian
Để hiểu rõ hơn về các khái niệm trường hợp, hoạt động,người thực thi, ta xét ví
dụ sau về một quy trình tuyển dụng như Hình 1.1
Hình 1.1 Sơ đồ quy trình tuyển dụngQuy trình tuyển dụng bao gồm các bước
Bước 1: Trưởng phòng nhân sự lên kế hoạch tuyển dụng
Bước 2: Bộ phận nhân sự (HumanResource -HR) đăng tin tuyển dụng
Trang 12 Bước 3: Ứng viên nộp hồ sơ ứng dụng.
Bước 4: HR liên hệ với ứng viên để sắp xếp lịch phỏng vấn
Bước 5: Trưởng bộ phận/HR v.v phỏng vấn ứng viên
Bước 6: Trưởng bộ phận/HR v.v đánh giá kết quả phỏng vấn và lựa chọn
ứng viên phù hợp
Bước 7: HR thông báo kết quả tuyển dụng cho ứng viên
Trong ví dụ này, mỗi lần tuyển dụng tương ứng là một trường hợp Các bước
trong quy trình tuyển dụng (1, 2, , 6, 7) là các hoạt động Trưởng phòng nhân
sự, HR, ứng viên, trưởng bộ phận… là những người thực thi
1.2 Khai phá quy trình
Sử dụng đầu vào là nhật ký sự kiện, mục tiêu của khai phá quy trình (Process
mining)là trích xuất thông tin về các quy trình [3], qua đó phát hiện, xây dựng và
cải tiến quy trình để nâng cao hiệu suất làm việc của doanh nghiệp Trong phát
hiện quy trình, yếu tố con người được bỏ qua, và chúng ta chỉ quan tâm đến thứ
tự thực hiện của các hoạt động trong các trường hợp
Để minh họa cho khái niệm khai pháquy trình, xét ví dụ với một nhật ký sự
kiệntổng quát như trongBảng 1.1
Bảng 1.1 Một ví dụ nhật ký sự kiện tổng quát
Trường hợp
123311242254133
Trang 13Sắp xếp lại theo từng trường hợp, chúng ta có Bảng 1.2.
Bảng 1.2 Nhật ký sự kiện tổng quát đã sắp xếp theo từng trường hợp
Trường hợp
Quan sát ví dụ trên ta thấy:
- Mỗi trường hợp đều bắt đầu với hoạt động A và kết thúc bằng hoạt động D
1 https://en.wikipedia.org/wiki/Alpha_algorithm
2 https://en.wikipedia.org/wiki/Petri_net
Trang 14Hình 1.2 Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quátTrong luận văn này, tôi tập trung vào khía cạnh xã hội (tức mối quan hệ giữa các
cá nhân) của nhật ký sự kiện Vì vậy, các khái niệm cụ thể trong khai phá quytrình, thuật toán và ký pháp biểu diễntôi sẽ không trình bày chi tiết
Trang 15Chương 2 Khai phá mạng xã hội
Khác với khai phá quy trình, khai phá mạng xã hội nhằm tới mục tiêu hỗ trợ nhàquản trị đưa ra các quyết định về mặt nhân sự trong doanh nghiệp.Do đó, thay vìtập trung vào thứ tự thực hiện của các hoạt động, khai phá mạng xã hội khai thácmối quan hệ giữa các cá nhân, nhóm người tham gia vào quy trình trích xuấtđược từ nhật ký sự kiện
Quá trình khai phá mạng xã hội trải qua hai bước Đầu tiên, đồ thị quan hệ xãhội (sociogram) giữa các cá nhân tham gia vào quy trình hoạt động của doanhnghiệp được trích xuất từ nhật ký sự kiện Sau đó,đồ thị quan hệ xã hội được sửdụng làm đầu vào cho phân tích mạng xã hội, tổng hợp dữ liệu và biểu diễn dướicác góc độ, khía cạnh khác nhau, thuận tiện hơn cho việc ra quyết định
2.1 Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện
Từ góc nhìn toán học, đồ thị quan hệ xã hội là đồ thị G(P, R) trong đó[1]
P:tập các nút của đồ thị, tương ứng tập những người thực thi các hoạt động trong các bản ghi sự kiện
R ⊆ P × P là tập các mối quan hệ giữa những người thực thi.
Tùy thuộc vào yêu cầu phân tích mà đồ thị có thể có hướng hoặc vô hướng, cótrọng số hoặc không có trọng số Nếu đồ thị G có trọng số, G có một hàm Wdùng để gán giá trị cho các phần tử của R Tập P có thể được xác định trực tiếp
từ các bản ghi sự kiện Tuy nhiên, R và W thì có nhiều tiêu chí khác nhau để xácđịnh Ví dụ, ta có thể coi giữa những người trong cùng một phòng ban trên cây
cơ cấu tổ chức là có mối liên hệ với nhau Trong cùng phòng ban đó, nhữngngười làm việc cùng một nhóm nhỏ sẽ có mối liên hệ mạnh hơn so với nhữngngười cùng phòng ban nhưng khác nhóm Những người có cùng vai trò trongcông việc hay có sự chuyển giao công việc cho nhau cũng được coi là có mốiliên hệ với nhau(ta gọi đó là mối quan hệ chuyển giao công việc – Transfer ofwork)
Theo ngôn ngữ của khai phá quy trình, giả sử trong cùng một trường hợp C, nếuhoạt động A2 được thực hiện ngay sau hoạt động A1 thì mối quan giữa ngườithực thi A1 và A2 được gọi là quan hệ chuyển giao công việc Nhìn chung, mốiquan hệ chuyển giao công việc phản ánh khá chính xác mối quan hệ trong thực
tế hoạt động của doanh nghiệp
Trang 16Quay lại với ví dụ nhật ký sự kiện trong Bảng 1.1, ta có nhận xét như sau:
- Chi và Duy có thể thực hiện các hoạt động như nhau (B và C)
- Duy thì luôn làm việc với An (trường hợp 1 và 2), còn Chi thì lại luôn làm việc với Mai (trường hợp 3 và 4)
Như vậy, mặc dù có thể Chi và Duy có cùng vai trò nhưng Chi không làm việcvới An và Duy không làm việc với Mai Lập luận tương tự, dựa trên mối quan hệchuyển giao công việc, từ nhật ký sự kiệnBảng 1.1, ta có thể trích xuất ra đồ thịquan hệ xã hội như Hình 2.1
Hình 2.1 Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1Trong đồ thị trên Hình 2.1, giữa An và Duy, Mai và Chi có sự chuyển giao côngviệc qua lại Tuy nhiên giữa Mai và Minh chỉ có sự chuyển giao công việc từMai sang Minh mà không có chiều ngược lại Tương tự với mối quan hệ giữa An
và Minh, Mai và Nga Đồ thị trên là đồ thị không có trọng số, tuy nhiên, để phục
vụ cho việc phân tích mạng xã hội, trọng số có thể được thêm vào đồ thị Trọng
số được đánh căn cứ vào tần suất chuyển giao công việc, ví dụ, cung từ An tớiDuy có trọng số là 2
Để xây dựng được đồ thị quan hệ xã hội, chúng ta định nghĩa ra các độ đo khácnhau nhằm đánh trọng số cho các cung thể hiện mối quan hệgiữa những ngườithực thi Gọi trọng số trên cung nối giữa người thực thi i và j là Wi,j Nếu Wi,j>=
τ nào đó (τ là giá trị ngưỡng) thì ta thêm cung ịj vào tập R Bằng cách đó, chúng
ta có được đồ thị G (P, R, W) có thể dùng làm đầu vào cho các công cụ phân tíchmạng xã hội Trong luận văn này, tôi chỉ trình bày ba loại độ đo có thể đượctrích xuất từ nhật ký sự kiện [1][2]:
(1) Độ đo dựa trên quan hệ nhân quả
Trang 1717 (2) Độ đo dựa trên những trường hợp chung
(3) Độ đo dựa trên các hoạt động chung
Để thuận tiện, tôi xin định nghĩa lại dưới dạng toán học khái niệm nhật ký sựkiện và các ký pháp tôi sẽ sử dụng trong phần này[1][2]
Định nghĩa 2.1(Nhật ký sự kiện):Gọi A là một tập các hoạt động, P là tập ntác
nhân (cá nhân, nhóm người tham gia vào quy trình).E = A×P là tập hợp các sựkiện có thể xảy ra Khi đó:
- Mỗi sự kiện được định nghĩa dưới dạng một cặp giá trị (a, p) thể hiện hoạtđộng a được thực hiện bởi p
- C = E*
là tập các chuỗi sự kiện có thể (mỗi chuỗi sự kiện tương ứng với một trường hợp)
- B(C) là tập các túi từ trên C
- L ⊆ B(C) là một nhật ký sự kiện và là tập con của C.
Với sự kiện e(a, p) ta định nghĩa hai phép toán
- a (e) = a
- p(e) = p
2.2.1 Độ đo dựa trên quan hệ nhân quả
Độ đo dựa trên quan hệ nhân quả phản ánh cách luồng công việc di chuyển giữacác cá nhân trong từng trường hợp Tính nhân quả thể hiện trong hai loại mốiquan hệ mà chúng ta sẽ sử dụng làm độ đo trong phần này: quan hệ chuyển giaocông việc (Handover of work) và quan hệ thầu phụ (Sub-contracting)
Quan hệ chuyển giao công việc: Trong cùng một trường hợp, nếu có một hoạt
động thực hiện bởi j được thực hiện ngay sau hoạt động thực hiện bởi i thì ta nói
ở đây có sự chuyển giao công việc từ i sang j Khi đánh giá quan hệ chuyển giaocông việc ta có thể kết hợp với khai phá quy trình để xác định có thật sự có mốiquan hệ nhân quả trong việc chuyển giao hay không Ngoài ra, khi sử dụng làm
độ đo, khái niệm chuyển giao công việc cũng cần thay đổi để có thể phân cấpđược độ mạnh yếu của mối quan hệ giữa những người thực thi Ngoài việc dựavào sự chuyển giao trực tiếp, chuyển giao gián tiếp cũng có thể được tínhtớithông qua việc sử dụng hệ số nhân quả β[1] Ví dụ nếu có 3 hoạt động xen
Trang 18giữa hoạt động thực hiện bởi i và hoạt động thực hiện bởi j thì hệ số nhân quả là
β3
Quan hệ thầu phụ: Nếu giữa hai hoạt động được thực hiện bởiicó hoạt động
được thực hiện bởi j thì ta có nói có mối quan hệ thầu phụ giữa i và j[1]
a. Độ đo dựa trên mối quan hệ nhân quả trong chuyển giao công việc
Ý tưởng cơ bản của độ đo này là những người thực thi có mối liên hệ với nhaunếu giữa họ có sự chuyển giao công việc cho nhau Khi đánh giá theo độ đo này,
có 3 yếu tố cần cân nhắc[1]:
- Ta chỉ quan tâm đến chuyển giao công việc trực tiếp hay tính tới cả chuyển
giao công việc gián tiếp
- Nếu trong cùng một trường hợp, hai người thực thi chuyển giao công việc chonhau nhiều lần thì tính thành một lần hay nhiều lần
- Chỉ xét tới chuyển giao công việc khi có mối quan hệ nhân quả hay cả khichuyển giao công việc theo thứ tự bất kỳ (ví dụ trong Hình 1.2, ta thấy A và Bkhông có quan hệ nhân quả vì sau A không nhất thiết phải là B mà còn có thể
là C hoặc E)
Căn cứ theo những tiêu chí trên, chúng ta có thể có 8 (23
) biến thể khác nhaucủa độ đo này
Công thức độ đo và các toán tử sử dụng trong độ đo được định nghĩa như sau:
Định nghĩa 2.2 ( ⊳, ⊵):Gọi L là một nhật ký sự kiện Ký hiệu → biểu diễn mối quan hệ nhân quả trích xuất được từ L Với a1 , a 2 ∈ A, p 1 , p 2 ∈ P, c = (c 0 , c 1 ,…) ∈ L và n ∈
Trang 19 p1 n c p2 là một hàm trả về giá trị 1 nếu tồn tại ít nhất một trường hợp trong
đó có cả p1 và p2 cùng tham gia, và khoảng cách giữa 2 hoạt động mà p1 và
p2 thực hiện là n Nếu n = 1 thì sự chuyển giao công việc là trực tiếp, ngượclại, nếu n > 1 là chuyển giao gián tiếp
Duy c n Minh = 1 do B và C có mối quan hệ nhân quả (sau B nhất định phải
Trang 20nhưng đã được bỏ qua những lần chuyển giao công việc trùng nhau trong
cùng một trường hợp Ví dụ trong Bảng 1.1 ta có:
An L Duy = 2/5
vào độ đo bằng cách bổ sung thêm hệ số giảm β Nếu trong cùng một trường
hợp, giữa hai người thực thi có n sự kiện thì hệ số giảm sẽ là βn
Trang 21Nếu áp dụng công thức trên cho nhật ký sự kiện trong Bảng 1.1, ta có kết quả như trong Bảng 2.1.
Trang 22Bảng2.1 Giá trị độ đo dựa trên sự chuyển giao công việc
β
0.10.50.9
Ta thấy Nếu β = 1 thì khả năng phân loại độ mạnh yếu của mối quan hệ giảm đi
đáng kể bởi khoảng cách giữa các cá nhân được san bằng, chỉ cần có chuyển
giao công việc, bất kể là có bao nhiêu sự kiện xen giữa đều coi như nhau Điều
này là không chính xác khi đánh giá mối quan hệ xã hội trong thực tế Khi β
càng tăng thì độ chênh lệch giữa các giá trị càng giảm [1]
Bốn công thức còn lại cũng tương tự như bốncông thức trên, chỉ khác là chúng
chỉ tính tới quan hệ nhân quả giữa các hoạt động
Ta có thể gộp 8 công thức trên thành 4 công thức như sau:
Định nghĩa 2.4 (Công thức chung cho độ đo dựa trên sự chuyển giao công
việc): Gọi L là một nhật ký sự kiện, p1, p 2∈ P và giá trị hệ số β (0 < β < 1), k ∈ N ta có [1]
β ,kp
Trong các công thức gộp này, chúng ta thêm vào một hệ số nữa là độ sâu tính
toán k (calculation depth factor) Khi tính toán độ đo, k thể hiện giá trị lớn nhất
của số sự kiện xen giữa hai hoạt động thực hiện bởi 2 người thực thi Ví dụ với k
Trang 23= 3 thì ta chỉ tính tới những lần chuyển giao trực tiếp hoặc chuyển giao gián tiếp
chỉ cách nhau 1 hoặc 2 sự kiện Ta thấy:
Với k = 1, β= 1 thì ta có công thức p1 1,1L p2 = p1 L p2
Với k > max(|c|) ta có công thức p1 β
L ,k p2 = p1 β
L p2
Do các nhật ký sự kiện thường có kích thước lớn nên việc tính tới tất cả các
trường hợp chuyển giao công việc dẫn đến phân tích chậm và không hiệu quả
Vì vậy chọn giá trị k phù hợp là rất quan trọng trong khai phá mạng xã hội
a Độđo dựa trên quan hệ thầu phụcông việc
Quan hệ thầu phụ công việc cũng dựa trên sự nối tiếp công việc giữa những
người thực thi Với mối quan hệ thầu phụ, cũng giống như chuyển giao công
việc, tacũng có thể điều chỉnh để cho ra các công thức độ đo khác nhau Sự nối
tiếp công việc là trực tiếp tức là chỉ có 1 hoạt động ở giữa 2 hoạt động thực hiện
bởi một người thực thi khác Khi có nhiều hoạt động xen giữa thì đó là thầu phụ
gián tiếp Hệ số giảm β cũng được đưa vào công thức cho trường hợp thầu phụ
gián tiếp Ví dụ, giả sử có 4 hoạt động, trong đó hoạt động đầu và cuối được
thực hiện bởi cùng người thực thi i, hoạt động thứ 2 và 3 được thực hiện theo
thứ tự bởi người thực thi j, k.Khi đó, chúng ta có thể trích xuất hai mối quan hệ
từ i tới j và k
Định nghĩa 2.5 (◊,◊) Gọi L là một nhật ký sự kiện Ký hiệu → biểu diễn mối
quan hệ nhân quả trích xuất được từ L Với a 1 , a 2 ∈ A, p 1 , p 2 ∈ P, c = (c 0 , c 1 ,…) ∈ L, |c| > 2, n ∈ N và n > 1 ta có[1]
Trang 24 p1 ◊c n p2 trả ra giá trị 1 nếu giữa haihoạt độngcó khoảng cách n được thực
hiện bởi p1 có hoạt động thực hiện bởi p2 Công thức này đã bỏ qua cả yếu tố
ràng buộc nhân quả và bỏ qua việc chuyển giao công việc nhiều lần trong
cùng một trường hợp Ví dụ trong Bảng 1.1, trường hợp 1 thì An ◊c2 Duy = 1
| p1 ◊c n p2 | trả ra số lần p1 ◊c n p2 trong trường hợp c, hay nói cách khác, ở đây
ta tính tới cả việc chuyển giao công việc nhiều lần trong cùng một trường
hợp
những trường hợp mà giữa các hoạt động thực sự có quan hệ nhân quả thay
vì thực thi ngẫu nhiên
Sử dụng những ký pháp được xác định tại định nghĩa 2.5 ta có các công thức cho
độ đo mức độ trung gian (in-between metric) dựa trên mối quan hệ thầu phụnhư
Trang 25Tuy nhiên, cũng như mối quan hệ chuyển giao công việc, ta cũng có thể gộp 8 công thức trên thành 4 công thức cho độ trung gian bằng cách đưa thêm vào hệ
Trang 26L p2 = p1◊L p2 và nếuk>max(|c|) thì p1◊βL ,k p2 =p1◊βLp2
2.2.2 Độ đo dựa trên trường hợp chung
Với độ đo này, chúng ta bỏ qua mối quan hệ nhân quả giữa các hoạt động màđơn giản tính tần suất haingười thực thi thực hiện các hoạt động trong cùng mộttrường hợp Và ta gọi những trường hợp mà cả hai cùng tham gia đó là trườnghợp chung (join case) Độ đo cộng tác dựa tính toán độ mạnh mối quan hệ trong
đồ thị quan hệ xã hội dựa trên trường hợp chung được định nghĩa như sau:
Định nghĩa 2.8 (Độ đo cộng tác): Gọi L là một nhật ký sự kiện p1 , p 2∈ P, c=(c0 , c 1 ,…) ∈ L ta có[2]
p 1 ⋈ L p 2 =p 1 ⋈ c p 2 / ∈ (c, p1) nếu ∈ (c, p 1 ) ≠ 0; ngược lại p 1 ⋈ L p 2 = 0
p 1 ⋈ c p 2 = 1 nếu ∃ 0<= i,j< |c|; i #j p (c i ) = p 1 ∧ p (c j ) = p 2 ; ngược lại p 1 ⋈ c p 2 = 0
g(c, p 1 ) = 1 nếu ∃ 0<= i < |c| p(ci) = p1; ngược lại g(c, p1) = 0
Chú ý, trong định nghĩa này chúng ta chia số trường hợp chung cho số trườnghợp có p1 tham gia khi xét mối quan hệ giữa p1 và p2 Mối quan hệ này không
Trang 27phải đối xứng Ví dụ: p 1 tham gia 3 trường hợp, p 2 tham gia 6 trường hợp, p 1 và p 2 có 3 trường hợp chung Như vậy, p 1 luôn làm việc với p 2 nhưng p 2 thì không Do đó, p 1 ⋈ L p 2 phải khác p 2 ⋈ L p 1 Áp dụng công thức vào nhật ký sự kiện Bảng 2.1, ta có An ⋈ L Minh = 2/2 và Minh⋈ L An = 2/4.
2.2.3 Độđo dựa trên các hoạt động chung
Để tính toán độ đo này, trước tiên chúng ta cần thống kê tần suất các cá nhântham gia vào từng hoạt động[1]
Định nghĩa 2.9( △):Gọi L là một nhật ký sự kiện p1∈ P, a1∈ A, c = (c0 , c 1,…) ∈
Toán tử △giúp xác định ma trận tần suất thực thi của các hoạt động Ma trận có hàng P và cột A Áp dụng
định nghĩa 2.9 cho nhật ký sự kiện Bảng 1.1 ta có ma trận tần suất như Bảng 2.2.
Bảng2.2 Ma trận tần xuất thực thi hoạt động
Sau khi có ma trận tần suất, chúng ta có thể tính khoảng cách của những ngườithực thi bằng cách so sánh các vector tần suất của những người thực thi Các loạikhoảng cách khác nhau có thể được áp dụng tuỳ vào mục đích của độ đo.Khoảng cách Minkowski3được áp dụng khi ta có tính tới tần suất tuyệt đối củacác cá nhân, hay khoảng cách Hamming4 khi ta không quan tâm giá trị tuyệt đốicủa tần suất mà chỉ quan tâm 2 giá trị 1/0 tương ứng cá nhân có/không thực thi
3
https://en.wikipedia.org/wiki/Minkowski_distance
4
https://en.wikipedia.org/wiki/Hamming_distance