1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Khai phá mạng xã hội dựa trên các bản ghi sự kiện hoạt động của doanh nghiệp

54 23 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 54
Dung lượng 427,57 KB

Các công cụ chuyển đổi và chỉnh sửa cho tài liệu này

Nội dung

MỞ ĐẦU Cùng với sự phát triển của công nghệ thông tin, các hệ thống thông tin doanhnghiệp ngày càng được ứng dụng phổ biến, trong đó có thể kể đến những cái têntiêu biểu: HRM – hệ thống

Trang 1

ĐẠI HỌC QUỐC GIA HÀ NỘI

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

TRẦN THỊ PHƯƠNG

KHAI PHÁ MẠNG XÃ HỘI DỰA TRÊN CÁC BẢN GHI SỰ KIỆN HOẠT ĐỘNG CỦA DOANH NGHIỆP

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS HÀ QUANG THỤY

Hà Nội - 2015

Trang 2

LỜI CÁM ƠN

Lời đầu tiên, tôi xin chân thành cảm ơn sự hướng dẫn và chỉ bảo tận tình củaPGS.TS Hà Quang Thụy – người đã đưa ra định hướng khoa học và luôn quantâm, động viên, thông cảm, tạo điều kiện thuận lợi cho tôi trong suốt quá trìnhthực hiện luận văn

Tôi xin cảm ơn Phòng thí nghiệm Khoa học dữ liệu và Công nghệ Tri thức(DS&KTLab)và Đề tài cấp Đại học Quốc Gia Hà Nội, mã số QG.15.22 đã địnhhướng cho tôi trong đề tài nghiên cứu này

Cuối cùng, tôi xin gửi lời cảm ơn tới các bạn bè đã giúp đỡ, hỗ trợ tôi cả vềmặt tinh thần và nền tảng kiến thức để tôi có thể hoàn thành luận văn

Hà Nội, tháng 10 năm 2015

Trần Thị Phương

Trang 3

LỜI CAM ĐOAN

Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá

nhân tôi, không sao chép lại của người khác Trong toàn bộ nội dung của luận

văn, những điều đã trình bày là của cá nhân tôi hoặc được tôi tổng hợp từ nhiều

nguồn tài liệu Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được

trích dẫn hợp pháp

Tôi xin chịu toàn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định

cho lời cam đoan của tôi

Hà Nội, tháng 10năm 2015

Trần Thị Phương

LỜI CÁM ƠN

LỜI CAM ĐOAN

DANH MỤC TỪ VIẾT TẮT

DANH MỤC BẢNG BIỂU

DANH MỤC HÌNH VẼ

MỞ ĐẦU

Chương 1 Những khái niệm cơ bản về nhật ký sự kiện và khai phá quy trình

1.1 Khái niệm nhật ký sự kiện

1.2 Khai phá quy trình

Chương 2 Khai phá mạng xã hội

2.1 Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện

2.2 Các độ đo trong xây dựng đồ thị quan hệ xã hội

2.2.1 Độ đo dựa trên quan hệ nhân quả

Trang 4

2.2.3 Độđ o d ự a tr ê n c á c hoạt động chung

2.3 Phân tích mạng xã hội

Chương 3 Cải thiện độ đo trong xây dựng đồ thị quan hệ xã hội

3.1 Đặt vấn đề

3.2 Giải pháp

3.2.2 Áp dụng trọng số chuyển giao vào công thức độ đo

Trang 5

Chương 4 Cài đặt, thực nghiệm

4.1 Công cụ MiSoN

4.2 Thiết kế và cài đặt

4.2.1 Thiết kế tổng thể

4.2.2 Cấu trúc tệp nhật ký sự kiện đầu vào

4.3 Kết quả thực nghiệm

Kết luận

Trang 7

DANH MỤC BẢNG BIỂU

Bảng 1.1 Một ví dụ nhật ký sự kiện tổng quát

Bảng 1.2 Nhật ký sự kiện tổng quát đã sắp xếp theo từng trường hợp

Bảng 2.1 Giá trị độ đo dựa trên sự chuyển giao công việc

Bảng 2.2 Ma trận tần xuất thực thi hoạt động

Bảng 4.1 Bảng trọng số các hoạt động

Bảng 4.2 Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, bỏ qua chuyển giao gián tiếp

Bảng 4.3 Ma trận trọng số khi bỏ qua chuyển giao công việc nhiều lần, có tính tới chuyển giao gián tiếp

Bảng 4.4 Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ qua chuyển giao gián tiếp

Bảng 4.5 Ma trận trọng số khi có tính tới chuyển giao công việc nhiều lần, bỏ qua chuyển giao gián tiếp

Trang 8

DANH MỤC HÌNH VẼ

Hình 1.1 Sơ đồ quy trình tuyển dụng

Hình 1.2 Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quát

Hình 2.1 Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1

Hình 2.2 Đồ thị minh họa về độ gần của nút trong đồ thị

Hình 2.3 Đồ thị minh họa về độ trung tâm cục bộ của nút

Hình 2.4 Đồ thị minh họa về độ trung gian

Hình 4.1 Kiến trúc của MiSoN

Hình 4.2 Giao diện MiSoN hiển thị đồ thị quan hệ xã hội với dữ liệu từ Staffware log

Hình 4.3 Vị trí và mối quan hệ của package SocialNetwork trong ProM

Hình 4.4 Thiết kế lớp cài đặt độ đo chuyển giao công việc

Hình 4.5 Biểu đồ công tác xây dựng đồ thị quan hệ xã hội

Hình 4.6 Sơ đồ luồng tính toán ma trận trọng số

Trang 9

MỞ ĐẦU

Cùng với sự phát triển của công nghệ thông tin, các hệ thống thông tin doanhnghiệp ngày càng được ứng dụng phổ biến, trong đó có thể kể đến những cái têntiêu biểu: HRM – hệ thống quản lý nhân sự, CRM - quản trị quan hệ kháchhàng… Các hệ thống này lưu trữ dữ liệu sự kiện hoạt động của doanh nghiệpdưới dạng các bản ghi có cấu trúc kèm theo thông tin về thời gian, chi tiết hoạtđộng, đối tượng tham gia…, nhờ đó chúng ta có thể hình dung được luồng côngviệc một cách có hệ thống Tuy nhiên, các hệ thống nói trên mới mới chỉ dừng ởmức lưu trữ và thống kê, dữ liệu sự kiện của các doanh nghiệp vẫn chưa được sửdụng một cách hiệu quả trong việc hỗ trợ nhà quản trị đưa ra quyết định điềuhành

Việc phân tích các bản ghi sự kiện đã được thực hiện từ rất sớm với nhiều côngtrình nghiên cứu khác nhau Hầu hết các đề tài nghiên cứu hiện nay đều đi theohướng khai phá quy trình - sử dụng các bản ghi sự kiện phục vụ việc xây dựng,cải tiến và kiểm chứng mô hình quy trình Tuy nhiên, bên cạnh các thông tin vềthời gian, công việc thì nhiều hệ thống còn ghi lại cả thông tin về yếu tố conngười (ví dụ người thực thi hành động, người được chuyển giao công việc…).Như vậy, các bản ghi sự kiện ngoài việc phản ánh luồng công việc còn có thểphản ánh được mối quan hệ cộng tác trong công việc giữa các cá nhân, nhómngười trong doanh nghiệp

Môi trường doanh nghiệp cũng có thể coi là một xã hội thu nhỏ, và mối quan hệtrong công việc có thể coi là một loại quan hệ xã hội trong xã hội thu nhỏ đó.Các cá nhân, nhóm người trong doanh nghiệp cùng mối quan hệ giữa họ hìnhthành nên mạng xã hội Từ các bản ghi sự kiện chúng ta có thể xây dựng nên môhình mạng xã hội cũng như phân tích dữ liệu để cho ra những thông tin tổng hợpdưới góc nhìn thuận tiện, hữu ích, hỗ trợ cho nhà quản trị doanh nghiệp

Luận văn của tôi dựa trên nghiên cứu của WMP Van der Aalst và Minseok Songtrình bày trong [1] Trong đó, các bản ghi sự kiện sẽ được sử dụng trong khaiphá mạng xã hội (mà cụ thể hơn là khai phá mối quan hệ giữa các cá nhân/nhómngười) nhằm phục vụ cho việc quản trị nhân sự trong doanh nghiệp

Nội dung đề tài tôi sẽ trình bày bao gồm các phần như sau:

Chương 1: Trình bày những khái niệm cơ bản về nhật ký sự kiện, khai phá quytrình và những kiến thức khác liên quan đến đề tài

Trang 10

Chương 2: Trình bày về khai phá mạng xã hội bao gồm những khái niệm cơ bản,các độ đo trong trích xuất đồ thị quan hệ xã hội và phân tích mạng xã hội.

Chương 3: Cải thiện độ đo trong trích xuất đồ thị quan hệ xã hội

Chương 4: Cài đặt và thực nghiệm

Hà Nội, ngày18 tháng10 năm 2015

Trần Thị Phương

Trang 11

sự kiện (event log) và khai phá quy trình(process mining).

1.1 Khái niệm nhật kýsự kiện

Giả sử rằng các hệ thống thông tin doanh nghiệp lưu trữ lịch sử hoạt động củadoanh nghiệp trong nhật ký sự kiện (event log)dưới dạng các bản ghi có cấu trúcgọi là sự kiện (event) Các sự kiện ghi trong nhật ký sự kiện thỏa mãn nhữngtính chất sau[2]:

- Mỗi sự kiện tương ứng với một trường hợp (case), một thể hiện quy trình hoạt động

- Mỗi sự kiện tương ứng với một hoạt động(activity), một bước nào đó trong một thể hiện quy trình hoạt động

- Mỗi sự kiện tương ứng có một người thực thi (performer hoặc resource)

- Trong cùng một trường hợp, các sự kiện được ghi lại theo đúng trình tự thực hiện về thời gian

Để hiểu rõ hơn về các khái niệm trường hợp, hoạt động,người thực thi, ta xét ví

dụ sau về một quy trình tuyển dụng như Hình 1.1

Hình 1.1 Sơ đồ quy trình tuyển dụngQuy trình tuyển dụng bao gồm các bước

 Bước 1: Trưởng phòng nhân sự lên kế hoạch tuyển dụng

 Bước 2: Bộ phận nhân sự (HumanResource -HR) đăng tin tuyển dụng

Trang 12

 Bước 3: Ứng viên nộp hồ sơ ứng dụng.

 Bước 4: HR liên hệ với ứng viên để sắp xếp lịch phỏng vấn

 Bước 5: Trưởng bộ phận/HR v.v phỏng vấn ứng viên

 Bước 6: Trưởng bộ phận/HR v.v đánh giá kết quả phỏng vấn và lựa chọn

ứng viên phù hợp

 Bước 7: HR thông báo kết quả tuyển dụng cho ứng viên

Trong ví dụ này, mỗi lần tuyển dụng tương ứng là một trường hợp Các bước

trong quy trình tuyển dụng (1, 2, , 6, 7) là các hoạt động Trưởng phòng nhân

sự, HR, ứng viên, trưởng bộ phận… là những người thực thi

1.2 Khai phá quy trình

Sử dụng đầu vào là nhật ký sự kiện, mục tiêu của khai phá quy trình (Process

mining)là trích xuất thông tin về các quy trình [3], qua đó phát hiện, xây dựng và

cải tiến quy trình để nâng cao hiệu suất làm việc của doanh nghiệp Trong phát

hiện quy trình, yếu tố con người được bỏ qua, và chúng ta chỉ quan tâm đến thứ

tự thực hiện của các hoạt động trong các trường hợp

Để minh họa cho khái niệm khai pháquy trình, xét ví dụ với một nhật ký sự

kiệntổng quát như trongBảng 1.1

Bảng 1.1 Một ví dụ nhật ký sự kiện tổng quát

Trường hợp

123311242254133

Trang 13

Sắp xếp lại theo từng trường hợp, chúng ta có Bảng 1.2.

Bảng 1.2 Nhật ký sự kiện tổng quát đã sắp xếp theo từng trường hợp

Trường hợp

Quan sát ví dụ trên ta thấy:

- Mỗi trường hợp đều bắt đầu với hoạt động A và kết thúc bằng hoạt động D

1 https://en.wikipedia.org/wiki/Alpha_algorithm

2 https://en.wikipedia.org/wiki/Petri_net

Trang 14

Hình 1.2 Sơ đồ quy trình dạng lưới Petri cho nhật ký sự kiện tổng quátTrong luận văn này, tôi tập trung vào khía cạnh xã hội (tức mối quan hệ giữa các

cá nhân) của nhật ký sự kiện Vì vậy, các khái niệm cụ thể trong khai phá quytrình, thuật toán và ký pháp biểu diễntôi sẽ không trình bày chi tiết

Trang 15

Chương 2 Khai phá mạng xã hội

Khác với khai phá quy trình, khai phá mạng xã hội nhằm tới mục tiêu hỗ trợ nhàquản trị đưa ra các quyết định về mặt nhân sự trong doanh nghiệp.Do đó, thay vìtập trung vào thứ tự thực hiện của các hoạt động, khai phá mạng xã hội khai thácmối quan hệ giữa các cá nhân, nhóm người tham gia vào quy trình trích xuấtđược từ nhật ký sự kiện

Quá trình khai phá mạng xã hội trải qua hai bước Đầu tiên, đồ thị quan hệ xãhội (sociogram) giữa các cá nhân tham gia vào quy trình hoạt động của doanhnghiệp được trích xuất từ nhật ký sự kiện Sau đó,đồ thị quan hệ xã hội được sửdụng làm đầu vào cho phân tích mạng xã hội, tổng hợp dữ liệu và biểu diễn dướicác góc độ, khía cạnh khác nhau, thuận tiện hơn cho việc ra quyết định

2.1 Trích xuất đồ thị quan hệ xã hội từ các bản ghi sự kiện

Từ góc nhìn toán học, đồ thị quan hệ xã hội là đồ thị G(P, R) trong đó[1]

 P:tập các nút của đồ thị, tương ứng tập những người thực thi các hoạt động trong các bản ghi sự kiện

 R ⊆ P × P là tập các mối quan hệ giữa những người thực thi.

Tùy thuộc vào yêu cầu phân tích mà đồ thị có thể có hướng hoặc vô hướng, cótrọng số hoặc không có trọng số Nếu đồ thị G có trọng số, G có một hàm Wdùng để gán giá trị cho các phần tử của R Tập P có thể được xác định trực tiếp

từ các bản ghi sự kiện Tuy nhiên, R và W thì có nhiều tiêu chí khác nhau để xácđịnh Ví dụ, ta có thể coi giữa những người trong cùng một phòng ban trên cây

cơ cấu tổ chức là có mối liên hệ với nhau Trong cùng phòng ban đó, nhữngngười làm việc cùng một nhóm nhỏ sẽ có mối liên hệ mạnh hơn so với nhữngngười cùng phòng ban nhưng khác nhóm Những người có cùng vai trò trongcông việc hay có sự chuyển giao công việc cho nhau cũng được coi là có mốiliên hệ với nhau(ta gọi đó là mối quan hệ chuyển giao công việc – Transfer ofwork)

Theo ngôn ngữ của khai phá quy trình, giả sử trong cùng một trường hợp C, nếuhoạt động A2 được thực hiện ngay sau hoạt động A1 thì mối quan giữa ngườithực thi A1 và A2 được gọi là quan hệ chuyển giao công việc Nhìn chung, mốiquan hệ chuyển giao công việc phản ánh khá chính xác mối quan hệ trong thực

tế hoạt động của doanh nghiệp

Trang 16

Quay lại với ví dụ nhật ký sự kiện trong Bảng 1.1, ta có nhận xét như sau:

- Chi và Duy có thể thực hiện các hoạt động như nhau (B và C)

- Duy thì luôn làm việc với An (trường hợp 1 và 2), còn Chi thì lại luôn làm việc với Mai (trường hợp 3 và 4)

Như vậy, mặc dù có thể Chi và Duy có cùng vai trò nhưng Chi không làm việcvới An và Duy không làm việc với Mai Lập luận tương tự, dựa trên mối quan hệchuyển giao công việc, từ nhật ký sự kiệnBảng 1.1, ta có thể trích xuất ra đồ thịquan hệ xã hội như Hình 2.1

Hình 2.1 Đồ thị quan hệ xã hội trích xuất từ nhật ký sự kiện Bảng 1.1Trong đồ thị trên Hình 2.1, giữa An và Duy, Mai và Chi có sự chuyển giao côngviệc qua lại Tuy nhiên giữa Mai và Minh chỉ có sự chuyển giao công việc từMai sang Minh mà không có chiều ngược lại Tương tự với mối quan hệ giữa An

và Minh, Mai và Nga Đồ thị trên là đồ thị không có trọng số, tuy nhiên, để phục

vụ cho việc phân tích mạng xã hội, trọng số có thể được thêm vào đồ thị Trọng

số được đánh căn cứ vào tần suất chuyển giao công việc, ví dụ, cung từ An tớiDuy có trọng số là 2

Để xây dựng được đồ thị quan hệ xã hội, chúng ta định nghĩa ra các độ đo khácnhau nhằm đánh trọng số cho các cung thể hiện mối quan hệgiữa những ngườithực thi Gọi trọng số trên cung nối giữa người thực thi i và j là Wi,j Nếu Wi,j>=

τ nào đó (τ là giá trị ngưỡng) thì ta thêm cung ịj vào tập R Bằng cách đó, chúng

ta có được đồ thị G (P, R, W) có thể dùng làm đầu vào cho các công cụ phân tíchmạng xã hội Trong luận văn này, tôi chỉ trình bày ba loại độ đo có thể đượctrích xuất từ nhật ký sự kiện [1][2]:

(1) Độ đo dựa trên quan hệ nhân quả

Trang 17

17 (2) Độ đo dựa trên những trường hợp chung

(3) Độ đo dựa trên các hoạt động chung

Để thuận tiện, tôi xin định nghĩa lại dưới dạng toán học khái niệm nhật ký sựkiện và các ký pháp tôi sẽ sử dụng trong phần này[1][2]

Định nghĩa 2.1(Nhật ký sự kiện):Gọi A là một tập các hoạt động, P là tập ntác

nhân (cá nhân, nhóm người tham gia vào quy trình).E = A×P là tập hợp các sựkiện có thể xảy ra Khi đó:

- Mỗi sự kiện được định nghĩa dưới dạng một cặp giá trị (a, p) thể hiện hoạtđộng a được thực hiện bởi p

- C = E*

là tập các chuỗi sự kiện có thể (mỗi chuỗi sự kiện tương ứng với một trường hợp)

- B(C) là tập các túi từ trên C

- L ⊆ B(C) là một nhật ký sự kiện và là tập con của C.

Với sự kiện e(a, p) ta định nghĩa hai phép toán

- a (e) = a

- p(e) = p

2.2.1 Độ đo dựa trên quan hệ nhân quả

Độ đo dựa trên quan hệ nhân quả phản ánh cách luồng công việc di chuyển giữacác cá nhân trong từng trường hợp Tính nhân quả thể hiện trong hai loại mốiquan hệ mà chúng ta sẽ sử dụng làm độ đo trong phần này: quan hệ chuyển giaocông việc (Handover of work) và quan hệ thầu phụ (Sub-contracting)

Quan hệ chuyển giao công việc: Trong cùng một trường hợp, nếu có một hoạt

động thực hiện bởi j được thực hiện ngay sau hoạt động thực hiện bởi i thì ta nói

ở đây có sự chuyển giao công việc từ i sang j Khi đánh giá quan hệ chuyển giaocông việc ta có thể kết hợp với khai phá quy trình để xác định có thật sự có mốiquan hệ nhân quả trong việc chuyển giao hay không Ngoài ra, khi sử dụng làm

độ đo, khái niệm chuyển giao công việc cũng cần thay đổi để có thể phân cấpđược độ mạnh yếu của mối quan hệ giữa những người thực thi Ngoài việc dựavào sự chuyển giao trực tiếp, chuyển giao gián tiếp cũng có thể được tínhtớithông qua việc sử dụng hệ số nhân quả β[1] Ví dụ nếu có 3 hoạt động xen

Trang 18

giữa hoạt động thực hiện bởi i và hoạt động thực hiện bởi j thì hệ số nhân quả là

β3

Quan hệ thầu phụ: Nếu giữa hai hoạt động được thực hiện bởiicó hoạt động

được thực hiện bởi j thì ta có nói có mối quan hệ thầu phụ giữa i và j[1]

a. Độ đo dựa trên mối quan hệ nhân quả trong chuyển giao công việc

Ý tưởng cơ bản của độ đo này là những người thực thi có mối liên hệ với nhaunếu giữa họ có sự chuyển giao công việc cho nhau Khi đánh giá theo độ đo này,

có 3 yếu tố cần cân nhắc[1]:

- Ta chỉ quan tâm đến chuyển giao công việc trực tiếp hay tính tới cả chuyển

giao công việc gián tiếp

- Nếu trong cùng một trường hợp, hai người thực thi chuyển giao công việc chonhau nhiều lần thì tính thành một lần hay nhiều lần

- Chỉ xét tới chuyển giao công việc khi có mối quan hệ nhân quả hay cả khichuyển giao công việc theo thứ tự bất kỳ (ví dụ trong Hình 1.2, ta thấy A và Bkhông có quan hệ nhân quả vì sau A không nhất thiết phải là B mà còn có thể

là C hoặc E)

Căn cứ theo những tiêu chí trên, chúng ta có thể có 8 (23

) biến thể khác nhaucủa độ đo này

Công thức độ đo và các toán tử sử dụng trong độ đo được định nghĩa như sau:

Định nghĩa 2.2 ( ⊳, ⊵):Gọi L là một nhật ký sự kiện Ký hiệu → biểu diễn mối quan hệ nhân quả trích xuất được từ L Với a1 , a 2 ∈ A, p 1 , p 2 ∈ P, c = (c 0 , c 1 ,…) ∈ L và n ∈

Trang 19

p1 n c p2 là một hàm trả về giá trị 1 nếu tồn tại ít nhất một trường hợp trong

đó có cả p1 và p2 cùng tham gia, và khoảng cách giữa 2 hoạt động mà p1 và

p2 thực hiện là n Nếu n = 1 thì sự chuyển giao công việc là trực tiếp, ngượclại, nếu n > 1 là chuyển giao gián tiếp

 Duy c n Minh = 1 do B và C có mối quan hệ nhân quả (sau B nhất định phải

Trang 20

nhưng đã được bỏ qua những lần chuyển giao công việc trùng nhau trong

cùng một trường hợp Ví dụ trong Bảng 1.1 ta có:

An L Duy = 2/5

vào độ đo bằng cách bổ sung thêm hệ số giảm β Nếu trong cùng một trường

hợp, giữa hai người thực thi có n sự kiện thì hệ số giảm sẽ là βn

Trang 21

Nếu áp dụng công thức trên cho nhật ký sự kiện trong Bảng 1.1, ta có kết quả như trong Bảng 2.1.

Trang 22

Bảng2.1 Giá trị độ đo dựa trên sự chuyển giao công việc

β

0.10.50.9

Ta thấy Nếu β = 1 thì khả năng phân loại độ mạnh yếu của mối quan hệ giảm đi

đáng kể bởi khoảng cách giữa các cá nhân được san bằng, chỉ cần có chuyển

giao công việc, bất kể là có bao nhiêu sự kiện xen giữa đều coi như nhau Điều

này là không chính xác khi đánh giá mối quan hệ xã hội trong thực tế Khi β

càng tăng thì độ chênh lệch giữa các giá trị càng giảm [1]

Bốn công thức còn lại cũng tương tự như bốncông thức trên, chỉ khác là chúng

chỉ tính tới quan hệ nhân quả giữa các hoạt động

Ta có thể gộp 8 công thức trên thành 4 công thức như sau:

Định nghĩa 2.4 (Công thức chung cho độ đo dựa trên sự chuyển giao công

việc): Gọi L là một nhật ký sự kiện, p1, p 2∈ P và giá trị hệ số β (0 < β < 1), k ∈ N ta có [1]

β ,kp

Trong các công thức gộp này, chúng ta thêm vào một hệ số nữa là độ sâu tính

toán k (calculation depth factor) Khi tính toán độ đo, k thể hiện giá trị lớn nhất

của số sự kiện xen giữa hai hoạt động thực hiện bởi 2 người thực thi Ví dụ với k

Trang 23

= 3 thì ta chỉ tính tới những lần chuyển giao trực tiếp hoặc chuyển giao gián tiếp

chỉ cách nhau 1 hoặc 2 sự kiện Ta thấy:

 Với k = 1, β= 1 thì ta có công thức p1 1,1L p2 = p1 L p2

 Với k > max(|c|) ta có công thức p1 β

L ,k p2 = p1 β

L p2

Do các nhật ký sự kiện thường có kích thước lớn nên việc tính tới tất cả các

trường hợp chuyển giao công việc dẫn đến phân tích chậm và không hiệu quả

Vì vậy chọn giá trị k phù hợp là rất quan trọng trong khai phá mạng xã hội

a Độđo dựa trên quan hệ thầu phụcông việc

Quan hệ thầu phụ công việc cũng dựa trên sự nối tiếp công việc giữa những

người thực thi Với mối quan hệ thầu phụ, cũng giống như chuyển giao công

việc, tacũng có thể điều chỉnh để cho ra các công thức độ đo khác nhau Sự nối

tiếp công việc là trực tiếp tức là chỉ có 1 hoạt động ở giữa 2 hoạt động thực hiện

bởi một người thực thi khác Khi có nhiều hoạt động xen giữa thì đó là thầu phụ

gián tiếp Hệ số giảm β cũng được đưa vào công thức cho trường hợp thầu phụ

gián tiếp Ví dụ, giả sử có 4 hoạt động, trong đó hoạt động đầu và cuối được

thực hiện bởi cùng người thực thi i, hoạt động thứ 2 và 3 được thực hiện theo

thứ tự bởi người thực thi j, k.Khi đó, chúng ta có thể trích xuất hai mối quan hệ

từ i tới j và k

Định nghĩa 2.5 (◊,◊) Gọi L là một nhật ký sự kiện Ký hiệu → biểu diễn mối

quan hệ nhân quả trích xuất được từ L Với a 1 , a 2 ∈ A, p 1 , p 2 ∈ P, c = (c 0 , c 1 ,…) ∈ L, |c| > 2, n ∈ N và n > 1 ta có[1]

Trang 24

p1 ◊c n p2 trả ra giá trị 1 nếu giữa haihoạt độngcó khoảng cách n được thực

hiện bởi p1 có hoạt động thực hiện bởi p2 Công thức này đã bỏ qua cả yếu tố

ràng buộc nhân quả và bỏ qua việc chuyển giao công việc nhiều lần trong

cùng một trường hợp Ví dụ trong Bảng 1.1, trường hợp 1 thì An ◊c2 Duy = 1

| p1 ◊c n p2 | trả ra số lần p1 ◊c n p2 trong trường hợp c, hay nói cách khác, ở đây

ta tính tới cả việc chuyển giao công việc nhiều lần trong cùng một trường

hợp

những trường hợp mà giữa các hoạt động thực sự có quan hệ nhân quả thay

vì thực thi ngẫu nhiên

Sử dụng những ký pháp được xác định tại định nghĩa 2.5 ta có các công thức cho

độ đo mức độ trung gian (in-between metric) dựa trên mối quan hệ thầu phụnhư

Trang 25

Tuy nhiên, cũng như mối quan hệ chuyển giao công việc, ta cũng có thể gộp 8 công thức trên thành 4 công thức cho độ trung gian bằng cách đưa thêm vào hệ

Trang 26

L p2 = p1◊L p2 và nếuk>max(|c|) thì p1◊βL ,k p2 =p1◊βLp2

2.2.2 Độ đo dựa trên trường hợp chung

Với độ đo này, chúng ta bỏ qua mối quan hệ nhân quả giữa các hoạt động màđơn giản tính tần suất haingười thực thi thực hiện các hoạt động trong cùng mộttrường hợp Và ta gọi những trường hợp mà cả hai cùng tham gia đó là trườnghợp chung (join case) Độ đo cộng tác dựa tính toán độ mạnh mối quan hệ trong

đồ thị quan hệ xã hội dựa trên trường hợp chung được định nghĩa như sau:

Định nghĩa 2.8 (Độ đo cộng tác): Gọi L là một nhật ký sự kiện p1 , p 2∈ P, c=(c0 , c 1 ,…) ∈ L ta có[2]

p 1 ⋈ L p 2 =p 1 ⋈ c p 2 / ∈ (c, p1) nếu ∈ (c, p 1 ) ≠ 0; ngược lại p 1 ⋈ L p 2 = 0

p 1 ⋈ c p 2 = 1 nếu ∃ 0<= i,j< |c|; i #j p (c i ) = p 1 ∧ p (c j ) = p 2 ; ngược lại p 1 ⋈ c p 2 = 0

g(c, p 1 ) = 1 nếu ∃ 0<= i < |c| p(ci) = p1; ngược lại g(c, p1) = 0

Chú ý, trong định nghĩa này chúng ta chia số trường hợp chung cho số trườnghợp có p1 tham gia khi xét mối quan hệ giữa p1 và p2 Mối quan hệ này không

Trang 27

phải đối xứng Ví dụ: p 1 tham gia 3 trường hợp, p 2 tham gia 6 trường hợp, p 1 và p 2 có 3 trường hợp chung Như vậy, p 1 luôn làm việc với p 2 nhưng p 2 thì không Do đó, p 1 ⋈ L p 2 phải khác p 2 ⋈ L p 1 Áp dụng công thức vào nhật ký sự kiện Bảng 2.1, ta có An ⋈ L Minh = 2/2 và Minh⋈ L An = 2/4.

2.2.3 Độđo dựa trên các hoạt động chung

Để tính toán độ đo này, trước tiên chúng ta cần thống kê tần suất các cá nhântham gia vào từng hoạt động[1]

Định nghĩa 2.9( △):Gọi L là một nhật ký sự kiện p1∈ P, a1∈ A, c = (c0 , c 1,…) ∈

Toán tử △giúp xác định ma trận tần suất thực thi của các hoạt động Ma trận có hàng P và cột A Áp dụng

định nghĩa 2.9 cho nhật ký sự kiện Bảng 1.1 ta có ma trận tần suất như Bảng 2.2.

Bảng2.2 Ma trận tần xuất thực thi hoạt động

Sau khi có ma trận tần suất, chúng ta có thể tính khoảng cách của những ngườithực thi bằng cách so sánh các vector tần suất của những người thực thi Các loạikhoảng cách khác nhau có thể được áp dụng tuỳ vào mục đích của độ đo.Khoảng cách Minkowski3được áp dụng khi ta có tính tới tần suất tuyệt đối củacác cá nhân, hay khoảng cách Hamming4 khi ta không quan tâm giá trị tuyệt đốicủa tần suất mà chỉ quan tâm 2 giá trị 1/0 tương ứng cá nhân có/không thực thi

3

https://en.wikipedia.org/wiki/Minkowski_distance

4

https://en.wikipedia.org/wiki/Hamming_distance

Ngày đăng: 11/11/2020, 21:48

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

🧩 Sản phẩm bạn có thể quan tâm

w