Cùng với sự phát triển của công nghệ thông tin, ngày càng có nhiều thông tin về các quy trình nghiệp vụ được lưu lại trong các hệ thống thông tin dưới dạng các bản ghi sự kiện, các bản g
Trang 1ĐỖ PHAN TRƯỜNG
NGHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH
VÀ ỨNG DỤNG ĐỂ PHÂN TÍCH QUY TRÌNH YÊU CẦU BỒI THƯỜNG TẠI SÂN BAY
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Đà Nẵng - Năm 2016
Trang 2ĐỖ PHAN TRƯỜNG
NGHIÊN CỨU KỸ THUẬT KHAI PHÁ QUY TRÌNH
VÀ ỨNG DỤNG ĐỂ PHÂN TÍCH QUY TRÌNH YÊU CẦU BỒI THƯỜNG TẠI SÂN BAY
Chuyên ngành: HỆ THỐNG THÔNG TIN
Mã số: 60.48.01.04
LUẬN VĂN THẠC SĨ HỆ THỐNG THÔNG TIN
Người hướng dẫn khoa học: TS PHẠM ANH PHƯƠNG
Đà Nẵng - Năm 2016
Trang 3ứng dụng phân tích quy trình xử lý yêu cầu bồi thường ở sân bay là do tôi thực hiện dưới sự hướng dẫn của TS Phạm Anh Phương
Tất cả các tài liệu tham khảo từ các nghiên cứu liên quan đến luận văn đều được nêu nguồn gốc một cách rõ ràng từ danh mục tài liệu tham khảo Trong luận văn, không có việc sao chép tài liệu, công trình nghiên cứu của người khác mà không ghi rõ tài liệu tham khảo
TÁC GIẢ
Đỗ Phan Trường
Trang 41 Tính cấp thiết của đề tài 1
2 Mục tiêu nghiên cứu 2
3 Đối tượng và phạm vi nghiên cứu 2
4 Phương pháp nghiên cứu 3
5 Bố cục đề tài 3
CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ QUY TRÌNH 4
GIỚI THIỆU CHUNG VỀ KHAI PHÁ QUY TRÌNH 4
1.1 MÔ HÌNH QUY TRÌNH VÀ PHÂN TÍCH MÔ HÌNH THEO QUY 1.2 TRÌNH 6
Mô hình hóa quy trình 6
1.2.1 Một số ngôn ngữ mô hình quy trình 7
1.2.2 Phân tích quy trình dựa trên mô hình 8
1.2.3 Giới hạn của phân tích quy trình dựa trên mô hình 9
1.2.4 Các thao tác nhật ký sự kiện và mô hình quy trình 10
1.2.5 BÀI TOÁN PHÁT HIỆN QUY TRÌNH 11
1.3 Nhật ký sự kiện 11
1.3.1 Phát hiện quy trình 14
1.3.2 KIỂM TRA PHÙ HỢP 17
1.4 Bài toán kiểm tra phù hợp 17
1.4.1 Kiểm tra phù hợp theo trường hợp replay 19
1.4.2 Kiểm tra phù hợp theo so sánh vết 22
1.4.3 Ứng dụng khác của kiểm tra phù hợp 22
1.4.4 MỞ RỘNG QUY TRÌNH 24
1.5 Thêm quan điểm tổ chức 25
1.5.1 Thêm quan điểm thời gian và xác suất 29 1.5.2
Trang 5CHƯƠNG II MỘT SỐ THUẬT TOÁN KHAI PHÁ QUY TRÌNH 32
THUẬT TOÁN ALPHA 322.1
Đầu vào của thuật toán 322.1.1
Thuật toán: 342.1.2
Ý tưởng của thuật toán Alpha 352.1.3
Giới hạn của thuật toán Alpha 362.1.4
THUẬT TOÁN KHAI PHÁ QUY TRÌNH HEURISTIC (HM) 412.2
Đầu vào và đầu ra của thuật toán 412.2.1
Thuật toán khai phá quy trình Heuristic 432.2.2
Kết luận thuật toán khai phá quy trình Heuristic 562.2.3
THUẬT TOÁN KHAI PHÁ QUY TRÌNH DI TRUYỀN (GPM) 572.3
Thuật toán di truyền (GA) 572.3.1
Một số lựa chọn thiết kế cần thực hiện 602.3.2
Kết luận thuật toán khai phá quy trình di truyền 652.3.3
KẾT LUẬN CHƯƠNG 2 652.4
CHƯƠNG III ỨNG DỤNG KHAI PHÁ QUY TRÌNH XỬ LÝ YÊU
CẦU BỒI THƯỜNG TẠI SÂN BAY 67
BÀI TOÁN KHAI PHÁ QUY TRÌNH XỬ LÝ YÊU CẦU BỒI
3.1
THƯỜNG TẠI SÂN BAY 67
Đầu vào của bài toán 673.1.1
Đầu ra của bài toán 693.1.2
Hướng giải quyết bài toán 693.1.3
CÔNG CỤ KHAI PHÁ QUY TRÌNH PROM 693.2
Giới thiệu chung về công cụ khai phá quy trình ProM 693.2.1
Các chức năng của công cụ khai phá quy trình ProM 703.2.2
Trang 6KẾT LUẬN 85 TÀI LIỆU THAM KHẢO 87 QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO)
Trang 7BPMN Business Process Modeling Notation
CRM Customer Relationship Management
EmiT Enhanced Mining Tool
EPC Event-driven Process Chain
ERP Enterprise Resource Planning
FHM Flexible Heuristics Miner
GPM Genetic Process Mining
MXML Mining eXtensible Markup Language
PNML Petri Net Markup Language
SCM Software Configuration Management
SWF-net Structured Workflow Net
XES eXtensible Event Stream
YAWL Yet Another Workflow Language
Trang 8Bảng 1.2: Một cách biểu diễn gọn hơn của bản ghi sự kiện 13Bảng 1.3: Một bản ghi sự kiện đơn giản với thông tin nguồn lực được làm nổi bật 26Bảng 1.4: Bảng nguồn lực hoạt động cho thấy thời gian trung bình một người thực hiện một hoạt động cho mỗi trường hợp 26Bảng 2.1: Ví dụ về một bảng in vết 33Bảng 2.2: Chuyển đổi một mạng Petri trong hình 2.8 thành một C-net 43Bảng 2.3: Đếm tần suất xuất hiện của các mối quan hệ nhân quả giữa các hoạt động 47Bảng 2.4: Đếm số vòng lặp có độ dài 2 (tức là đếm a >>w b) 47Giá trị 89 tại vị trí D,F cho biết có 89 mẫu DF trong bản ghi sự kiện 47Bảng 2.5: Hiển thị độ phụ thuộc giữa các hoạt động 49Bảng 2.6: Đồ thị phụ thuộc kết quả được suy ra từ bảng 2.5 49Bảng 2.7: Một C-net mở rộng đối với đồ thị phụ thuộc của bảng 2.6 với
sự liên kết các bản ghi sự kiện với 1000 vết 52Bảng 3.1: Bản ghi sự kiện LFull 68Bảng 3.2: So sánh, đánh giá các thuật toán đã thực nghiệm 82
Trang 9Hình 1.2: Ba sự liên quan giữa các bản ghi sự kiện và quy trình mô hình:
Play-in, Play-out, và Replay 10
Hình 1.3: WF-net N2 được phát hiện cho L2 15
Hình 1.4: Vấn đề phát hiện lại quy trình 16
Hình 1.5: Kiểm tra phù hợp 18
Hình 1.6: kiểm tra sự phù hợp cung cấp các biện pháp phù hợp toàn cục và chẩn đoán địa phương 21
Hình 1.7: Mô hình tích hợp 25
Hình 1.8: Một mạng xã hội bao gồm các nút đại diện cho các tổ chức và cung đại diện cho mối quan hệ 27
Hình 1.9: Mô hình tổ chức được phát hiện dựa trên bản ghi sự kiện 28
Hình 2.1: Một mô hình quy trình được khai phá từ bản ghi sự kiện được mô tả như bảng 1.2 bằng thuật toán Alpha 35
Hình 2.2: Mối liên hệ giữa bản ghi sự kiện với cấu trúc mạng Petri cơ bản dựa trên các mối quan hệ >W, →W, ||W v{ #W 36
Hình 2.4: Một mô hình quy trình với các hoạt động trùng lặp 37
Hình 2.5: Một mô hình quy trình với cấu trúc không tự do lựa chọn 38
Hình 2.6: Mô hình quy trình có vòng lặp ngắn độ dài 1 39
Hình 2.7: Mô hình quy trình có vòng lặp ngắn độ dài 2 39
Hình 2.8: Mô hình mạng Petri được sử dụng để tạo ra một bản ghi sự kiện 42
Hình 2.9: Đồ thị phụ thuộc kết quả khi sử dụng các tham số mặc định 50 Hình 2.10: Đồ thị phụ thuộc kết quả khi thiết lập tham số σa = 0.80 và σr = 0.2 51
Hình 2.11: Một mô hình quy trình dưới dạng mạng Petri với cấu trúc phụ thuộc khoảng cách xa 54
Trang 10Hình 2.13: DG tương ứng với hình 2.12 với quan hệ đồ thị phụ thuộc
khoảng cách xa 56
Hình 2.14: Tổng quan về hướng tiếp cận sử dụng khai phá di truyền 58
Hình 2.15: Hai mô hình bố mẹ (trên) và hai mô hình con là kết quả từ phép giao nhau 64
Hình 2.16: Mô tả quá trình đột biến, một vị trí bị loại bỏ và một cung mới được thêm vào 64
Hình 3.1: Tổng quan về khung ứng dụng ProM 70
Hình 3.2: Các tùy chọn đối với dữ liệu đầu vào là bản ghi sự kiện 71
Hình 3.3: Giao diện làm việc trên ProM 5.2 72
Hình 3.4: Giao diện chức năng quản lý gói flugin của ProM 6.5 73
Hình 3.5: Kết quả khai phá quy trình xử lý yêu cầu bồi thường tại sân bay bằng thuật toán Alpha 75
Hình 3.6: Kết quả nhân được khi khai phá với bản ghi sự kiện có lỗi 76
Hình 3.7: Mô hình kết quả khai phá quy trình bằng thuật toán HM khi sử dụng các tham số mặc định 77
Hình 3.8: Mô hình kết quả khai phá quy trình bằng thuật toán HM khi thiết lập tham số σa = 0.90 và σr = 0.1 78
Hình 3.9: Kết quả khai phá với bản ghi có sự kiện lỗi và hoạt động trùng lặp 79
Hình 3.10: Các tham số thiết lập khi thực hiện thuật toán khai phá quy trình di truyền 80
Hình 3.11: Một cá thể có độ phù hợp gần bằng 1 81
Hình 3.12: Một cá thể có độ phù hợp thấp 81
Hình 3.13: So sánh thời gian thực hiện và độ phù hợp của mô hình kết quả của ba thuật toán Alpha, HM, GPM 83
Trang 11MỞ ĐẦU
1 Tính cấp thiết của đề tài
Trong mọi lĩnh vực hoạt động, bất kỳ một cơ quan, tổ chức, doanh nghiệp nào dù lớn hay nhỏ muốn thực hiện các công việc của mình đều phải thực hiện theo các quy trình nghiệp vụ định sẵn Cùng với sự phát triển của công nghệ thông tin, ngày càng có nhiều thông tin về các quy trình nghiệp vụ được lưu lại trong các hệ thống thông tin dưới dạng các bản ghi sự kiện, các bản ghi sự kiện này có đặc điểm là nó phản ánh một cách trung thực, chính xác những gì đã xảy ra trong thực tế Tuy nhiên, cho đến gần đây, các thông tin này ít khi được các tổ chức, doanh nghiệp sử dụng để phân tích việc thực hiện các quy trình nghiệp vụ cơ bản của cơ quan, tổ chức, doanh nghiệp mình
Ý tưởng của khai phá quy trình nghiệp vụ là trích xuất thông tin từ các bản ghi sự kiện để khai phá ra các mô hình quy trình nghiệp vụ Những mô hình này có thể được dùng để phân tích các quy trình, phát hiện những vấn đề sai lệch từ đó đề xuất điều chỉnh, thiết kế lại quy trình một cách chính xác hơn mang lại hiệu quả công tác cao hơn Với những lợi ích mà nó mang lại, khai phá quy trình đang trở thành một trong những hướng nghiên cứu thu hút được
sự quan tâm của các nhà nghiên cứu lĩnh vực quản lý quy trình nghiệp vụ (BPM) và giới nghiên cứu khoa học máy tính Trong những năm gần đây, bên cạnh việc nghiên cứu cải tiến các giải thuật khai phá quy trình, các nhà nghiên cứu trên thế giới đang tập trung nghiên cứu ứng dụng các kỹ thuật khai phá quy trình vào các lĩnh vực cụ thể như lĩnh vực y tế, giáo dục, tài chính kinh doanh, thương mại v.v… Ngày càng có nhiều nhà cung cấp phần mềm bổ sung chức năng khai thác quy trình vào các công cụ của họ
Từ sự cấp thiết đó, luận văn thực hiện nghiên cứu tổng quan về kỹ thuật khai phá quy trình và một số thuật toán khai phá quy trình để đem đến cái nhìn rõ ràng hơn về kỹ thuật này Bên cạnh đó, luận văn thực nghiệm kỹ thuật
Trang 12khai phá quy trình đối với quy trình xử lý yêu cầu bồi thường ở sân bay Đây
là một quy trình đơn giản, thực nghiệm khai phá quy trình này có thể giúp minh họa rõ hơn kỹ thuật này cũng như các thuật toán khai phá quy trình
2 Mục tiêu nghiên cứu
- Tìm hiểu một cách tổng quan về khai phá quy trình nghiệp vụ
- Nghiên cứu một số thuật toán sử dụng trong khai phá quy trình nghiệp
vụ Qua đó so sánh, đánh giá ưu và nhược điểm của các thuật toán
- Sử dụng các thuật toán và công cụ khai phá quy trình nghiệp vụ để minh họa ứng dụng khai phá quy trình xử lý yêu cầu bồi thường tại sân bay với dữ liệu thực tế được mô tả trong tài liệu W.M.P van der Aalst (2011), Process Mining: Discovery, Conformance and Enhancement of Business Processes, Springer - Verlag, Berlin
3 Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu
- Kỹ thuật khai phá quy trình
- Các thuật toán khai phá quy trình
- Công cụ khai phá quy trình ProM
Springer - Verlag, Berlin để mô phỏng kỹ thuật khai phá quy trình
- Phương pháp thu thập thông tin: Tìm kiếm tài liệu từ sách, giáo trình,
báo cáo, internet
Trang 134 Phương pháp nghiên cứu
- Phương pháp so sánh: Tổng hợp và đối chiếu giữa những tài liệu thu
được để đưa ra một cái nhìn tổng quan nhất về kỹ thuật khai phá quy trình và các thuật toán khai phá quy trình
- Phương pháp chuyên gia: Tham vấn từ những người có kinh nghiệm
nhằm hoàn thiện các nội dung cần nghiên cứu
- Phương pháp thực nghiệm: Thực nghiệm khai phá quy trình xử lý yêu
cầu bồi thường của khách ở sân bay
5 Bố cục đề tài
- Chương 1: Tổng quan về khai phá quy trình, sẽ giới thiệu ý tưởng,
mục đích của khai phá quy trình nghiệp vụ, giới thiệu kỹ thuật mô hình quy trình và một số hạn chế của các kỹ thuật đó, giới thiệu các bài toán của khai phá quy trình Quá đó, cho thấy ý nghĩa và tầm quan trọng của việc ứng dụng khai phá quy trình nghiệp vụ tại các cơ quan, doanh nghiệp…
- Chương 2: Một số thuật toán khai phá quy trình, giới thiệu chi tiết ba
trong số các thuật toán thường được sử dụng trong khai phá quy trình nghiệp
vụ, đó là: thuật toán khai phá quy trình Anpha, thuật toán khai phá quy trình Heuristic và thuật toán khai phá quy trình di truyền, qua đó so sánh đánh giá
ưu, nhược điểm của từng thuật toán
- Chương 3: Ứng dụng khai phá quy trình xử lý yêu cầu bồi thường tại
sân bay, sẽ giới thiệu một cách tổng quan về công cụ khai phá quy trình
ProM Qua đó ứng dụng ProM để khai phá quy trình xử lý yêu cầu bồi thường tại sân bay bằng các thuật toán đã được trình bày ở chương 2 Kết quả khai phá sẽ góp phần mô tả chi tết và đánh giá cụ thể hơn ưu nhược điểm của các thuật toán khai phá quy trình đã được trình bày
- Phần Kết luận tổng kết những kết quả đã đạt được và đưa ra hướng
phát triển của luận văn trong tương lai
Trang 14CHƯƠNG 1: TỔNG QUAN VỀ KHAI PHÁ QUY TRÌNH
GIỚI THIỆU CHUNG VỀ KHAI PHÁ QUY TRÌNH
1.1.
Trước khi tập trung vào kỹ thuật khai phá quy trình, ta lướt qua một số
kỹ thuật và mô hình liên quan Hệ thống quản lý quy trình nghiệp vụ (BPM),
hệ thống quản lý luồng công việc (WFM) là hệ thống cho phép chúng ta xác định và điều khiển luồng công việc của một quy trình, hệ thống hoạch định nguồn lực doanh nghiệp (ERP), hệ thống quản lý mối quan hệ với khách hàng (CRM), công cụ quản lý cấu hình phần mềm (SCM) Những hệ thống thông tin khác nhau này đều có một điểm chung đó là tất cả các hoạt động của chúng đều được ghi lại trong bản ghi sự kiện Các bản ghi được ghi lại bởi các
hệ thống thông tin nói trên chứa dữ liệu về các sự kiện, các giao dịch, các trường hợp ngoại lệ trong quá trình thực hiện quy trình Các bản ghi này phản ánh các quy trình thực của nó một cách trung thực nhất, nghĩa là chúng phản ánh đúng thực tế
Khai phá quy trình trong phạm vi của các quy trình luồng công việc được giới thiệu đầu tiên bởi Agrawal et al vào năm 1998 Tuy nhiên, thuật ngữ khai phá luồng công việc hay còn gọi là khai phá quy trình chính thức được đưa ra vào năm 1999 bởi Ton Weijters và Van der Aalst Theo Van der
Aalst: Ý tưởng của khai phá quy trình là để khám phá, giám sát và cải thiện quy trình thực sự của nó bằng cách trích xuất tri thức từ những bản ghi sự
kiện có sẵn trong các hệ thống thông tin ngày nay [6]
Cụ thể hơn theo A Rozinat, I.S.M de Jong, C.W G"unther, và W.M.P van der Aalst, 2007: ý tưởng cơ bản của khai phá quy trình là nghiên cứu từ những hoạt động quan sát được của một quy trình và dùng nó để
(i) : khám phá mô hình mới,
(ii) : kiểm tra tính phù hợp của mô hình bằng cách kiểm tra xem trạng thái của mô hình đó có phù hợp với trạng thái mô hình được quan sát hay
Trang 15không?
(iii): mở rộng mô hình đang có bằng cách sắp xếp thông tin được trích xuất từ những bản ghi vào một số mô hình ban đầu [6]
Hình 1.1: Sơ đồ khai phá quy trình
Hình 1.1 cho chúng ta thấy quá trình khai phá quy trình và các mối quan
hệ giữa các thực thể như là hệ thống thông tin, quy trình hoạt động, các bản ghi sự kiện và mô hình quy trình Khai phá quy trình thiết lập liên kết, một mặt giữa quy trình thực tế và dữ liệu của chúng, mặt khác giữa quy tình thực tế và
mô hình quy trình Các hệ thống thông tin ngày nay ghi lại một lượng lớn các
dữ liệu về quá trình hoạt động Dữ liệu này được mô tả như là bản ghi sự kiện
ở sơ đồ trên
Chiết tách dữ liệu là một phần không thể thiếu của bất kỳ nỗ lực khai thác quy trình nào bởi vì dữ liệu được lưu trong các hệ thống thông tin thường không được cấu trúc sẵn
Trang 16Bản ghi sự kiện được sử dụng trong ba loại khai phá quy trình Đó là phát hiện quy trình, kiểm tra phù hợp, và cải thiện quy trình như đã trình bày
ở định nghĩa phía trên Ba hoạt động khai phá quy trình này sẽ được trình bày chi tiết ở các phần sau
MÔ HÌNH QUY TRÌNH VÀ PHÂN TÍCH MÔ HÌNH THEO 1.2.
QUY TRÌNH
Sự phát triển của các kỹ thuật, ngôn ngữ mô hình hóa quy trình cho thấy
sự quan trọng của quá trình mô hình hóa quy trình Ngày nay, hầu hết các mô hình quy trình được thực hiện bằng tay và không dựa trên một phân tích nghiêm ngặt của dữ liệu quy trình hiện có Phần này trình bày hai nội dung chính Một là, giới thiệu chung về các kỹ thuật mô hình quy trình sẽ được sử dụng trong các chương sau Hai là, chương này cho thấy những hạn chế của phương pháp cổ điển, do đó thúc đẩy nhu cầu khai thác quá trình
Mô hình hóa quy trình
mô hình ở mức độ trừu tượng sai
Trang 17Một số ngôn ngữ mô hình quy trình
1.2.2.
Có rất nhiều ngôn ngữ mô hình và việc quyết định chọn một hay nhiều
mô hình phụ thuộc vào nhiều yếu tố Trong phần dưới đây luận văn sẽ giới thiệu một số ngôn ngữ mô hình thường được sử dụng trong khai phá quy trình
a Mạng Petri
Mạng Petri [8], [11], [12], công cụ hình học và toán học biểu diễn quá trình biến đổi trạng thái của các hệ thống, do Carl Adam Petri đề xuất vào năm 1962 Mạng Petri được xem là một ngôn ngữ mang tính tượng trưng cao
và dễ dàng giao tiếp giữa các nhà thiết kế khác nhau trên thế giới cũng như rất thuận lợi và dễ dàng cho người sử dụng Trong lĩnh vực khai phá quy trình mạng Petri được sử dụng rộng rãi để mô hình hóa luồng quy trình dựa vào các bản ghi sự kiện Hiện nay có nhiều phương pháp được dùng để phân tích mạng Petri Hơn thế nữa, ngôn ngữ ProM cung cấp cho chúng ta nhiều công
cụ để chuyển đổi những ngôn ngữ mô hình khác thành mạng Petri
Mạng Petri là một dạng biểu đồ có hướng gồm hai loại nút: chuyển tiếp (transition) và vị trí (place) Các vị trí và chuyển tiếp được nối với nhau bằng các đường nối (liên kết) Chỉ có thể nối vị trí với chuyển tiếp, không thể nối giữa hai vị trí hoặc hai chuyển tiếp với nhau Khi một đường nối đi từ một vị trí đến một chuyển tiếp, thì vị trí đó được gọi là vị trí đầu vào của chuyển tiếp
đó Ngược lại, khi có một đường nối đi từ chuyển tiếp tới một vị trí thì vị trí
đó được gọi là vị trí đầu ra của chuyển tiếp đó Các vị trí có thể chứa một số lượng các thẻ (token) nào đó Thẻ trong vị trí được biểu diễn bằng dấu chấm Chuyển tiếp của Petri Net có thể hoạt động được khi tất cả các vị trí đầu vào của nó có ít nhất một token Sau khi chuyển tiếp hoạt động (bắn), mỗi vị trí đầu vào sẽ mất một thẻ và mỗi vị trí đầu ra thêm một thẻ Tại một thời điểm, việc phân bố các thẻ trên các vị trí, được gọi là đánh dấu (marking) của Petri Net Nó biểu diễn trạng thái hiện tại của hệ thống được mô hình hóa
Trang 18b Mạng Workflow
Khi mô hình hóa quy trình nghiệp vụ dưới dạng mạng Petri ta thường quan tâm đến một tập con của mạng Petri được gọi là mạng luồng công việc [10] (Workflow nets hay WF-nets) Một WF-nets là một mạng Petri chỉ có một vị trí dành riêng cho nguồn nơi quy trình bắt đầu và một vị trí dành riêng cho đích nơi quy trình kết thúc Ngoài ra, tất cả các nút đều trên một đường dẫn từ nguồn đến đích
Phân tích quy trình dựa trên mô hình
1.2.3.
Theo [11], phân tích quy trình dựa trên mô hình bao gồm kiểm tra quy trình và phân tích hiệu suất quy trình Kiểm tra quy trình tập trung vào sự đúng đắn của hệ thống hoặc quy trình Phân tích hiệu suất tập trung vào số dòng công việc, thời gian chờ, dịch vụ được sử dụng và mức độ
a Kiểm tra quy trình
Một phương pháp ta kiểm tra tính mạnh của mô hình, tức là tính liên thông của mô hình khi từ bất kỳ một trạng thái nào cũng có đường chuyển đến trạng thái kết thúc Một phương pháp kiểm tra khác là so sánh hai mô hình Ví dụ, khi bước vào giai đoạn triển khai, quy trình đó cần được so sánh với các đặc điểm kỹ thuật cao cấp hơn Nếu quy trình đó có thể “theo tất cả các hành động” của quy trình cao cấp hơn thì có thể nói, mô hình quy trình được triển khai là đúng đắn
b Phân tích hiệu năng
Hiệu suất của một quá trình hoặc tổ chức có thể được định nghĩa theo nhiều cách khác nhau Thông thường, ba khía cạnh của hoạt động được xác định: thời gian, chi phí và chất lượng Đối với từng khía cạnh hiệu suất, chỉ số hiệu suất chính khác nhau có thể được xác định Các chỉ số sau đây có thể
được xác định cho khía cạnh thời gian: Thời gian dẫn là tổng thời gian từ việc
tạo ra các trường hợp đến hoàn thành các trường hợp Mức độ lệch thời gian
Trang 19dẫn giữa các trường hợp khác nhau có tầm quan trọng khi đánh giá hiệu suất
Thời gian phục vụ là thời gian làm việc thực tế trên một trường hợp Thời gian chờ đợi là thời gian một trường hợp đang chờ tài nguyên trở nên có sẵn Thời gian đồng bộ hóa là thời điểm hoạt động chưa được kích hoạt đầy đủ và
chờ đợi một kích hoạt bên ngoài hoặc một nhánh song song Chỉ số hiệu suất cũng có thể được định nghĩa cho mức chi phí Các chi phí thực hiện một hoạt động có thể được cố định hoặc phụ thuộc vào loại tài nguyên được sử dụng, tận dụng, hoặc thời gian hoạt động Chỉ số hiệu suất thường được tính bằng trung bình các nguồn lực trong một thời gian nhất định Các chỉ số chất lượng thường tập trung vào các "sản phẩm" hoặc "dịch vụ" giao cho khách hàng Như chi phí, điều này có thể được đo bằng nhiều cách khác nhau Ví dụ sự hài lòng của khách hàng đo lường thông qua bảng câu hỏi
Trong khi kiểm tra tập trung vào tính chính xác của quy trình được mô hình hóa thì phân tích hiệu quả nhằm mục tiêu cải tiến quy trình liên quan đến thời gian, chi phí, hoặc chất lượng Trong bối cảnh của hoạt động quản lý, nhiều kỹ thuật phân tích đã được phát triển
Giới hạn của phân tích quy trình dựa trên mô hình
1.2.4.
Kiểm định và phân tích hiệu suất phụ thuộc rất nhiều vào sự sẵn có của
mô hình chất lượng cao Khi các mô hình và thực tế có rất ít điểm chung, phân tích dựa trên mô hình không có ý nghĩa nhiều Ví dụ, mô hình quy trình
có thể nhất quán và đáp ứng tất cả các loại tính chất mong muốn Tuy nhiên, nếu mô hình mô tả một phiên bản lý tưởng của thực tế, điều này là khá vô dụng như trong thực tế tất cả các loại sai lệch có thể xảy ra, mô hình mô phỏng cũng tương tự Có thể mô hình dự đoán một sự cải thiện đáng kể trong khi trên thực tế đây không phải là trường hợp vì các mô hình dựa trên các giả định sai lầm Tất cả những vấn đề này xuất phát từ sự thiếu liên kết giữa các
mô hình làm bằng tay và thực tế Khai phá quy trình giải quyết những vấn đề này bằng cách thiết lập một kết nối trực tiếp giữa các mô hình và dữ liệu sự
Trang 20kiện cấp thấp thực tế về quá trình này Hơn nữa, các kỹ thuật phát hiện quy trình cho phép xem cùng một thực tế từ các góc độ khác nhau và ở mức độ trừu tượng khác nhau
Các thao tác nhật ký sự kiện và mô hình quy trình
1.2.5.
Một trong những yếu tố quan trọng của khai phá quy trình là sự nhấn mạnh vào việc thiết lập một mối quan hệ mạnh mẽ giữa một mô hình quy trình và "thực tế" được ghi lại dưới các hình thức của một bản ghi sự kiện Ta
sử dụng các thuật ngữ Play-in, Play-out, và Replay để phản ánh về mối quan
hệ này [11] Hình 1.2 minh họa ba khái niệm
Hình 1.2: Ba sự liên quan giữa các bản ghi sự kiện và quy trình mô hình:
Play-in, Play-out, và Replay
Bản ghi sự kiện Mô hình quy trình
- Mở rộng mô hình
- Kiểm tra, chản đoán
- Dự đoán
- Đề xuất
Trang 21Play-out đề cập đến cách sử dụng cổ điển của các mô hình quy trình Có thể hiểu đơn giản, Play-out có đầu vào là một mô hình và mục tiêu là thu thập
số liệu thống kê và khoảng tin cậy bằng cách chạy liên tục một mô hình thông qua mô phỏng Play-in ngược lại với Play-out, tức là, hành vi mẫu được lấy làm đầu vào và mục tiêu là xây dựng một mô hình Replay sử dụng một bản ghi sự kiện và một mô hình quy trình như đầu vào Nhật ký sự kiện được "tái hiện lại" trên đỉnh của các mô hình quy trình cho các mục đích khác nhau như kiểm tra phù hợp, mở rộng các mô hình với tần số và thông tin thời gian, xây dựng mô hình dự báo, hỗ trợ hoạt động
BÀI TOÁN PHÁT HIỆN QUY TRÌNH
1.3.
Nhật ký sự kiện
1.3.1.
Bản ghi sự kiện (event log) hay còn được gọi là bản ghi luồng công việc
là một trong những thành phần chính của các kỹ thuật khai phá quy trình nó
có thể được xem như là đầu vào của các kỹ thuật khai phá quy trình [11] Các bản ghi này chứa thông tin về các sự kiện và các quy trình xảy ra trong hệ thống, nó có thể được sử dụng để khai phá một mô hình, mở rộng một mô hình đã tồn tại hay tính toán chất lượng của nó Ngày nay, bất kỳ một hệ thống phần mềm nào được sử dụng để hỗ trợ quy trình (ERP, WFM.) đều ghi lại thông tin này theo các hình thức khác nhau Tuy nhiên, để phục vụ mục đích khai phá quy trình, các sự kiện được ghi lại trong bản ghi phải thỏa mãn các yêu cầu sau:
- Mỗi sự kiện phải đề cập đến một hoạt động hay một tác vụ,
- Mỗi sự kiện đề cập đến một trường hợp (ví dụ như một yêu cầu tìm kiếm đối tượng),
- Mỗi sự kiện có thể có một người thực hiện còn gọi là người khởi đầu (người thực hiện hoặc bắt đầu hoạt động),
- Các sự kiện có một nhãn thời gian và tất cả các sự kiện đều được sắp xếp theo thứ tự
Trang 22Bên cạnh đó bản ghi có thể chứa các loại của sự kiện, ví dụ như: sự kiện bắt đầu (bắt đầu một hành động), sự kiện hoàn thành (kết thúc một hành động), sự kiện đã được lịch trình (một hành động dự kiến sẽ được thực hiện) v.v Bảng 1.1 cho thấy một ví dụ về bản ghi sự kiện với một số thông tin như
đã nói ở trên Bản ghi sự kiện ở bảng 1.1 là một ví dụ điển hình cho cấu trúc của một bản ghi sự kiện
Không phải tất cả những thông tin chứa trong bản ghi sự kiện đều cần thiết cho mục đích khai phá quy trình mà phụ thuộc vào kỹ thuật khai phá quy trình được sử dụng và những câu hỏi đặt ra, chỉ có một phần thông tin trong bản ghi được sử dụng Do đó, để đơn giản hóa bảng ghi sự kiện, ta có thể sử dụng các ký hiệu đại diện cho tên các hoạt động hoặc các thuộc tính khác tùy theo yêu cầu phân tích Trong đó mỗi dòng của bản ghi được gọi là một vết tương ứng với chuỗi các sự kiện đã được nhóm thành các “mã trường hợp” (case id) Trong trường hợp xem xét dựa trên các quan điểm khác, những dữ liệu khác được lưu trữ trong bản ghi sẽ đóng vai trò quan trọng hơn
1 35654423 30-12-2010:11.02 đăng ký yêu cầu Pete 50
1 35654424 31-12-2010:10.06 kiểm tra kỹ Sue 400
1 35654425 05-01-2011:15.12 kiểm tra vé Mike 100
1 35654426 06-01-2011:11.18 quyết định Sara 200
1 35654427 07-01-2011:14.24 từ chối yêu cầu Pete 200
2 35654483 30-12-2010:11.32 đăng ký yêu cầu Mike 50
2 35654485 30-12-2010:12.12 kiểm tra vé Mike 100
2 35654487 30-12-2010:14.16 kiểm tra nhanh Sean 400
2 35654488 05-01-2011:11.22 quyết định Sara 200
2 35654489 08-01-2011:12.05 chi trả bồi thường Ellen 200
3 35654521 30-12-2010:14.32 đăng ký yêu cầu Pete 50
3 35654522 30-12-2010:15.06 kiểm tra nhanh Mike 400
3 35654524 30-12-2010:16.34 kiểm tra vé Ellen 100
3 35654525 06-01-2011:09.18 quyết định Sara 200
3 35654526 06-01-2011:12.18 xem lại yêu cầu Sara 200
Trang 233 35654527 06-01-2011:13.06 kiểm tra kỹ Sean 400
3 35654530 08-01-2011:11.43 kiểm tra vé Pete 100
3 35654531 09-01-2011:09.55 quyết định Sara 200
3 35654533 15-01-2011:10.45 chi trả bồi thường Ellen 200
4 35654641 06-01-2011:15.02 đăng ký yêu cầu Pete 50
4 35654643 07-01-2011:12.06 kiểm tra vé Mike 100
4 35654644 08-01-2011:14.43 kiểm tra kỹ Sean 400
4 35654645 09-01-2011:12.02 quyết định Sara 200
4 35654647 12-01-2011:15.44 từ chối yêu cầu Ellen 200
Định dạng được sử dụng để lưu trữ các bản ghi trong mỗi hệ thống thường là khác nhau Nếu thiếu một định dạng thống nhất thì sẽ làm cho việc chia sẻ và trao đổi các bản ghi giữa các công cụ gặp khó khăn và làm tăng chi phí của quá trình phân tích khai phá quy trình Vì lý do đó, năm 2003 một định dạng đã được đề xuất bởi Medeiros, Ana Karla và Van der Aalst và trở thành định dạng chuẩn cho các bản ghi sự kiện, đó là Mining eXtensible Markup Language (MXML) [13] MXML dựa trên XML và có thể được sử dụng để lưu trữ bất kỳ thông tin nào có liên quan đến các sự kiện và các quy trình MXML là định dạng được hỗ trợ bởi hầu hết các công cụ phân tích khai phá quy trình, chẳng hạn như ProM Tuy nhiên, để có thể chạy ProM từ và ProM6.0 ra đời vào tháng 11/2010 người ta sử dụng định dạng eXtensible Event Stream (XES) [11] thay vì sử dụng MXML XES là một chuẩn khai phá quy trình mới được thực hiện bởi IEEE Task Force cho khai phá quy trình Hiện tại, một số công cụ như XESame, ProM Import, Nitro có thể chuyển đổi được hầu hết các bản ghi sự kiện về định dạng MXML và XES
Bảng 1.2: Một cách biểu diễn gọn hơn của bản ghi sự kiện
Trang 24Phát hiện quy trình
1.3.2.
Phát hiện quy trình là một trong những nhiệm vụ khó khăn nhất của khai phá quy trình Dựa trên nhật ký sự kiện, một mô hình quy trình được xây dựng nhờ nắm bắt được các hành vi trong nhật ký sự kiện [11] Phần này trình bày các vấn đề về phát hiện quy trình từ bản ghi sự kiện, phát hiện lại quy trình từ bản ghi sự kiện và quy trình mẫu
Đặc vấn đề phát hiện quy trình
a.
Như đã trình bày ở phần trước, có ba lớp bài toán khai phá quy trình: phát hiện quy trình, kiểm tra phù hợp, cải tiến quy trình Ở phần này, ta tập trung vào lớp phát hiện quy trình và quan điểm điều khiển luồng
Ta xác định mục tiêu là một mô hình mạng Petri Ta sử dụng một bản ghi sự kiện đơn giản làm đầu vào Một bản ghi sự kiên đơn giản L là tập dấu
vết trên một số thiết lập của hoạt động A, tức là, L ∈ 𝔹 (𝒜 ∗) Ví dụ,
L1 = [(a,b,c,d)3,(a,c,b,d)2,(a,e,d)]
L1 là một bản ghi sự kiện đơn giản mô tả lịch sử của sáu trường hợp Mục tiêu là khám phá một lưới Petri có thể "phát lại" bản ghi sự kiện L1 Rõ ràng, lưới Petri là một lưới WF-net mạnh như được nhắc đến ở các phần trước Dựa trên những sự lựa chọn, ta xây dựng các vấn đề phát hiện quy trình
và làm cho nó cụ thể hơn
Định nghĩa 1.1 Một thuật toán phát hiện quy trình là một hàm ánh xạ
bản ghi L ∈ 𝔹 (𝒜 ∗) vào một mạng Petri đã được đánh dấu γ(L) = (N,M) Khi
đó, N là một WF-net mạnh và tất cả các trình tự trong L tương ứng với trình
tự có thể có của (N, M)
Xét L2 là một bản ghi sự kiện đơn giản bao gồm 13 trường hợp đại diện của 6 dấu vết khác nhau
Trang 25L2 = [(a,b,c,d)3, (a,c,b,d)4, (a,b,c,e,f,b,c,d)2, (a,b,c,e,f,c,b,d),
(a,c,b,e,f,b,c,d)2, (a,c,b,e,f,b,c,e,f,c,b,d)]
Hàm γ định nghĩa kỹ thuật "Play-in" đã mô tả ở phần 1.2.4 Dựa trên L2,
một thuật toán phát hiện quy trình γ có thể phát hiện các WF-net thể hiện
trong hình 1.3 , tức là, γ (L2) = (N2, [start]) Mỗi trình tự trong L2 tương ứng với một trình tự có thể có của WF-net N2 trong hình 1.3 Vì vậy, rất dễ dàng
để thấy rằng WF-net thực sự có thể mô tả lại tất cả các trình tự trong các bản ghi sự kiện
Dựa trên bản ghi sự kiện L2, một số hàm γ có thể khám phá WF-net N2 như hình 1.3 WF-net này có thể xem lại tất cả các dấu vết trong bản ghi Tuy nhiên, không phải tất cả các trình tự N2 tương ứng với dấu vết trong L2 Ví dụ, trình tự (a, c, b, e, f, c, b, d) không xuất hiện trong L2 Trong thực tế, có vô hạn các trình tự vì các cấu trúc vòng lặp trong N2 Rõ ràng, những điều này không thể xuất hiện trong tất cả các bản ghi sự kiện Do đó, định nghĩa 1.1 không yêu cầu tất cả các trình tự của (N, M) là dấu vết L
Hình 1.3: WF-net N2 được phát hiện cho L2 = [(a,b,c,d)3, (a,c,b,d)4, (a,b,c,e,f,b,c,d)2, (a,b,c,e,f,c,b,d), (a,c,b,e,f,b,c,d)2, (a,c,b,e,f,b,c,e,f,c,b,d)]
Trong phần này, ta tập trung vào phát hiện quy trình trên lưới Petri bởi vì lưới Petri đơn giản và trực quan nhưng vẫn cho phép mô hình hóa truy cập đồng thời, lựa chọn, và lặp Điều này được minh họa qua hình 1.3 Lưới N2 là
Trang 26một WF-nets mạnh Mặc dù ta thấy trong phần này, WF-nets được sử dụng để phát hiện quy trình Nhưng điều đó không có nghĩa là phát hiện quy trình không thể thực hiện bằng các ngôn ngữ khác Có nhiều kỹ thuật chuyển từ lưới Petri sang các ngôn ngữ khác để phục vụ nghiên cứu giải thuật và phát triển
Có bốn chỉ tiêu chất lượng của một mô hình quy trình được phát hiện:
- Phù hợp: mô hình phát hiện nên cho phép các hành vi nhìn thấy trong
bản ghi sự kiện
- Chính xác: các mô hình phát hiện ra không nên cho phép các hành vi
hoàn toàn không liên quan đến những gì được thấy trong các bản ghi sự kiện
- Khái quát: mô hình phát hiện nên khái quát các hành vi ví dụ nhìn thấy
được trong bản ghi sự kiện
- Đơn giản: các mô hình phát hiện nên càng đơn giản càng tốt
Phát hiện lại quy trình
b.
Phát hiện và sử dụng mô hình quy trình chỉ một hoặc một vài lần từ các bản ghi sự kiện ban đầu là điều không hiệu quả Thay vào đó cần có các kỹ thuật để kiểm tra tính chính xác của thuật toán, phát hiện lại quy trình, từ đó
có thể có biện pháp tối ưu thuật toán hoặc mô hình quy trình
Vấn đề phát hiện lại quy trình có thể được mô tả qua sơ đồ sau:
Hình 1.4: Vấn đề phát hiện lại quy trình: phát hiện mô hình quy trình N’
tương đương với mô hình quy trình gốc N
Mô hình
gốc N
Mô hình phát hiện lại N’
Trang 27Trên hình 1.4 ta thấy, điểm bắt đầu là một mô hình quy trình, ví dụ, một WF-net N Dựa trên mô hình này chúng ta có thể chạy nhiều thí nghiệm mô phỏng và ghi lại các sự kiện mô phỏng trong một bản ghi sự kiện Giả định rằng các bản ghi sự kiện hoàn thành đối với một số tiêu chí Sử dụng các bản ghi sự kiện hoàn chỉnh như là đầu vào cho một thuật toán phát hiện quy trình (ví dụ, thuật toán Alpha), chúng ta có thể xây dựng một mô hình mới Vấn đề được đặc ra là mô hình được phát hiện lại N’ và mô hình gốc N có gì tương đương Tương đương có thể được xem xét tại nhiều mức độ khác nhau Tất nhiên ý định phát hiện lại quy trình không nhắm đến tên hay bố cục ban đầu
mà tập trung nhiều hơn vào hành vi khi so sánh mô hình được phát hiện lại với mô hình gốc
Nhiều khái niệm tương đương có thể được xác định Ở đây, ta mô tả hai khái niệm: tương đương dấu vết và tương đương mô phỏng Tương đương dấu vết xem xét hai hệ thống chuyển tiếp là tương đương nếu tập các trình tự thực hiện giống hệt nhau Hai hệ thống chuyển tiếp là tương đương mô phỏng nếu hệ thống đầu tiên có thể "bắt chước bất kỳ động thái nào" của hệ thống thứ hai, và ngược lại Tương đương mô phỏng là một quan hệ tương đương mạnh hơn tương đương dấu vết, tức là, nếu hai hệ thống chuyển tiếp là tương đương mô phỏng, thì chúng cũng tương đương dấu vết
Trang 28toán Hơn nữa, các kỹ thuật kiểm tra phù hợp này cũng có thể được sử dụng
để đo lường hiệu suất của thuật toán phát hiện quy trình và sửa chữa các mô hình không phù hợp với thực tế
Hình 1.5: Kiểm tra phù hợp
Hình 1.5 minh họa các ý tưởng chính của kiểm tra phù hợp Các hành vi của một mô hình quy trình và các hành vi ghi lại trong một bản ghi sự kiện được so sánh để thấy sự tương đồng và khác biệt Kết quả phân tích nằm trong các biện pháp kiểm tra phù hợp toàn cục và địa phương Việc giải thích
sự không phù hợp phụ thuộc vào mục đích của mô hình Nếu mô hình dùng
để mô tả, sự khác biệt giữa mô hình và bản ghi cho thấy mô hình cần phải được cải thiện để nắm bắt thực tế tốt hơn Nếu mô hình này là bản chuẩn, thì
sự khác biệt này có thể được hiểu theo hai cách Một số khác biệt tìm thấy có thể cho thấy những sai lệch không mong muốn hoặc khác biệt có thể cho thấy
độ lệch mong muốn Ví dụ, người lao động có thể đi làm lệch giờ để phục vụ khách hàng tốt hơn hoặc để xử lý các tình huống không lường trước của mô hình quy trình Trong thực tế, tính linh hoạt và sự không phù hợp thường tương quan tích cực
Kiểm tra địa phương Kiểm tra địa
phương
Kiểm tra phù hợp toàn cục
Bản ghi
sự kiện
Mô hình quy trình
Trang 29Khi kiểm tra phù hợp, hai góc độ quan trọng là để thấy độ lệch là: (a) mô hình này "sai" và không phản ánh thực tế ("Làm thế nào để cải thiện mô hình này?"), Và (b) Các trường hợp khác với các mô hình và hành động khắc phục
là cần thiết ("Làm thế nào để cải thiện kiểm soát để thực thi một sự phù hợp tốt hơn?") Kỹ thuật kiểm tra phù hợp nên hỗ trợ cả hai quan điểm Do đó, hình 1.5 cho thấy độ lệch ở cả hai bên
Kiểm tra phù hợp theo trường hợp replay
ta sử dụng một khái niệm phù hợp được xác định ở cấp độ của sự kiện hiệu quả hơn là dấu vết đầy đủ
Trong tính toán phù hợp ngây thơ vừa mô tả, ta dừng phát lại một dấu vết khi ta gặp phải một vấn đề và đánh dấu nó như không phù hợp Bây giờ ta chỉ cần tiếp tục phát lại các dấu vết trên các mô hình nhưng ghi lại tất cả các tình huống mà một quá trình chuyển đổi buộc phải thực hiện mà không được kích hoạt, tức là, ta đếm tất cả các thẻ còn thiếu Các loại thẻ bao gồm: thẻ sản xuất (thẻ p), thẻ tiêu thụ (thẻ c), thẻ còn lại (thẻ r), thẻ bị thiếu (thẻ m) Thẻ p được tạo ra khi bắt đầu một hoạt động, thẻ c được tạo khi khi kết thúc một hoạt động, thẻ m tạo ra khi một hoạt động không bị thiếu, thẻ r là các thẻ còn lại ở các vị trí bị thiếu hoặc lỗi
Trang 30Sau ghi phát lại toàn bộ các trường hợp, ta tính toán độ phù hợp bằng cách tính tỉ lệ các thẻ theo công thức sau:
Công thức trên tính độ phù hợp cho 1 trường hơp, để tính độ phù hợp cho cả bản ghi sự kiện, ta sử dụng công thức sau:
Lưu ý rằng Σσ∈L L (σ) × mN, σ là tổng số thẻ còn thiếu khi phát lại toàn bộ bản ghi sự kiện, vì L (σ) là tần số của dấu vết σ và mN, σ là số thẻ còn thiếu cho một trường hợp duy nhất của các σ Giá trị của giá trị của độ phù hợp là
từ 0 (phù hợp rất kém; không có các thẻ được sản xuất được tiêu thụ và tất cả các thẻ được tiêu thụ là mất tích) và 1 (phù hợp hoàn hảo, tất cả các trường hợp có thể được thực hiện lại mà không có bất kỳ vấn đề Thông thường, độ phù hợp dựa trên sự kiện cao hơn so với phù hợp ngây thơ dựa trên trường hợp Bên cạnh đó, thông qua số lượng thẻ ở từng vị trí, phát lại bản ghi sự kiện trên mô hình cũng có thể đưa ra một số chẩn đoán các vấn đề phù hợp và cho thấy mức độ nghiêm trọng của chúng Mặc dù fitness (L, N) là một biện pháp tập trung vào thẻ trong vị trí, ta sẽ giải thích nó như là một biện pháp trên sự kiện Một cách trực quan, fitness (L, N) = 0,9 là khoảng 90% trong những sự kiện có thể được tái hiện lại một cách chính xác
Như hình 1.6 cho thấy, một bản ghi sự kiện có thể được chia thành hai loại: bản ghi sự kiện chỉ chứa các trường hợp phù hợp và bản ghi sự kiện chỉ bao gồm các trường hợp không phù hợp Mỗi một bản ghi sự kiện có thể được
sử dụng để phân tích thêm Ví dụ, người ta có thể xây dựng một mô hình quy trình cho các bản ghi sự kiện chỉ chứa các trường hợp sai lệch Sau đó, khai
Trang 31phá dữ liệu và khai phá quy trình có thể được sử dụng Đối với bản ghi chứa các trường hợp phù hợp, có thể sử dụng kỹ thuật phân loại để điều tra thêm sự không phù hợp
Hình 1.6: kiểm tra sự phù hợp cung cấp các biện pháp phù hợp toàn cục như
fitness(L, N) và chẩn đoán địa phương
Ý tưởng để phát lại bản ghi sự kiện trên các mô hình quy trình không giới hạn trong lưới Petri mà có thể thực hiện trên các ngôn ngữ mô hình khác Trong phần này, ta tập trung hoàn toàn vào phù hợp Đây chỉ là một trong bốn tiêu chí chất lượng được trình bày trong phần 1.3.2 Để kiểm tra sự phù hợp,
ba tiêu chí khác cũng có liên quan Kỹ thuật phát lại cũng có thể được sử dụng
để phân tích chính xác và tổng quát
Kiểm tra phù
hợp toàn cục
Kiểm tra địa phương
Bản ghi sự kiện mới: phục vụ các kỹ thuật khai phá dữ liệu, quy trình Lọc ra
Trang 32Kiểm tra phù hợp theo so sánh vết
1.4.3.
Một vết, tức là một ma trận cho thấy sự phụ thuộc quan hệ nhân quả Một ma trận như vậy là đặc trưng của bản ghi sự kiện Rõ ràng, mô hình quy trình cũng có một vết: chỉ đơn giản là tạo ra một bản ghi sự kiện đầy đủ, tức
là, Play-out trình tự thực hiện mô hình và ghi lại
Điều thú vị là cả các mô hình và các bản ghi sự kiện có dấu vết Điều này cho phép so sánh bản ghi và mô hình như vừa mô tả và so sánh mô hình
và bản ghi "đồng ý" về trật tự của các hoạt động So sánh các dấu vết của hai
mô hình quy cho phép xác định số lượng tương tự của chúng So sánh các dấu vết của hai bản ghi sự có thể được sử dụng để phát hiện các khái niệm bị trôi dạt Các khái niệm trôi dạt đề cập đến tình hình trong đó quá trình này đang thay đổi khi được phân tích
Các kỹ thuật phát lại thẻ của mô tả trong phần 1.4.2 và sự so sánh các ma trận dấu vết có thể được sử dụng để kiểm tra sự phù hợp của một bản ghi sự kiện và toàn bộ mô hình quy trình
Ứng dụng khác của kiểm tra phù hợp
1.4.4.
Kiểm tra sự phù hợp có thể được sử dụng để cải thiện sự liên kết của các quá trình kinh doanh, tổ chức, và các hệ thống thông tin Kiểm tra phù hợp có thể được sử dụng cho các mục đích khác như sửa chữa các mô hình và đánh giá thuật toán quá trình khám phá Hơn nữa, thông qua việc kiểm tra phù hợp các bản ghi sự kiện được kết nối với các mô hình quy trình và do đó cung cấp
cơ sở cho tất cả các loại phân tích
Sửa chữa mô hình
a.
Khi một mô hình quy trình và một bản ghi sự kiện "không đồng ý" về quy trình, điều này sẽ dẫn đến sự thích ứng của các mô hình hoặc các chính quy trình Kiểm tra phù hợp có thể được dùng để sửa chữa mô hình, tức là, gắn nó với thực tế bằng cách sử dụng các chẩn đoán về thẻ như đã trình bày ở
Trang 33trên để chỉnh sửa lại các hoạt động, các đường dẫn, truy cập đồng thời,… So sánh các ma trận dấu vết của các bản ghi và mô hình sẽ hiển thị các vấn đề tương tự Những thông tin này có thể được sử dụng bởi người thiết kế để sửa chữa các mô hình
Đánh giá các thuật toán phát hiện quy trình
b.
Phát hiện quy trình là một nhiệm vụ phức tạp và nhiều thuật toán đã được đề xuất trong các tài liệu Rõ ràng, kiểm tra phù hợp liên quan chặt chẽ đến việc đo độ phù hợp của một mô hình đã được phát hiện Do đó, kiểm tra phù hợp cũng có thể được sử dụng để đánh giá và so sánh các thuật toán phát hiên quy trình Mặc dù trọng tâm của kiểm tra phù hợp theo trường hợp phát lại thẻ trong phần 1.4.2 là về khía cạnh phù hợp, phát lại cũng có thể được sử dụng đối với các khía cạnh chính xác và tổng quát Ngoài ra các ma trận dấu vết có thể được sử dụng để phân tích chính xác và tổng quát Kiểm tra phù hợp không liên quan đến các khía cạnh đơn giản Rõ ràng, một thuật toán phát hiện quy trình tạo nên các mô hình đơn giản nhất mà có khả năng giải thích hành vi
Kết nối bản ghi sự kiện và mô hình quy trình
c.
Trong khi phát lại các mô hình, các sự kiện trong bản ghi có liên quan đến hoạt động trong mô hình Bằng cách liên kết các sự kiện để hoạt động, thông tin từ các bản ghi có thể được sử dụng để làm giàu cho quy trình này Phát lại thẻ có thể được sử dụng để thiết lập một kết hợp chặt chẽ giữa các cấp độ mô hình và sự kiện
Các thuộc tính cung cấp thông tin có giá trị khi được kết nối với các hoạt động Ví dụ, nhãn thời gian có thể được sử dụng để hình dung vướng mắc, thời gian chờ đợi, vv dữ liệu tài nguyên gắn liền với các sự kiện có thể được
sử dụng để học các kiểu làm việc và nguyên tắc phân bổ Thông tin chi phí có thể được chiếu lên mô hình quá trình để xem sự thiếu hiệu quả Phần tiếp theo
sẽ trình bày vấn đề này
Trang 34MỞ RỘNG QUY TRÌNH
1.5.
Trong phần này, luận văn cho thấy rằng một mô hình quy trình có thể được mở rộng với các quan điểm bổ sung trích ra từ các bản ghi sự kiện Hình 1.7 phác thảo cách tiếp cận để có được một mô hình tích hợp đầy đủ bao gồm tất cả các khía cạnh liên quan của quá trình này Các phương pháp tiếp cận bao gồm năm bước:
Bước 1: Thu thập bản ghi sự kiện và trích xuất dữ liệu sự kiện từ các hệ thống liên quan đến quy trình, dữ liệu sự kiện này sẽ được sử dụng ở nhiều mục đích khác nhau
Bước 2: Tạo hoặc phát hiện mô hình quy trình Sử dụng các thuật toán phát hiện quy trình để tìm ra được mô hình quy trình Bên cạnh đó, các mô hình được xây dựng bằng tay cũng có thể được sử dụng
Bước 3: Kiểm tra phù hợp: theo trường hợp replay hoặc theo ma trận dấu vết Ở bước này, ta có thể kiểm tra xem thuật toán phát hiện quy trình đã tối
ưu chưa, hoặc mô hình quy trình có cần sửa chữa gì không, bên cạnh đó có thể kết nối dữ liệu sự kiện và mô hình quy trình để có thể có thêm nhiều quan điểm đối với mô hình quy trình
Bước 4: Mở rộng mô hình quy trình Mô hình quy trình được mở rộng bằng cách thêm các quan điểm như quan điểm tổ chức, quan điểm thời gian, quan điểm trường hợp, và một số quan điểm khác từ đó ta có thể hiểu rõ hơn
về tính hiệu quả của việc tổ chức nhân sự, công việc, hay sắp xếp thời gian làm việc, phân bổ nhân viên, cũng như có thể nắm được khả năng ứng phó với nhiều trường hợp thực tiễn của quy trình, từ có có biện pháp khắc phục, sửa chữa quy trình sao cho hiệu quả và tương thích với thực tế nhất
Các bước 1, 2, 3 tương ứng với các nội dung đã trình bày ở các phần trước Ta tiếp tục nghiên cứu các phương pháp mở rộng mô hình quy trình ở bước 4
Trang 35Hình 1.7: Mô hình tích hợp bao gồm quan điểm tổ chức, thời gian và
sử dụng để tìm hiểu thêm về con người, máy móc, cơ cấu tổ chức (vai trò và các phòng ban), phân phối công việc, và các mẫu làm việc
Trang 36Bằng cách phân tích một bản ghi sự kiện như trong bảng 1.3, có thể phân tích các mối quan hệ giữa các nguồn lực và các hoạt động
Bảng 1.3: Một bản ghi sự kiện đơn giản với thông tin nguồn lực được làm
nổi bật
1 (aPete, bSue, dMike, eSara, hPete)
2 (aMike, dMike, cPete, eSara, gEllen)
Bảng 1.4: Bảng nguồn lực hoạt động cho thấy thời gian trung bình một người
thực hiện một hoạt động cho mỗi trường hợp
Trang 37trong nhật ký và các đơn vị tổ chức Trong hình 1.8 nút x, y, và z có thể tham chiếu đến người Các nút trong một mạng xã hội cũng có thể tương ứng để tổng hợp các đơn vị tổ chức như: vai trò, nhóm, và các phòng ban Các cung trong một mạng xã hội tương ứng với các mối quan hệ giữa các thực thể tổ chức như vậy Các cung và các nút có thể có trọng lượng Trọng lượng của một cung hay nút chỉ ra tầm quan trọng của nó
Hình 1.8: Một mạng xã hội bao gồm các nút đại diện cho các tổ chức và cung đại diện cho mối quan hệ Cả hai nút và vòng cung có thể có trọng lượng
Phát hiện cấu trúc tổ chức
b.
Các hành vi của một nguồn tài nguyên có thể được đặc trưng bởi một hồ
sơ cá nhân, tức là, một vector chỉ ra cách mỗi hoạt động đã được thực hiện bởi các tài nguyên thường xuyên như thế nào Bằng cách sử dụng hồ sơ như
Trang 38vậy, các kỹ thuật phân nhóm khác nhau có thể được sử dụng để khám phá nguồn tài nguyên tương tự Các tính năng khác có liên quan của các nguồn tài nguyên (uỷ quyền, tiền lương, tuổi, vv) có thể được bổ sung vào hồ sơ trước khi phân cụm Tất cả điều này phụ thuộc vào các thông tin có sẵn Sau khi phân nhóm các nguồn lực thành các nhóm, các nhóm này có thể liên quan đến các hoạt động trong quá trình này Hình 1.9 cho thấy kết quả cuối cùng bằng cách sử dụng vai trò phát hiện trước đó
Hình 1.9: Mô hình tổ chức được phát hiện dựa trên bản ghi sự kiện
Phân tích hành vi của nguồn lực
Xem lại yêu cầu
Chi trả bồi thường
Từ chối yêu cầu
Trang 39dụ, thời gian sử dụng và đáp ứng của các nguồn tài nguyên có thể được hiển thị
Giả sử rằng các bản ghi sự kiện có chứa thông tin chất lượng cao, bao gồm các nhãn thời gian chính xác và các loại giao dịch, hành vi của các nguồn tài nguyên có thể được phân tích chi tiết
Thêm quan điểm thời gian và xác suất
1.5.2.
Các quan điểm thời gian liên quan tới thời gian và tần số của các sự kiện Trong hầu hết các bản ghi sự kiện, sự kiện có một nhãn thời gian Sự chi tiết của các nhãn thời gian có thể thay đổi Sự hiện diện của nhãn thời gian cho phép phát hiện các vướng mắc, phân tích các mức dịch vụ, giám sát việc sử dụng tài nguyên, và dự đoán thời gian xử lý các trường hợp chạy còn lại Bằng cách thực hiện kỹ thuật phát lại thẻ trên thuộc tính nhãn thời gian,
ta có thể nắm được các thông tin sau:
- Hình dung thời gian chờ đợi và thời gian dịch vụ Các hoạt động với
một sự biến đổi cao trong thời gian chờ đợi và thời gian dịch vụ có thể được nhấn mạnh trong các mô hình
- Phát hiện nút thắt cổ chai và phân tích Các bản ghi chứa các trường
hợp chậm trễ có thể được phân tích riêng biệt để tìm nguyên nhân gốc rễ cho
sự chậm trễ
- Luồng thời gian và phân tích mức độ thỏa thuận dịch vụ Thời gian
giữa hai hoạt động có thể sử dụng để giám sát mức độ thỏa thuận dịch vụ Sự không phù hợp đối với một mức độ thỏa thuận dịch vụ như vậy có thể được đánh dấu bằng các mô hình
- Phân tích các tần số và sử dụng Trong khi phát lại các mô hình, thời
gian và tần số được thu thập Chúng có thể được sử dụng để hiển thị xác suất định tuyến trong mô hình Bằng cách kết hợp tần số và thời gian phục vụ trung bình, người ta cũng có thể tính toán việc sử dụng các nguồn tài nguyên Điều
Trang 40này cho thấy rằng phát lại có thể được sử dụng để phân tích hành vi của tài nguyên
Thêm quan điểm trường hợp
1.5.3.
Quan điểm của trường hợp tập trung vào tính chất của các trường hợp Mỗi trường hợp được đặc trưng bởi các thuộc tính trường hợp của mình, các thuộc tính của các sự kiện của nó, con đường thực hiện của trường hợp, và các thông tin hoạt động (ví dụ, luồng thời gian)
Các kỹ thuật khai phá quyết định được sử dụng nhằm mục đích tìm quy tắc giải thích sự lựa chọn về các đặc điểm của các trường hợp Khi đó, một kỹ thuật phân loại như cây quyết định có thể được sử dụng để tìm nguyên tắc như vậy Có thể có các vòng lặp trong mô hình Do đó, điểm quyết định tương
tự có thể được truy cập nhiều lần cho cùng một trường hợp Mỗi lần ghé thăm tương ứng với một hàng mới trong bảng được sử dụng bởi các thuật toán cây quyết định Sử dụng phát lại, kết quả của các quyết định có thể được xác định cho mỗi hàng
Các thủ tục có thể được lặp đi lặp lại cho tất cả các điểm quyết định trong một mô hình quy trình Các kết quả có thể được sử dụng để mở rộng mô hình xử lý, do đó kết hợp các quan điểm như vậy
Mô hình tích hợp kết quả từ các bước trong hình 1.7 có thể được sử dụng cho các mục đích khác nhau Trước hết, nó cung cấp một cái nhìn toàn diện
về quy trình này Điều này cung cấp những hiểu biết mới và có thể tạo ra những ý tưởng khác nhau để cải tiến quy trình Hơn nữa, mô hình tích hợp có thể được sử dụng như là đầu vào cho các công cụ và phương pháp tiếp cận khác Trong quá trình cấu hình của một hệ thống như vậy cho một quy trình
cụ thể, người ta cần phải cung cấp một mô hình kiểm soát luồng công việc và các quan điểm khác Các mô hình tích hợp cũng có thể được sử dụng để tạo ra một mô hình mô phỏng bao gồm tất cả các quan điểm Mô hình mô phỏng có