프로세스 마이닝
Process mining프로세스 마이닝은 이벤트 로그에 기반한 운영 프로세스 분석을 지원하기 위해 데이터 과학 및 프로세스 관리 분야와 관련된 기법의 제품군이다. 프로세스 마이닝의 목표는 이벤트 데이터를 통찰력과 행동으로 바꾸는 것이다. 프로세스 마이닝은 이벤트 데이터의 가용성과 프로세스 개선 욕구에 의해 촉발된 데이터 과학의 필수적인 부분이다.[1] 프로세스 마이닝 기술은 이벤트 데이터를 사용하여 사람, 기계 및 조직이 실제로 무엇을 하고 있는지를 보여준다. 프로세스 마이닝은 운영 프로세스가 수행하는 실행 경로를 식별하고 이들의 성능과 규정 준수 문제를 해결하는 데 사용할 수 있는 새로운 통찰력을 제공한다.
프로세스 마이닝은 이벤트 데이터에서 시작한다. 프로세스 마이닝에 대한 입력은 이벤트 로그 입니다. 이벤트 로그는 특정 각도에서 프로세스를 본다. 로그의 각 이벤트는 (1) 특정 프로세스 인스턴스에 대한 고유 식별자(사례 ID), (2) 활동(발생 중인 이벤트의 설명), (3) 타임스탬프를 포함해야 한다. 자원, 비용 등을 참조하는 추가적인 이벤트 속성이 있을 수 있지만, 이는 선택사항이다. 어느 정도 노력하면 운영 프로세스를 지원하는 어떤 정보 시스템에서도 그러한 데이터를 추출할 수 있다. 프로세스 마이닝은 이러한 이벤트 데이터를 사용하여 다양한 프로세스 관련 질문에 답한다.[2]
프로세스 마이닝 기법에는 프로세스 검색, 적합성 검사, 프로세스 개선의 3가지 주요 등급이 있다. 과거에는 워크플로 마이닝 및 ABPD(Automaticated Business Process Discovery)와 같은 용어가 사용되었다.
개요
프로세스 마이닝 기법은 다른 접근방법에 의해 프로세스에 대한 공식적인 설명을 얻을 수 없거나 기존 문서의 품질이 의심스러울 때 종종 사용된다.[4] 예를 들어, 프로세스 마이닝 방법론을 워크플로우 관리 시스템의 감사 추적, 기업 자원 계획 시스템의 트랜잭션 로그 또는 병원의 전자 환자 기록에 적용하면 조직의 프로세스를 기술하는 모델이 될 수 있다.[5] 또한 이벤트 로그 분석을 사용하여 관측치가 규범적 또는 서술적 모델에 적합한지 여부를 파악하기 위해 이벤트 로그를 이전 모델과 비교할 수 있다. 이벤트 로그 데이터를 사례 ID, 활동 및 타임스탬프[6] · [7]에 연결해야 한다.
BAM(Business Activity Monitoring), BOM(Business Operations Management), BPI(Business Process Intelligence)와 같은 동시대 경영 동향은 비즈니스 프로세스 관리 기술(예: Workflow Management Systems 및 기타 프로세스 인식 정보 시스템)의 맥락에서 진단 기능 지원에 대한 관심을 보여준다.) 프로세스 마이닝은 메인스트림 머신러닝, 데이터 마이닝, 인공지능 기법과는 다르다. 예를 들어, 프로세스 마이닝 분야의 프로세스 검색 기법은 순차적, 선택적 관계, 동시적, 루프 동작을 설명할 수 있는 엔드투엔드 프로세스 모델을 발견하려고 한다. 적합성 검사 기법은 전통적인 학습 접근법보다 최적화에 가깝다. 그러나 프로세스 마이닝은 머신러닝, 데이터 마이닝, 인공지능 문제 발생에 활용될 수 있다. 프로세스 모델을 발견하고 이벤트 로그를 정렬한 후, 기본적인 감독 및 감독되지 않은 학습 문제를 만들 수 있다. 예를 들어, 실행 사례의 남은 처리 시간을 예측하거나 컴플라이언스 문제의 근본 원인을 파악한다.
IEEE 프로세스 마이닝 태스크 포스는 IEEE 컴퓨터 인텔리전스 소사이어티의 일부로 2009년 10월에 설립되었다.[8] 벤더 중립적인 조직으로서, 공정 채굴의 연구·개발·교육·이해 촉진, 최종 사용자·개발자·컨설턴트·연구자 등을 공정 채굴의 첨단성을 인식하게 하고, 공정 채굴 기법과 도구의 활용을 촉진하고, 새로운 응용을 촉진하고, 표준화에 있어서의 역할을 도모하는 것을 목적으로 한다.이벤트 데이터 로깅 노력(예: XES)에 대해 튜토리얼, 특별 세션, 워크샵, 대회, 패널, 자료(페이퍼, 책, 온라인 코스, 영화 등)를 구성하여 현장에 새로 들어온 사람들에게 알리고 안내한다. IEEE 프로세스 마이닝 태스크 포스는 국제 프로세스 마이닝 컨퍼런스(ICPM) 시리즈를 [9]제정하고 이벤트 데이터 저장 및 교환을 위한 IEEE XES 표준 개발을 주도했으며,[11] 16개 언어로 번역된 프로세스 마이닝 매니페스토를[12] 작성했다.
데이터 과학의 역사와 장소
"공정 채굴"이라는 용어는 네덜란드의 컴퓨터 과학자 윌 반 데어 알스트("공정 채굴의 대부")가 쓴 연구 제안서에서 처음 만들어졌다. 이리하여 1999년 아인트호벤 대학에서 데이터 과학과 프로세스 과학과 관련된 기법의 산하에 등장한 새로운 연구 분야가 시작되었다. 초기에는 프로세스 마이닝 기법이 워크플로우 관리에 사용되는 기법과 함께 복잡해지는 경우가 많았다. 2000년에, 공정 발견에 실제로 적용 가능한 최초의 알고리즘인 "알파 광부"가 개발되었다. 바로 그 다음 해인 2001년에 "휴리스틱 광부"라고 불리는 휴리스틱스에 기초한 훨씬 유사한 알고리즘이 연구 논문에 소개되었다. 링크를 따라 더욱 강력한 유도 광부와 같은 알고리즘이 프로세스 검색을 위해 개발되었다. 공정 채굴 분야가 진화하기 시작하면서 적합성 점검은 필수적인 부분이 되었다. 2004년도는 적합성 검사를 위한 "토큰 기반 재생"의 개발을 명시했다. 프로세스 발굴과 적합성 확인의 주류 기법과는 별도로, 프로세스 마이닝은 2005년과 2006년에 각각 "성능 분석"과 "결정 마이닝" 그리고 "조직 마이닝"의 발견과 개발로 이어지는 여러 분야로 확장되었다. 2007년에는 사상 최초의 상업적 공정 채굴회사 '후투라파이'가 설립되었다. 공정 채굴과 관련된 규범과 기준을 간과하기 시작한 2009년 관리기구인 "IEEE on PM"이 결성되었다. 적합성 검사를 위한 추가 기법이 개발되어 2010년에 "정렬 기반 적합성 검사"를 발간하게 되었다. 2011년에는 사상 최초의 공정 채굴 책이 출간되었다. 2014년에는 프로세스 마이닝에 대한 Coursera에 의해 MOOC 코스가 제공되었다. 2018년까지 거의 30개 이상의 상업적으로 사용할 수 있는 공정 채굴 도구가 이 사진에 포함되었다. 2019년은 첫 번째 공정 채굴 회의가 개최되었다. 현재 35개 이상의 벤더가 프로세스 검색 및 적합성 검사를 위한 툴과 기술을 제공하고 있다.
프로세스 마이닝은 종종 데이터 과학과 관련된 분야로 잘못 해석된다. 프로세스 마이닝은 데이터 과학과 프로세스 과학 사이의 가교로 보아야 한다. 프로세스 마이닝은 여러 데이터 과학과 머신러닝 관련 문제를 형성할 수 있는 프로세스의 의미 있는 표현으로 이벤트 로그를 변환하는 데 초점을 맞춘다.
분류
공정 채굴 기술에는 세 가지 범주가 있다.
- 프로세스 검색: 공정 채굴의 첫 단계. 프로세스 검색의 주요 목표는 이벤트 로그를 프로세스 모델로 변환하는 것이다. 이벤트 로그는 해당 활동에 대한 타임스탬프와 함께 조직의 활동을 기록하는 모든 데이터 스토리지 시스템에서 가져올 수 있다. 이러한 이벤트 로그는 사례 ID(활동이 속하는 사례를 인식하는 고유 식별자), 활동 설명(실행된 활동에 대한 텍스트 설명), 활동 실행 시간 스탬프를 포함해야 한다. 프로세스 검색 결과는 일반적으로 이벤트 로그를 대표하는 프로세스 모델이다. 예를 들어 알파 알고리즘(실제적으로 구동되는 접근법), 휴리스틱 광부 또는 유도 광부와 같은 기법을 사용하여 이러한 프로세스 모델을 발견할 수 있다.[13] 이벤트 로그를 기반으로 프로세스 모델(예: Petri nets, BPMN 다이어그램, 활동 다이어그램, 상태 다이어그램, EPC)을 자동으로 구성하기 위해 확립된 많은 기법이 존재한다.[13][14][15][16][17] 최근 공정 채굴 연구는 다른 관점(예: 데이터, 자원, 시간 등)을 대상으로 하기 시작했다. 한 예는 소셜 네트워크 구축에 사용할 수 있는 (Aalst, Reijers, & Song, 2005)[18]에서 기술된 기법이다. 이제는 현장에서 처리해야 하는 지속적인 온라인 데이터로 작업할 수 있는 '스트리밍 프로세스 마이닝' 등의 기술이 개발되고 있다.
- 적합성 검사: 이벤트 로그와 기존 프로세스 모델의 불일치를 분석하기 위해 이벤트 로그를 비교하는 데 도움이 된다. 이러한 프로세스 모델은 수동으로 또는 발견 알고리즘의 도움을 받아 구성할 수 있다. 예를 들어, 프로세스 모델은 100만 유로가 넘는 구매 주문에는 두 개의 수표가 필요하다는 것을 나타낼 수 있다. 또 다른 예로는 이른바 포이(four eyes) 원칙을 견지하는 것이다. 적합성 검사는 편차를 탐지하거나(만족성 검사), 발견 알고리즘을 평가하거나 기존 프로세스 모델을 강화하는데 사용될 수 있다. 예를 들어 성능 데이터를 포함한 프로세스 모델의 확장, 즉 잠재적 병목 현상을 투영하기 위해 일부 priori 프로세스 모델을 사용한다. 또 다른 예로는 (Rozinat & Aalst, 2006b)[19]에서 설명한 의사결정 광부가 있는데, 이 광부는 선행 프로세스 모델을 취하고 프로세스 모델의 모든 선택사항을 분석한다. 이벤트 로그는 각 옵션에 대해 상담하여 선택이 이루어지는 순간 일반적으로 어떤 정보를 사용할 수 있는지 확인한다. 적합성 점검은 시스템 요구에 따라 사용되는 '토큰 기반 재생', '스트리밍 적합성 검사' 등 다양한 기법이 있다.그런 다음 어떤 데이터 요소가 선택에 영향을 미치는지 확인하기 위해 고전적인 데이터 마이닝 기법을 사용한다. 결과적으로, 의사결정 트리는 프로세스의 각 선택사항에 대해 생성된다.
- 성능 분석: 선험 모델이 있을 때 사용한다. 이 모델은 처리 시간, 주기 시간, 대기 시간, 비용 등의 추가 성능 정보로 확장되어 있어 적합성을 점검하는 것이 아니라 특정 공정 성과 조치와 관련하여 기존 모델의 성능을 향상시키는 것이 목표다. 예를 들어, 성능 데이터를 포함한 프로세스 모델의 확장, 즉 일부 이전 프로세스 모델은 성능 데이터를 사용하여 동적으로 주석을 달았다. 의사결정 규칙 및 조직 정보(예: 역할)와 같은 추가 정보로 프로세스 모델을 확장할 수도 있다.
참고 항목
참조
- ^ van der Aalst, Wil (2016). Process Mining: Data Science in Action.
- ^ van der Aalst, Wil (2011). Process Mining: Data Science in Action.
- ^ "Automated Business Process Discovery (ABPD)". Gartner.com. Gartner, Inc. 2015. Retrieved 6 January 2015.Gartner 정의.
- ^ "Gartner Top 10 Strategic Technology Trends for 2020". Gartner.
- ^ Kirchmer, M, Laengle, S, & Masias, V. (2013). 의료 환경에서 투명성 기반 비즈니스 프로세스 관리[최상위] Technology and Society Magazine, IEEE, 32(4), 14-16.
- ^ Luis M. Camarinha-Matos, Frederick Benaben, Willy Picard(2015). 협업 네트워크의 위험성과 복원력
- ^ 시므온 크리스토둘루, 라이마르 스케르(2016년). eWork and eBusiness in Architecture, Engineering and Construction: ECPPM 2016
- ^ "IEEE Task Force on Process Mining". Home page of the task force on process mining. IEEE Task Force on Process Mining. Retrieved 10 January 2021.
- ^ "International Process Mining Conference (ICPM) series". Home page of the ICPM conference series. IEEE Task Force on Process Mining. Retrieved 10 January 2021.
- ^ "IEEE Standard for eXtensible Event Stream (XES) for Achieving Interoperability in Event Logs and Event Streams". IEEE Standard for eXtensible Event Stream (XES). ieee. 11 November 2016. Retrieved 10 January 2021.
- ^ "eXtensible Event Stream (XES)". eXtensible Event Stream (XES). IEEE Task Force on Process Mining. 11 November 2016. Retrieved 10 January 2021.
- ^ "Process Mining Manifesto". Process Mining Manifesto. IEEE Task Force on Process Mining. 2011. Retrieved 10 January 2021.
- ^ a b Aalst, W. van der, Weijters, A. & Maruster, L. (2004) 워크플로 마이닝: 이벤트 로그에서 프로세스 모델 검색. IEEE 지식 및 데이터 엔지니어링 거래, 16(9), 1128–1142.
- ^ 아그라왈, R, 구노풀로스, D, & 레이만, F. (1998년) 워크플로 로그의 마이닝 프로세스 모델. 데이터베이스 기술 확장에 관한 6차 국제 회의(pp. 469–483)에서.
- ^ Cook, J, & Wolf, A. (1998년) 이벤트 기반 데이터에서 소프트웨어 프로세스 모델 검색. ACM Transactions on Software Engineering and Methodology, 7(3), 215–249.
- ^ 다타, A. (1998년) 현재의 비즈니스 프로세스 모델 검색 자동화: 확률론적 접근 방식 및 알고리즘적 접근 방식 정보 시스템 연구, 9(3), 275–301.
- ^ Weijers, A, & Aalst, W. van der(2003년). 리틀 썸을 사용하여 이벤트 기반 데이터에서 워크플로 모델 재발견 통합 컴퓨터 지원 엔지니어링, 10 (2), 151–162.
- ^ Aalst, W. van der, Beer, H, & Dongen, B. van (2005) 프로세스 마이닝 및 속성 검증: 시간적 논리에 기초한 접근법. R. Meersman & Z에서. T. 외 연구진(Eds). 2005년 의미 있는 인터넷 시스템으로 이동: CoopIS, DOA 및 ODBASE: OTM 연합 국제 회의, CoopIS, DOA 및 ODBASE 2005(Vol. 3760, 페이지 130–147) 베를린 스프링거-베를라크.
- ^ 로지낫, A, & Aalst, W. van der(2006a) 적합성 테스트: 이벤트 로그 및 프로세스 모델의 적합성 및 적합성 측정 C. Bussler 외 (Ed.)에서는 BPM 2005 워크샵(Bussler 등) (Vol. 3812, 페이지 163–176)을 참조한다. 베를린 스프링거-베를라크.
추가 읽기
- Aalst, W. van der(2016). 프로세스 마이닝: 실행 중인 데이터 과학. 베를린 스프링거 베를라크(ISBN 978-3-662-49850-7)
- 레인크메이어, L.(2020). 실행 중인 프로세스 마이닝: 원칙, 사용 사례 및 전망. 베를린 스프링거 베를라크(ISBN 978-3-030-40171-9)
- 카모나, J, 반동엔, B.F., 솔티, A., 웨이들리치, M. (2018) 적합성 검사: 프로세스 및 모델 관련. 베를린 스프링거 베를라크(ISBN 978-3-319-99413-0).
- Aalst, W. van der(2011년). 프로세스 마이닝: 비즈니스 프로세스의 검색, 컴플라이언스 및 개선. 베를린 스프링거 베를라크(ISBN 978-3-642-19344-6)
- Aalst, W. van der, Dongen, B. van, Herbst, J, Maruster, L, Schim, G, & Weijters, A. 워크플로우 마이닝: 문제 및 접근 방식 조사. 데이터 및 지식 엔지니어링, 47(2), 237–267.
- Aalst, W. van der, Reijers, H, & Song, M. (2005) 이벤트 로그에서 소셜 네트워크 검색. 컴퓨터 지원 협동 작업, 14(6), 549–593.
- Jans, M, Van der Ferf, J.M, Lybaert, N, Vanhof, K.(2011) 내부 거래 부정 행위 완화를 위한 비즈니스 프로세스 마이닝 애플리케이션, 애플리케이션 포함 Expert Systems, 38(10), 13351–13359
- 동엔, B. 밴, 메데이로스, A, 베르베크, H, 웨이스터즈, A, & Aalst, W. 반 데르(2005) ProM 프레임워크: 프로세스 마이닝 툴 지원의 새로운 시대. G. Ciardo & P. Darondau (Eds.)에서는 페트리 네트 2005의 적용과 이론 (Vol. 3536, 페이지 444–454)을 인용하였다. 베를린 스프링거-베를라크.
- 알스트, W. 반 데어 채굴을 위한 실무자 가이드: 직접 추적 그래프의 한계 엔터프라이즈 정보 시스템 국제 회의(Centeris 2019)에서 Procedia Computer Science 164권 321-328페이지. 엘스비에, 2019년.
- 그리고리, D, 카사티, F, 카스텔라노스, M, 다얄, U, 사얄, M, & Shan, M. (2004) 비즈니스 프로세스 인텔리전스. Industry의 컴퓨터, 533, 321–343.
- 그리고리, D, 카사티, F, 다얄, U, & Shan, M. (2001) 예외적인 이해, 예측 및 예방을 통한 비즈니스 프로세스 품질 개선. P. Apers, P. Atzeni, S. Ceri, S. Paraboschi, K. Ramamohanarao, & R. Snodgrass (Eds)에서, 매우 큰 데이터 베이스에 관한 제27차 국제 회의(VLDB'01)의 진행 (pp. 모건 카우프만
- IDS 쉐어. (2002). ARIS Process Performance Manager(ARIS PPM): 비즈니스 프로세스 성과 측정, 분석 및 최적화(whitepaper)
- 잉발슨, J.E. & J.A. 굴라. (2006년) 모델 기반 비즈니스 프로세스 마이닝. 정보 시스템 관리 저널, 23권, 1호, 비즈니스 인텔리전스에 관한 특별호, Auerbach 간행물
- Kirchmer, M, Laengle, S, & Masias, V. (2013). 의료 환경에서 투명성 기반 비즈니스 프로세스 관리[최상위] Technology and Society Magazine, IEEE, 32(4), 14-16.
- 주르 므를렌, M. (2004) 워크플로 기반 프로세스 제어: 워크플로우 기반 프로세스 정보 시스템의 기초, 설계 및 적용. 로고스, 베를린.
- 주르 므를렌, M, & 로즈만, M. (2000) 워크플로 기반 프로세스 모니터링 및 제어 – 기술 및 조직 문제 R. 스프래그(Ed.)에서는 제33회 하와이 시스템 과학 국제 회의의 진행 (HICS-33) (pp. 1–10)을 참조한다. 캘리포니아 로스앨러미토스의 IEEE 컴퓨터 협회 프레스
- 로지낫, A, & Aalst, W. van der(2006b). ProM에서 의사 결정 채굴. S. Dustdar, J. Faidiro, & A. Sheth(에드스)에서는, 국제 비즈니스 프로세스 관리 회의(BPM 2006) (Vol. 4102, 페이지 420–425). 베를린 스프링거-베를라크.
- Sayal, M, Casati, F, Dayal, U & Shan, M. (2002) 비즈니스 프로세스 콕핏. 제28차 대규모 데이터 베이스 국제 회의(VLDB'02) (pp. 880–883)에서. 모건 카우프만
- Huser V, Starren JB, EHR 데이터 사전 처리 프로세스 마이닝 촉진: 만성 신장 질환에 대한 응용 프로그램. AMIA Annu Common Proc 2009 링크
- Ross-Talbot S, 우리 산업에 대한 설명의 중요성과 가능성. 제10회 분산 컴퓨팅 기법에 관한 국제 연합 회의의 기조[1]
- 가르시아, 클리톤 두스 산토스, 마인첨, 알렉스 외 (2019) 프로세스 마이닝 기술 및 애플리케이션 – 체계적인 매핑 연구 » 응용 프로그램이 있는 전문가 시스템. 133: 260–295. ISSN 0957-4174. doi:10.1016/j.eswa.2019.05.003 [2]
- 판 데어 알스트, W.M.P.와 버티 A. 객체 중심 페트리 네트 발견. 푼다멘타티카, 175(1-4):1-40, 2020.