Process Mining with example

Preview:

Citation preview

فرایندکاویپروم رپیدو اجرای یک مثال ساده با آشنایی:اولقسمت

سلیمی بنیامین

۹۵زمستان دانشگاه صنعتی بیرجند

منابع

• processmining.org • rapidprom.org• janclaes.info• RM World 2014: Defining and executing process mining workflows presentation• Supporting Process Mining Workflows with RapidProM (Department of

Mathematics and Computer Science, Eindhoven University of Technology)• IEEE Process Mining Manifesto• Process Mining: Discovery, Conformance and Enhancement of Business Processes,

Springer Verlag, Berlin (ISBN 978-3-642-19344-6).• Rozinat, A., & Aalst, W. van der (2006a). Conformance Testing: Measuring the Fit and

Appropriateness of Event Logs and Process Models. In C. Bussler et al. (Ed.), BPM 2005 Workshops (Workshop on Business Process Intelligence) (Vol. 3812, pp. 163–176). Springer-Verlag, Berlin.

فرایند کاوی چیست؟

که میباشد جوانیموضوع نسبتًا ) mining Process :انگلیسی به( فرایند کاوش یا فرایندکاوی•سو قرار دیگراز آنالیزو مدلسازی فرایندهای سازمان سو و یکاز دادهکاوی و هوش محاسباتی بین

میگیرد سنتی است BPMو کاوریداده بینشده گمحلقه کاوی فرایند• قابل انطباق با ساختار های داده کاوی نظیر درخت تصمیم نیست•اربر چه با دانش استخراج شده از تاریخچه رویداد های میتوان پیش بینی های نظیر اینکه یک ک•

نه ( انالین زمانی محصول خود را دریافت میکند احنام داد، پس میتواند این تکنیک ها را به صورت نیز به کار گرفت) منظور استفاده برخط میباشد وبلزوما

اهداف فرایند کاوی

دانشخراج است طریقاز واقعی فرایندهای ارتقایو مانیتورینگ، کشف فرایند کاوشهدف •.میباشد امروزه اطالعاتی سیستمهایاز خوانششده قابل ذخیره دادههایاز این یریکارگو به اطالعاتی های سیستم رویداد های فایلاز دانشبه زبان ساده استخراج •

!ها سیستم ایندر جهت ارتقاع دانش

اویتفاوت فرایند کاوی و روش های کالسیک داده ک

مدلهای رویبر... قانون و کاوش، طبقهبندی، بندیخوشه نظیر دادهکاوی کالسیک تکنیکهای • میشوند ستفادها کلی فراینددر مشخصی گام آنالیز برایو فقط ندارند مترکز کارو کسب فرایندی

.دارد مترکز انتهابه انتها فرایندهای برروی فرایند کاوش•وسعه داد ت طوریمدل را میتوانثبت شده دادههایدر زمانی برچسباز استفاده بابه عنوان مثال •

وجود، م آنالیز روشهای برخالف. دهدرا نشان عملیاتیو زمان توان سرویس الیههای، گلوگاهها که مچنینه. حقایقبر مبتنیو هوشمند کامًالو نه داده محور، میباشدمحور فرایند، فرایند کاوش فرایند کاوش لیو هستندبر داده مبتنی دادهکاوی سنتی روشهایالبته . میباشد دادهکاوی بامرتبط .میباشد فرایندبر مبتنی

در فرایند کاوی چه چیزی را دنبال میکنیم؟

فرایندهای ایارتقو آنالیزو کشف برایثبت شده وقایع دادههایاز فرایندکاوی تکنیکهای• . میکنند استفاده کارو کسب

دانشاز فادهاست با واقعی فرایندهای ارتقایو مانیتورینگو کشف معنای، به فرایندکاوی• امروزه اطالعاتی سیستمهایموجود در ) Event Log( رویداد نگارههایاستخراج شده از

. میباشد.میباشد) دفراینمنونه یک نظیر(مورد یک بااشاره دارد و مرتبط فعالیت یکثبت شده به رویدادهر •

اصول رهنما در فرایند کاوی

:اصل اول •روسه برای آن شهروند درجه یک در نظر گرفته میشوند و باید به بهترین نحو پ) مشتری ها(متامی داده های •

در سیستم یکی از اهداف فرایند کاوی تصحیح همین بحث! (ها احنام گیرد فارغ از هر گونه بحث فرعی )های ماست

داده ها باید توسط سیستم های اطالعاتی کامل و صحیح وارد شده باشند•

سطح بلوغ داده های رویداد

رت به صو رویدادها.هستندقابل اعتماد، کامل و رویداد ها خوش تعریف : پنج ستاره•افی در این حریم شخصی به میزان ک مالحضات.میشوندو امن ذخیره خودکار،سیستماتیک

.هستندتعریف شده داری معانی واضح و صفاتشانرویداد ها و . داده ها حلاظ شدهعالیت به منونه فرایند و ف. هستندقابل اعتماد، کامل و رویداد ها خوش تعریف :چهار ستاره•

صورت صریح تعریف شده هستندتا حدودی ( ندرویداد ها به صورت خودکار ذخیره میشوند ولی سیستماتیک نیست: سه ستاره•

)میتوان صحت داده ها را تایید کرد کارراهمیشوند ولی محصول فرعی به حساب می آیند و چون ذخبرهخودکار : دو ستاره •

خیره نشوندحلاظ نشده ممکن است داده ها گم شوند یا درست ذ ذخبرهبرای سیستماتیکیها واقعیت کیفیت این رویدادها به شدت پایین است، ممکن است این رویداد: یک ستاره •

انداین رویداد ها به صورت دستی ذخیره شده . نداشته باشند، گم شوند

اصول رهنما در فرایند کاوی

.استخراج نگاره ها باید سوال احنام شود برای:دوماصل • میخواهیم مدل فرایند را به دست آوریم ؟• که داریم انطباق را چک کنیم ؟ هاییمیخواهیم بر اساس مدل و داده • که داریم بررسی احنام دهیم و مدل خود را بهینه سازی کنیم؟ هاییمیخواهیم بر اساس مدل و داده •

اصول رهنما در فرایند کاویشتیبانی جریان باید پ-همزمانی، انتخاب و سایر سازه های کنترل: اصل سوم•

شوندد مدل که داریم بای فرایندهاییزیادی مدل فرایند سازی وجود دارد با توجه به تعدا•

درست را انتخاب کنیم مزمان فعالیت ه چندیدنمثال برای تولید مدل های دنیای واقعی که مستعد داشنت •

خابی از همزمانی هستند، مدل نتیجه قادر به تولید رفتار بسیار باالست ولی اگر مدل انت !پشتیبانی نکند پیچیدگی به شدت باال میرود

اصول رهنما در فرایند کاوی ندهای مدل باش املانرویداد ها باید مرتبط با : اصل چهارم•

ممکن است بعد جریان نیست-همانطور که گفته شد فرایند کاوی مربوط به کشف کنترل•د چک دو بع... رمان را در نظر بگیرد، ممکن است چشم انداز سازمانی داشته باشد و

داشته های مدل انطباق املاناحتیاج دارد که بر دادهاییکردن انطباق و بهبود مدل به باشند

ا ر.. ) از نظر زمانی، منطقی و(که انطباق ندارند دادهاییدر فرایند چک کردن مدل •ناسایی درست مثل کاری که در ش(شناسایی کرده و یا آن ها را اصالح یا حذف میکنیم

)در داده کاوی احنام میدهیم نویز

اصول رهنما در فرایند کاوی

لقی مدل ها باید انتزاعی هدفمند از واقعیت ت: اصل پنجم• شوند وجه مدل های استخراج شده از داده های رویداد دید های مختلفی را ارائه میکند و با ت•

.مختلف دیدهای مختلفی خواهیم داشت ذینعفانبا .ندممکن است مدل های استخراج شده چندین دید مفید برای هر بخش داشته باش• .همیشه با این مدل ها به دید نقشه نگاه میکنیم•

اصول رهنما در فرایند کاوی

ه باشدفرایند کاوی باید یک فرایند پیوست: اصل ششم•اوی و و به خاطر ماهیت فرایند ک پویاستداده های که از فرایند ها داریم به صورت •

باشند باید فرایند که رفتارهای انسانی را مدل میکند و ممکن است مرتب در حال تغییریل گران را نفس پویایی و زندگی را در فرایند کاوی حلاظ ایجاد کرد و کاربران رو حتل

کرد که به صورت روزانه فرایند ها را بررسی کنند تشیوق ستم کمک کردتنها در صورت استمرار فرایند فرایند کاوی میتوان به بهبود عملکرد سی• . یستمدیریتی به آن نگر داشتبوردهای املانپیشنهاد میشوند به عنوان یکی از •

جایگاه سه بخش اصلی فرایند داده کاوی

مدل فرایند رویدادهای نگارهEvent logs

سیستم نرم افزاری

”دنیا“ ماشین ها سازمان ها

مردم فرایند های کسب کار

ها کامپونت

ل هاکنتر/ پشتیبانی ها

بهبود

چک کردن انطباق

کشف

رکوردها رویدادها،نظیر

پیغام ها ..ها و تراکنش

مشخص کردن دنکر پیکربندی

نپیاده سازی کرد آنالیز کردن

ها حتلیل مدلجتزیه و

وردی هایبر أساس داده فرایندکاوی کنیکهایت میشوند بندیدسته

)process discovery( فرایند کشف تکنیکهای• پیشینی اطالعات هیچاز استفادهمدل بدون یکو کرده دریافترا رویداد ثبتشده دادههای، ورودیعنوان ه ب•

میمنایند تولید )conformance checking(متابعت کردن چک تکنیکهای•

ثبت ادروید فایلآن در اطالعاتبوده و سازماندر حال اجرا در که ایی واقعی فرایند آیا که میکنند بررسی• بلعکسو میباشد مدنظر اولیهمدل هدف یک باشده است منطبق

)organizational mining( سازمانی کاوش تکنیکهای• دادتوسعه یاارتقا فرایندرا یکثبت شده رویداد دادههایاز استفاده با میشود آیا •

جایگاه سه بخش اصلی فرایند داده کاوی

Event log

Event log

Model

Event log

Model

Model

diagnostics

New Model

conformance checking

discovery

organizational mining

ابزار های فرایند کاوی

• ProM, developed at Eindhoven University of Technology by Wil van der Aalst and his research group.• PMLAB• Apromore• Process Mining functionality is also offered by the following commercial vendors:• Interstage Automated Process Discovery,[a Process Mining service offered by Fujitsu, Ltd. as part of the Interstage Integration

Middleware Suite.• Disco is a complete Process Mining software by Fluxicon.• ARIS Process Performance Manager, a Process Mining and Process Intelligence Tool offered by Software AG as part of the Process

Intelligence Solution.• QPR ProcessAnalyzer, Process Mining software for Automated Business Process Discovery (ABPD).• Perceptive Process Mining, the Process Mining solution by Perceptive Software (formerly Futura Reflect / Pallas Athena Reflect).• Celonis Process Mining, the Process Mining solution offered by Celonis• SNP Business Process Analysis, the SAP-focused Process Mining solution by SNP Schneider-Neureither & Partner AG• minit is a Process Mining software offered by Gradient ECM• myInvenio cloud and on-premises solution by Cognitive Technology Ltd.• LANA is a process mining tool featuring discovery and conformance checking.• ProcessGold Enterprise Platform, an integration of Process Mining & Business Intelligence.

؟ Promچرا

منت باز است• !رایگان است• با نرم افزار های داده کاوی یکپارچه میشود•متامی یک فریم ورک کامل طراحی شده برای این کار است که الگوریتم های آماده برای•

مراحل از قبیل آماده سازی و پردازش و بهینه سازی را در خود دارد

به تنهایی کافی نیست؟ Promچرا

عدم پشتیبانی از الگوریتم های داده کاوی و یادگیری ماشینی• علمی های آزمایشعدم پشتیبانی از • حتلیلو جتزیه تکراراز پشتیبانیعدم •

!است کاوی فرایند های افزارنرم اکثر گیردامن مشکالت این•

apidPromR: راه حل در مباحث آماری و یادگیری ماشینی رپیدمیانرامکان استفاده از امکانات • داشنت محیط استاندارد • عدم نیاز به یادگیری و یا آماده سازی محیط جدید•

RapidProm را چگونه نصب کنیم؟

عد از نصب نیاز به ب. را با توجه به سیستم عامل بارگیری و نصب کنیدرپید ماینر ابتدا باید •فزار منت باز نرم ا. داری تا بتوانید از این نرم افزار استفاده کنید ماینر رپید اکانتساخت

.در آن رایگان است اکانتمیباشد و همچنین ساخت •RapidProm نصب میشود ماینر رپیدبه عنوان یک افزونه از مخازن )Market place ( حجم

)را آموزش میدهیم راهکاراین ( مگابایت ۲۰۰ ماینر رپیدفزونه های و ماننده متام ا. بارگیری کنیدمارکت رپید ماینر میتوانید بسته را به صورت جداگانه از •

) ۶راهنمای کامل رپید ماینر ورژن (نصب میشود

فرایند کاوی اکتشافی

فرمت استاندارد داده های رویداد که توسط کتاب خوانه ( Xesفایل رویداد به فرمت •OpenXES بوده که از سایت ) پشتیبانی میشودrapidPromقابل بارگیری است

.استفاده شده ۷.۳ ورژن ماینر رپیددر این آموزش از •

Event log Modeldiscovery

پروسه فرایند کاوی اکتشافی

(Event log)رویدادوارد کردن فایل داده های بکشید Processرا انتخاب کرده و به تب import event logsگزینه Operatorsاز تب •

راهنمای وارد کردن داده را مشاهده میکنیدHelpدر تب •)۱(میتوانید فایل رویدادهای خود را وارد کنید پارمتراز تب •

پروممنایش داده ها در !وصل شود resultsها نیاز نیست که حتما داده به ورژندر بعضی 1.این عملیات را اجرا کنید2.

منودار پیش فرض

ای داده ها نقظهمنودار

منایش جدولی داده ها

میتوانید هر فرایند را موردی ببینید inspectorاز قسمت

گرافیکیمنایش فرایند ها به صورت

مشخصه های کشف شده از فرایند

در این قسمت خالصه ای در مورد داده ها میبینید

(discovery)اجرای الگوریتم اکتشاف برای داده هاندک درگعملیات قمستها مانند تصویر الگوریتم مورد نظر را به عملگرااز قسمت • است استنتاجیالگوریتم انتخابی ما یک الگوریتم •

الگوریتم وصل کنید و بعد خروجی وردیرا به ) import event log(خروجی داده های وارد شده •resultالگوریتم را به قسمت

)۱(نید را در از قسمت پارامتر الگوریتم انتخاب ک نویزروش کالس بندی و مقدار حداقل برای •پروسه را اجرا کنید•

(Model)حاصل اکتشاف داده های رویداد ما را مشاهده میکنید

چک کردن انطباق

در مرحله قبل مدل فرایند را به دست آوردیم حال میخواهیم این مدل را بر روی داده ها• .چک کنیم، تا دریابیم داده های ثبت شده تا چه حد از مدل ما پیروی میکنند

که برای تست در نظر گرفتیم نیز آزمایش شود هاییدر این قسمت میتوان داده • را در منودار پایین مشاهده میکنید conformance checkingفرایند •

Event log

Modeldiagnosticsconformance

checking

متابعاتپروسه فرایند چک کردن

مدل در بخش قبل به دست آمده بود

کنید درگرا مانند تصویر به قسمت عملیات conformance checking عملگر•یر داده های روی داد و مدل را دارد که مانند تصو وردیدو عملگرهمانطور که گفته شد این •

را به آن میدهیم وردیدو

.پردازش ها باید بدین صورت باشد•

ه ابزار در تصویر زیر خروجی را مشاهده میکنید با جعبببنید یکیگرافسمت راست میتوانید نتایج را به صورت

اهده از این تب میتوانید میخواهید چه چیزی را مش• کنیدیا حرکت مدل به حرکت داده ها بر روی مدل •

تنهایی

کلی از این تب میتوانید اطالعاتی•و زوم(در مورد نحوه منایش

) قوانین را ببینید

ت از این تب میتوانید داده کیس های به دس•ک مورد آماده را فیلتر کنید و فقط بخشی یا ی

.مدل ببینیداز آن را روی

و از این تب میتوانید از منودار د• نوع خروجی بگیرید

ل خروجی کیس ها به صورت فای• تصویر/ جدید

مثال از فیلتر کردن

. را انتخاب میکنیم تا و فیلتر را بر روی مدل اعمال میکنیم ۶کیس شماره •

غییر اینگونه تبا اعمال فیلتر منودار مدل • میکند

مراحل آبی اجرا شده و مراحل سفید و کم• رنگ اجرا نشده است

بررسی دسته ای کیس ها

بررسی کیس منطبق به هم بر روی مدل .اندمورد است که یک مسیر را روی مدل طی کرده ۳۸فراوانی این کیس • کیس قابل اعتماد است• )تکمیل شده استیجیمیتوان دید که چه انهابه ایستادن روی (قسمت های سبز رنگ •ن نشان داده در تصویر پایی(قسمت خاکستری قسمتی است که فقط روی مدل وجود دارد و در داده ها موجود منیباشد •

)تصمیم گیری ها را شامل میشود)(اندشده

!خطا های احتمالی

از مالاحتمشکل . (داشتند مکدلیل این خطا رو پیدا نکردم، چند نفر دیگه هم همی خطا رو تو • )جاوا هستش

!میکنیم ریستارتبرای رفع این خطا فقط سیستم عامل رو • https://github.com/rapidprom/rapidprom-source/issues/44: هاب گیتلینک •

Done!By Benyamin salimi

Benyamin.Salimi@Gmail.comhttp://www.slideshare.net/benyaminsalimi

Recommended