面向知识密集型业务过程的知识挖掘与推荐技术 - …ise.thss.tsinghua.edu.cn/CIMS2016/UploadFile/2016/report/...第 8 页 1.2 知识密集型工作流关键技术1.过程挖掘技术

第 0 页

面向知识密集型业务过程的

知识挖掘与推荐技术

汇报人：刘庭煜

第 1 页

报告内容提要

1. 业务过程管理与知识管理概述

2. 快速资源分配技术

3. 任务知识推荐技术

4. 总结与展望

第 2 页

1.业务过程管理与知识管理概述

第 3 页

1.1 复杂机电产品开发过程特点

某产品工艺准备业务流程示例

任务模型

型号工艺负责人

型号产品

工艺任务1

工艺任务1

工艺任务1

… …

专业工艺负责人

机加工工艺任务

工艺任务1

工艺任务1

工艺任务1

… …

工艺任务

分类

机加工工艺设计人

员

工艺任务1

工艺任务1

工艺任务1

… …

工艺任务

分配

工艺准备过程模型

填写工艺审

查记录卡

设计师审查

工艺记录卡修改图纸

工艺师审查

图样

正式图样归

档

机加工工艺规程设计与审批子流

程

钣金工艺规程设

计与审批子流程

焊接工艺规程设


总装工艺规程设


工装设计审核会签

工装设计结

果归档

编制工艺定

额

复核各种工

艺文件底图

工艺、工装

验证工艺总结

开始

AND-

Join

AND-

Split

批准

P5

P4 P3

P2P1

P6

P7

P8

P9

P12

P11

P10

P13

P14

P15P16P17

P18 P19 P20

P21P22

人员组织模型

角色模型组织结构十四所工艺部

总体室(701) 705

计划组编程组技术组

… …

… …

总工艺师

型号主任工艺

师A

型号主任工艺

师X

专业主任工艺

师A

专业主任工艺

师B

专业主任工艺

师Z

… …

… …

结束

任务执行

第 4 页

1.2 知识密集型工作流

工作流的主要工作模式

控制流模式

资源模式

数据模式

第 5 页

快速工艺准备与

工艺过程优化系统

1.1 复杂机电产品开发过程特点

业务过程管理工具

提升业务管理效率

加强知识管理

第 6 页


以数据为中心的工作流（Data-centric Workflow）已经成为业务过程管理领域新的研究趋势*。

*R. Hull, J. Su, and R. Vaculin, "Report on NSF Workshop on Data-Centric Workflows," 2009.

Rick HullIBM T.J. Watson

Wil van der AalstTU/e

Jianwen SuUC Santa Barbara

Conceptual elements of analytics and relationship to workflow

第 7 页

过程

管理

知识

管理

知识密集型业务过程管理


第 8 页


关键技术1.过程挖掘技术

过程挖掘技术，是一种从系统日志中发掘有用知识的技术，这些知识包括任务的控制流信息，也可以是系统的资源组织结构信息等。

关键技术2.基于过程的知识推荐技术

解决工作流任务执行阶段的知识推荐问题

流程配置

流程诊断

流程设计

流程执行

工作流程Workflow

流程挖掘

传统方案

挖掘结果反馈

流程组织挖掘

变化分析/符

合性测试

任务

知识

推荐

第 9 页


方法贡献者备注

Knowledge Flow Hai Zhuge中科院

ACM杰出科学家

信息过滤/NLP Duen-Ren Liu 台湾国立交通大学

文档分析/NLP Andreas Abecker KIT

Context-aware Matthias Born SAP Research

集成智能工厂情境 Frank Leymann德国斯图加特大学BPEL标准制定人

Business Artifact A. Nigam, R. Hull IBM T.J. Watson

Process Mining

Rakesh AgrawalIBM，美国工程院、ACM

及IEEE Fellow

Wil van der AalstTU/e，欧洲科学院、荷兰

皇家科学院 Fellow

第 10 页


工作流管理模式3.数据

1.资源

A1

A2

A4

A3

A5 …2.控制流

…

R1

R2

R3

分配分配

分配

分配

执行

实例化

第 11 页


知识密集型任务的生命周期

过程维

任务维

数据/知识维

任务转发

任务挂起

工作流任务工作项工作流活动实例化任务执行活动结束任务分配

任务执行知识

任务分配知识

过程模型知识

执行实例化工作流模型工作流案例案例结束

控制流模式资源模式数据流模式

第 12 页


知识密集型任务涉及的知识分类

系统本身的执行知识（设计/实例化阶段）

• 工作流日志

• 工作流模型

• 工作流执行资源

业务执行的内容知识（执行阶段）

• 任务要求

• 任务执行结果

第 13 页

1.3 报告主要内容安排

工作流闭环资源分配模块工作流程

基于本体的工作流情境模型WfCOM

基于Apriori的资源分配规则挖掘算法研究

基于关联规则的工作流资源分配

面向知识密集型任务生命周期的知识管理与推荐

情境感知的工作流任务知识推荐技术研究

第 14 页

2.快速资源分配技术工作流任务实例化阶段的快速资源分配技术

第 15 页

2.1 总体过程

日志

知识

Step 3. Rules generation Step 1. Resource allocation

Step 2. Task Execution and log generation

A D

AND-Split

B

C AND-Join

E

EventID ActID FlowID Staff CaseID SetDate

5313 5 68 Tony 207 2007-10-15 21:06

5314 5 68 Sam 207 2007-10-15 21:06

5315 5 68 Tony 207 2007-10-15 21:06

5316 5 68 Tom 207 2007-10-15 21:06

5317 1 68 Tony 207 2007-10-22 20:04

5318 1 66 Tony 209 2007-10-23 13:56

5319 1 66 Susan 209 2007-10-23 13:56

5320 2 66 Tony 209 2007-10-23 13:56

5321 2 66 Susan 209 2007-10-23 13:56

5322 3 66 Tony 209 2007-10-23 13:56

5323 3 66 Susan 209 2007-10-23 13:56EventID ActID FlowID Staff CaseID SetDate

5313 5 68 Tony 207 2007-10-15 21:06

5314 5 68 Sam 207 2007-10-15 21:06

5315 5 68 Tony 207 2007-10-15 21:06

5316 5 68 Tom 207 2007-10-15 21:06

5317 1 68 Tony 207 2007-10-22 20:04

5318 1 66 Tony 209 2007-10-23 13:56

5319 1 66 Susan 209 2007-10-23 13:56

5320 2 66 Tony 209 2007-10-23 13:56

5321 2 66 Susan 209 2007-10-23 13:56

5322 3 66 Tony 209 2007-10-23 13:56

5323 3 66 Susan 209 2007-10-23 13:56

ProcessProcess LogsLogs

Resource Allocation RulesResource Allocation Rules

Tony SamSam SusanSusan MaryMary TomTom

OrganizationOrganizationRoleRole

R1 R2 R3 O2

ResourceResource

Rule 1: ProcessID=1 TaskID=2 ==> ResourceID=4 conf:(0.59) lift:(5) lev:(0.01) [351] < conv:(2.16)>Rule 2: ProcessID=1 TaskID=2 ==> ResourceID=17 conf:(0.73) lift:(1.51) lev:(0) [328] < conv:(0.51)>Rule 3: ProcessID=1 TaskID=2 ==> ResourceID=13 conf:(0.47) lift:(3.75) lev:(0) [322] < conv:(1.95)>

O3O1Rule 1: ProcessID=1 TaskID=2 ==> ResourceID=4 conf:(0.59) lift:(5) lev:(0.01) [351] < conv:(2.16)>Rule 2: ProcessID=1 TaskID=2 ==> ResourceID=17 conf:(0.73) lift:(1.51) lev:(0) [328] < conv:(0.51)>Rule 3: ProcessID=1 TaskID=2 ==> ResourceID=13 conf:(0.47) lift:(3.75) lev:(0) [322] < conv:(1.95)>

Rule 1: ProcessID=1 TaskID=2 ==> ResourceID=4 conf:(0.59) lift:(5) lev:(0.01) [351] < conv:(2.16)>

Rule 2: ProcessID=1 TaskID=2 ==> ResourceID=17 conf:(0.73) lift:(1.51) lev:(0) [328] < conv:(0.51)>

Rule 3: ProcessID=1 TaskID=2 ==> ResourceID=13 conf:(0.47) lift:(3.75) lev:(0) [322] < conv:(1.95)>

New workflow instancesNew workflow instances

AdministratorAdministrator

Decision-makingDecision-making

TonyTony

Task A

SusanSusan

Task B

SamSam

Task C Task E

?

第 16 页

2.2 从日志到知识

EventID ActID FlowID Staff CaseID SetDate

5313 1 66 Tony 203 2007-10-15 21:06

5314 1 66 Sam 204 2007-10-15 21:09

5315 4 66 Mary 203 2007-10-15 21:10

5316 1 66 Sam 205 2007-10-15 21:11

5317 1 66 Tony 205 2007-10-15 21:13

5318 1 66 Tony 206 2007-10-16 13:46

5319 2 66 Tom 204 2007-10-16 13:47

5320 1 66 Sam 203 2007-10-16 13:49

5321 4 66 Susan 203 2007-10-16 13:50

5322 1 66 Mary 206 2007-10-16 13:51

5323 2 66 Mary 204 2007-10-16 13:52

5324 3 66 Tony 204 2007-10-16 13:53

5325 3 66 Tom 204 2007-10-16 13:54

5326 1 66 Sam 206 2007-10-16 13:55

5327 2 66 Tom 205 2007-10-16 13:56

5328 5 66 Susan 203 2007-10-16 14:02

5329 4 66 Sam 206 2007-10-23 14:04

5330 2 66 Mary 205 2007-10-23 14:05

5331 1 66 Susan 204 2007-10-23 14:06

5332 1 66 Mary 206 2007-10-23 14:08

5333 3 66 Sam 205 2007-10-23 14:10

5334 3 66 Susan 205 2007-10-23 14:13

5335 2 66 Tony 206 2007-10-23 14:14

5336 3 66 Susan 206 2007-10-23 15:31

5337 3 66 Tom 206 2007-10-23 15:33

5338 4 66 Sam 204 2007-10-23 15:37

5339 3 66 Susan 206 2007-10-23 15:38

5340 5 66 Tom 205 2007-10-23 15:42

5341 5 66 Susan 205 2007-10-23 15:43

5342 5 66 Tom 204 2007-10-23 15:44

5343 5 66 Susan 206 2007-10-23 15:47

5344 5 66 Tom 205 2007-10-23 15:50

工作流运行日志样例

( ,"1... ") ( ,"1... ")

( ," ... ")

pX

p tprocess X n task Y n

resource Z Terry Mary

(task)(process)

(process,resource,task)

(resource,task)(process,task)(process,resource)

(resource)

1 1 9p t r ,

1 9 1p r t ,

1 9 1t r p ,

1 1 9p t r ,

9 1 1r p t ,

1 9 1t r p ,

1 9p r ,

1 9t r ,

1 1p t ,

1 1t p

9 1r t

9 1r p

资源分配元规则

第 17 页

2.2 从日志到知识

资源分配规则挖掘 (DMQL)

第 18 页

2.3 基于Apriori的分配规则发现

算法原理

* Han, Jiawei, and Micheline Kamber. Data Mining:Concepts and Techniques.

Morgan Kaufmann, 2006. doi:citeulike-article-id:709476.

第 19 页

2.3 基于Apriori的分配规则发现

算法（伪代码）Mining Multidimensional association rules from workflow event logs. Algorithm: Frequent-pattern generation. Find frequent itemsets using an iterative

level-wise approach based on Apriori candidate generation.

Input: L, the workflow event log;

min_sup, the minimum support count threshold.

Output: 3F , frequent 3-itemsets in L.

Method:

(1) 1 _ _1 ( );F find frequent itemsets L

(2) for -1( 2; ; ){kk F k

(3) 1_ ( ) ;k kC apriori gen F

(4) for each transaction t L {//scan L for counts

(5) ( , ) ;t kC subset C t //get the subsets of t that are candidates

(6) for each candidate tc C

(7) .c c o u n t ;

(8) }

(9) { | . m i n _ s u p }k kF c C c count

(10) }

(11) return 33L LU ; //Generate frequent 3-itemsets with dimension

constraints.

Procedure 1_ ( ; ( 1) )kapriori gen F frequent k itemsets

(1) for each itemset 1 1kl F

(2) for each itemset 2 1kl F

(3) if (

(4) 1 2 1 2

1 2 1 2

( [1] [1]) ( [2] [2]) ...

( [ 2] [ 2]) (( [ 1] [ 1])

l l l l

l k l k l k l k

(5) )

(6) then {

(7) 1 2;c l l //joint step: generate candidates

(8) if has_infrequent_subset( c , 1kF ) then

(9) delete c ; //prune step: remove unfruitful candidate

(10) else add c to kC ;

(11) }

(12) return kC ;

Procedure has_infrequent_subset ( : ;c candidate k itemset

1 : ( 1)kF frequent k itemsets ); // use the prior knowledge

(1) for each ( 1)k -subset s of c

(2) if 1ks F then

(3) return TRUE;

(4) return FALSE;

第 20 页

2.4 试验数据概览

活动数据分布

第 21 页

2.4 试验数据概览

资源数据分布

0 3 6 9 12 15 18 21

1000

2000

3000

4000

5000

6000

Fre

qo

en

cy C

ou

nts

# of Resources

Frequency Counts of resources

第 22 页

2.5 参数选择策略

支持度-测准度关系

第 23 页

2.5 参数选择策略

支持度-强规则数关系

第 24 页

2.6 实验结果

L-3分布图

第 25 页

2.6 实验结果

测准度分布

第 26 页

2.6 实验结果

与现有方法实验结果对比*

方法预测准确数时间(s) 全局预测准确度(%)

Apriori-based approach 46663 20 61.452

SVM 46643 9268 61.426

C4.5 46656 17 61.443

ID3 45285 14 59.637

Naïve Bayes 28920 9 38.086

*Tingyu Liu, Yalong Cheng, and Zhonghua Ni, "Mining Event Logs to Support Workflow Resource Allocation," Knowledge-Based Systems, vol. 35, pp. 320-331, 2012.其他相关论文：刘庭煜, 易红, 倪中华, "面向快速工艺准备的闭环工作流管理系统的研究," 计算机集成制造系统, vol. 15, pp. 495-501, 2009.

第 27 页

2.7 实验结果讨论

案例1→

案例2→

第 28 页

2.8 小结

建立了闭环工作流资源管理框架

研究了基于Apriori的强资源分配规则的生成方法

研究了负相关资源分配规则的评价指标及标注方法

研究了基于置信度的资源分配规则的排序方案

基于工艺准备工作流管理系统中的真实日志数据进行了

实验验证

第 29 页

3.任务执行时的任务知识推荐技术工作流任务执行阶段的知识推荐技术

第 30 页

3.1 情境感知的TKRE总体方案

情境感知系统（context-aware system）：若一个系统运用情境，根据用户当前任务状况对用户提供相应的信息或者服务，那么这个系统就是情境感知的。 - DEY.A.K.（CMU）

步骤 1.建立工作流情境模型步骤 2.多维相似性计算及验证步骤 3.任务信息推荐

最佳候选

GA

WfCOM U L A D TS D D D D D

当前情境

历史情境

1 2 3 4 5, , , ,T

w w w w w w1

( , ) ( ) ( , )WfCOM

k

S

j j k d i j

k

Sim C C w d Sim C C

交叉验证

验证结果

Sim()

t24748552

32752411

24415124

32543213

32752411

24748552

32752411

24415124

2431

%

2329

%

2026

%

1114

%

(a)

初始种群

(b)

适应度

(c)

选择

32748552

24752411

32752124

24415411

3274152

24752411

32252124

24415417

(d)

交叉

(e)

突变

第 31 页

3.2 工作流情境模型WfCOM

常用情境建模方式比较**

** STRANG T, LINNHOFF-POPIEN C. A Context Modeling Survey , UbiComp 2004 Nottingham /

England, F, 2004 [C].

第 32 页


工作流管理系统中实体关系ER图

第 33 页


工作流本体的情境映射

wc.what

Workflowentity

is_a

is_a

resource

is_a

task

is_a

org_entity

has_roleb

elong_t

oengage

has_task

role

Orgunits

is_aproduct

prod_data

of

process

workflow context wc

wc.how

wc.who

wc.where

exec_time

wc.when

Role_1

Role_3Role_2

Role_2_2

Role_2_1

sub sub

sub sub

Role_1

Role_3Role_2

Role_2_2

Role_2_1

sub sub

sub sub

is_aengage

execute restricted_to

Legend: owl:Class rdfs:subClassOf owl:Property

第 34 页


WfCOM模型

Activity

WfCOMentity

Workflowentity

resourcetask

org_entity

role

Org units

Productstructure

prod_data

process

exec_time

engagedIn

hasTask

hasOrgRestriction

UserTime

DataLocation

isCon

text

hasRole

isC

onte

xt

isContext

isC

on

text

isConte

xt

att

ach

ed

_to

hasOrgRestriction

engag

e

isCon

text

onto_1

onto_3

onto_2

onto_2_2

onto_2_1

locatedIn

isMemberOf

onto_1

onto_3

onto_2

onto_2_2

onto_2_1

onto_1

onto_3

onto_2

onto_2_2

onto_2_1

onto_1

onto_3

onto_2

onto_2_2

onto_2_1

Product datainstances

Process ontology Org ontology Role ontology


通用工作流情境本体G-WfCOM

扩展工作流情境本体

Ext-

WfCOM

hasArtifact

inst

ance

s_of

timestamp

inst

ance

s_of in

stan

ces_

of

inst

an

ces_

of

isP

art

Of

Artifact

wc.what

Workflowentity

is_a

is_a

resource

is_a

task

is_a

org_entity

has_role

belo

ng_to

engage

has_task role

Orgunits

is_in

productstructure

prod_data

process

workflow context wc

wc.how

wc.who

wc.where

exec_time

wc.when

is_a

atta

ched

_to

execute

restricted_to


is_a

hasArtifact timestamp

Artifact

engage

第 35 页

3.3 工作流情境本体WfCOM

情境本体实例节点的属性的分类与内涵

rdfs 属性标签意义

rdfs:type 用于申明实例的种类

rdfs:label 用于表达实例的名称、标签等，通常以字符串形式存在

rdfs:comment 用于表达实例的文本描述，通常以长文本的形式存在

rdfs:subClassOf 用于描述类之间的父子（包含）关系

rdfs:subPropertyOf 用于描述属性之间的父子关系

rdfs:domain 用于申明属性的值域

rdfs:range 用于申明属性的定义域

第 36 页


主要RDF三元组

D1

D2

D3

D4

D5

RDF triples: RDF triples:

t1: <resource, rdfs:inContext, User>t2: <resource, rdfs:subClassOf, workflow_entity>t3: <role, rdfs:isContext, User>

……

t1: <exec_time, rdfs:isContext, Time>t2: <exec_time, rdfs:subClassOf, workflow_entity>

……

D1

D2

D3

t1: <task, rdfs:isContext, Activity>t2: <task, rdfs:in, process>t2: <process, rdfs:subClassOf, workflow_entity>

……t1: <prod_data, rdfs:isContext, Data>t2: <prod_data, rdfs:isContent, prod_structure>t3: <Artifacts, rdfs:subClassOf, prod_data>t4: <Artifacts, rdfs:subClassOf, prod_structure>

……

D4

D5

t1: <org_unit, rdfs:subClassOf, org_entity>t2: <org_unit, rdfs:isContext, Location>t3: <resource, rdfs:hasOrgUnit, org_unit> … ...

Refs=http://www.workflowcontext.org/ontologies/wfcom.owl#

D1: WfCOM.Location D2: WfCOM.User D3: WfCOM.Time

D4: WfCOM.Activity D5: WfCOM.Data

第 37 页

3.2 工作流情境本体WfCOM

多维工作流情境空间：

User维度，即用户维度

Location维度，即位置维度

Activity维度，即活动维度

V-Doc维度，即虚拟文档维度

Time维度，即时间维度

WfCOM User Location Activity Doc TimeS D D D D D

第 38 页

3.3 情境本体节点相似性计算

3.3.1.基于Jaro-Winkler的字符串语言学相似计算

3.3.2.基于向量空间模型的文本相似性计算

1 21 ,1 2

1 2

1 2 1

1( , )

3

S SS TS SJaro S S

S S S

Term x

Term y

1( )v d

( )iv d

2( )v d

1

1

0

1

2 2

1 1

( , ) ( , )

( ( ), ( ))

cos( ( ), ( ))

( )( ) ( )

( ) ( )

doc i j i j

i jVSM

i j

z

mi mji j m

z zi j mi mjm m

sim d d Coh d d

Sim V d V d

V d V d

w wV d V d

V d V d w w

r r

r r

r r

r r

...

y

Term x

Term

第 39 页


3.3.3 结构相似性计算方法

Antenna

is_part_of

T/R moduleBeamformer

is_part_of

Beam steeringcomputer

is_part_of

Radiatingelements

is_part_of

output_signal_to


controls

controls

Property

Predicatestatement

Object classSubject class

predicate

domain range

谓语

(属性

节点

)谓

语声

明(连

接)

主语

/宾语

(类节

点)

is_part_of

ps1

Beam steering computer

谓语

(属性

节点

)谓

语声

明(连

接)

主语

/宾语

(类节

点)

controlsoutput_signal_

to

ps3ps2 ps4 ps5 ps6 ps7

Antenna T/R moduleRadiating elements

Beamformer

_ _is part ofBeamformer Antenna

1 2 3 4 5 1 2 3 1 2 3 4 5 6 7

C1 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0

C2 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0

C3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

C4 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1

C5 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0

P1 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0

P2 0 0 0 0 0 0 0 0 0 0 1 1 1 1 0

P3 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1

S1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0

S2 1 0 0 0 0

S3

S4

S5

S6

S7

C C C C C P P P S S S S S S S

0 0 0 0 0 0 0 0 0 0

0 0 1 0 0 0 0 0 0 0 0 0 0 0 0

0 0 1 0 0 0 0 0 0 0 0 0 0 0 0

0 0 1 0 0 0 0 0 0 0 0 0 0 0 0

0 0 1 0 0 0 0 0 0 0 0 0 0 0 0

0 0 0 0 1 0 0 0 0 0 0 0 0 0 0

邻接矩阵

有向二部图

有向二部图图元

1 , 0,1,...T T

k kk T T

k k F

BZ A B Z AZ k

BZ A B Z A

第 40 页

0 5 10 15 20 25 30 350

0.05

0.1

0.15

0.2

0.25

迭代收敛曲线

迭代次数

收敛

值

奇数次迭代偶数次迭代


3.3.3 结构相似性算例迭代结果

迭代次数：34次运行时间：0.0120s

Z偶

类节点 C1 C2 C3 C4 C5

C1 0.0584 0.0538 0.0308 0.0554 0.0435

C2 0.0538 0.0538 0 0.0509 0.0402

C3 0.0308 0 0.5343 0.0312 0.0251

C4 0.0554 0.0509 0.0312 0.0530 0.0419

C5 0.0435 0.0402 0.0251 0.0419 0.0344

0.0584 0.0538 0.0308 0.0554 0.0435 0.0240 0.1662 0.0096 0 0 0 0 0 0 0

0.0538 0.0538 0 0.0509 0.0402 0.0239 0.1655 0.0094 0 0 0 0 0 0 0

0.0308 0 0.5343 0.0312 0.0251 0 0 0 0 0 0 0 0 0 0

0.0554 0.0509 0.0312 0.0530 0.0419 0.0219 0.1592 0.0060 0 0 0 0 0 0 0

0.0435 0.0402 0.0251 0.0419 0.0344 0.0148 0.1305 0.0060 0 0 0 0 0 0 0

0.0240 0.0239 0 0.0219 0.0148 0.0164 0.0620 0.0062 0 0 0 0 0 0 0

0.1662 0.1655 0 0.1592 0.1305 0.0620 0.5343 0.0251 0 0 0 0 0 0 0

0.0096 0.0094 0 0.0089 0.0060 0.0062 0.0251 0.0025 0 0 0 0 0 0 0

0 0 0 0 0 0 0 0 0.0125 0.0123 0.0243 0.0240 0.0226 0.0239 0.0096

0 0 0 0 0 0 0 0 0.0123 0.0125 0.0239 0.0239 0.0223 0.0235 0.0094

0 0 0 0 0 0 0 0 0.0243 0.0239 0.1037 0.1034 0.1001 0.1030 0.0195

0 0 0 0 0 0 0 0 0.0240 0.0239 0.1034 0.1033 0.0999 0.1027 0.0192

0 0 0 0 0 0 0 0 0.0226 0.0223 0.1001 0.0999 0.0970 0.0995 0.0183

0 0 0 0 0 0 0 0 0.0239 0.0235 0.1030 0.1027 0.0995 0.1024 0.0193

0 0 0 0 0 0 0 0 0.0096 0.0094 0.0195 0.0192 0.0183 0.0193 0.0077

第 41 页

3.4 多维情境相似性计算组合策略

相似计算

情境搜索

1 2 3 4 5 6 7 8 9 10 11 12

( ) ( )

( , , ,0, , , ,0, , ,0,0,0,0,0, )

( , )

( ( ),

, ,

, , ,0,

, ,( ), ( ,, ),0

x y

x

string doc s

y x y x y

U U U U U Utruc strin

Sim W SIM

W

w w w w w w w w w w w w

SIM x y

ci ci x y

i i i i i iSim Sim Sim Sim

( ),

( ), ( ),0, ( ), ( ), ( ),

0, ( ), (( ),0,0,0,0,0, ( )

,

, , , ,

, , , )

,

g

do

x y

L L

x y x y x y x y x y

L L L L A A A A A A

x y x y x y

D D D D

c struc string doc struc

string do time T Tc

Sim Sim Sim Sim Sim

Sim Sim Sim

i i

i i i i i i i i i i

i i i i i i

arg max( ( ,( ) ))j H

C jci

C CI

Sim c cii i ic c

第 42 页

3.4 多维情境相似性计算组合策略

基于GA的最优权重向量搜索的基本条件

1

1

( , , )

. .

1,

0 1 1,

2,...,12

HI

H s m

s

H

i

Object function

I ci h W

IMinimize

s t

W

w i

1

( , , )

Pr ( )

HI

s m

s

H

ci h W

ecision WI

第 43 页

3.5 实验数据概览

全局索引词频度（TF）统计

0

100

200

300

400

500

600

700

800

Stem Frequency

第 44 页


工艺部某室文件操作日志实例片段

对象创建人操作人操作类型操作时间

200385 542 307 A 2007/9/15 11:39

617692 542 266 A 2007/9/15 11:52

184537 543 266 A 2007/9/15 12:19

184537 543 266 A 2007/9/15 12:20

616270 547 222 A 2007/9/15 15:37

526755 214 337 A 2007/9/15 15:52

667839 546 222 A 2007/9/15 16:14

616271 547 222 A 2007/9/15 16:16

216365 542 307 A 2007/9/15 16:37

216365 542 307 A 2007/9/15 16:39

216375 542 307 A 2007/9/15 16:41

198859 545 307 A 2007/9/15 16:45

600898 551 222 A 2007/9/15 16:58

第 45 页


操作人员操作频度分布图

第 46 页


文档对象受访频度分布图

第 47 页


文档创建人执行频度分布图

第 48 页

3.6 实验结果

基于GA的最优权重向量搜索算法收敛曲线

第 49 页

3.6 实验结果

User维度相似性矩阵图形化表示(服务器端)

(U-1) (U-2) (U-3)

图 1 WfCOM 的 User 维度相似性矩阵图形化表示

第 50 页

3.6 实验结果

WfCOM的Location维度相似性矩阵图形化表示(服务器端)

(L-1) (L-2) (L-3)

图 1 WfCOM 的 Location 维度相似性矩阵图形化表示

第 51 页

3.6 实验结果

WfCOM的活动维度相似性矩阵图形化表示(服务器端)

(A-1) (A-2) (A-3)

图 1 WfCOM 的 Activity 维度相似性矩阵图形化表示

第 52 页

3.6 实验结果

WfCOM的Data维度String/Doc相似性矩阵图形化表示(服务器端)

图 1 WfCOM 的 Data 维度 Doc 相似性矩阵图形化表示

第 53 页

3.6 实验结果

向量搜索结果及最终预测结果*表 1 基于 GA 的权重向量空间搜索结果数据

搜索时间（s）迭代次数最佳目标函数值函数验证次数最大约束超差

388.6279 2500 0.168682 150056 9.99E-4

表 2 最优权重向量

情境维度 U L A D T

分维度取

值 0.18 0.14 0.40 0.22 0.06

分维度

权重向量1 1w 2w

3w 4w

5w 6w

7w 8w

9w 10w

11w 12w

值 0.02 0.04 0.12 0.02 0.06 0.06 0.06 0.08 0.26 0.04 0.18 0.06

1表 2 中， iw与相似计算因子类别的对应关系参见式错误!未找到引用源。。

*[1] Tingyu Liu, Huifen Wang, Yong He. Intelligent knowledge recommending approach for new product development based on workflow context matching[J]. Concurrent Engineering, 2016.[2] 刘庭煜*，汪惠芬等，一种基于多维情境本体匹配的产品开发过程业务产物智能推荐方法[J]. 计算机集成制造系统, 2016.

第 54 页

3.6 实验结果

表 1 工作流任务生命周期各阶段效率对比

KiWfMS 工作模式任务分配平均操作时间（s）任务执行的历史信息获取平均操作时间（s）

人员熟练度* R1 R2 R3 T1 T2 T3

Generic Mode 42.8 26.1 13.3 286.2 191.3 110.4

Quick Mode 15.5 10.6 8.7 144.2 124.9 89.5

*注：R1、R2、R3 分别为熟练度为 1、2、3 的任务分配管理人员；T1，T2，T3 分别为熟练度为 1、2、3 的任务执行人员。

工作流任务生命周期各阶段效率比

0

0.5

1

1.5

2

2.5

3

R1 R2 R3 T1 T2 T3

效率比

GenericModeRatio

QuickMode

执行时间

执行时间

第 55 页

3.7 小结

针对工作流管理系统在任务执行领域的知识推荐问题

提出了一种情境感知的任务知识推荐技术。首先，基于本

体论建立了工作流情境模型WfCOM，

研究了WfCOM的本体节点在元素层面以及结构层面的相

似计算方法。

在此基础上，提出了一种基于文件历史访问记录的多维权

重向量搜索方法。

最后，基于实际数据进行了算法实例验证。

第 56 页

4.总结与展望

第 57 页

4.1 工作总结

任务实例化阶段快速资源分配技术:

提出了一种闭环的工作流资源管理框架

提出了一种基于Apriori的资源分配规则快速发现方法

提出了一种基于lift的负相关分配规则标注方式

任务执行阶段的知识推荐技术：

建立了基于本体的工作流情境模型WfCOM

研究了情境本体模型在元素层面（Jaro-Winkler/TF-IDF

）和结构层面(二部图法)的相似计算方法

提出了一种基于工作流文档访问历史的权重向量评价方法

以实现最优历史情境推荐

第 58 页

4.2 工作展望

快速资源分配算法效果和效率的改进

从资源个体层面向更高组织层面的探索

工作流任务知识推荐技术仍待改进

情境本体模型WfCOM的进一步扩充

节点相似度算法的改进

系统突然变动带来的“冷启动”问题

第 59 页

Documents

面向知识密集型业务过程的 知识挖掘与推荐技术 - …ise.thss.tsinghua.edu.cn/CIMS2016/UploadFile/2016/report/...第 8 页 1.2 知识密集型工作流 关键技术1.过程挖掘技术

面向知识密集型业务过程的知识挖掘与推荐技术 - …ise.thss.tsinghua.edu.cn/CIMS2016/UploadFile/2016/report/...第 8 页 1.2 知识密集型工作流关键技术1.过程挖掘技术