On this page... (hide)
1. 重复任务重命名算法的实验代码及数据
Attach:RenameDuplicateTasks.zip
压缩包中:RenameDuplicateTasks\RenameDuplicateTasks.py 是Python语言实现的算法处理脚本。
RenameDuplicateTasks\cpnModels 目录是用于实验的7个CPN形式表达的流程模型。
RenameDuplicateTasks\xml_logs 目录中,形如“b29_log.mxml”的文件是由实验流程模型生成的原始MXML工作流日志;形如“b29_log_renamed_bak.mxml”是经过重复任务重命名处理之后的MXML工作流日志。
1.1 算法的性能改进方向
目前实验85%的运算时间都消耗在事件特征间的距离度量上了,可以试着用Levenshtein Distance算法来优化距离度量的计算性能。
2. 不带有Case Id参考信息的通用事件日志生成算法
压缩包中:CombineTraces\CombineTraces.py 是Python语言实现的算法处理脚本。
CombineTraces\cpnModels 目录是用于实验的4个CPN形式表达的流程模型。
CombineTraces\xml_logs 目录中,形如“B5_log.mxml”的文件是由实验流程模型生成的原始MXML工作流日志;形如“B5_log_combined_bak.mxml”是经过算法处理合并之后的MXML工作流日志。
3. 改造后的ProM流程挖掘平台Alpha算法插件
使用压缩包中的“LogAbstractionImpl.java”文件替换ProM 4.2源代码目录中\src\framework\org\processmining\mining\logabstraction\ 的同名文件。重新编译、启动ProM平台,即可启用修改后的Alpha算法用于行为模式挖掘中。